如何重用df.groupby()的结果。在另一个数据框中填充NaN是什么意思?

onthemoon01

我正在处理Titanic数据集

我计算df['Age']基于'Sex'和'Pclass'的均值,以将NaN填充到中df['Age']

代码如下:

import pandas as pd
df = pd.read_csv('train.csv')
df['Age'] = df.groupby(['Sex','Pclass'])['Age'].transform(lambda x:x.fillna(x.mean()))

这很好用,但是现在,在测试集上,我想用训练集中“ Sex”和“ Pclass”分组的平均年龄值填充NaNs。我可以通过轻松获得这些值df.groupby(['Sex', 'Pclass'])['Age].mean(),但是我无法弄清楚如何重用这些值来填充测试数据帧中的NaN。

谁能帮我?

耶斯列尔

使用DataFrame.merge与左连接,然后通过替换缺失值Series.fillnaDataFrame.pop

mean = df1.groupby(['Sex', 'Pclass'], as_index=False)['Age'].mean()

df2 = df2.merge(mean, on=['Sex','Pclass'], how='left', suffixes=('','_'))
df2['Age'] = df2['Age'].fillna(df2.pop('Age_'))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何基于另一个数据框的多索引值应用数据框中的值?

来自分类Dev

如何重用另一个定义中的示例?

来自分类Dev

如何将一个数据框转换为另一个数据框

来自分类Dev

如何访问另一个数据框中的列表/数据框值

来自分类Dev

在R中,如何通过另一个数据框的列名删除一个数据框中的行?

来自分类Dev

如何根据另一个数据框的值删除数据框中的行

来自分类Dev

如何查找数据框中某行的匹配,条件是来自另一个数据框中的许多行

来自分类Dev

如何删除熊猫数据框中的NaN值,该列的列在另一个数据框中被引用为表示缺少或未知值的编码值

来自分类Dev

如何通过另一个数据框中的键过滤一个数据框中的列

来自分类Dev

如何创建一个新表来汇总另一个数据框中的数据?

来自分类Dev

如何基于对R中另一个数据框的数学运算来创建数据框

来自分类Dev

如何根据另一个数据框中的查找值替换熊猫数据框值?

来自分类Dev

如何根据R中的另一个数据框条目替换空白?

来自分类Dev

如果另一个数据框中缺少值,如何在一个数据框中删除一行?

来自分类Dev

如何基于另一个数据框中的组在熊猫数据框中创建指标列?

来自分类Dev

如何从另一个数据框中按组正确合并变量?

来自分类Dev

如何使用熊猫间隔查找值,以填充另一个数据框

来自分类Dev

如何删除一个数据框中的空行,同时删除另一个数据框中的相应行?

来自分类Dev

pyspark:如何在具有条件的列中填充值并用另一个数据框中的列替换

来自分类Dev

如何检查R中的另一个数据框中是否存在一个数据框中的值?

来自分类Dev

如何使用一个数据框的索引重新索引熊猫中的另一个

来自分类Dev

如何用另一个数据框(熊猫)中的值更新空数据框值?

来自分类Dev

如何删除不在另一个数据框中的数据框行?

来自分类Dev

如何使用来自另一个数据框的随机值更新Pyspark中的数据框?

来自分类Dev

如何在另一个表中获得多个数据的结果

来自分类Dev

如何转换数据框并将其包含在另一个数据框中

来自分类Dev

如何搜索熊猫数据框以填充另一个数据框?

来自分类Dev

如何在不使用 R 进行循环索引的情况下用另一个数据框的内容填充一个大数据框?

来自分类Dev

如何根据特定规则将一个数据框中的列添加到另一个数据框中

Related 相关文章

  1. 1

    如何基于另一个数据框的多索引值应用数据框中的值?

  2. 2

    如何重用另一个定义中的示例?

  3. 3

    如何将一个数据框转换为另一个数据框

  4. 4

    如何访问另一个数据框中的列表/数据框值

  5. 5

    在R中,如何通过另一个数据框的列名删除一个数据框中的行?

  6. 6

    如何根据另一个数据框的值删除数据框中的行

  7. 7

    如何查找数据框中某行的匹配,条件是来自另一个数据框中的许多行

  8. 8

    如何删除熊猫数据框中的NaN值,该列的列在另一个数据框中被引用为表示缺少或未知值的编码值

  9. 9

    如何通过另一个数据框中的键过滤一个数据框中的列

  10. 10

    如何创建一个新表来汇总另一个数据框中的数据?

  11. 11

    如何基于对R中另一个数据框的数学运算来创建数据框

  12. 12

    如何根据另一个数据框中的查找值替换熊猫数据框值?

  13. 13

    如何根据R中的另一个数据框条目替换空白?

  14. 14

    如果另一个数据框中缺少值,如何在一个数据框中删除一行?

  15. 15

    如何基于另一个数据框中的组在熊猫数据框中创建指标列?

  16. 16

    如何从另一个数据框中按组正确合并变量?

  17. 17

    如何使用熊猫间隔查找值,以填充另一个数据框

  18. 18

    如何删除一个数据框中的空行,同时删除另一个数据框中的相应行?

  19. 19

    pyspark:如何在具有条件的列中填充值并用另一个数据框中的列替换

  20. 20

    如何检查R中的另一个数据框中是否存在一个数据框中的值?

  21. 21

    如何使用一个数据框的索引重新索引熊猫中的另一个

  22. 22

    如何用另一个数据框(熊猫)中的值更新空数据框值?

  23. 23

    如何删除不在另一个数据框中的数据框行?

  24. 24

    如何使用来自另一个数据框的随机值更新Pyspark中的数据框?

  25. 25

    如何在另一个表中获得多个数据的结果

  26. 26

    如何转换数据框并将其包含在另一个数据框中

  27. 27

    如何搜索熊猫数据框以填充另一个数据框?

  28. 28

    如何在不使用 R 进行循环索引的情况下用另一个数据框的内容填充一个大数据框?

  29. 29

    如何根据特定规则将一个数据框中的列添加到另一个数据框中

热门标签

归档