如何重用df.groupby（）的结果。在另一个数据框中填充NaN是什么意思？

debugcn 发表于 Dev

我计算df['Age']基于'Sex'和'Pclass'的均值，以将NaN填充到中df['Age']。

import pandas as pd
df = pd.read_csv('train.csv')
df['Age'] = df.groupby(['Sex','Pclass'])['Age'].transform(lambda x:x.fillna(x.mean()))

这很好用，但是现在，在测试集上，我想用训练集中“ Sex”和“ Pclass”分组的平均年龄值填充NaNs。我可以通过轻松获得这些值df.groupby(['Sex', 'Pclass'])['Age].mean()，但是我无法弄清楚如何重用这些值来填充测试数据帧中的NaN。

mean = df1.groupby(['Sex', 'Pclass'], as_index=False)['Age'].mean()

df2 = df2.merge(mean, on=['Sex','Pclass'], how='left', suffixes=('','_'))
df2['Age'] = df2['Age'].fillna(df2.pop('Age_'))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

Related 相关文章

文章

如何重用df.groupby（）的结果。在另一个数据框中填充NaN是什么意思？

如何重用df.groupby（）的结果。在另一个数据框中填充NaN是什么意思？

如何基于另一个数据框的多索引值应用数据框中的值？

如何重用另一个定义中的示例？

如何将一个数据框转换为另一个数据框

如何访问另一个数据框中的列表/数据框值

在R中，如何通过另一个数据框的列名删除一个数据框中的行？

如何根据另一个数据框的值删除数据框中的行

如何查找数据框中某行的匹配，条件是来自另一个数据框中的许多行

如何删除熊猫数据框中的NaN值，该列的列在另一个数据框中被引用为表示缺少或未知值的编码值

如何通过另一个数据框中的键过滤一个数据框中的列

如何创建一个新表来汇总另一个数据框中的数据？

如何基于对R中另一个数据框的数学运算来创建数据框

如何根据另一个数据框中的查找值替换熊猫数据框值？

如何根据R中的另一个数据框条目替换空白？

如果另一个数据框中缺少值，如何在一个数据框中删除一行？

如何基于另一个数据框中的组在熊猫数据框中创建指标列？

如何从另一个数据框中按组正确合并变量？

如何使用熊猫间隔查找值，以填充另一个数据框

如何删除一个数据框中的空行，同时删除另一个数据框中的相应行？

pyspark：如何在具有条件的列中填充值并用另一个数据框中的列替换

如何检查R中的另一个数据框中是否存在一个数据框中的值？

如何使用一个数据框的索引重新索引熊猫中的另一个

如何用另一个数据框（熊猫）中的值更新空数据框值？

如何删除不在另一个数据框中的数据框行？

如何使用来自另一个数据框的随机值更新Pyspark中的数据框？

如何在另一个表中获得多个数据的结果

如何转换数据框并将其包含在另一个数据框中

如何搜索熊猫数据框以填充另一个数据框？

如何在不使用 R 进行循环索引的情况下用另一个数据框的内容填充一个大数据框？

如何根据特定规则将一个数据框中的列添加到另一个数据框中