python按两列分组，按一个索引提取第一个元素

debugcn 发表于 Dev

用户名

如果我使用groupby函数，例如Data.groupby(['id','company']).size()，它将给出如下结果：

id   company 
1    a        2
     b        3
     c        6
2    d        1
     e        5

但是如何提取数字[2,1]（根据第一个索引级别组的排序顺序，每个零索引级别组的第一个元素）？

伊利

首先，让：

agg_df = Data.groupby(['id','company']).size()

假设您希望从第一个条目的结果中获得对于MultiIndex的第零级具有相同值的每组元素，并且您可以根据需要按第一级对每个组进行排序。（更新评论后，这似乎是所需的输出）

unique_zeroth_level = dict(agg_df.index.values).keys()
group_first_vals = [
    agg_df.select(lambda x: x[0]==idx_val, axis=0).head(1).values[0] 
    for idx_val in unique_zeroth_level]

假设您要查询生成的MultiIndex的第零级的唯一元素

在这种特殊情况下，由于返回的结果是Series，因此可以使用以下技巧unstack：

agg_df.unstack(level=0).columns.values

或使用dict构造函数

dict(agg_df.index.values).keys()

假设你想要的结果的(1, 'a')和(2, 'd')特别，而且要通过索引值访问他们（而不仅仅是那些正在各自小组的第一字典序条目的后果）

agg_df.ix[[(1, 'a'), (2, 'd')]]

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-4

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何按数组的第一个元素分组？

来自分类Dev

按第一个元素分组数组

来自分类Dev

Pandas DataFrame按两列分组，并获得第一个和最后一个

来自分类Dev

Pandas DataFrame按两列分组，并获得第一个和最后一个

来自分类Dev

按级别从多索引分组中获取第一个索引

来自分类Dev

按元组的第3个元素排序，然后按第一个元素分组并分配等级

来自分类Dev

按两列分组时获取第一个记录更改时间戳 SQL Server

来自分类Dev

按索引选择groupby对象的第一个元素而不转换为列表

来自分类Dev

将列的所有值替换为第一个值-按ID分组

来自分类Dev

Python：如何按最常见的第一个元素对列表进行排序？

来自分类Dev

Python-按一个元素对列表进行分组

来自分类Dev

按两个字段分组，并在第一个字段上具有count（）

来自分类Dev

按熊猫数据框唯一的第一个值分组 - 返回 numpy 数组

来自分类Dev

比较两个熊猫列，并返回与第二个元素匹配的第一个的索引

来自分类Dev

SQL查询按2列分组并采用第3列的第一个匹配项

来自分类Dev

在mysql中按小时分组，但还包括来自hour + 1的第一个值

来自分类Dev

按第一个字符对单词进行分组

来自分类Dev

按SQL中的第一个值将行序列分组

来自分类Dev

我如何获得按MySQL查询分组的最后结果（不是第一个）

来自分类Dev

mongodb按第一个字符分组

来自分类Dev

按foreach中的第一个字符对行进行分组

来自分类Dev

分组表按名称的第一个字符查看

来自分类Dev

按属性第一个字母对对象数组进行分组

来自分类Dev

MYSQL按日期分组并计算第一个日期

来自分类Dev

按组查找第一个和最后一个NA值的全局索引

来自分类Dev

保留数组的第一个索引元素和最后一个索引元素

来自分类Dev

按值对json进行排序，然后提取第一个值

来自分类Dev

按日期排序，第一个为空

来自分类Dev

数组按第一个值排序

Related 相关文章

文章