在 Python Pandas 中计算每个组的唯一值

要计算 Python Pandas 中每个组的唯一值,我们可以使用df.groupby('column_name')。count().

步骤

  • 创建二维、大小可变、潜在异构的表格数据df

  • 打印输入数据帧df

  • 使用df.groupby('rank')['id']。count()查找每组唯一值的计数并将其存储在变量“ count ”中。

  • 打印步骤 3 中的计数。

示例

import pandas as pd

df = pd.DataFrame(
    {
       "id": [1, 2, 1, 3, 5, 1, 4, 3, 6, 7],
       'rank': [1, 4, 1, 2, 1, 4, 6, 1, 5, 3]
    }
)

print"Input DataFrame 1 is:\n", df
count = df.groupby('rank')['id'].count()
print"Frequency of ranks:\n", count
输出结果
Input DataFrame 1 is:

   id  rank
0   1    1
1   2    4
2   1    1
3   3    2
4   5    1
5   1    4
6   4    6
7   3    1 
8   6    5
9   7    3
Frequency of ranks:
rank
1  4
2  1
3  1
4  2
5  1
6  1
Name: id, dtype: int64