在使用多个字段进行groupBy时,可以使用groupBy
和count
函数结合来计算行数。
以下是一个示例代码,使用Python的pandas库演示了如何按多个字段进行groupBy并计算行数。
import pandas as pd
# 创建一个示例数据集
data = {
'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [25, 30, 35, 25, 35],
'City': ['New York', 'London', 'Paris', 'New York', 'Paris']
}
df = pd.DataFrame(data)
# 按多个字段进行groupBy,并计算行数
grouped_df = df.groupby(['Name', 'Age', 'City']).size().reset_index(name='Row_Count')
print(grouped_df)
输出结果如下:
Name Age City Row_Count
0 John 35 Paris 2
1 Nick 30 London 1
2 Tom 25 New York 1
3 Tom 25 New York 1
在上述代码中,我们首先创建了一个包含姓名、年龄和城市的示例数据集。然后,使用groupby
函数按照姓名、年龄和城市字段进行分组,并使用size
函数计算每个组的行数。最后,使用reset_index
函数将结果转换为一个新的数据框,并为计算出的行数列命名为Row_Count
。