以下是一个代码示例来解决"按另一列分组的二元目标变量的值计数比例"的问题:
import pandas as pd
# 创建示例数据
data = {'Group': ['A', 'A', 'B', 'B', 'B', 'C', 'C'],
'Target': [1, 0, 1, 1, 0, 0, 1]}
df = pd.DataFrame(data)
# 按Group列分组,并计算每个分组中Target值为1的比例
result = df.groupby('Group')['Target'].mean()
print(result)
输出结果:
Group
A 0.500000
B 0.666667
C 0.500000
Name: Target, dtype: float64
在上述示例中,我们使用pandas库创建了一个包含两列(Group和Target)的DataFrame。然后,我们使用groupby
方法按Group列对数据进行分组,并使用mean
方法计算每个分组中Target列值为1的比例。
这样,我们就得到了按另一列分组的二元目标变量的值计数比例。