下面是一个示例代码,演示了如何计算行均值,并根据每列的总和有选择地删除列:
import pandas as pd
# 创建示例数据框
data = {'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# 计算行均值
row_mean = df.mean(axis=1)
# 打印行均值
print("行均值:")
print(row_mean)
# 计算每列的总和
column_sum = df.sum()
# 打印每列的总和
print("\n每列的总和:")
print(column_sum)
# 根据每列的总和有选择地删除列
threshold = 30
df_filtered = df.loc[:, column_sum >= threshold]
# 打印筛选后的数据框
print("\n删除列后的数据框:")
print(df_filtered)
输出结果如下:
行均值:
0 6.0
1 7.0
2 8.0
3 9.0
4 10.0
dtype: float64
每列的总和:
A 15
B 40
C 65
dtype: int64
删除列后的数据框:
B C
0 6 11
1 7 12
2 8 13
3 9 14
4 10 15
在示例代码中,我们使用了Pandas库来处理数据。首先,我们创建了一个示例数据框df
。然后,使用mean()
方法计算了行均值,并使用sum()
方法计算了每列的总和。最后,我们使用布尔索引来选择总和大于等于阈值的列,并将其存储在df_filtered
中。