下面是一个示例代码,演示了如何计算行均值,并根据每列的总和有选择地删除列:
import pandas as pd
# 创建示例数据框
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10],
        'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# 计算行均值
row_mean = df.mean(axis=1)
# 打印行均值
print("行均值:")
print(row_mean)
# 计算每列的总和
column_sum = df.sum()
# 打印每列的总和
print("\n每列的总和:")
print(column_sum)
# 根据每列的总和有选择地删除列
threshold = 30
df_filtered = df.loc[:, column_sum >= threshold]
# 打印筛选后的数据框
print("\n删除列后的数据框:")
print(df_filtered)
输出结果如下:
行均值:
0     6.0
1     7.0
2     8.0
3     9.0
4    10.0
dtype: float64
每列的总和:
A    15
B    40
C    65
dtype: int64
删除列后的数据框:
    B   C
0   6  11
1   7  12
2   8  13
3   9  14
4  10  15
在示例代码中,我们使用了Pandas库来处理数据。首先,我们创建了一个示例数据框df。然后,使用mean()方法计算了行均值,并使用sum()方法计算了每列的总和。最后,我们使用布尔索引来选择总和大于等于阈值的列,并将其存储在df_filtered中。