以下是一个示例代码,展示了如何按条件选择列:
import pandas as pd
# 创建一个示例数据集
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 30, 35, 40],
'Gender': ['Female', 'Male', 'Male', 'Male'],
'Salary': [5000, 6000, 7000, 8000]
}
df = pd.DataFrame(data)
# 定义条件
condition = (df['Age'] > 30) & (df['Salary'] > 6000)
# 根据条件选择列
selected_columns = df.loc[condition, ['Name', 'Age', 'Salary']]
print(selected_columns)
输出结果将是:
Name Age Salary
2 Charlie 35 7000
3 David 40 8000
在这个示例中,我们创建了一个包含姓名、年龄、性别和工资的示例数据集。然后我们定义了一个条件,即年龄大于30且工资大于6000。最后,我们使用df.loc
方法根据条件选择了姓名、年龄和工资这三列,并将结果打印出来。
上一篇:按条件统计每月的记录数