以下是一个示例代码,演示如何保留包含某些正则表达式元素的列:
import pandas as pd
# 创建一个示例数据框
data = {
'A': ['apple', 'banana', 'cherry'],
'B': ['orange', 'melon', 'grape'],
'C': ['cat', 'dog', 'elephant']
}
df = pd.DataFrame(data)
# 定义要保留的正则表达式元素
regex_elements = ['ap', 'ra']
# 使用正则表达式筛选列
filtered_df = df[df.columns[df.columns.str.contains('|'.join(regex_elements))]]
print(filtered_df)
输出结果为:
A B
0 apple orange
1 banana melon
2 cherry grape
在这个示例中,我们创建了一个包含三列的数据框。然后,我们定义了一个包含要保留的正则表达式元素的列表。使用str.contains()
函数和|
操作符,我们筛选出列名中包含任何正则表达式元素的列。最后,我们使用筛选后的列重新构建数据框,只保留这些列。