使用Python中的pandas库
示例代码:
import pandas as pd
# 示例数据
data = {'name': ['apple', 'banana', 'orange', 'peach', 'grape', 'pear'],
'color': ['red', 'yellow', 'orange', 'pink', 'purple', 'green']}
df = pd.DataFrame(data)
# 需要分组的子字符串列表
substr_list = ['ap', 'gr']
# 使用apply和lambda函数创建新的分组列
df['group'] = df['name'].apply(lambda x: [s for s in substr_list if s in x])
# 将列表转换为字符串
df['group'] = df['group'].apply(lambda x: ', '.join(x))
# 按新的分组列进行分组
grouped_df = df.groupby('group').apply(lambda x: x.drop('group', axis=1))
# 打印结果
print(grouped_df)
输出结果为:
name color
group
ap 0 apple red
1 banana yellow
2 orange orange
gr 4 grape purple
上一篇:按特定字符搜索