以下是一个示例代码,展示了如何按唯一列值分离数据:
import pandas as pd
# 创建一个包含重复值的数据集
data = {
'姓名': ['张三', '李四', '王五', '张三', '李四'],
'年龄': [20, 25, 30, 22, 27],
'性别': ['男', '男', '女', '男', '女']
}
df = pd.DataFrame(data)
# 按姓名列值分离数据
unique_names = df['姓名'].unique()
separated_data = []
for name in unique_names:
separated_data.append(df[df['姓名'] == name])
# 打印分离后的数据
for i, data in enumerate(separated_data):
print(f"分离后的数据集 {i+1}:")
print(data)
print()
输出结果如下:
分离后的数据集 1:
姓名 年龄 性别
0 张三 20 男
3 张三 22 男
分离后的数据集 2:
姓名 年龄 性别
1 李四 25 男
4 李四 27 女
分离后的数据集 3:
姓名 年龄 性别
2 王五 30 女
以上代码首先创建了一个包含重复值的数据集,然后按照姓名列的唯一值进行数据分离。通过遍历唯一值列表,将符合条件的数据添加到新的列表中。最后,打印分离后的数据集。