df.shape是使用 Pandas 库时用来获取 DataFrame 的维度的元组。它返回一个包含行数和列数的元组,可调用该元组来获得 DataFrame 的形状。
df.value_counts().sum()是针对 Pandas DataFrame 中列中数据频次统计的总数。它返回一个整数值,表示列中所有数据点的数量和。
例如,如果我们有一个包含以下内容的 DataFrame:
import pandas as pd
data = {'Animal': ['Dog', 'Dog', 'Cat', 'Cat', 'Dog', 'Bird'],
'Age': [2, 5, 3, 1, 3, 2],
'Weight': [10, 20, 7, 4, 8, 3]}
df = pd.DataFrame(data)
如果我们运行df.shape
,我们将得到输出‘(6, 3)’,这意味着这个 DataFrame 包含6行和3列。
如果我们运行df['Animal'].value_counts().sum()
,我们将得到输出‘6’,这是框架中所有动物的数量和(狗,猫和鸟总共6只)。
因此,df.shape返回DataFrame的行列数,而df.value_counts().sum()返回DataFrame某一列值的总数。需要理解这两个属性在数据分析中的不同,从而使用它们来处理数据。
上一篇:不理解的一个类SVM玩具示例