偏度(Skewness)是衡量 数据分布非对称程度的统计量。它反映了数据分布的偏斜方向和程度。如果数据分布是对称的,那么偏度为零;如果数据分布是不对称的,偏度不为零。偏度有两种类型:
正偏度(Positive Skewness):
表示数据分布有一个长长的右尾,即数据中存在较大的值较多。
负偏度(Negative Skewness):
表示数据分布有一个长长的左尾,即数据中存在较小的值较多。
偏度的计算公式为:
\[ Sk = \frac{E[(X - \mu)^3]}{\sigma^3} \]
其中,\( X \) 是随机变量,\( \mu \) 是均值,\( \sigma \) 是标准差,\( E \) 是期望值。
通过测量偏度,我们可以判定数据分布的不对称程度以及方向,从而更好地理解数据的分布特征。正态分布的偏度是0,因为它是对称的。
建议在实际应用中,结合偏度和其他描述性统计量(如峰度)来全面评估数据的分布特征,以便更准确地做出数据分析和决策。