标准差计算器
粘贴一组数值后,计算器将返回每个数值的均值、方差、标准差(样本数据s使用n−1作为分母,总体数据σ使用n作为分母)、变异系数及z值。此功能在需要了解数据围绕均值的离散程度时尤为实用——这是进行任何参数检验前的关键诊断步骤。
标准差如何计算
-
1
粘贴您的数字
用逗号、空格或换行符分隔。非数字项将被跳过。
-
2
平均横线已计算完成
总和除以计数。
-
3
平方偏差被相加在一起。
求和((x – x̄) ²)。
-
4
除以并求根
示例:除以(n−1),取 √. Population: divide by n,take √.
样本与总体——何时使用哪种
| 使用总体样本量(n/除数) | 使用样本样本量(n−1/除数) |
|---|---|
| 您拥有整个总体数据; | 您从更大的总体中抽取了样本; |
| 全员员工普查数据 | 从数千名客户中抽取的20位样本 |
| 特定实验过程中掷出的全部10个骰子结果 | 生产线上的测量数据 |
使用n−1除数(贝塞尔校正)可从样本数据中得出无偏的总体方差估计量;而采用n除数则会系统性地低估真实的总体方差。当样本量较大时,这种差异会逐渐缩小;但在小样本量情况下,该差异仍具有显著影响。
标准差的直观理解
若某组数据的均值为100、标准差(SD)为15,则(假设近似服从正态分布):
- 68%的数值落在85至115(1个标准差)范围内
- 95%位于 70–130(2 个标准差)范围内
- 99.7% 的数据落在 55 至 145(3 个标准差)之间
这就是所谓的68-95-99.7规则,亦称为经验法则。智商分数、人体身高以及许多自然测量值均严格遵循该规律。
变异系数
变异系数(CV)= 标准差(SD)/均值。这是一种无量纲的离散度指标,在比较具有不同均值的数据集间变异性时尤为实用。CV为0.1(10%)意味着标准差约为均值的10%;对于数值可能跨越零点的数据,该指标缺乏实际意义。
Z值
对于每个数值 x:z = (x − 均值) / 标准差。该值表示该数值位于均值上方或下方多少个标准差处。当 |z| > 2 时通常被视为异常值;而在正态分布数据中,|z| > 3 的情况极为罕见。
常见错误
- 在应使用样本数据时却使用总体数据,会低估样本数据集中的变异性。
- **混合不同单位的均值与标准差。**务必核对刻度范围。
- 对非正态数据应用正态分布规则。 偏态或多峰数据会破坏68-95-99.7经验法则。请先绘制直方图。
- 忽略异常值。 单个极端值可使标准差(SD)增加三倍。针对重尾数据,存在稳健的替代指标(中位数绝对偏差、四分位距)。
常见问题
Excel提供两种函数: STDEV(用于样本,分母为n−1)和 STDEVP(用于总体,分母为n)。请确保选择与您所需的样本或总体假设相匹配的函数。
是的——标准差(SD)的计量单位与您的测量单位相同(厘米、美元、秒)。方差以平方单位表示,因此标准差更易于阅读。
样本标准差(SD)的定义适用于n≥2的情况。当样本量大致为n=30时,建议报告围绕该标准差的置信区间或采用稳健替代方法。
标准差(SD)仍可定义。对于比例为p的情况,SD = √(p × (1−p))。当样本中1的比例为60%时,无论观测值数量如何,SD均等于√(0.6 × 0.4) ≈ 0.49。