ANOVA 计算器

F 统计量

粘贴两组或更多组数字,计算器会运行单因素 ANOVA,以检验各组均值是否存在显著差异。它会返回 F 统计量、自由度、p 值和 eta-squared 效应量 — 这些都是统计论文或实验报告会引用的标准输出。

如何运行单因素 ANOVA

  1. 1

    输入分组数据

    将每组粘贴为逗号分隔或换行分隔的列表。最少两组;建议每组至少 3-5 个观测值。

  2. 2

    检查假设条件

    单因素 ANOVA 假设残差近似正态分布,并且各组方差大致相等。如果各组离散程度差异很大,应标记出来。

  3. 3

    读取 F 统计量

    F 是组间方差与组内方差的比值。F 越大,组间差异的证据越强。

  4. 4

    解释 p 值

    如果低于你选择的 alpha(通常 0.05),则拒绝“所有组均值相等”的原假设。ANOVA 不会告诉你哪些组不同 — 需要使用 post-hoc test。

ANOVA 表

来源 SS(平方和) df(自由度) MS(均方) F
组间 SSB k - 1 MSB = SSB/(k-1) MSB/MSW
组内 SSW N - k MSW = SSW/(N-k)
总计 SST = SSB + SSW N - 1

其中 k = 组数,N = 总观测数。

F 分布临界值(alpha = 0.05)

df1 \ df2 10 20 30 60 120
2 4.10 3.49 3.32 3.15 3.07
3 3.71 3.10 2.92 2.76 2.68
4 3.48 2.87 2.69 2.53 2.45
5 3.33 2.71 2.53 2.37 2.29

如果计算得到的 F 超过对应 df1 (= k-1) 和 df2 (= N-k) 的表中数值,则在 p < 0.05 下拒绝原假设。

引用 ANOVA 前应验证的假设

  1. 组内和组间观测值的独立性
  2. 残差的正态性(Shapiro-Wilk test,或可视化:Q-Q plot)。
  3. 方差齐性(Levene’s test,或经验规则:最大 SD 小于最小 SD 的 2 倍)。

如果正态性不成立:Kruskal-Wallis test 是非参数替代方案。 如果方差齐性不成立:Welch’s ANOVA 可处理不等方差。

显著 ANOVA 之后:事后检验(post-hoc)

单因素 ANOVA 告诉你 某些 组不同,但不告诉你 哪些 组不同。后续可使用:

  • Tukey HSD — 保守,控制族系误差率(多重比较的总体错误率)。
  • Bonferroni — 简单调整:α / 比较次数。
  • Scheffé — 灵活但功效低;适合探索性分析。
  • Dunnett — 只将每个处理组与控制组比较。

效应量

显著的 p 值说明“存在差异”。效应量说明“差异有多大”。报告 eta-squared (η²) = SSB / SST。粗略参考:0.01 小,0.06 中,0.14 大。

常见问题

当你有三组或更多组时。运行多个 t-test 会放大家族式 I 类错误率(在三次成对检验中,0.05 的 α 大约变成 0.14)。ANOVA 会把整体 alpha 保持在 0.05。

单因素只有一个分组因子(例如处理类型)。双因素有两个因子(例如处理 × 性别),并且可以检验主效应和交互作用。本计算器处理单因素情形。

统计上没有 — 它们几乎相同。0.05 阈值是一种惯例,不是物理常数。应报告精确 p 值和效应量,让读者判断,而不是把 0.05 当作锐利分界线。

小样本会产生不稳定的 F 值。每组 n=3 时得到很大的 F 有提示意义,但应重复验证。请在报告 F 的同时报告组均值的置信区间。

相关工具