统计 - 单(双)因素方差分析
笔记链接:http://www.cnblogs.com/igoslly/p/6782963.html
方差分析(Analysis of Variance / ANOVA)
实验中,我们要考察的指标为试验指标,影响的条件成为因素。由于各种因素的影响,使得测试数据结果呈波动状,包含不可控的随机因素、人为调控的可控因素。
应用条件:
1、各样本是相互独立的随机样本
2、各样本均来自正态分布总体
3、各样本的总体方差相等,即具有方差齐性
单因素方差分析(one-way ANOVA)
试验参数
假设因素A有s个水平A1,A2…..,As,每个水平下进行nj次独立试验,样本总数n
观测变量总离差平方和 = 组间离差平方和 + 组内离差平方和,表述为:SST=SSA+SSE。
组内差异——测量误差、个体差异
SSE(误差平方和)各个水平下,样本观察值与样本均值差异的平方和
组内*度 dfe=n-s
组间差异——不同实验条件处理
SSA(因素A的效应平方和)各个水平下样本平均值与数据总平均差异的平方和
组间*度 dfa=s-1
均方 = 离差平方和 / *度 SA=SSA/dfa SE=SSE/dfe
单因素方差分析基本步骤
1、提出原假设:H0——无差异;H1——有显著差异
2、选择检验统计量:方差分析采用的检验统计量是F统计量,即F值检验
拒绝H0 |
F>F0.05(dfa,dfe) |
组间均方>>组内均方,来自不同正态总体 |
接受H0 |
F<F0.05(dfa,dfe) |
组间均方<<组内均方,来自相同正态总体 |
3、计算检验统计量的观测值和概率P值
4、给定显著性水平,并作出决策
方差齐性检验 ——对控制变量不同水平下各观测变量总体方差是否相等进行检验
控制变量不同水平下观测变量总体方差无显著差异是方差分析的前提要求。
若不满足,便不能认为各总体分布相同。
多重比较检验 ——控制变量的不同水平对观测变量的影响程度如何
实现对各个水平下观测变量总体均值的逐对比较
多(双)因素方差分析
单独效应 ——其他因素固定,某一因素不同水平之间均数的差别
交互效应 ——某因素的单独效应,随另一因素水平而变化,且不能用随机误差解释
试验参数
假设因素A有r个水平(A1,A2…..,Ar),因素B有s个水平(B1,B2……,Bs),每个ABzuhe进行t次独立试验,样本总数n
所有数据平均值μ,αi是水平Ai的效应,βj是水平Bj的效应,γij表示Ai与Bj的交互作用
同样计算离差平方和SST=SSA+SSE+SSB+SSAB
SSE(误差平方和)每个(ij)水平下测量值与均值差异的平方和
SSA、SSB(因素A\B的效应平方和)、SSAB(AB交互效应平方和)
例如双因素方差分析的基本步骤
1、提出原假设:
|
因素A(r) |
因素B(s) |
AB交互作用(rs) |
无显著差异 |
H01 |
H02 |
H03 |
有显著差异 |
H11 |
H12 |
H13 |
2、F值检验
拒绝H01 |
F0.05(dfa,dfe)<FA |
因素A不同存在显著差异 |
拒绝H02 |
F0.05(dfb,dfe)<FB |
因素B不同存在显著差异 |
拒绝H03 |
F0.05(dfab,dfe)<FAB |
因素A与B存在交互效应 |
补充:F分布
设X、Y为两个独立的随机变量,
X服从*度为k1的卡方分布,Y服从*度为k2的卡方分布
变量 F =(X / k1) / (Y / k2)服从F(k1,k2)的分布
学习资料来源
1、百度百科:方差分析
2、概率论与数理统计(第四版)
3、百度文库https://wenku.baidu.com/view/30a2bafc941ea76e58fa045a.html
申明
本笔记为个人整理,仅限学习使用,禁止转载
上一篇: 常用数据分析方法:方差分析和实施!
下一篇: 工业互联网发展水平及在行业中的应用分析
推荐阅读
-
[数学统计] 单因子方差分析(ANOVA)
-
统计 - 单(双)因素方差分析
-
用 Matlab 进行数理统计:第 5 章 方差分析 - 5.1 单因素方差分析
-
R 海洋拾贝 - 双因素重复测量方差分析
-
统计学习 04:假设检验(以 t 检验为例)和 P 值 - 要点 I. 假设检验的一般思路 假设检验 清楚你的问题是什么?期望得出什么结论? 例如,两种药物的疗效是否存在差异,自变量与因变量之间是否存在回归关系 .... 请始终牢记,假设检验回答的是是否存在某种关系的问题:它并不衡量这种关系有多大。 提出两种假设:零假设 (H0) 和备择假设 (H1) 零假设与备择假设相反,一般来说,研究的目的是证明原假设是错误的,即得出备择假设的结论。 例如,如果实验预期希望两种药物的疗效存在差异,那么 H0:μ1 - μ2 = 0;H1:μ1 - μ2 ≠ 0 H0:μ1-μ2 = 0 的一般形式称为双侧检验,而 >、<等零假设称为单侧检验。一般来说双侧检验更为常见,下面也主要介绍这种方法。 单尾或双尾测试 根据原始数据计算零假设概率分布的统计量(t 值、Z 值、F 值等)。 根据问题的性质选择合适的概率检验方法,从而计算出相应的统计量值;因此,不同情况的统计量值有不同的计算方法。 根据计算出的统计量值,利用统计软件,可以知道相应的 p 值是多少 也可以先确定一个合适的显著性水平(0.0.001....),并计算其临界值,再与我们计算出的统计量值进行比较,从而做出判断。 根据第四步的比较结果,如果 p 值小于预期的显著性水平(α,通常设定为 0.05),则认为该统计量远离原假设分布,属于小概率事件,则拒绝原假设,从而接受备择假设。 决定 要点 2:以 t 检验为例,演示上述假设检验思路。 t 检验基于 t 分布,常见的 t 检验有三种,如下图所示,但我认为第三种配对设计可能更常用(零假设:差异是否为零),下面介绍的例子就是一种配对设计 三次 t 检验 举例测量两组大鼠肝脏中维生素 A 的含量,比较两组大鼠维生素 A 含量是否有差异。数据如下 数据 (1) 预计两组大鼠的维生素 A 水平存在差异 (2) H0:μd=0,H1:μd≠0,α=0.05,双侧检验 (3) t 统计量的计算 配方 计算 上述程序计算的是*度为 7 的 t 分布情况下的 t 值。只需理解公式即可,不同的方法有不同的公式,这些交给统计软件即可。
-
[数学建模] 单因素和多因素试验的方差分析(Matlab 代码实现