Python底层数量经济分析实战(四):探索自相关现象(原因、结果与检验:DW测试,解决方法:广义线性回归)
系列前面的文章:
- 多元线性回归和显著性检验(参数估计、T检验、F检验、拟合优度)
- 多重共线性(导致结果、检验——方差膨胀因子、补救措施——岭回归)
- 异方差(导致结果、检验——White、补救措施——广义线性回归)
- 自相关(导致结果、检验——D-W、补救措施——广义线性回归)
写的比较仓促,代码中如有错误欢迎指正!
多元线性回归的基本假定:
- 模型符合线性模式
- X X X满秩(无多重共线)
- 零均值价值: E ( ε i ∣ X i ) = 0 E(ε_i|X_i)=0 E(εi∣Xi)=0(自变量外生)
- 同方差: V a r ( ε i ∣ X i ) = σ Var(ε_i|X_i)=σ Var(εi∣Xi)=σ
- 无自相关: c o v ( ε i , ε j ) = 0 cov(ε_i, ε_j)=0 cov(εi,εj)=0
- 球形扰动:ε_i是正态分布
若果模型违反了相应的假设就会犯对应的错误,我们在计量经济分析中的检验就是检验出是否可能犯了某一类错误,若果极有可能犯了一种错误时,我们应该怎么修正它,才能保证分析的结果是有效的。
一、异方差性
和前面一样,举个例子。如果,我们一个理论上的多元线性回归模型为:
Y
i
=
β
0
+
β
1
∗
x
1
i
+
β
2
∗
x
2
i
+
β
3
∗
x
3
i
2
+
u
i
Y_i=β_0+β_1*x_{1i}+β_2*x_{2i}+β_3*x_{3i}^2+u_i
Yi=β0+β1∗x1i+β2∗x2i+β3∗x3i2+ui
但我们再建模时只考虑
x
3
x_{3}
x3的一阶情况,此时我们实际建立的模型变为
Y
i
=
β
0
+
β
1
∗
x
1
i
+
β
2
∗
x
2
i
+
β
3
∗
x
3
i
+
u
i
Y_i=β_0+β_1*x_{1i}+β_2*x_{2i}+β_3*x_{3i}+u_i
Yi=β0+β1∗x1i+β2∗x2i+β3∗x3i+ui
如果
x
3
x_{3}
x3本身具有一定自相关,这样遗漏一个变量会对我们的估计产生后果?
1.1.自相关
多元线性回归要求无自相关,即
c
o
v
(
ε
i
,
ε
j
)
≠
0
,
i
不
等
于
j
cov(ε_i, ε_j)≠0, i不等于j
cov(εi,εj)=0,i不等于j,如果我们估计的模型
c
o
v
(
ε
i
,
ε
j
)
≠
0
,
i
≠
j
cov(ε_i, ε_j)≠0, i≠j
cov(εi,εj)=0,i=j时,就出现了自相关问题。
1.2.自相关的原因
- 变量本身带有趋势
我们通常研究的时间序列自身就是带有一定趋势的,比如 y t y_t yt和 y t − 1 y_{t-1} yt−1本身就存在一定关系(此时可试试AR模型),此时就会出现异方差问题。 - 变量的之后效应
通常,一个变量对另一个变量的影响并不会在当期表现出来,往往需要之后一期或几期才会表现出来,如果忽视了这些之后效应,模型也可能出现自相关问题。 - 模型设定偏差
如果我们的模型设定存在偏差,比如真实模型为:
Y i = β 0 + β 1 ∗ x 1 i + β 2 ∗ x 2 i + β 3 ∗ x 3 i 2 + u i Y_i=β_0+β_1*x_{1i}+β_2*x_{2i}+β_3*x_{3i}^2+u_i Yi=β0+β1∗x1i+β2∗x2i+β3∗x3i2+ui
我们建模时,建立的模型为
Y i = β 0 + β 1 ∗ x 1 i + β 2 ∗ x 2 i + + v i Y_i=β_0+β_1*x_{1i}+β_2*x_{2i}++v_i Yi=β0+β1∗x1i+β2∗x2i++vi
此时 v i = β 3 ∗ x 3 i 2 + u i v_i=β_3*x_{3i}^2+u_i vi=β3∗x3i2+ui, v i v_i vi包含了 x 3 i 2 x_{3i}^2 x3i2上一篇: DW统计值的上下限参考表格
下一篇: 回归实践:深入理解临床模型的第一步