-
百度文库
第三章
一元经典线性回归模型的基本假设与检验
问题
<
/p>
TSS,RSS,ESS
的自由度如何计算?直观含义是什么?<
/p>
答:对于一元回归模型,残差平方和
R
SS
的自由度是
(
n
< br>?
2)
,它表示独立观察值的个数。
?
和
?
?
,
n
个残差
对于既定的自变量和估计量
?
1
2
p>
?
?
?
?
X
?
i
< br>?
Y
i
?
?
u
i
2
i
必须满足正规方程组。因此,
n
个残差
中只有
(
n
?
2)
个可以“自由取值”
,其余两个随之
确定。所以
RSS
的自由度是
(
p>
n
?
2)
。
TSS
的自由度是
(
n
?
1)
:
n
个离差之和等于
0
< br>,这意味着,
n
个数受到一个约束。
由于
TSS=ESS+RSS
,
回归平方和
ESS
的自由度是
1
。
为什么做单边检验时,犯第一类错误的概率的评估会下调一半?
答:选定显著性水平
?
之后,对应的临
界值记为
t
?
/2
,则双边检验的拒绝区域为
|
t
|
?
t
?
/2<
/p>
。
单边检验时,
对参数的符号有先验估计
,
拒绝区域变为
t
?
< br>t
?
/2
或
t
?
?
t
?
/2
,
故对犯第
I
类错
误的概率的评估下下降一半。
常常把高斯
-
< br>马尔科夫定理简述为:
OLS
估计量具有
BULE
性质,其含义是什么?
答:含义是:
(
1
)它是线性的(
linear
)
:
OLS
估计量是因变量的线性函数。
(
2
)它是
无偏的(
unbiased
)
:估计量
的均值或数学期望等于真实的参数。比如
p>
?
)
?
?
。
E
(
?
2
2
(
< br>3
)它是最优的或有效的(
Best or effic
ient
)
:如果存在其它线性无偏的估计量,其方差必
定大于
OLS
估计量的方差。
做显著性检验时,针对的是总体回归函数(
PRF
)的系数还是样本回归函数(
SRF<
/p>
)的系
数?为什么?
< br>答:做显著性检验时,针对的是总体回归函数(
SRF
)
的系数。总体回归函数是未知的,也
是研究者所关心的,
所以只
能利用样本回归函数来推测总体回归函数,
后者是利用样本数据
计算所得,是已知的,无需检验。
1
百度文库
(习题)
以下陈述正确吗?不论正确与否,请说明理由。
(
1
)
X
< br>值越接近样本均值,斜率的
OLS
估计值就越精确。
p>
?
)
答:错误。
因为
se
(
?
2
?
n
?
?<
/p>
x
i
2
?
1
?
x
i
2
?
i
2
u
?
?
n
?
2
,当
X
值越接近样本均值时
?
)
变大。标准
差的变大致使
x
i
?
< br>X
i
?
X
将会变小,则
?
x
i
2
也将变小,这将会导致
se
(
?
2
i
?<
/p>
1
OLS
估计值波动更大,
OLS
估计值也变得更不精确了。
(
2
)如果误差项
u
与自变量
X
相关,则估计量仍然是无偏的。
p>
答:错误。在证明估计量是无偏性的时候,我们假定自变量是给定
的,否则
?
)
?
?
?
?
k
E
(
u
)
?
p>
?
的第一个等式不成立。
E
(
?
2
2
i
i
2
(
3
)仅当误差项服从正态分布时,估计量才具有
BLUE
性质。
答:错误
,在证明高斯
-
马尔科夫定理时,无需假设误差项服从正态分布
。
(
4
)如
果误差项不服从正态分布,则不能进行
t
检验和
F
检验。
答:正确。在证明
相关统计量服从学生分布和
F
分布时,需要假设误差项服从正态
分布。
(
5
)如果误差项的方差较大,则置信区间较宽。
答:正确。因为
当误差项变大时,置信区间的表达式:
?
?
se
(
?
?
)
?
t
?
?
?
?
?
?
p>
se
(
?
?
)
?
t
中,
可知区间长度更大,
从而可知置信
?
2
2
?
/2
2
2
2
?
< br>/2
区间将会变宽。
(
6
)如果自变量方差较大,则系数的置信区间较窄。
< br>
答:正确。因为自变量的方差较大,则系数估计量的方差较小。以一元回归方程
为例:
?
)
?
se
(
?
2
?
?
x
i
p>
2
?
1
?
x
i
2
?
i
2
u
?
< br>?
n
?
2
系数估计量的方差随自变量方差的增加而增加。
(
7
)
p
值较大意味着系数为零的可能性小。
答:错误。<
/p>
P
值就是当原假设为真时样本观察结果对应的统计值出现的概率,
p
值较则拒绝
原假设成立的可能性越大
,也就是说系数为
0
的可能性也就越大。
(
8
)如果选择的显著性水平较高
(
p
值较小)
,则回归系数为显著的可
能性较大。
答:正确。当选择的显著性水平较高时,容许犯第
I
类错误的概率上限将会下降,这使得我
们断言“回归系数显著”的可能性也越小。
2
百度文库
(
9
)如果
误差项序列相关或为异方差,则估计系数不再是无偏或
BLUE
。
答:
错误。
当误差项序列相关或为异方差时,
估计系数依然是无偏的,
但
是不再具有有效性,
同时线性性也是满足的。
(
10
)
p
< br>值是零假设为真的概率。
答:错误。
< br>P
值是当原假设为真时我们拒绝原假设的概率。
以下是商品价格
P
< br>和商品供给
S
的数据:
P
2
7
5
1
4
8
2
8
S
15
41
32
9
28
43
17
40
< br>?
s
2
?
1025,
?
p
2
?
55.9,
?
ps
?
255.4
其中
小写字母表示离差(观察值减去均值)
。
(
1
)估计
OLS
线性回归方程
E
(
S
)
?
?
1
?
?
2
P
< br>。
(
2
)估计
?
1
,
?
2
的标准差。
< br>(
3
)检验假设:价格影响供给。
(
4
)求
?
1
的置信度为
95%
的置信区间。你对置信区间有何评论?
答:
(
1
)
P
?
?
P
?
< br>4.625
S
p>
?
?
S
i
i
8
8
?
28.125
?
i
?
1
x
i
y
i
?
?
Y
?
?
?
X
,可得
?
由系数估计公式:
?
2
?
,
?
1
2
n
2
x
?
< br>i
?
1
i
?
?
?
2
n
?
ps<
/p>
?
255.4
?
4.57
?
?
?
p>
p
55.9
2
1<
/p>
?
S
2
P
?
28.125
?
4
.57
?
4.625
?
6.99
可得估计的回归方程为:
E
(
S
)
?
?
1
?
?
< br>2
P
?
6.99
?
4.57
P
2
2
?
X
< br>u
?
?
i
i
?
)
?
?
(
2
)由于总体方差未知,则
se
(
?
=
1
p>
2
n
?
2
n
?
x
i
?
)
?
se
(
?
2
1
?
x
i
2
?
i
2
u
?<
/p>
?
=0.3352
n
?
2
(
3
)假设:
H
0
3
:
?
2
?
0
,则
百度文库
?
?
?
)
se
(
?
2
2
p>
?
?
2
?
13.63
t
,而对
于当前样本,
?
se
(
?
2
)
6
利用
Excel
计算可得:
p>
Pr
ob
.(
t<
/p>
6
?
13.63)
?
9.6845
E
-06
这说明,在一次抽样中,统计量绝对值大于等于的概率非常非常小,几乎
不会发生。所以,
我们拒绝原假设:
H
0
:
?
2
?<
/p>
0
,则说明价格影响供给。
?
?
se
(
?
?
)
?
< br>t
?
?
?
?
?
?
se
(
?
?
)
?<
/p>
t
(
4
)由置信区间公式:
?
1
1
?
/
2
1
1
1
?
/<
/p>
2
这
里
?
?
5%
,
对
于
本
题
,
自
由
度
为
< br>n
?
2
?
6
,
则
t
?
/
2
?
2.4
47
.
已
知
?
?
6.99
,
se
(
?
?
)
?
1.786
,故
?
1
1
2.6197
?
?
< br>1
?
11.3603
这也就是说
?
2.6197,11.3603
?
由
95%
的可能性包含
?
1
。
【不能说:
?
1
有
95%
的可能性落在
区间
?
2.6197,11.3603
?
内】
已
知
Y
和
X
满足
如下的总体回归模型:
Y
(
1
)根据
Y
和
X
的
5
对观测值计算出:
?
?
p>
1
?
?
2
X
?
u
?
X
?
55,
?
Y
?
15,
?
x
2
?
p>
74,
?
y
2<
/p>
?
10,
?
x
y
?
27
n
利用最小二乘法估计
?
1
,
?
2
。
< br>
?
i
?
1
x
i
y
i
27
?
?
0.
3649
答:
?
2
?
=
n
2
?
i
?
1<
/p>
x
i
74
?
p>
?
Y
?
?
?
X
?
1
2
=
3
?
< br>0.3649
?
11
?
?
3.0139
(<
/p>
2
)经计算,该回归模型的残差平方和
R
SS
为。计算判定系数,并估计回归标准误
?
< br>。
答:
R
2
ESS
RSS
1.4
?
?
1
?
?
1
?
?
0.86
TSS
TSS
10
2
?
X
i
2
?
?
(
x
i
?
X
)
?
?
x
i
2
?
nX
2
?
74
?<
/p>
5
?
11
2
p>
?
679
4
百度文库
2
2
?
X
u<
/p>
679
1.4
?
?
i
i
?
se
(
?
1
)
p>
?
?
?
?
?
0.922
2
p>
n
?
2
5
?
74
3
n
?
x
i
?
)
?
se
(
< br>?
2
1
2
x
?
i
?
i
2
u
?
?
p>
?
n
?
2
1.4
?
0.0794
3
?
74
<
/p>
假设某人利用容量为
19
的样本估计了消
费函数
C
i
?
?
?
?
Y
i<
/p>
?
u
i
,并获得
下列结果:
?
p>
?
15
?
0.81
Y
C
i
i
p>
t
?
(3.1)(18.7)
R
?
0.98
2
(
1
)计算参数估计量的标准差。
(
2
)构造
?
的
95%
的
置信区间,据此检验
?
的统计显著性。
?
< br>?
?
)
?
0.81
?
0.0433
?
18.7
可得:
se
(
?
答:
(
1
)
?
)
18.7
se
(
?
?
?
15
?
)
?
?
3.1
可得:
se
(
?
?
4.8387
< br>
?
)
3.1
< br>se
(
?
?
?
se
(
?
?
)
?
t
?
?
?
?
?
p>
?
se
(
?
?
)
?
t
,可得:
(
2
)由置信区间公式:
?
?
/
2
?
/
2
0.7186
?
?
?
0.9014
,原点没有包含在置信区间内,故
?
是统计显著性的。
已经得到如下回归方程:
?
?
0.2033
?
0.
6560
X
Y
se
?
(0.0976)
(0.1961)
R
2
?
0.397 ESS=0.0544 RSS=0.0358
其中
Y
?
1972
p>
年妇女的劳动参与率(
LFPR
)
,
X
?
1968
年妇女的劳动参与率。该回归结
果来自于美国
19
个城市构成的数据样本。
(
p>
1
)你如何解释该结果?
(
2
)在对立假设为
H
1
:
?
2
使用什么检验?为什么?
(
3
)假设
1968
年的
LFPR
为(或
58%
)
,基于上述回归结果,
1972
年的<
/p>
LFPR
的均值的估
计值是多少?构造其
真实均值的
95%
的置信区间。
p>
(
4
)如何检验总体回归误差项服从正态分
布的虚拟假设?
答:
(
1
)由可决系数可知,
两个年度的劳动参与率有一定
程度的相关性,
但相关程度不是很
高。直观地说,劳动力参与率
存在一定的惯性。
?
1
的前提下,检验
H
0
:
p>
?
2
?
1
的虚拟假设(零假设)
。你
5
-
-
-
-
-
-
-
-
-
上一篇:荷塘月色两种英文翻译版本
下一篇:英语环保标语大全