-
1.
ADF
单位根检验
2.
Engle-
Granger
协整检验
3.
Da-
vdson
误差修正模型
4.
Granger
因果关系检验
1
、简单回归;
2
、工具变量回归;
3
、面板固定效应回归;
4
、差分再差分回归
(difference
in differnece)
;
5
、狂忒二回归
(Quantile)
。
大杀器就这几种,
破绽最少,
公认度最高,
使用最广泛。
真是所谓的老少皆
宜、
童叟无欺。
其他的方法都不会更好,
只会招致更多的破绽。
你在
STATA
里面
还可以看到无数的其他方法,
例如
GMM
、随机效应等。
GMM
p>
其实是一个没有用的
忽悠,例如估计动态面板的
diffGMM
,其关键思想是当你找不到工具变量时,用
滞后项来做工具变量。
结果你会发现令人崩溃的情况:
不同滞后
变量的阶数,
严
重影响你的结果,更令人崩溃的是,一些判断估
计结果优劣的指标会失灵。这
GMM
的唯一价值在于理论价值,
而不在于实践价值。你如果要玩计量,你就可以
在
GMM
的基础上进行修改(玩计量的方法后面讲)
。
有人会问:简单回归会不会太简单?我只能说你真逗。
STATA
里面那么多选项,
你加就是了。<
/p>
什么异方差、
什么序列相关,
一大堆尽管
加。
如果你实在无法确定
是否有异方差和序列相关,
那就把选项都加上。
反正如果没有异方差,
结果是
一
样的。有异方差,软件就自动给你纠正了。这不很爽嘛。如果样本太少,你还能
加一个选项:
bootstrap
来估计方差
。你看爽不爽!
bootstrap
就是自己把脚抬
起来扛在肩上走路,
就这么牛。
这个
bootstrap
就是用
30
个样本能做到
30
万样
本那样的效
果。
有吸引力吧。
你说这个简单回归简单还是不简单!
很简单,
就是
加选项。可是,要理论推导,就不
简单了。我估计国内能推导的没几个人。那些
一流期刊上论文作者,最多只有
5%
的人能推导,而且大部分是海龟。所以,你
不需要会推导,也能把计量做的天花乱坠。
工具变量
(IV)
< br>回归,
这不用说了,
有内生性变量,
就用这个吧。
一旦有内生性变
量,
你的估计就有问题了。
国际审稿人会拼了老命整死你。
国内审稿
人大部分不
懂这东西(除了经济研究季刊等等这类刊物的部分审稿人以外)
。工具变量的选
择只要掌握一个关键点就行:
找一个
和内生性变量有数据相关的,
但是和残差没
有关系的东西,这就
是你的
IV
了。例如贸易量如果是内生的,那么你找地理距
p>
离作为
IV
。北京到纽约的距离,那是自然
形成的,没人认为是由你的
Y
或者残
差
导致的。
但是你会发现贸易量和地理距离在数据上具有相关性。
这就很好。
这
种数据相关性越强,
IV
的效果就越好。就这么一段话,
IV
变
量回归就讲完了。
在
STATA
里面,
你直接把原回归方程写出来,然后把
IV
填进去就可以了,回车
就得到你的结果。
关键是你不一定能找到这样的工具变量。
p>
你能找到,
这个工具
也不大能用。不过要注
意,
IV
不灵不代表你不能发表。你只要找到一个
IV
,效
果不是差的太离谱,
一般都能发。
当然不能发国际一流了。
国内是没问题。
国内
审稿人没人会重复你的结果看看是否有问题,因此你说这个
IV
效果已经是最好
的了,世界上还找不到第
二个比这个更好的了,审稿人也没的话说。就发表呗!
如果审稿人说,另外一个
IV
效果可能要比你的好。那你就采纳他的建议用他的
< br>IV
(尽管他的建议会更差)
,然后感谢他一下。第二次
审稿,难道他还会说自己
上次是胡说八道???所以就发表了,哈哈哈哈!
有人又会问:
面板不是
还有个随机效应嘛?我只能说,
你是看过书的人,
所以才
知道随机
效应。
其实
随机效
应压根
就没什
么用处
。有
人信誓
旦旦说
可以用
hausman
来检验。我只能告诉你,这检验压根就不可靠。
可靠也是理论上可靠,
实践上根本没人信。
当然中国人都信,<
/p>
不信的都是美国欧洲这样的计量经济学家。
你难道不知道
hausman
还会出现负值!
做过这个检验的
人都很头疼这个负值,
不
知道该怎么做。
你如果看看一些高手的建议,
或者一些书籍,
你就会发现,<
/p>
最权
威的建议就是:
当你无法判断该用固
定效应还是随机效应的时候,
选择固定效应
更可靠。随机效应不
是任何时候都可以做,但是固定效应是任何时候都可以做。
所以你知道该怎么做了吧。<
/p>
差分再差分
(Difference-in-Differen
ces)
,或者叫作差差分法、双差分法,是
固定效应的一个变
种,
在估计某个事件发生带来的效应时最有用的方法,
特简单。
关键思想是通过差分的方法把相同的固定效应差分掉,就剩下来事件的净效应
了。
举一个例子你就明白怎么回事了。
大家都知道
买房子靠不靠学校医院等设施
还是有很大差别的。
ZF
为了拉动某个地方的房价,直接把地铁建到那里。但是
你不知道这种设施
到底导致价格有多少差别。你看到学校旁边的学区房价格上
升,
难道一定是学区房因素导致的吗?北京房价一直飙升,
很可能是学区房以外
的因素导致的。
现在你要检验一个假设:
学区房因素
导致房价上升。
差分再差分,
这个方法要凑效的秘诀是:
学区房因素发生变化,
而其他因素基本维持不变。
例
如
ZF
重新划分学区,一个著名
小学突然在某个没学校的地方建分校,或者一个
著名小学搬迁,这些因素导致房子是否属
于学区房发生了变化。以建分校为例。
建校后周围一片区域
A<
/p>
的房子都属于学区房,这个区域以外附近区域
(B)
的其他
房子就不算该校学区房。然后收集建校前后两个时间点上、
A
和
B
区域房价的数
p>
据。所谓的差分再差分法,就是:
A
区域两
个时间点上的平均房价差距
-
B
区
域
两时间点上的平均房价差距
=
d
,这个
d
就是建校对房价的影响了。<
/p>
d
是两个差
距之间的差距,
所以才叫做差分再差分。
用计量回归把这个
d
给估计出来,
是有
办法的:
< br>
——————
P= b0
+ b1*Da + b2*Dt + d*(Da*Dt) + Xb + e
P
是房价,
Da
是虚拟变量,在区域
A
则为
1
,否则为
0
,
p>
Dt
是时间虚拟变量,
建校后为
1
,建校前为
0
。
p>
STATA
一跑,就把
d
估计出来了。为什么
d
可以如此
表示?自己思考一下啦。实在想不出来,
Wooldridge
的书上有精确严格的解释。
这里给出一个直观的粗略解释:
北
京所有区域的房价每个月都在上升,
因此需要
控制这部分因素,
这就是时间因素
Dt
;区域不同自然也有差别,需要控制区域<
/p>
位置因素,
这就是
Da
< br>,
这就控制了即使不建校也存在的差距;
控制住其他因素
X
,
那么剩下的
Da*Dt
就是建校带来的房价提升效应了。这下明白了哦。
狂忒二
回归
(Quantile)
是一般均值回归的一个推广。
看名字挺吓人,
其实很简单。
如果你知道
p>
OLS
是一个均值回归,
那类推就可以知道
1/2
分位数回归。
你知道的,
正态分布下,
均值就是
1/2
分位数的地方。
均值回归就是
1/2
< br>分位数回归。
知道
了
1/2
p>
回归,
你自然知道
1/4
< br>和
3/4
分位数回归了。
如果还
不懂,
翻开伍德里奇
的书,
讲到简单<
/p>
OLS
回归时,
我记得有一个图,
上面对不同位置的
x
位置画了不
同的正态分布密度函数
(
第
2
版是
figure 2.1
,
pp26
,见下面
)
。如果是异方差
问题,
那么不同
x
p>
位置的正太分布图的方差就有变化。
这个图上注明了预测值是
E(Y|X)
,就是
Y
的条件期望,就是那根回归预测直线啦。在正态分布下就是
Y
的密度函数的中心点的连线,
就是
1/2
分位数点的连线。
如果那条预测线画在密
度函数的
1/4
和
3/4
分位数点
上,
那么预测结果就不是
Y
的均值
p>
(在非正态下可
能是均值)
,而是
1/4
和
3/4
分位数
点的预测值。这下明白狂忒二回归了吧。分
位数回归就是看看那根预测直线在不同的分位
数点上有什么结果
,
得到什么样的
回归
系数。
通常的
OLS
预测直线,
仅仅是一个特例而已。进一步推广,
可以推广
到任意分位数点回归的情况。道理一样。
< br>quantile
回归还可以推广到带
bootstra
p
的
quantile
回归哦,
想起来是不是很
过瘾啊???道理还是一样的,
具体怎样操作,
耐心往下看,
到最后有
quantile
的速成秘诀哦,包你
10
< br>分钟能在
STATA
里面跑出
q
uantile
回归来。
p>
伍德里奇《计量经济学导论
——
现代观点》
的图
2.1
(解释
Quantile<
/p>
回归的意义)
不过要注意,大杀器要用对。有内生性变量,你就不要用简单回归了,你得用
IV
p>
回归。
这几种大杀器的精髓一领会,
基本上
其他东西就难不倒你了。
就是
STATA
-
-
-
-
-
-
-
-
-
上一篇:高考励志英文句子
下一篇:美剧中常见的俚语口头禅