-
Stata:
输出
regression table
到
word
和
excel
1.
安装
estout
。最简单的方式是在
stata<
/p>
的指令输入:
ssc install
estout, replace
EST
安装的指导网址是:
/bocode/e/estout/
2.
跑你的
regression
3.
写下这行指令
esttab
using
,
然后就会出现个漂亮的表格给你
(
WORD
< br>文档)
。
只要再小幅修改,
就可
以直接用了。
这个档案会存在
my
d
ocumentstata
下。如果你用打开的是一个
stat
a do file
,结果会保存到
do
文件所在文件夹
中。如果要得到
excel
< br>文件,就把后缀改为
.xls
或者
.csv
就可以了
4.
跑多个其实也不难,只要每跑完一个
regression
,你把它取个名字存起来:
est store m1
。
m1
是你要改的,第一个
model
所以我叫
m1
,第二个的话指令就
p>
变成
est store
m2
,依次类推。
5.
运行指令:
esttab m1
m2 ... using
就行了。
异方差的检验:
Breusch-
Pagan test in STATA
:
其基本命令是:
estat hettest var1
var2 var3
其中,
var1 var2 var3
分别为你认为导致异方差性的几个自变量。是你自己设
定的一个
滞后项数量。
同样,
如果输出的
P-Value <
/p>
显著小于
0.05
,
则拒绝原假设,
即不存在异方差性。
White
检验:
其基本命令是在完成基本的
OLS
回归之后,输入
imtest
,
white
如果输出的
P-Value
显著小于
0.05
,则拒绝原假设,即不存在异方差性
< br>
处理异方差性问题的方法:
方法一:
WLS
WLS
是
GLS
(一般最小二乘法)的一种,也可以说在
异方差情形下的
GLS
就是
WLS
p>
。在
WLS
下,我们设定扰动项的条件方差
是某个解释变量子集的函数。之所
以被称为加权最小二乘法,
是
因为这个估计最小化的是残差的加权平方和,
而上
述函数的倒数
恰为其权重。
在
stata
中实现
WLS
的方法如下:
reg
(被解释变量)
p>
(解释变量
1
)
(解释变量
2
)……
[
aweight=
变量名
]
其中,
a
weight
后面的变量就是权重,是我们设定的函数。
p>
一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指
数函数。在
stata
中也可以方便地实现:
首先做标准的
OLS
回归,并得到残差项;
reg
(被解释变量)
(解释变量
1
)
(解释变量
p>
2
)……
predict r, resid
生成新变量
logusq
,并用它对所有解释变量做回归,得到这个回归的拟合值,
p>
再对这个拟合值求指数函数;
gen
logusq=ln(r^2)
reg logusq
(
解释变量
1)
(解释变量
2
)……
predict g, xb
gen h=exp(g) <
/p>
最后以
h
作为权重做
WLS
回归;
reg
(被解释变量)
(解释变量
1
)
(解释变量
2
)……
[aweight=h]
如果我们确切地知道扰动项的协方差
矩阵的形式,
那么
GLS
估计是最小方
差线性
无偏估计,
是所有线性估计中最好的。
< br>显然它比
OLS
更有效率。
虽然
GLS
有很多
好处,
< br>但有一个致命弱点:
就是一般而言我们不知道扰动项的协方差矩阵,
因而
无法保证结果的有效性。
方法二:
HC SE
There
are 3 kinds of HC SE
(
1
)
Huber-White Robust Standard
Errors HC1
,
其基本命令是:
reg var1
var2 var3, robust
White
(
1980
)
证明了这种方法得到的标准误是渐进
可用
(
asymptotically
valid
)
的。这种方法的优点是简单,而且需要的信息少
,在各种情况下都通用。缺点是
损失了一些效率。这种方法在我们日常的实证研究中是最
经常使用。
(
2
)
MacKinnon-White SE
HC2
,其基本命令是:
reg
var1 var2 var3, hc2
(
3
)
Long-Ervin SE
HC3
,其基本命令是:
reg
var1 var2 var3, hc3
约束条件检验:
如果需要检验两个变量,比如
x
与
y
,之间系
数之间的关系,以检验两者系数相
等为例,我们可以直接输入命令:
test x=y
再如检验两者系数之和等于
1
,我们可以直接
输入命令:
test x+y=1
如果输出结果对应的
P-Value
小于
0.05
,则说明原假设显著不成立,即拒绝原
假设。
序列相关性问题的检验与处理
序列相关性问题的检验:
首先,要保证所用的数据必须为时间序列数据。如果原数据不是时间序
列
数据,
则需要进行必要的处理,最常用的方法就是:
gen n=_n
tsset n
这两个命令的意思是,首先要生成一个时间序列的标志变量
n
(或者
t
也可以);
然后通过
tsset
命令将这个数据
集定义为依据时间序列标志变量
n
定
义
的时间序
列数据。
最直观的检验方式是通过观察残差分布,
其基本步骤是在跑完回归之后,
p>
直接输
入
Predict error, stdp
这样就得到了残差值;然后输入命令:
plot error n
会得到一个
error
随
n
变化的一个散点图。
D-W
检验——对一阶自相关问题的检验:
<
/p>
D-W
检验是对一阶自相关问题的常用检验方法,但是如果实际问
题中存在高阶
序列相关性问题,则不能用这个检验方法。
D-W
检验的命令如下:
首先,输入回归命令,
reg
Variable1 Variable2 Variable3…VariableM
输出一个简单的
OLS
估计结果。然后
,再输入命令:
dwstat
这时会输出一个
DW
统计量。通过与临界值之间的比较,可以得出结论。也可
以执行如下命令
estat
durbinalt
直接进行
Durbin
检验。
Breusch-GodfreyTest in
STATA
——
检验高阶序列相关性:
在得到一个基本回归结果和
error
之后,我们假设这样一个关系:
et = α0 + α1 et
-
1
+ α2 et
-
2 …+ αk
et
-
p + β1 x1t + β2 x2t … +βk
xkt
+εt
BG
检验的原假设是:
H0
:
α1 = α2 = … αp
=0
。
其基本命令是:
bgodfrey
, lags(p)
其中
p
是
你自己设定的一个滞后项数量。
如果输出的
p-value <
/p>
显著小于
0.05
,
则
可以拒绝原假设,这就意味着模型存在
p
阶序列相关性;如果输出的
p-value
显
著大于
0.05
甚至很大,则可以接受原假设,即不存在
p
阶序列相关性。
处理序列相关性问题的方法—
—
GLS
:
常用的几种
GLS
方法:
(
1
)
Cochrane-Orcutt estimator
和
Prais-Winsten estimator
其基本命令是
prais
var1 var2 var3, corc
(
2
)
Newey-West standard errors
其基本命令是
newey
var1 var2 var3, lag(3)
其中,
l
ag
(
3
)意思是对三阶序列相关性问
题进行处理;如果需要对
p
阶序列
相
关
性问题进行处理,则为
lag
(
p
p>
)
t<
/p>
因变量,
g,f,c
是自变量,
_26
存放了弟
26
个
观测值,为需要预测的值
reg t g f c if
_n!=26
点预测
predict taxpredict if _n==26
均值的区间预测
predictnl py=predict(xb),ci(lb ub)
l(95)
因变量的区间预测
adjust g=117251.9 f=24649.95
c=99.9,stdf ci level(95)
H
ausman
检验
是检验内生性的最常用的方法。它是通过比较
一致估计
量与有效估计量的
Wald
统
计量。
命令格式为:
.hausman name-constistent [name-
efficent] [,options]
其中,
name-
cosistent
指一致估计的结果,
name-
efficent
指有效估计的结果。
注意,一致、有效估计
量的先后顺序不能改变。
Option
选项:
constant
计算检验统计量将常数也包括在内,默认值为排除常数
allegs
利用所有方程进行检验,默认只对第一个方程进行检验
skipeqs(eqlist)
eqlist
只能以方程名称而不能以方程序号表示
equation(matchlist)
比较设定的方程。
force
即使假设条件不满足仍进行检验
df(#)
默认值为一致估计与有效估计的协方差矩阵的差的估计
sigmamore
协方差矩阵采用有效估计量的协方差矩阵
sigmaless
协方差矩阵采用一致估计量的协方差矩阵
tconsistent(string)
一致估计量的标题
tefficient(string)
有效估计量的标题