-
缩尾
1. capt prog drop
_all
//
如果内存中存在
do<
/p>
文件,请清除;没有,请继续
2.
prog vw
//
将此
do
文件命名为
vw
3. set more off
//
自动翻屏到最后一页
4. cd d:data
//
变化
目录到
d
,
(把文件默认目录存到
p>
d
盘)
5.
import excel
//
输入
表格,表单
<
/p>
(分析表格中的表单
BS
行变量)
6. global v Divrecv
Othrecv
Invtr
//
global
全局宏,
v
指变量
Divrecv
,
Othrecv<
/p>
,
Invtr
(这三个变量为数值型变量
)
7. foreach x of varlist
$$v{
//foreach
指循环,
x
泛指变量中的每一个
,$$
用
p>
来限定
v
变量里的
winsor `x',gen(w`x') p(0.05)
//winsor
变量名,前空两格。对
x
按
5%
进行缩尾,并生成以
w
开头的
x
。
}
8. g d=(Divrecv!=wDivrecv)
/
/g
指
generate:
生成一个新
的虚拟变量
d
,如果
D
不等于缩尾
后的
D
,则
d
产生数值
1
,否则产生数值
0.
9. l Comcd
H_stkcd Divrecv
wDivrecv if d==1
//l
指
list
列示表格中的其他
变量
,replace
//
保存数据集
replace
:覆盖以前的数据集(如果
以前有的话)
excel
//
再把
数据集输出,制成新表格,以
命名,并
在表格中的
表单中
列示。
1.
****************
回归分析
************************
2. /********
吴良海,
2014/09/25 *********/
3. capt prog drop _all
//
如果内存中存在
do
文件,请清除;没有,请
继续
4. prog REG
//
将此
do
文件命名为
< br>REG
5. set more off
//
自动翻屏到最后一页
6. sysuse auto,clear
//
调入数据集,并清除
7. tabstat price-forei,stats(n min mean
median sd max) ///
columns(statistics)
format(%6.0g)
//
统计(
sabstat
)变量
Noterecw
到
Advp
ay,
需以下要数据(观
测值、最小值、平均值、终值、标准差
、最大值)列出数据,数据显示的格式按
6.0g
8.
corr price-forei
//
计算之间的相关系数
,
corr
指皮尔逊乘积距相关系数
9.
pwcorr
price-
forei,sig
star(0.10)
//pwcorr
指配对相关系数,
sig
指显著性。配对相关系数(
price
到
forei
)
,
相关系
数
P
值如果小于
0.10
请加星。
an price-
forei,stats(rho p) star(0.10) sidak mat
//description
sidak
指可选项,
mat
即
mat
rix
指报告方式为举证方式。斯皮尔曼相关系数
(定序变量)
v weight length
//global
全局宏,
v
指变量
w
eight
、
length
为变
量
h x of varlist
$$v{
//foreach
指循环,
x
泛指变量中的每一个
,$$
用
p>
来限定
v
变量里的
winsor `x',gen(W`x') p(0.1)
//winsor
变量名,前空两格。产生新变量,
在
0.1%
的位置上缩尾
}
13./*regression*/
price Wweight Wlength foreign,nocons
beta
//nocons
指无截距,
beta
指标准化值的大小,抽
掉量差的差异,将三个变量
对
price
的影响进行比较。
reg
指回归,
price
为被解释变量
p>
,Wweight
指对变
量
weight
进行缩尾
。
store OLS
//est
指
估计,把回归的结果
OLS
保存起来。
tab OLS,stats(r2 r2_a N F) star(0.1
0.05 0.01) b(%9.2f)
//tab
指表格
,
star
指把回归的数
居加星,
p>
%9.2f
为系数格式。请以表格形式来报告
OLS
,把(
r2,
调整的
r2
,观测值,统计量)几项数据报
告出来。<
/p>
price Wweight Wlength
foreign,beta
//
方
差膨胀因子,经验值不超过
10
,解决多元共线性。
c Wweight Wlength
h
y of varlist $$c{
sum `y',detail
g C`y'=`y'-r(mean)
//
对中处理,新变量
=
原始变量
-
均值
g
C`y'2=C`y'^2
//
新变量
2
次方
=
对中后的值的乘方,
p>
`y
’变量,是一个宏
(
< br>经
常变化
)
}
price CWweight CWweight2 CWlength
CWlength2 foreign,beta
分组回归
1. capt prog
drop REGG
2. prog REGG
3.
set more off
4. sysuse auto,clear
//
调入数据集,并清除
5. by foreign,sort:reg price weight
length,robust
//sort
指排序,把分
组变量排序,
robust
指稳健回归,请你区分国产、进口车,并分别进行回归。
6.
qui sum
price,detail
//qui
静默执行,在结果窗口
处不显示,
sum
描述性
统计。取得均值和中位数,根据价格把车分为高价位和低价位。
7. return list
//r
类命名有哪些宏
8. g group1=price>r(mean)
//
如果
price
变量的每个值和均值比
较,产生分组
变量,命名为
group1.
9.
g group2=price>r(p50)
//
产生分组
变量,命名为
group2.
group1,sort:reg price weight length foreign,robust
beta level(90)
//
做分组回归(第一组回归)
,执行区间设置为
90
p>
,
(不设置系统默认为
95
)
group2,sort:reg price
weight length foreign,robust
//
第二组回归
values group2 group2lbl
//
给变量取值做标签(标签名为
group2lbl
)
,即对
group2lbl
作标签
13.
label define group2lbl 0
低于价格中位数
高于价格中位数
//
对
group2lbl
定义作标签
group2,sort:reg price weight length foreign,robust
pct_price=price,nq(3)
genp(pctx)
//pctile
指产生百分位数,<
/p>
nq(3)
指分位数的数量(请提
供
p>
3
分位数
)
,
p>
genp(pctx)
指产生新的变量(请保存分为数值)
。把
price
变量用(
1,2,3
)这样的标识进
行标识,以显示
price
在那个位置
priceq=price,nq(3)
//xtile
指列联表
foreign priceq,c(mean mpg)
format(%5.2f)
//c
指内容,请报告
mpg
这个变量的均值
priceq,sort:reg price weight length foreign,robust
priceq,sort:reg price weight length
foreign,robust nocons
20.g
price_low=mpg if group2==0
//
产生两个新变量检验,每加仑汽油所跑里
程数是否有显著差异。低价车的
mpg
做变量
p>
21.g price_high=mpg if
group2==1
//
高价车的
m
pg
做变量
price_low=price_high,unp une
//unp
指
unpair
非配对,
unp
指不
相等。这两个新产生的变量是否相等(两组是否存在异方差)
。
23.g price_domestic=price
if foreign==0
24.g price_foreign=price
if foreign==1
price_domestic=price_foreign,unp une
foreign,sort:ttest price_low=price_high,unp une
mpg group2 //anova
做方差分析,
va
指
variety
mpg foreign
mpg priceq
/**********
异方差:多元线性回归模型的
FGLS
回归
************/
/****
**
吴良海,安徽工业大学商学院会计系
**
****/
/********
*********
*
2014/10/11
*
***************/
cap prog drop fgls
prog fgls
note:
当误差结构未知时,可行的
FGLS
回归
set more
off
#delimit
sysuse
auto,clear;
reg price weight length
foreign,noc /*OLS
回归
*/
imtest,white
/*
怀特检验,零假设为同方差
*/
predict r,res;
g
lnr2=ln(r^2);
reg lnr2 weight length;
predict plnr2;
g
w=exp(plnr2);
reg price weight length
foreign[aw=1/w],noc
/*FWLS
回归
*/
reg
price weight length foreign,robust noc
/*
稳健回归
*/
wls0 price weight length
foreign,wvar(weight length) type(loge2) nocons
graph;
#delimit cr
end
fgls
//
回归步骤:
//1.
对原方程用
OLS
进行估
计,得到残差项的估计
r;
//2.
计算
ln(r^2);
p>
//3.
用
ln(r^2)
对所有独立的解释变量进行回归,然后得到拟合值
plnr2;
//4.
计算权数
w=exp(plnr2); <
/p>
//5.
用
1/w
作为权重,做
WLS
回归。
1.****
干扰项序列相关(自相
关)的
GLS
估计
********/
2. ***
吴良海,安徽工业大学商学院会计系,
2014/10/16***
3. cap prog drop ar
//
如果内存中存在
do
文件,请清除,如果没有,请继
4. prog
ar
//
命名一个以
ar
为名的
do
文件
5. version 13.0
6. set more
off
//
自动翻屏到最后一页
7. use D:data10.17friedman2,clear
//
请调入系统中自带的数据集
8. drop if m1==.
//
如果
m1
这个变量等于缺失值
,请删除。
9. tsset
time
//time
为时间变量,
tsset
时间序列设置。
h
var of varlist cons m1 m2{
//
对三个变量
cons m1
m2
做循环。
11.
g
ln_`var'=ln(`var')
//
对上述三个变量
产生它的对数值,
var
是宏的
名字。
12.
g
dln_`var'=_`var'
//D1
表示一阶差分。
先有上述变量,才能进行
差分。
计算三个变量对数的一阶拆分。
13.}
//
一阶拆分表示为
D
,二阶拆分表示
为
D2.....
reg consump m1 m2
//consump
被解释变量
和货币突发量
m1m2
之间的
关系。
m1m2
是否影响
consump?
程度?
qui
静静的,
结果窗口不显示运行结果。
15.
dwstat
//Durbin Watson
检验,
2
为标准值,如果得到很小的数,说明存
在序列相关。
D
W
为人。检验一阶自相关,不能检验高阶自相关。
list
//
列示内存中保存的那些值。
//
计算一阶自相关系数,
dw~=2(1-rho)
dw
代表
德斌沃森检验
?
dis
为
display
显示,
rh
o
为相关系数表达式。
ln_consump ln_m*
//
原始数据对数形式的序列相关检验
reg
dln_consump dln_m*
//
原始数据对数
差分形式的序列相关检验
/*
进行单位根检验,判断序列平稳性
*/
h var of varlist consump m1
m2 ln_consump ln_m1 ln_m2{