-
Stata
命令
1
主成分估计
Stata
可以通过变量进行主成分分析,
也可以直接通过相
关系数矩阵或协方
差矩阵进行。
(<
/p>
1
)
sysuse
auto,clear
pca trunk weight length
headroom
pca trunk weight length
headroom, comp(2) covariance
(
2
)
webuse
bg2,clear
pca bg2cost*, vce(normal)
2 Estat
estat
给出了几个非常有用的工具,包括
KMO
、<
/p>
SMC
等指标。
Kaiser-Meyer-Olkin
(
KMO
)
,
是用于测量变量之间相
关关系的强弱的重要指
标,
是通过比较两个变量的相关系数与偏
相关系数得到的。
KMO
介于
0
于
1
之间。
KMO<
/p>
越高,
表明变量的共性越强。
如果偏相关
系数相对于相关系数比较高,
则
KMO
比较低,主成分分析不能起到很好的数据约化效果。根据
Kaiser
< br>(
1974
)
,一般
的判断标准如下:
0.00-0.49,
不能接受
(
unacceptable
)
;0.
50-0.59,
非常差
(
miser
able
)
;
0.60-0.69
p>
,勉强接受(
mediocre
)
;
0.70-0.79,
可以接受
(
middling
)
;<
/p>
0.80-0.89
,
比较好
(
meritorious
)
;
0.90-1.00,
非常好
(
marvelous
)
。
SMC
即一个变量与其他所有变量的复相关系数的
平方,
也就是复回归方程的
可决系数。
SMC
比较高表明变量的线性关系越强,共性越强,主成分分析就越合
< br>适。
根据
KMO
越高,
表明变量的共性越强和
SMC
比较高表明变量的线性关系越强,
共性越强,主成分分析就越合适。
webuse bg2,clear
pca
bg2cost*, vce(normal)
estat anti
estat kmo
estat loadings
estat residuals
estat smc
estat summarize
3
预测
Stata
可以通过
predict
预测变量得分、拟合值和残差等。
webuse bg2,clear
pca bg2cost*, vce(normal)
predict score fit residual q
< br>(备注:
q
代表残差的平方和)
4
碎石图
碎石图是判断保留多少个主成分的重要方法。命令为
screeplot
。
webuse bg2,clear
pca bg2cost*, vce(normal)
screeplot