-
-------------
X
检验
X<
/p>
2
检验是用途广泛的假设检验方法,
它的
原理是检验实际分布和理论分布的吻合程度。
主要用途有:两个及以上样本率(或构成比
)之间差异比较,推断两变量间有无相关关系,
检验频数分布的拟合优度。X
2
检验类型有:四格表资料X
2
< br>检验
(
用于两样本率的检验
)<
/p>
,行
×列表X
2
检验(用于两个及两个以上样本率或构成比的检验)
,
行×列
列联表X
2
检验(用
于计数资料的相关
分析)
。在
SPSS
中,所有
X
2
检验均用
Cros
stabs
完成。
Crosstab
ls
过程用于对计数资料和有序分类资料进行统计描述和统计推断。在分析时可
以产生二维至
n
维列联表,并计算相应的百分数
指标。统计推断则包括了我们常用的
X
2
检
验、
Kappa
值,分层
X
2
(
X
2
M-H
)
。如果安装了相
应模块,还可计算
n
维列联表的确切概率
(
Fisher's
Exact
Test
)值。
Crosstabs
过
程不能产生一维频数表(单变量频数表)
,该功能由
Frequ
encies
过程实现。
界面说明
2
【
Rows
框】
用于选择行
*
列表中的行变量。<
/p>
【
Columns
框】
用于选择行
*
列表中的列变量。
【
La
yer
框】
Layer
指的是层,
对话框中的许多设置都可以分层设定,
在
同一层中的变量使用相同的设置,
而不同层中的变量分别使用各自层的设置。
如果要让不同的变量做不同的分析,
则将其选入
L
ayer
框,并用
Previous
和
Next
钮设为不同层。
Layer<
/p>
在这里用的比较少,在多元回归中我
们将进行详细的解释。
【
Display clustered
bar charts
复选框】
显示重叠条图。
【
Suppress
table
复选框】
禁止在结果中输
出行
*
列表。
【
Statistics
】按钮
-------------
-------------
弹出
Statistics
对话框,用
于定义所需计算的统计量。
Chi-square
复选框:计算
X
值。
Co
rrelations
复选框:计算行、列两变量的
Pears
on
相关系数和
Spearman
等级
相关系数。
Norminal
p>
复选框组:选择是否输出反映分类资料相关性的指标,很少使用。
Contingency coefficient
复选框:即
列联系数,其值界于
0
~
1
之间;
Phi
and
Cramer's
V
复选框:这两者也是基于
X
2
值的,
Phi
在四格表
X
2
检验中界于
-1
~
1
之<
/p>
间,在
R*C
表
X
2
检验中界于
0
~
1
之间;
Cramer's V
则界于
0
~
1
之间;
Lambda
复选框:在自变量预测中用于反映比例缩减误差,其值为
1
时表明自变量预测应变
量好,为
0
时表明自变量预测应变量差;
Uncertainty co
efficient
复选框:不确定系数,以熵为标准的比例缩减误差,其值接近
1
时表
明后一变量的信息很大程度来自前一变
量,
其值接近
0
时表明后一变量的信息
与前一变量无
关。
Ordinal<
/p>
复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。
Gamma
复选框:界于
0
p>
~
1
之间,所有观察实际数集中于左上角和
右下角时,其值为
1
;
Somers'd
复选框:为独立变量上不存在同分的偶对中,同序对子数超
过异序对子数的比例;
Kendall's tau-b
p>
复选框:界于
-1
~
1
之间;
Kendall's t
au-c
复选框:界于
-1
~
1
之间;
Eta
p>
复选框:计算
Eta
值,其平方值可认为是
应变量受不同因素影响所致方差的比例;
< br>Kappa
复选框:计算
Kappa
值,即内部一致性系数;
Ri
sk
复选框:计算比数比
OR
值;
p>
McNemanr
复选框:进行
McNemanr
检验,即常用的配对计数资
料的
X
2
检验(一种非参检
验)
;
Cochran's and Mantel-Haenszel statistic
s
复选框:
计算
X
2
M-H
统计量
(分层
X
2
,
也有写为
X
2
CMH
的)
,可在下方输出
H
0
假设的
OR
值,默认为
1
。
【
Cells
】按钮
弹出
Cell
s
对话框,用于定义列联表单元格中需要计算的指标:
Counts
复选框组:是否输出实际观察数
(Observed)
和理论数(
Expected
)
;
Percentages
复选框组:是否输出行百分数(
Row
)
、列百分数(
Column
)以及合计百分数
-------------
2
-------------
(<
/p>
Total
)
;
Residuals
复选框组:
p>
选择残差的显示方式,
可以是实际数与理论数的差值
(
Unstandardized
)
< br>、
标化后的差值(
Standardized
,实际数与理论数的差值除理论数)
,或者由标准误确立的单元
格残差(
Adj.
Standardized
)
;
【
Format
钮】
用于选择行变量是升序还是降序排列。
分析实例
一、四格表资料的
X
2
检验
例
6.1
某医生用呋
喃硝胺和甲氰咪胍治疗十二指肠溃疡,
结果如下表,
问两种药物
治疗效果
有无差别?
组
别
愈合
未愈合
合计
有效率(
%
)
呋喃硝胺
54
8
62
87.09
甲氰咪胍
44
20
64
68.75
合
计
98
28
126
77.78
【建立数据文件】
p>
由于此处给出的是频数表(大部分资料都以这种形式给出)
,因此在
建立数据集时可以直接
输入三个变量:
行变量(分组变量)
:变量名取“
R
”
,变量值为
1=
< br>“呋喃硝胺组”
,
2=
“甲氰咪
胍组”
列变量(疗效变量)
:变量名
取“
C
”
,变量值为
< br>
1=
“愈合”
,
2=
“未愈合”
指示每个
格子中频数的变量:变量名取“
F
”
,
直接输入各个格子的频数。
所建立的数据集如下表。
然后用
Weight Cases
对话
框指定频数变量进行加权,最后调用
Crosstabs
过程进
行
X
2
检验。
R
C
F
44.00
8.00
1.00
1.00
54.00
1.00
2.00
2.00
1.00
-------------
-------------
2.00
2.00
20.00
【操作过程】
Data==>Weight Cases
(
对数据按频数进行加权
)
Weight Cases
by
单选框:选中
Freqency
Variable
:选入
F
单击
OK
钮
Analyze==>Descriptive
Statistics==>Crosstabs
Rows
框:选入
R
Columns
框:
C
Statistics
按钮:选中<
/p>
Chi-square
复选框,单击
Co
ntinue
钮
Cells...
按钮:
选中
Row
复选框,单击
Continue
钮
单击
OK
钮
【结果解释】
上题分析结果如下:
Case
Processing Summary
Valid
N
组
别
*
疗
效
126
Percent
100.0%
N
Cases
Miss
ing
Percent
0
.0%
Total
N
Percent
126
100.0%
首先是
有效记录数和处理记录缺失值情况报告,可见
126
例均为有效
值。
组
别
*
疗
效
Cro
sstabu
latio
n
疗效<
/p>
组别
呋喃硝胺
甲氰米胍
< br>Total
Count
% within
组别
Count
% within
组别
Count
% within <
/p>
组别
愈合
54
8
7.1%
44
68.8%
98
77.8%
未愈合
8
1
2.9%
20
31.3%
28
22.2%
Total
62
100.0%
64
100.0%
1
26
100.0%
上表为列出的四格
表,其中加入变量值和变量值标签,看起来很清楚。
-------------
-------------
Chi-Square Tests
Value
6.133
b
5.118
6.
304
6.084
126
df
1
1
1
1
Asymp. Sig.
(2-sided)
.01
3
.024
.012
.014
Exact
Sig.
(2-sided)
Exact
Sig.
(1-sided)
Pearson Chi-
Square
a
Continuity
Correction
Likelihood
Ratio
Fisher's Exact
Test
Linear-by-
Linear
Association
N of Valid
Cases
.018
.011
a.
Computed only for a 2x2
table
b.
0 cells (.0%) have
expected count less than 5. The minim
um
expected count is
13.78.
上表给出了一堆检验结果,从左到右为:检验统计量值
(Value)<
/p>
、自由度
(df)
、双侧近似概率
(.2-sided)
、双侧精确概率
(Ex
act
Sig.2-sided)
、单侧精确概率
(Exact Si
g.1-sided)
;从
上到下为:
Pearson
卡方(
Pearson
Chi-Square
即常用的卡方检验)
、连续性校正的卡方值
(Continuity
Corr
ection)
、对数似然比方法计算的卡方
(Likelih
ood
Ratio)
、
Fisher
's
确切概率法
(Fisher's Exact Test)
、
线性相关的卡方值
(Linear
by Linear Association)
、
有效记录数
(N of Valid
Cases)
。另外,
Continuity
Correction
p>
和
Pearson
卡方值处分别标注有
p>
a
和
b
,表格下方
为相
应的注解:
a.
只为
2*2
表计算。
b.0%
个
格子的期望频数小于
5
,最小的期望频数为
13.78
。因
此,这里无须校正,直接采用第一行的检验
结果,即
X
2
=6.133
,
P=0.013
。
<
/p>
因
P=0.013
,可以认为两种药物疗
效有差异,结合样本率,可以认为呋喃硝胺有效率高于甲
氰米胍。
如何选用上面众多的统计结果令许多初学者头痛,
实际上我
们只需要在未校正卡方、
校正卡
方和确切概率法三种方法之间选
择即可,其余的对我们而言用处不大,可以视而不见。
二、配对计数资料
X
2
检验
例
6.2
有
28
份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,
结果如下表,试检验甲、乙培养基生长率有无差别。
甲乙两种结核杆菌培养基的培养结果
乙培养基
甲培养基
+
—
合
计
+
11
9
20
—
1
7
8
合
计
12
16
28
【建立数据文件】
输入三个变量:
行变量(代表甲培养
基)
:变量名取“
R
”
,变量值为
1=
“生长”<
/p>
,
2=
“未生长”
列变量(代表甲培养基)
:变量名取“
C
”
,变量值为
1=
“生长”
,
2=
“未生长”
指示每个格子中频数的变量:变量
名取“
F
”
,直接输入各个格子的频数
。
所建立的数据集如下表。
然后用
Weight Cases
对话
框指定频数变量进行加权,最后调用
Crosstabs
过程进
行
X
2
检验。
-------------
-------------
R
1.00
C
F
1.00
11.00
1.00
2.00
9.00
2.00
1.00
1.00
2.00
2.00
7.00
【操作过程】
1.
Data==>Weight Cases
(
对数据按频数进行加权
)
Weight Cases
by
单选框:选中
Freqency
Variable
:选入
F
单击
OK
钮
2. Analyze==>Descriptive
Statistics==>Crosstabs
Rows
框:选入
R
Columns
框:
C
Statistics
按钮:
选中
Chi-square
复选框
(
做成组
X2
检验,
p>
分析甲乙两培养基分析结果有无相
关
)
选中
Mc
Nemanr
复选框
:(
做配对
X2
检验
,
分析甲乙
培养基阳性率有无差异
)
单击
p>
Continue
钮
Cells...
按钮:
选中
Row
复选框,单击
Continue
钮
单击
OK
钮
【结果解释】
Case Processing Summary
Valid
N
甲培
养基
*
乙培
养基
28
Percent
100.0%
N
C
ases
Missing
Percent
0
.0%
Total
N
Percent
28
100.0%
< br>
上表为有效例数
,
缺失例数和总例数的情况
,
28
例均有效
.
甲
< br>培
养
基
*
< br>乙
培
养
基
Crosstab
ulation
Count
乙
培养
基
+
甲
培
养
基
Total
+
-
11
1
12
-
9
7
16
Total
20
8
28
上表输出配对四格表数据。
-------------
-------------
Chi-Square Tests
Value
4.215
b
2.658
4.
689
4.064
28
df
1
1
1
1
Asymp. Sig.
(2-sided)
.040
.103
.030
.044
.021
c
Exact
Sig.
(2-sided)
Exact
Sig.
(1-sided)
Pearson Chi-
Square
a
Continuity
Correction
Likelihood
Ratio
Fisher's Exact
Test
Linear-by-
Linear
Association
McNemar
Test
N of Valid
Cases
.088
.048
a.
Computed only for a 2x2
table
b.
2 cells (50.0%) have
expected count less than 5. The minimum
expected count
is 3.43.
c.
Binom
ial distribution used.<
/p>
2
2
2
上表为
X
检验的结果。首先是成组
X
检验,
X
=4.21<
/p>
,
P=0.040
,可以认为甲乙两培养
基的结果有相关性(即甲阳性,乙可能也阳性)。下面做了配对
X
2
检验(
McNemar Test
)
,
用精确概率法计算,
P=0.021
(双侧),可以认为甲乙两培养基阳性率差异有统计学意义。
三、
R<
/p>
×
C
表
X
2
检验
例
6.3
某市三个地区出生婴儿的畸
形发生情况如下表,
试比较这三个地区出生婴儿畸形率有
无差异
。
地区
畸形数
无畸形数
合计
发生率(‰)
重污染区
114
3278
3392
33.61
一般市区
444
40103
40547
10.95
农村
67
8275
8342
8.03
合计
625
5165
52281
11.95
这是
3
< br>×
2
表资料,要进行
3
个样本率的比较。
【建立数据文件】
直接输入三个变量:
行变量(分组变
量)
:变量名取“
R
”
,变量值为
1=
“重污染区
”
,
2=
“一般市区”
,
“农村”
。
列变量(疗效变量)
:变量名取“
C
”
,变量值为
1=
“畸形”
,
2=
“非畸
形”
指示每个格子中频数的变量:变量名取“
F
”
,直接输入各个格子的频数。
所建立的数据集如下表。
R
1
1
2
2
3
-------------
C
1
2
1
2
1
F
114
3278
444
40103
67
-
-
-
-
-
-
-
-
-
上一篇:俄语名词形容词代词变格表格
下一篇:动名词的规则变化