-staples
第八章
列联表中的相关性测量
第一节
列联表相关测量的有关问题
一、交互分类和列联表
来自某个总体
的样本,同时按两个或两个以上的标准进行分类。分类的资料可以排
列成一个行、列交织
的表,称为列联表,也叫交互分类表。如:
妇女的教育水平与志愿
教育水平(<
/p>
X
)
愿
望
(Y)
高
幸福家庭
理想工作
合
计
125
65
190
低
95
105
200
220
170
390
合计
列联表可以清楚反映在
X
变化的条件下,
Y
的
次数分布情况。因此,列联表又称为条件
次数表。
列和:行边缘次数
行和:列边缘次数
表中的次数:条件
次数,表示在自变量的每个条件,因变量各个值的数目。
X
1
f
11
X
2
…
…
…
…
…
…
X
c
f
1
c
f
2
c
合计
Y
1
f
12
f
22
f
1
?
Y
2
┇
f
21
f
2
?
Y
r
合计
f
r
1
f
?
1
f
r
2
f
?
2
f
rc
f
?
c
f
r
?
f
?
?
二、条件频率
妇女的教育水平与志愿
(
%
)
教育
水平(
X
)
愿
望
(Y)
高
低
第三章
两相关样本的非参数检验
1
幸福家庭
理想工作
65.79
34.21
100.00
47.50
52.50
100.00
?
教育水平(
X
)
愿
望
(Y)
高
幸福家庭
理想工作
56.82
38.24
低
43.18
61.76
?
100.00
100.00
第二节
McNmar
检验
这种检验方法适用
于非独立样本的
2*2
表,
即
单因素两水平
。
Co
chran
检验
是该
检验方法在多样本
条件下的推广。
例
为了评估一位政党候选人竞选活动的效果,
由
60
个选民组成的随机样本在候选人
演说
之
前和之后,询问的问题是“对该候选人是投赞成还是反对”
受试者
演说前
演说后
受试者
演说前
演说后
受试者
演说前
演说后
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2
1
1
1
0
0
0
1
0
1
0
0
1
0
1
0
1
0
0
1
0
1
1
0
1
1
0
1
1
1
1
0
1
1
1
1
0
1
1
1
0
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
后
(-)
0
1
0
1
0
1
0
1
0
1
1
0
1
0
1
0
1
0
1
0
1
1
0
1
0
1
0
1
0
1
1
0
1
0
1
0
1
1
1
0
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
后
(+)
1
0
1
0
1
1
0
0
0
1
0
0
1
0
1
0
0
0
1
0
1
0
1
0
1
1
1
0
1
1
0
1
1
0
1
0
0
0
1
0
第三章
两相关样本的非参数检验
前
(+)
前
(-)
2
20
25
13
McNmar
检验思路
:
在竞争演说前后有
15
个人改变了观点,我们分析
的焦点在改变了观点的
15
个人。
<
/p>
H
0
:
竞争演说
无效应
H
1
:
竞争演说有效应
在原假设为真的条
件下,认为
n
个人改变观点的人是随机的选择“
+
”或“
-
”
。可
以认为,选择“
+
”的人
数是服从
B
(
n
,
0.5
)分布。
(
n
为前后改变了选择的样本点
)
。
则检验的
p
值:
P
?
?
C
0
.
5
(
1
?
0
p>
.
5
)
i
15
i
i
?
13
15
15
?
i
=
0.000488
或
P
?
p>
?
C
i
?
0
2
i
15
0
.
5
i
(
1
?
0
.
5
)
15
?
i
故拒绝原假设,竞争演说有显著的正效应。
< br>注:
当样本容量(改变观点或发生改变)大于
50
p>
时,可以将
?
2
检
验用于
McNmar
检
验。
前
(+)
前
(-)
?
a+c
后
(-)
后
(+)
Σ
b
a+b
c+d
a+b+c+d
a
c
b+d
d
2
?
a
?
np
1
?
因为
Q
?
np
(
1
?
p
1
)
p>
?
~
?
2
(
1
)
而
Q
?<
/p>
?
a
?
np
p>
1
?
2
?
a
?
np
1
?
2
np
1
n
(
1
?
< br>p
1
)
?
a
?
np
1
?
?
np
1
2
2
?
n
?
p>
d
?
n
?
np
2
?
?
np
2
2
2
?
a
?
< br>np
1
?
?
np
1
?
d
?
np
2
?
?
np
2
在
原假设为真时,
np
1
?
np
2
?
2
2
a
?
d
,则上式为
2
a
?
d
?
a
?
d
?
?
?
?
a
?
?<
/p>
?
d
?
?
2
2
?
?
?
?
~
?
2
(
1
)
?
2
?
?
a
?
d
a<
/p>
?
d
2
2
2
?
?
a
?
d
2
等价的公式为
p>
?
?
a
?
d
~
?
2
(
1
)
第三章
两相关样本的非参数检验
3
(
a
?
d
)
2
当
p
(
?
?
)
?
?
,则拒绝原假设。
a
?
d
2
第三节
列联表中的
?
p>
2
检验及相关测量
一、四格表资料的
χ
2
检验
(
两个样本率比较
)
两因素两水平,两因素是否相互独立。
1
、两个样本率资料的四格表形式
y
x
a
c
?
Σ
b
d
b+d
a+b
c+d
a+b+c+d
a+c
如果
X
与
Y
相互没有关系
,
有
a<
/p>
?
[(a+b)(a+c)/(a+b+c+d)]=e
11
b
?
[(a+b)(b+d)/(a+b+c+d)]=e
12
c
?
[(a+c)(c+d
)/(a+b+c+d)]=e
21
d
?
[(b+d)(c+d)/(a+b+c+d)]=e
p>
22
故设计统计量
(
a
?
e
11
)
2
(
b
?
e
12
)
2<
/p>
(
c
?
e
21
)
2
(
a
?
e
22
)
2
Q
?
?
?
?
~
?
2
(
1
)
e
11
e
12
e
21
e
22
n
(
a
d
?
bc
)
2
?
(<
/p>
a
?
b
)(
p>
b
?
c
)(
c
?
d
)(
d
?
a
)
2
、
χ
2
< br>检验的基本思想
χ
2
值反映了实际频数和理论频数的吻合程度。
χ
2
值越小,说明实际频
数与理论频数越吻合,
χ
2
值越大,说明实际频数与理论频数差异越大。如果
p>
检验假设成立,则实际频数与理论频数之差一般不会很大,即出现大的
χ
2
值的概率是小的。若在无效假设下,出现了大的
χ
2
值的概率
P
≤
α
(检验水
准)<
/p>
,我们就怀疑假设的成立,因此拒绝它。另外
χ
< br>2
值的大小,还与自由度
有关。故考虑
< br>χ
2
值大小的意义时要同时考虑自由度。
二、
行
< br>(r)
×列
(c)
表资料的
p>
χ
2
检验
两因素多水平的情形。
4
第三章
两相关样本的非参数检验
-staples
-staples
-staples
-staples
-staples
-staples
-staples
-staples
-
上一篇:蝶阀设计原则
下一篇:亲爱的汉修先生阅读题及答案