-
..
..
..
..
第一章
绪论
1.
名词解释
随机变量
< br>:
在统计学上
,
把取值之前不能
预料取到什么值的变量称之为随机变量
总体
< br>:
又称为母全体
、
全域
,
指据有某种特征的一类事物的全体
样本
:
从总体中抽取的一部分个体
,
称为总体的一个样本
个
体
:
构成总体的每个基本单元称为个体
次数
:
指某一事件在某一类别中出现的
数目
,
又成为频数
,
< br>用
f
表示
频率
:
又称相对次数
,
即某一事件发生的次数被总的事件数目除
,
亦即某
一数据出现的次数被这一组
数据总个数去除
。
< br>频率通畅用比例或百分数表示
概率
:
又称机率
。
或然率
,
用符号
P
表示
,
指某一事件在无限的观测中所能预料的相对出现的次数
< br>,
也就是某一事物或某种情况在某一总体中出现的比率
统计量
:
样本的特征值叫做统计量
p>
,
又叫做特征值
参
数
p>
:
总体的特性成为参数
,
< br>又称总体参数
,
是描述一个总体情况的统计指标
观测值
:
在心理学研
究中
,
一旦确定了某个值
,
就称这个值为某一变量的观测值
,
也就是具体数据
2.
<
/p>
何谓心理与教育统计学
?
学习它有何意义
心理与教育统计学是专门研究如何运用统计学原理和方法
p>
,
搜集
。
整理
p>
。
分析心理与教育科学研究中
获得的随机数
据资料
,
并根据这些数据资料传递的信息
,
进行科学推论找出心理与教育活动规律的一
门学科
。
3.
选用统计方法有哪几个步骤
?
首先要分析一下试验设计是否合理
,
即所获得
的数据是否适合用统计方法去处理
,
正确的数量化是应
用统计方法的起步
,
如果对数量化的过程及其意
义没有了解
,
将一些不着边际的数据加以统计处理是
毫无意义的
其次要分析实验数据的类型
,
不同数据类型所使用的统计方法有很大差别
,
了解实验数据的类型和水
平
,
对选用恰当的统计方法至关重要
第三要分析数
据的分布规律
,
如总体方差的情况
,<
/p>
确定其是否满足所选用的统计方法的前提条件
4.
什么叫随机变量
?
心理与教育科学实验所获得的数据是否属于随机变量
随机变量的定义
:①
率先无法确定
p>
,
受随机因素影响
,
成随机变化
,
具有偶然性和规律性
②
有规律变
化的变量
5.
怎样
理解总体
、
样本与个体
?
总体
N
:
据有某种特征的一类事物的全体
,
又称为母体
、
样本空间
,
常用
p>
N
表示
,
其构成的
基本单元
为个体
。
特点
:①
大小随研究问题而变
(
有
、
无限
)②
总
体性质由组成的个体性质而定
样本
n
:
从总体中抽取的一部分交个体
,
p>
称为总体的一个样本
。
样本数目用
n
表示
,
又叫样本容量
。
特点
:①
样
本容量越大
,
对总体的代表性越强
<
/p>
②
样本不同
,
统
计方法不同
总体与样本可以相互转化
。
个体<
/p>
:
构成总体的每个基本单元称为个体
。<
/p>
有时个体又叫做一个随机事件或样本点
6.
统计量与参数之间有何区别和关系
?
参数
:
总体的特性称参数
,
又称总体参数
,
是描述一
个总体情况的统计指标
统计量
:
p>
样本的特征值叫做统计量
,
又称特征值
p>
二者关系
:
参数
是一个常数
,
统计量随样本而变化
参数常用希腊字母表示
,
统计量用英文字母表示
当试验次数
=
总体大小时
,
二者为同一指标
p>
参考
.
资料
..
..
..
..
当总体
无限时
,
二者不同
,
< br>但统计量可在某种程度上作为参数的估计值
7.
试举例说明各种数据类型之间的区别
?
8.
下述一些数据
< br>,
哪些是测量数据
?
哪些是计数
数据
?
其数值意味着什么
?
17.0
千克
89.85
厘米
199.2
秒
93.5
分是测量数据
17
人
25
本是计数数据
9.
说明下面符号代表的意义
μ
反映总体集中情况的统计指标
,
即总体平均数或
期望值
X
反映样本平均数
ρ
表示某一事物两个特性总体之间关
系的统计指标
,
相关系数
r
样本相关系数
σ
反映总体分散情况的统计指标标准差
s
样本标准差
β
表示两个特性中体之间数量关系的回归系数
第三章
集中量数
1.
应用算术平均数表示集中趋势要
注意什么问题
?
应用算术平均数必须
遵循以下几个原则
:
①
同质性原则
。
数据是用同一个观测手段采用相同的观测标准
,
能反映某一问题的同一方面特质
的数据
。
②
平均数与个体数据相结合的原则
③
平均数与标准差
< br>、
方差相结合原则
2.
中数
、
众数
、
几何平均数
、
调和平均数个适用于心理与教育研究中的哪些资料
?
p>
中数适用于
:①
当一组观测结果中出现两个极端数目时
②
次数分布表两端数据或个别数据不
清楚
时
③
要快速估计一组数据代表值时
众数适
用于
:①
要快速且粗略的求一组数据代表值时
< br>
②
数据不同质时
,
表示典型情况
③
次数分布中
有两极端的数目时
④
粗略估计次数
分布的形态时
,
用
M-Mo
作为表示次数分布是否偏态的指标
(
正
态
:
M=Md=Mo
;<
/p>
正偏
:
M>Md>Mo;
负偏
:
<
br>等距 <
br>, <
br>
M
)
⑤
当次数分布中出现双众数时
几何平
均数适用于
①
少数数据偏大或偏小
,<
/p>
数据的分布成偏态
②
、
等比量表实验
③
平均增长
率
,
按一定比
例变化时
调和平均数适用于
①
工作量固定
,
记录各被试完成相同工作所用时
间
②
学习时间一定
记录一定时
间内各被试完成的工作量
3.
对于下列数据
,
使用何种集中量数表示集中趋势其代表性更好
?
并计算它们的值
。
⑴
4 5 6 6 7 29
中数
=6
⑵
3 4 5 5 7 5
众数
=5
⑶
2 3
5 6 7 8 9
平均数
=5.71
4.
求下列四个年级的总平均成绩
。
年级
一
90.5
236
i
i
二
91
318
三
92
215
四
94
200
x
n
解<
/p>
:
X
T
n
X
?
?
?
n
i
?
90.5
?
236
?
91
?
318
?
92
p>
?
215
?
94<
/p>
?
200
?
91
.72
236
?
318
?
215
?
200
5.
三个不同被试对
某词的联想速度如下表
,
求平均联想速度
参考
.
资料
..
..
..
..
被试
A
B
C
联想词数
13
13
13
时间
(
分
)
2
3
25
词数
/
分
(
Xi
)
13/2
13/3
-
解
:
C
被试联想时间
25
分钟为异常数据
,
删除
调和平均数
M
H
?
1
1
1
?
N
X
i
?
p>
1
1
2
3
(
?
)
2
13
13
?
5.2
6.
下面是某校几
年来毕业生的人数
,
问平均增加率是多少
?
并估计
10
年后的毕业人数有多少
。
年份
毕业人数
1978
542
1979
601
1980
750
1981
760
1982
810
1983
930
1984
1050
1985
1120
p>
解
:
用几何平均数变式计算
:
Mg=
N-1
X
N
7
1120
?
?
1.10925
所以平均增加率为
11%
X
1
542
10
年后毕业
人数为
1120
×
1.10925
p>
10
=3159
人
第四章
差异量数
1.
度量离中趋势的差异量数有哪些
?
为什么要度量离中趋势
?
度量离中趋势的差异量数有全距
、
四分位差
、
百分位差
、
p>
平均差
、
标准差与方差等等
。
在心理和教育研究中
,<
/p>
要全面描述一组数据的特征
,
不但要了解
数据的典型情况
,
而且还要了解特殊
情
况
。
这些特殊性常表现为数据的变异性
。
如两个样本的平均数相同但是整齐程度不同
,
如果只比较
平均数并不能真实的反映样本全貌
。
因此只有集中量数不可能真实的反映出样本的分布情况
。
为了全
面反映数据的总体情况
,
除了必须求出集中量数外
,
这时还需要使用差异量数
。
2.
各种差异量数各有什么特点
?
见课本
103
页
“<
/p>
各种差异量数优缺点比较
”
3.
标准差在心理与教育研究中除度
量数据的离散程度外还有哪些用途
?
可以计算差异系数
(
应用
)
和标准分数
(
应用
)
p>
4.
应用标准
分数求不同质的数据总和时应注意什么问题
?
要求不同质的数据的次数分布为正态
5.
计算下列数据的标准差与平均差
11.0 13.0 10.0 9.0 11.5 12.2 13.1 9.7
10.5
Xi
11.0
?
13.0
?
10.0
?<
/p>
9.0
?
11.5
?
12.2
?
13.1
?
9.7
?
10.5
?
X
?
?
?
11.1
N
9
Xi-X
?
A.D.
=
n
6.
?
10.7
?
1.19
9
7.
今有
一画线实验
,
标准线分别为
5cm
p>
和
10cm
,
实验
结果
5cm
组的误差平均数为
1.3c
m
,
标准差为
0.7cm
,
10cm
组的误差平均数为
4.3cm
,
标准差为
1.2cm<
/p>
,
请问用什么方法比较其离散程度的大小
?
并具体比较之
。
用差异系数来比较离散程度
。
CV1=(s1/
X
1
)
×100%=
(0.7/1.3)
×100%=53.85%
参考
.
资料
..
..
..
..
CV2=(s2/
X
2
)
×100%
=(1.
2/4.3)
×100%
<
br>40
<
br>0.2)
=27.91%
所以标准线为
5cm
的离散程度大
。
8.
求下表所列各班成绩的总标准差
班级
1
2
3
4
平均数
90.5
91.0
92.0
89.5
标准差
6.2
6.5
5.8
5.2
人数
40
51
48
43
di
0.3
-0.2
-1.2
1.3
?
N
i
?
40
?
5
1
?
48
?
4
3
?
182
X
T
?
?
N<
/p>
X
?
N
i
i
i
?
90.5
p>
?
40
?
91.0
?
51
?
92
.0
?
48
?
89.5
?
43
16525.5
?
?
90.80
<
/p>
182
182
d
i
?
X
T
?<
/p>
X
i
其值见上表
2
2
2
2
2
N
s
?
40
?<
/p>
6.2
?
51
?
6.5
?
48
?
5.8
?
43
?
5.2
?
6469.79
?
i
i
?
N
d
?
?
0.3
?
51
?
(
?
?
48
?
(
?
1.2)
?
43
?
1.3
?
147.43
N
s<
/p>
?
?
N
d
6469.79
?
147.43
?
s
?
?
< br>?
6.03
即各班成绩的总标准差是
6.03
N
182
?
2
2
2
2
2
i
p>
i
2
2
i
i
i
i
T
i
第五章
相关关系
1.
解释相关系数时应注意什么
?
(
1
)
p>
相关系数是两列变量之间相关成都的数字表现形式
,
相关程度指标有统计特征数
r
和总体系数
ρ
(
2
)
p>
它只是一个比率
,
不是相关的百分数
,
更不是等距的度量值
,
只能说
r
大
比
r
小
相关密切
,
< br>不能说
r
大
=0.8
是
r
小
=0.4
的两倍
(
不能用倍数关系来解释
)
(
3
)
p>
当存在强相关时
,
能用这个相关关系根据一
个变量的的值预测另一变量的值
(
4
)
p>
-1
≤
r
≤
1
,
正负号表示相关方向
,
值大小表示相关程度
;(
0
p>
为无相关
,
1
为完
全正相关
,
-1
为完
< br>全负相关
)
(
5
)
相关系数大的事物间不一定有因果关系
(
6
)
p>
当两变量间的关系收到其他变量的影响时
,
两者间的高强度相关很可能是一种假象
(
7
)
p>
计算相关要成对数据
,
即每个个体有两个观
测值
,
不能随便
2
个个体计算
(
8
)
p>
非线性相关的用
r
得可能性小
,
但并不能说不密切
2.
假设两变量为线性关系
,
计算下列各情况的相关时
,
< br>应用什么方法
?
(
1
)
p>
两列变量是等距或等比的数据且均为正态分布
(
积差相关
)
(
2
)
p>
两列变量是等距或等比的数据且不为正态分布
(
等级相关
)
(
3
)
p>
一变量为正态等距变量
,
另一列变量也为正
态变量
,
但人为分为两类
(
二列相关
)
(
4
)
p>
一变量为正态等距变量
,
另一列变量也为正
态变量
,
但人为分为多类
(
多列相关
)
(
5
)
p>
一变量为正态等距变量
,
另一列变量为二分
称名变量
(
点二列相关
)
(
6
)
p>
两变量均以等级表示
(
等级相关
、
交错系数
、
相容系数<
/p>
)
3.
如何区分点二列相关与二列相关
?
<
/p>
主要区别在于二分变量是否为正态
。
二列
相关要求两列数据均为正态
,
其中一列被人为地分为两类
;
点二列相关一列数据为等距或等比测量数据
,
且其总体分布为正态
,
另一列变量是
二分称名变量
,
且
两列数存在一一对应
关系
。
4.
品质相关有哪几种
?
各种品质相关的应
用条件是什么
?
品质相关分析的总条
件是两因素多项分类之间的关联程度
,
分为一下几类
:
参考
.
资料
..
..
..
..
(
1
)
(
2
)
(
3
)
等级相关
6.
下表是平时两次考试成绩分数<
/p>
,
假设其分布成正态
,
< br>分别用积差相关与等级相关方法计算相关系数
,
并回答<
/p>
,
就这份资料用哪种相关法更恰当
?
p>
被试
1
2
3
4
5
6
7
8
9
10
∑
A
86
58
79
64
91
48
55
82
32
75
670
B
83
52
89
78
85
68
47
76
25
56
659
A
2
7396
3364
6241
4096
8281
2304
3025
6724
1024
5625
48080
B
2
6889
2704
7921
6084
7225
4624
2209
5776
625
3136
47193
AB
7138
3016
7031
4992
7735
3264
2585
6232
800
4200
46993
R
A
2
7
4
6
1
9
8
3
10
5
55
R
B
3
8
1
4
2
6
9
5
10
7
55
R
A
R
B
6
56
4
24
2
54
72
15
100
35
368
D=R
A
-R
B
-1
-1
3
2
-1
3
-1
-2
0
-2
D
2
1
1
9
4
1
9
1
4
0
4
34
四分相关
,
应用条件是
:
两因素都为正态连续变量
(
eg.
学习能力
,
身体状态
))
人为分为
两个
类别
;
同一被试样品中
,
分别调查两个不同因素两项分类情况
Φ
系数
:
除四分相关外的
2
×
2
表
(
p>
最常用
)
列联表
相关
C
:
R
×
C
表的计数资料分析相关程度
5.
预考查甲乙丙丁四人对十件工艺
美术品的等级评定是否具有一致性
,
用哪种相关方法
?
r=
N
?
XY
?
?
X
?
Y
N
?
X
?
(
?
X)
?
N
?
Y
?
(
?
p>
Y)
2
2
2
2
?
10
?
46993
?
670
?
659
10
?
48080
?
670
?
10
?
47193
?
659
2
2
?
0.82
r
R
?
1
?
6
?
D
2
N(N
2
-1)
3
4
?
R
X
R
Y
3
?
4
?
368
?
r
R
?
[
?
(N+1)]
?
?
?
< br>?
11
?
?
0.794
N-1
N(N+1)
9
?
110
?
?
1
?
6
p>
?
34
?
0.79
4
或
2
10
?
(10
?
1
)
用积差相关的条件成立
,
故用积差相
关更精确
7.
下列两列变量为非正态
,
选用恰当的方法计算相关
本题应用等级相关法计算
,
< br>且含有相同等级
X
有
3
个数据的等级相同
,
等级
3.5
的数据中有
2
个数据的等级相同
,
等级为
6.5
和
8.5
的数据中也分别有
p>
2
个数据相同
;
Y
有
3
个数据等级相同
< br>,
等级为
3
的数据中有
3
个数据等级相同
,
等
级为
5.5
的数据中有
2
个数据等级相同
,
等级为
9
的数据中有
3
个数据等级相同
。
被试
1
2
3
4
5
6
7
8
9
10
参考
.
资料
X
13
12
10
10
8
6
6
5
5
2
Y
14
11
11
11
7
7
5
4
4
4
R
X
1
2
3.5
3.5
5
6.5
6.5
8.5
8.5
10
R
Y
1
3
3
3
5.5
5.5
7
9
9
9
D=R
X
-R
Y
0
-1
0.5
0.5
-0.5
1
-0.5
-0.5
-0.5
1
D
2
0
1
0.25
0.25
0.25
1
0.25
0.25
0.25
1
..
..
..
..
N=10
4.5
n(n
2
-1)
2(2
2
?
1)
2(2
2
?
1)
2(2
2
?
1)
?
C
X
?
?
12
?
12
?
12
?
12
?
1.5
n(n
2
-1)
3(3
p>
2
?
1)
2(2<
/p>
2
?
1)
3(3
2
?
1)
?<
/p>
C
Y
?
?
12
?
12
?
12
?
12
?
4.5
N
3
?
N
10
3
?
10
2
?
x
?
12
?
?
C
X
?
< br>12
?
1.5
?
81
N
3
< br>?
N
10
3
?
10
2
?
y
?
12
?
?
C
Y
?
12
?
4.5
?
7
8
x
2
?<
/p>
?
y
2
?
?
D
2
81
?
78
?
4.5
?
r
RC
?
?
?
0.972
p>
2
2
2
81
?
78
2
?
?
x
?
?
y
8.
问下表中成绩与性别是否相关
?
被试
1
2
3
4
5
6
7
8
9
10
∑
性别
男
女
女
男
女
男
男
男
女
女
成绩
83
91
95
84
89
87
86
85
88
92
880
男成绩
83
84
87
86
85
425
女成绩
91
95
89
88
92
455
成绩的平方
6889
8281
9025
7056
7921
7569
7396
7225
7744
8464
77570
适用点二列相关计算法
。
p
为男生成绩
,
q
为女生成绩
,
X
< br>p
为男生的平均成绩
,
X
q
为女生的平均成
绩
,
s
t
为所有学生成绩的标准差
从
表
中
可
以
计
算
得
:
p=0.5
q=0.5
X
p
?
425
?
85
5
X
q
?
455
?
91
5
s
t
?
77570
880
2
?
(
)
?
3.6
N
N
10
10
X
p
?
X
q
85
?
91
r
pb
?
?
p
q
?
?
0.5
?
0.5
?
?
0.83
s
t
3.6
?
(
2
?
X
2
?
X
)
?
相关系数为
-0.83
,
相关较高
9.
第
8<
/p>
题的性别若是改为另一成绩
A
()
正态分布的及格
、
不及格两类
,
且知
1
、
< br>3
、
5
、
7
、
9
被试的成
绩
A
为及格
,
2
、
4
、
6
、
8
、
10
被试的成绩
A
为不及格
,
请选用适当的方法计算相关
,
并解释之
。
被试
1
2
3
4
5
6
参考
.
资料
成绩
A
及格
不及格
及格
不及格
及格
不及格
成绩
B
83
91
95
84
89
87
及格成绩
83
95
89
不及格成绩
91
84
87
成绩的平方
6889
8281
9025
7056
7921
7569
..
..
..
..
7
8
9
10
∑
及格
不及格
及格
不及格
86
85
88
92
880
86
88
441
85
92
439
7396
7225
7744
8464
77570 <
/p>
适用二列相关
。
s
t
和
X
t
分
别为成绩
B
的标准差和平均数
,
X
p
和
X
q
分别是成绩
A
及格和不
及格时成绩
B
的平均数
,
p
为成绩
A
及格的比率
p>
,
y
为标准正态曲线中
p
值对应的高度
N
N
439
查正态表得
y=0.39894
p>
X
q
?
?
87.8
p=0.
5
5
X
p
?<
/p>
X
q
pq
88.
2
?
87.8
0.5
< br>?
0.5
所以
r
b
?
?
?
?
?
0.070
或者
s<
/p>
t
y
3.6
0.
39894
s
t
?
?
X
2
?
(
?
X
)
2<
/p>
?
77570
880
2
880
441
?
88
X
p
< br>?
?
88.2
?
(
)
?
3.6
X
t
?
10
5
10
10
r
b
?
X
p
?
X
t
p
88.2
?
88
0.5
?
?
?
?
0.070
< br>相关不大
s
t
y
3.6
0.39894
10
.
下表是某新编测验的分数与教师的评价等级
,
请问测验成绩与教师的评定间是否有一致性
?
0.871
11.
下表是
9
名被试评价
10
名著名的天文学家的等级评定结果
,
问这
9
名被试的等级评定是否具有一致
性
?
被评价者
A
B
C
D
E
F
G
H
I
J
∑
被试
1
1
2
4
3
9
6
5
8
7
10
2
1
4
2
5
6
7
3
10
8
9
3
1
3
4
5
2
8
9
6
10
7
4
1
3
4
5
2
6
10
8
7
9
5
1
9
2
5
6
3
4
8
10
7
6
1
4
9
2
5
6
7
3
10
8
7
1
3
5
10
2
6
9
7
8
4
8
1
3
5
7
6
4
8
10
2
9
9
1
2
8
4
9
6
3
7
5
10
∑
R
i
9
33
43
46
47
52
58
67
67
73
495
∑
R
i
2
81
1089
1849
2116
2209
2704
3364
4489
4489
5329
27719
适用肯德尔<
/p>
W
系数
。
p>
495
2
s=
?<
/p>
R
?
?
2771
9
?
?
3216.5
< br>
N
10
s
3216.5
W=
?
?
0.481
即存在一定关系但不完全一致
1
p>
2
1
K
N(N
p>
3
-N)
?
9
p>
2
?
(10
3
p>
-10)
12
12
2
i
(
?
R<
/p>
i
)
2
12.<
/p>
将
11
题的结
果转化为对偶比较结果
,
并计算肯德尔一致性系数
A
B
C
A
0
0
B
9
2
C
9
7
D
9
7
6
E
9
5
5
F
9
8
6
G
9
7
7
H
9
7
7
I
9
8
7
J
9
8
7
参考
.
资料
-
-
-
-
-
-
-
-
-
上一篇:苯
下一篇:(整理)常用三极管大全及功能