高中数学公理2-2019高中数学联赛山西通知
高中数学统计
知识点归纳
概率
全)
与
(
精品文档
高中数学统计与概率知识点(文)
一、众数: 一组数据中出现次数最多的那个数据。
二、 众数与平均数的区别:
众数表示一组数据中出现次数最多的那个数据;平均数是
一组数据中表示平均每份的数量。
三、二、.中位数:
一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据
时,为最中间两个数据的平均数)
四、 三 .众数、中位数及平均数的求法。
五、 ①众数由所给数据可直接求出;②求中
位数时,首先要先排序(从小到大或从大到
小),然后根据数据的个数,当数据为奇数个时,最中间的一
个数就是中位数;当数据
为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的
总和
除以数据的个数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中
的数据;
⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据
是中位数;若这组数据
是偶数个时,则中间的两个数据的平均数是中位数;
⑶中位数的单位与数据的单位相同;
⑷众数考察的是一组数据中出现的频数;
⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单
位与数据的单位相同;
收集于网络,如有侵权请联系管理员删除
精品文档
(6)众数可能是一个或多个甚至没有;
(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
五.平均数、中位数与众数的异同:
⑴平均数、众数和中位数都是描述一组数据集中趋势的量;
⑵平均数、众数和中位数都有单位;
⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重
要,应用最广;
⑷中位数不受个别偏大或偏小数据的影响;
⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的
数据。
六、
对于样本数据x
1
,x
2
,…,x
n
,设想通过各数据到其
平均数的平均距离来反映样
本数据的分散程度,那么这个平均距离如何计算?
|x
1
-x|+|x
2
-x|+L+|xn
-x|
n
思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,
一般用s表示.
假设样本数据x
1
,x
2
,…,x
n
的平均数为
x
,则标准差的计算公式是:
七、简单随即抽样的含义
(x
1
-x)
2
+(x
2
-x)
2
+L+(x
n
-x)
2
s=
n
收集于网络,如有侵权请联系管理员删除
精品文档
一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N),
如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随
机抽
样.
八、根据你的理解,简单随机抽样有哪些主要特点?
(1)总体的个体数有限;
(2)样本的抽取是逐个进行的,每次只抽取一个个体;
(3)抽取的样本不放回,样本中无重复个体;
(4)每个个体被抽到的机会都相等,抽样具有公平性.
九、抽签法的操作步骤?
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第二步,将号签放在一个容器中,并搅拌均匀
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
十一、抽签法有哪些优点和缺点?
优点:简单易行,当总体个数不多的时候搅拌均
匀很容易,个体有均等的机会被抽
中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
十一、
利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样
步骤如何?
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
收集于网络,如有侵权请联系管理员删除
精品文档
第
三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取
出,编号范围外的数去掉
,直到取满n个号码为止,就得到一个容量为n的样本.
简单随机抽样一般采用两种方法:抽签法和随机数表法。
思考:
如果从100个个体中抽取一个容量为10的样本,你认为对这100个个体进行
怎样编号为宜? 解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号
签,分别
写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10
个号签,然后测量这个10
个号签对应的轴的直径。
解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数
表中选定一个
起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,5
5,
74,77,40,44,这10件即为所要抽取的样本。
小结、
简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体
的方法:放回和不放回,
我们在抽样调查中用的是不放回抽样,常用的简单随机抽
样方法有抽签法和随机数法.
抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方
便,
如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签
法相同,缺点上当总体容量较
大时,仍然不是很方便,但是比抽签法公平,因此这
两种方法只适合总体容量较少的抽样类型.
收集于网络,如有侵权请联系管理员删除
精品文档
简单随机抽样每个个体入样的可能性都相等,均为nN,但是这里一定要将每个
个体入
样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的
可能性这三种情况区分开来,
避免在解题中出现错误.
解题应用
如果从600件产品中抽取60件进行质量检查,按照上述思路抽样应如何操作?
第一步,将这600件产品编号为1,2,3,…,600.
第二步,将总体平均分成60部分,每一部分含10个个体.
第三步,在第1部分中用简单随机抽样抽取一个号码(如8号).
第四步,从该号码起,每隔
10个号码取一个号码,就得到一个容量为60的样本.(如
8,18,28,…,598)
十二、系统抽样的定义:
一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成
均衡的若
干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,
这
种抽样的方法叫做系统抽样.
由系统抽样的定义可知系统抽样有以下特征:
(1)当总体容量N较大时,采用系统抽样。
(2)将总体分成均衡的若干部分指
的是将总体分段,分段的间隔要求相等,因此
N
系统抽样又称等距抽样,这时间隔一般为k=[
n
].
收集于网络,如有侵权请联系管理员删除
精品文档
(3)预先制定的规则指的是:在第1段内采用简单随机抽
样确定一个起始编号,在
此编号的基础上加上分段间隔的整倍数即为抽样编号.
思考.下列抽样中不是系统抽样的是 ( C )
A、从标有1~15号的15号
的15个小球中任选3个作为样本,按从小号到大号排
序,随机确定起点i,以后为i+5,
i+10(超过15则从1再数起)号入样
B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五
分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规
定的
调查人数为止
D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留
下来座谈
十三、系统抽样的一般步骤
用系统抽样从总体中抽取样本时,首先要做的工作是什么?将总体中的所有个体编号.
如果用
系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分
成60部分,应先从
总体中随机剔除5个个体,再均衡分成60部分.
一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤
如何?
第一步,将总体的N个个体编号.
第二步,确定分段间隔k,对编号进行分段.
第三步,在第1段用简单随机抽样确定起始个体编号l.
收集于网络,如有侵权请联系管理员删除
精品文档
第四步,按照一定的规则抽取样本.
十四:分层抽样的定义:
若总体由差异
明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照
一定的比例,从各层独立地抽取一定
数量的个体,再将各层取出的个体合在一起作为
样本.
分层抽样又称类型抽样
十五. 应用分层抽样应遵循以下要求及具体步骤:
(1)分层:将相似的个体归入一
类,即为一层,分层要求每层的各个个体互不交叉,
即遵循不重复、不遗漏的原则。
(2)分
层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每
层样本数量与每层个体数量的
比与这层个体数量与总体容量的比相等。
一般地,分层抽样的操作步骤如何?
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.
第四步,将各层抽取的个体合在一起,就得到所取样本.
十六、简单随机抽样、系统抽样和分层抽样三种抽样的类比学习
简单随机抽样、系统抽样和分
层抽样既有其共性,又有其个性,根据下表,你能对三
种抽样方法作一个比较吗?
对
分
层
抽样
系统
抽样
方法
类别
共同
特点
抽样特
征相互联系适应范围
简单随
机抽样
抽样过
程中每
个个体
被抽
取
的概率
相等
从总体中
逐个不放
回抽取
将总体分成
均衡几部
分,按规则
关联抽取
将总体分
成几层,
按比例分
层
抽取
用简单随
机抽样抽
取起始号
码
用简单随
机抽样或
系统抽样
对各层抽
样
总体中
的个体
数较少
总体中
的个体
数较多
总体由
差异明
显的几
部分组
成
样收集于网络,如有侵权请联系管理员删除
精品文档
本数据进行分组,
组距的确定没有固定的标准,组数太多或太少,都会影响我们了解
数据的分布情况.数据分组的组数与样
本容量有关,一般样本容量越大,所分组数越多.
十七 列频率直分布表的步骤
列出一组样本数据的频率分布表可以分哪几个步骤进行?
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分
组.
第四步,列频率分布表.
十八、绘制频率分布直方图的步骤
?
频率分布直方图中
小长方形的高
0.5
0.4
0.3
0.2
0.1
O
频率
组距
0.5
1 1.5 2 2.5 3 3.5 4 4.5
月均用水量t
频率
组距
样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布
直方图的作图步骤如何?
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
收集于网络,如有侵权请联系管理员删除
精品文档
小结
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取
值的
频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的
分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改
变数据的排列
方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提
取信息,又可以利用图形传递信息
.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比<
br>例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分
布情况,并由此
估计总体的分布情况.
十九、如何根据样本频率分布直方图,分别估计总体的众数、中位数和平均数?
(1)众数:最高矩形下端中点的横坐标.
(2)中位数:直方图面积平分线与横轴交点的横坐标.
(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
二十:什么是茎叶图
茎叶图又称“枝叶图”,它的思路是将数组中的数按位数进行比较,将数
的大小基
本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列
在
主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。
收集于网络,如有侵权请联系管理员删除
精品文档
第二部分:概率
一、随机事件的概率及概率的意义
1、基本概念:
(1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件;
(2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事
件;
(3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件;
(4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机
事件; <
br>(5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n
次试验中事
件A出现的次数nA为事件A出现的频数;称事件A出现的
n
A
比例fn(A)=n
为事件A出现的概率:对于给定的随机事件A,如果随
着试验次数的增加,事件A发生的
频率fn(A)稳定在某个常数上,把这
个常数记作P(A),称为事件A的概率。
(6)频
率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总
n
A
次数
n的比值
n
,它具有一定的稳定性,总在某个常数附近摆动,且
随着试验次数的不断增
多,这种摆动幅度越来越小。我们把这个常数叫
做随机事件的概率,概率从数量上反映了随机事件发生的
可能性的大
小。频率在大量重复试验的前提下可以近似地作为这个事件的概率
二、
概率的基本性质
收集于网络,如有侵权请联系管理员删除
精品文档
1、基本概念:
(1)事件的包含、并事件、交事件、相等事件
(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;
(3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事
件;
(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+
P(B);若事件A与B为
对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+
P(B)=1,于是有
P(A)=1—P(B)
2、概率的基本性质:
1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1;
2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);
3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+
P(B)=1,于是有P(A)=1—P(B);
4)互斥事件与对立事件的区别与联系,互
斥事件是指事件A与事件B在一次试验
中不会同时发生,其具体包括三种不同的情形:(1)事件A发生
且事件B不发
生;(2)事件A不发生且事件B发生;(3)事件A与事件B同时不发生,而对立
事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发
生B不发生;(2)
事件B发生事件A不发生,对立事件互斥事件的特殊情形。
三、古典概型及随机数的产生
1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。
收集于网络,如有侵权请联系管理员删除
精品文档
(2)古典概型的解题步骤;
①求出总的基本事件数;
A包含的基本事件数
②求出事件A所包含的基本事件数,然后利用公式P(A)=
总的基本事件个数
四、几何概型及均匀随机数的产生
1、基本概念:
(1)几何概率模型:如果每个
事件发生的概率只与构成该事件区域的长度(面积
或体积)成比例,则称这样的概率模型为几何概率模型
;
(2)几何概型的概率公式:
构成事件A的区域长度(面积或体积)
P(A)=
试验的全部结果所构成的区域长度(面积或体积)
;
(1) 几何概型的特点:1)
试验中所有可能出现的结果(基本事件)有无限多个;
2)每个基本事件出现的可能性相等.
第三部分: 统计案例
1.线性回归方程
①变量之间的两类关系:函数关系与相关关系;
②制作散点图,判断线性相关关系
③线性回归方程:
y?bx?a
(最小二乘法)
n
?
x<
br>i
y
i
?nxy
?
?
i?1
?
?<
br>b?
n
2
注意:线性回归直线经过定点
(x,y)
。
2
?
x?nx
?
i
?
i?1
?
?
?
a?y?bx
?收集于网络,如有侵权请联系管理员删除
精品文档
2. 相关系数(
判定两个变量线性相关性):
r?
?
(x
i?1
n
i?1<
br>n
i
?x)(y
i
?y)
n
22
(x?x)(y?y)
?
i
?
i
i?1
注:⑴
r<
br>>0时,变量
x,y
正相关;
r
<0时,变量
x,y
负相关;
(2)
|r|
越接近于1,两个变量的线性相关性越强;
|r|
接近于0时,两个变量
之间几乎不存在线性相关关系。
3.回归分析中回归效果的判定: <
br>⑴总偏差平方和:
?
(y
i
?y)
⑵残差:
e
i
?y
i
?y
i
;⑶残差平方和:
2
i?1n
??
?
(yi?yi)
i?1
n
?
2
;⑷回归平方和:
?
(y
i
?y)
-
?
(yi
?yi)
2
;⑸相关指数
2
i?1i?1
nn
?
R
?1?
2
?
(y
?
(y
i?1
i?1
n<
br>n
i
?y
i
)
2
。
?
i
?y
i
)
2
2
注:①
R
得知越大,说明残差平方
和越小,则模型拟合效果越好;
②
R
越接近于1,,则回归效果越好。
4.独立性检验(分类变量关系):
随机变量
K
越大,说明两个分类变量,关系越强,反之,越弱。
22列联表
2
2
x
1
x
2
总计
K
2
=
y
1
a
c
a+c
y
2
b
d
b+d
总计
a+b
c+d
a+b+c+d
收集于网络,如有侵权请联系管理员删除
精品文档
收集于网络,如有侵权请联系管理员删除
高中数学选修2_2步步高-高中数学演绎推理的例子
山西高中数学联赛省队-高中数学江苏南通满分几分
全国高中数学联赛 怎么报名-3天学会高中数学
高中数学重难点教学设计-天津学而思高中数学视频
高中数学老师开学第一课-高中数学必修4向量全章综合题型
新版高中数学必修二课后题答案-高中数学甲种本和乙种本区别
高中数学探究性实验室的建没-高中数学工作坊网络研修方案
高中数学说课 哪节最好-高中数学代表数的符号
-
上一篇:高中数学选修计数原理概率知识点总结
下一篇:高中数学新课概率教案