关键词不能为空

当前您在: 主页 > 英语 >

统计与统计学含义

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-05 19:43
tags:

-

2021年2月5日发(作者:los)


统计与统计学的含义



学习统计学,首先应该明确什么是“统计”。










“统计”一词有三种含义:



统计数据




——




反映客观现象数量方面的数据资料



统计工作




——




收集、整理、分析统计数据的实践活动



统计学





——




收集 、分析、表述和解释数据的科学


(


不列颠百科全书的定义


)


统计学


:


收集、 处理、分析、解释数据并从数据中得出结论的科学




1.


收集数据:取得数据




2.


处理数据:整理与图表展示





3


分析数据:利用统计方法分析数据




4


数据解释:结果的说明




5


得到结论:从数据分析中得出客观 结论



统计学与数学的区别




1



数学研究的是抽 象的数量规律性,


而统计学研究的是具体的、


实实在在的数量规 律性。


数学研究的是没有量纲或单位的数,而统计学研究的是有具体实物内容或计量单位 的数据。




2


)数学研究使用的是纯粹的演绎,而统计学是演绎与归纳相结合,且占主导地位的是归


纳。











数学家可以端坐家中,


凭借纸笔和聪 明的大脑,


从假设的命题出发而推导出漂亮的


结果。

< p>
而统计学家则必须深入实际收集数据,


才能有所作为,

没有大量数据的归纳,统计学


家就得不出任何有益的结论。




统计研究的过程



实际问题




收集数据




整理数据




分析数据




解释数据




实际问题





统计学的分类



数理统计学

< p>


是以概率论为基础,


对统计数据数量关系的模式 加以解释,


对统计原理和方法


给予数学的证明。



应用统计学


:是数理统计原理和方法在各个领域的应 用。




统计在商务和经济中的应用



1


会计



2


财务




3


市场



4


生产




5


经济




1.1.2


什么是教育统计学




教育统计学的概念:属于应用统计学类别,是运用数理统计的 原理和方法研究教育问题的


一门应用科学。



主要任务:











研究如 何搜集、


整理、


分析由教育调查和教育实验等途径所获得的数字 资料,


并以


此为依据,进行科学推断,从而揭示蕴含在教育现象 中的客观规律。




理解教育统计学的两个关键点:



< /p>


1


教育调查和教育实验课题的提出、内容的界定、对象范围的确定 、假设的建立、结论的得


出以及分析不是教育统计学的研究任务。


(这些还需要依靠与研究内容有关的教育专业只是


来解决)



2


教育统计学只能提供各种统计方法的应用条件和统计计算结果 的解释。




1.1.3


统计学与教育统计学的内容




统计学的内容:描述统计,推断统计(参数估计,假设检验) ,实验设计




描述统计:对已获得的 数据进行整理、概括、显现其分布特征统计方法





内容


:


搜集 数据


,


整理数据


,

展示数据


,


描述性分析



目的


:


描述数据特征


,


找出数据的基本规律




描述统计在教育统计学中的解释:


通过教育调查和教育实验获得了大量的数据 ,


用归组、



表、绘图等统计方法对之 进行归纳、


整理,以直观形象的形式反映其分布特征;通过计算各


种特征量来反映他们分布上的数字特征。




推断统计



研究如何利用样本数据来推断总体特征的统计方法


< p>
内容


:


参数估计


,


假设检验



目的


:< /p>


对总体特征作出推断




实验设计



概念


:


实验者为了揭示试验中自变量与因变量的关系,在实验之前所设定的实验计划成为实


验设计。



内容:抽样方式;计算样本 容量;确定实验对照形式;控制无关因素;选择统计方法处理和


分析实验结果

< p>




教育统计学以阐述


描述统计和推断统计


两部分内容为主,


实验设计


将作为独立课程进行教





1.2




统计中的几个基本概念



1.


总体和总体单位(个体)



总体是客观存在的、存在某种共同性质的许多个别事物组成的整体。



具有大量性、同质性、变异性等特征。




总体单位


:


构成总体的个体事物称总体单位。



总体由总体单位构成,要认识总体必须从总体单位开始。




统计总体与总体单位的相对性



随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。



总体或总体单位的区分不是固定的,在一定条件下可以相互转化。

< p>



1.


研究

< p>
1000


名学生的学习成绩,则总体是(


B




A



1 000


名学生的学习成绩












B



1 000


名学生



C


.每一名学生的学习成绩














D


.每名学生




2


.要了解


300


名学生的身体情况,则总体单位是(


C

< br>)



A



300


名学生



















B



300


名学生的身体情况



C


.每名学生





















D


.每一名学生的身体情况




(



)


统计总体的种类



有限总体


l:


指所包含的单位数目有限的总体



对有限总体可以进行全面调查,也可以进行非全面调查;



无限总体


:


指所包含的单位数目无限的总体



对无限总体只能采取非全面调查






2.


样本



样本:从总体中抽取的一部分元素的集合。



样本量:构成样本的元素的数目。




二、参数和统计量




1.参数:用来描述


总体特征


的概括性数字度量。(平 均数


,


标准差


,


比例


)


2.统计量:用来描述


样本 特征


的概括性数字度量。(平均数


,


标 准差


,


比例


)



某研究部门准备在全市


200


万个家庭中抽取


2000


个家庭,推断该城市 所有职工


家庭的年人均收入。这项研究的参数是(


D

< p>







A. 2000


个家庭





















B. 200


万个家庭







C. 2000


个家庭的人均收入











D. 200


万个家庭的人均收入







































三、变量与标志



1


、变量



分类变量:说明事物类别的一个名称



顺序变量:说明事物有序类别的一个



名称



数值型变量:离散型变量,连续型变量



连续性变量


的数值是连续不断的,任意两个变量值之间可以做无限分割。(需要使用度


量工具取值)人的身高、体重、年龄,气象上的温度、湿度,零件的尺寸,电子元件的使 用


寿命等



离散变量

< br>的取值可以按一定次序一一列举,变量值通常用整数表示。


(取值不需要用


工具度量,用计数的方式即可)



特定范围的人口数、汽车数量、企业数量、林木株数




1


.下列变量属于连续变量的是


( D



)





A


.学生人数















B


.工厂的设备台数








C


.某市的医院数











D


.零件的尺寸误差




2


.商业企业的职工人数与商品销售 额是


(



C )





A


.连续变量




B


.前者是连续变量,后者是离散变量






C


.离散变量




D


.前者是离散变量,后者是连续变量




2


、标志


是 说明总体单位特征的名称




品质标志


说明总体单位的属性特征,在原始状态下无法量化





数量标志


说明总体单位的数量特征,在原始状态下能够量化。



标志表现即标志特征在各单位的具体表现。


< br>标志表现有


品质标志表现和数量标志表现


之分。


品质标志表现只能用


文字


表述,


因此不


能转化为统计指标,


但对其对应的单位进行总计 时就形成统计指标。数量标志表现是一


具体


数值


,也称标志值。




标志与标志表现示例



标志

< p>
:(


性别


,


民族


,


宗教信仰


,


所在省份


)


品质标志








(年龄,身高,体重)数量标志



标志 表现:




,汉,佛教,天津



品质标志表现



< /p>



31


岁,


17 5


厘米



80


公斤)数量


标志表现





1.


某同学的统计学考试成绩为< /p>


90


分,则


90


分是


( B )


A


.品质标志














B


.数量标志表现







C


.数量指标














D


.标志值




2.


下列标志属于品质标志的是


(




B )


A


.工人的年龄









B


.工人的工种






C


.工人的工资









D


.工人的日产量





统计的概念



统计的分类及内容



统计中的几个基本概念



< p>
一、统计数据



统计变量的具体表现




统计数据的类型



1


按计量尺度(分类数据,顺序数据,数值型数据)



















2


按收集方法


(


观测数据


,


实验数据


)


















3


按时间状况


(


截面数据


,


时序数据


)



分类数据


(categorical data)


是对事物进行分类的结果,


数据则表现为类别,


是用 文字来表


述的。



如人口性别:男、女 。可以用“


1


”表示男性,“


0


”表示女性



它是用定类尺度计量形成的




顺序数据


(rank data)


也是 对事物进行分类的结果,但这些类别是有顺序的。



产品等级:一等品、二等品、三等品、次品等



考试成绩:优、良、中、及格、不及格等



受教育的水平:小学、初中、高中、大学及以上



一个人对事物的态度:非常同意、同意、保持中立、不同意、非常不同意等



它是由定序尺度计量的形成的。




数值型数据(


metric data



是使用自然或度量单位对事物进行计量的结果。其结


果表现为 具体的数值。




截面数据(


cross



sectional data< /p>



是在相同或近似相同的时间点上收集的数据,

< br>它所描述的是现象在某时刻的变化情况,



2002


年我国各地区的国内生产总值。


截面数据又称静态数据




时间序列数据(


time series data

< p>


是在不同的时间上收集到的数据,它所描述的


是 现象随时间而变化的情况。如


2002



2007


年我国的国内生产总值。时间序列


数据又称为动态数 据。





一 名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的


2006

< p>


城镇家庭的人均收入数据,这一数据属于(


C








A.



分类数据


















B.



顺序数据



C.



截面数据


















D.



时间序列数据






二、统计数据的来源



数据来源


:


直接来源


(


实验, 调查,观察);间接来源(出版物或网上)




间接来源数据


;


1


、查阅公开 出版物;



2


、向政府统计机构咨询;



3


、向其他机构咨询;



4


、网上查询。



直接来源数据



1


、实验(独立课程,本课程不讲授)



2


、观察(等同于调查)



3


、调查(重点讲授)



在教育统计中,直接数据来源教育实验和教育调查。





统计调查



收集原始数据资料的统计活动过程



原 始数据资料指直接从各调查单位收集的用来反映个体特征的数据资料



要求:准确、及时、全面、系统



统计 调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败







统计调查的种类



按调查单位的范围大 小分为


全面调查,非全面调查



按调查 时间是否连续分为


经常性调查,一次性调查


< br>按调查的组织方式不同分为


统计报表,专门调查


(普查, 重点调查,典型调查,


抽样调查)




统计报表制度



指按照国家统一规定的 各项要求,


自下而上


地定期向国家和主管


部门报送基本统计资料的一种报告制度



优点:


能保证统计资料的全面性和连续性



能保证统计资料的统一性和及时性



能满足各级部门对统计资料的需要



局限:


统计报表过多会增加基层负担



有可能由于虚报瞒报而影响统计资料质量




普查:


指国家为详尽了解某项重要的 国情国力而专门组织的一次性全面调查



作用:


可以为抽样调查提供抽样框,


可以收集统计报表所不能提供的反映重大国


情国力的基本统计信息



局限


:由于需要大量的人力、物力和财力,不宜经常进行




重点调查:


为了解总体基本情况,


在调 查对象中只选择一部分


重点单位


(这些单


位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本


情况)< /p>



进行调查的一种非全面调查组织方式



作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料



局限:只适用于客观存在着重点单位的情况




典型调查:


在对调查对象有一定了解 的基础上,


有意识地选择少数典型单位




在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量)



进行调查的一种非全面调查组织方式



作用:一定条件下能估计总体指标数值



可以补充全面调查的不足



可以用来研究新生事物



局限:不能确定推断的把握程度,无法计算和控制推断误差





抽样调查:


按照



随机原则



(指样本单位的抽取不受主 观因素及其他系统性因素


的影响,


每个总体单位都有均等的被抽 中机会)


从调查对象中抽取一部分样本单


位进行调查,


再用样本资料推断把握总体的数量特征的一种非全面调查组织方式



特点


:


按随机原则抽取样本单位目的是推断 总体的数量特征抽样误差可以事先计


算并控制



优点:


能用较少的人力、


物力和时间达到全面调查的目 的。


调查资料的准确性较


高、受人为干扰的可能性较小





下列哪些现象适宜采用非全面调查()








A.


企业经营管理中出现的新问题;







B.


某型号日光灯耐用时数检查;







C.


某地区居民储蓄存款;







D.


某地区森林的木材积蓄量。



重点调查中的重点单位,是指


( D )






A.


处于较好状态的单位








B.


规模较大的单位







C.


体现当前工作重点的单位



D.


就调查标志而言在总体中占有很大比重的单位




抽样调查


的含义


:抽样调查是按照一定的程序(随机原则),从所研究对象的


全体中抽取一部分单位 进行调查,


并在一定条件下对研究对象的数量特征进行估


计和推 断。



抽样调查包括


概率抽样调查



非概率抽样调查


两种。

< br>



(一)概率抽样



概率抽样也称随机抽样,它有以下特点:


首先,


抽样时是按一定的概率以随机原则抽取样本。


所谓随 机原则就是在抽取样


本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会 被抽中



其次,每个单位被抽中的概率是已知的,或者是可以计 算出来的。



最后,


当用样本对总体目 标量进行估计时,


要考虑到每个样本单位被抽中的概率。



概率抽样的类型



< br>1


)简单随机抽样



抽样框。< /p>


进行概率抽样需要抽样框,


抽样框通常是包括所有总体单位名单。


如企


业名录,学生名册,住户门牌号码等



简单随机抽样就是从包括总体


N


个 单位的抽样框中随机地、一个一个地抽取


n


个单位作为样本,每 个单位入样的概率是相等的。



简单随机抽样是一种最基本的的 抽样方法是其他抽样方法的基础。



特点:简单、直观;






在抽样框完整时可直接从中抽取样本;






抽选概率相同;



< br>2


)分层抽样



分层抽样是将抽 样单位按某种特征或某种规则分为不同的层,


然后从不同的层中


独立、随机地抽取样本。将各层的样本结合起来对总体的目标量进行估计。


< p>


3


)整群抽样



整群抽样是指将总体各单位划分成许多群,


然后从中抽取部分,


对中选群的所有


单位逐个进行调查的一种抽样调查技术形式。


整群抽样因为是对中选群的全面调


查,所以调查单位很集中大大简便抽样 工作,节省经费开支。




4



系统抽样



将总体中 的所有单位按一定顺序排列,


在规定的范围内随机地抽取一个单位作为

< br>初始单位,然后按事先规定好的规则确定其他样本单位。





(二)非概率抽样技术



非随机抽样是 指在抽样时不按照随机原则,而是由调查者根据调查目的和要求,


主观设立某个标准从总 体中抽选样本的抽样方式。



非随机抽样主要有四种具体方式:



方 便抽样



是根据


调查者的方便与否,< /p>


以尽可能使调查对象对总体具有代表性为


原则的一种调查方法。< /p>



判断抽样:


是指市场调查者根据自己的


主观判断


经验和知识,


从总体中选择具 有


典型代表性的单位作为样本的一种抽样方法。




配额抽样:


它是先按照市场调查对象 的某种特征,


将总体分为若干类,


然后按一

定的比例


在各类中分配样本单位数额,并按各类数额在每类中任意或主观抽样。



滚雪球抽样


:是通过以一触十、



以十触百,类似“


滚雪球”的方式


抽取样本 。


运用这种方法的前提是样本单位之间具有一定的联系,


是在不 了解总体的情况下


去了解总体的一种方式。



(三)概率抽样与非概率抽样的比较



非概率抽样


不是依据随机原则


抽选样本,


样本统计量的分布是不确切的,


因而无


法使用样本的结果对总 体相应的参数进行推断。但操作简便、时效快、成本低,


适合于探索性的研究,可从调查 中发现问题。



有时在一项研究项目中,


也可以把概率抽样和非概率抽样相结合,


发挥各自的特


点,满 足研究中的不同需求。




下列哪种调 查方式样本不是随机选取(


D











A.


分层抽样











B.


系统抽样










C.


整群抽样











D.


判断抽样




如果要搜集某一特定群体的有关资料,适宜采用的调查方式是 (


B










A.


系统抽样












B.


整群抽样









C.


滚雪球抽样









D.


判断抽样






搜集数据的基本方法




(一)自填式



自填式指在没有调查员 协助的情况下,由被调查者自己填写,完成调查问卷。



方式:邮寄、网络、媒体。



要求:调 查问卷结构严谨,有清楚的说明,应有制作详细、形象友好的说明。



特点:成本低,适用大范围调查,减少被调查者压力。



返回率低,周期长,出错率高。




(二)面访式



调查员与被调查者面对面,提问回答。



特点:数据质量高,可调节调查时间



成本高,存在调查员主观因素影响



(三)电话式



电话式是指调查人员通过打电话的方式向被调查者实施调查。



速度快、成本低、容易控制。




数据搜集方法的选择因素



1


、抽样框中的有关信息



抽样框中有关信息是影响方法选择的一相因素。



例如:



抽样框中没有通讯地址,就不能将自填式问卷寄给被调查者;



没有计算机随机数字拨号系统,又没有电话号码的抽样框,电话调查的概率样

< p>
本就难以产生。



2


、目标总体特征



目标总体的特征也影响数据搜集的方法。



例如:



总体的识字率很低,就不宜使用自填式方法


< br>样本单位分布很广,地域跨度太大,进行面访式的调查,交通费用就会很高,


且过 程管理也难以控制。



3


、调查问题的内容



对于比较复杂的问题,面访调查比较适合。


< br>如果调查问题涉及一些敏感性问题,


也可以设置匿名的数据搜集方法,

< p>
如自填式


可能比较适合。



4


、有形辅助物的使用



如在调查期间显示产品、产品样本、广告、或促销演示等,有时还需要让被调查


者试用产品,然后再接受调查。这对于面访问式比较适合。



5


、实施调查的资源



实施调查的资源会对搜集数据方法产生重大影响。



如经费预算、人员配备、调查设备和调查所需要的时间。



如劳务费、交通费、礼品费是面访所必须的。



6


、管理与控制



对调查员的控制,电话调查就比面访调查容易控制。




7


、质量要求



在面访和电话调查中,


调查员的水平和素质对调查质量的影响是显而易见的;



经验的调查员还可以对被访者回答的真实性做出判断,


并采用适当的方法予以澄


清。



回答率也是影响质量的一个重要因素。





一、统计数据的整理



(一)数据整理概念和内容



统计数据 整理就是对搜集得到的初始数据进行


审核、分组、汇总,使之条理化、

< br>系统化


,变成能反映总体特征的综合数据的工作过程。



它是统计由对个别现象的认识上升到对总体现象认识的重要阶段,


在统计研究工


作中起着承前启后的作用,


它既是数据搜集的继 续和深化,


又是数据分析的基础


和前提。



统计数据整理必须遵循


目的性、联系性和简明性

< p>
三原则。




统计数据整理的内容一般有五个方面:



第一,确定指标分组;



第二,对原始数据进行预处理;



第三 ,计算出各组单位数、总体单位数以及各组或总体的有关标志值之和;



第四,编制统计图表;



第五,对统计数据进行系统积累。



(二)数据的预处理



数据的预处理是 在对数据分类或分组之前所做的必要处理


,


内容包括数据的



核、筛选、排序等。



1


、数据审核



数据审核是为了保证数据的质量,为进一步的整理与分析打下基础。



对于通过直接调查取得的原始数据


,


应主要从


完整性


(


应调查单位是否有遗漏,所

< p>
有的调查项目或指标是否填写齐全


)


< p>
准确性


(


一是数据资料是否真实地反映了


客观实际情况,


内容是否符合实际;


二是检查数 据是否有错误,


计算是否正确等


)


两个方面去审核



审核数据准确性的方法



< p>
逻辑检查


主要用于对分类的数据和顺序的数据的审核,它是从定性角度。< /p>



计算检查


主要用于对数值型数据的审核 ,


它是检查调查表中的各项数据在计算结


果和计算方法上有无错 误。



对于通过其他渠道取得的二手数据,

除了对其完整性和准确性进行审核外,


还应


着重审核数据的


时效性和适用性



< br>数据审核中发现的错误应尽可能予以纠正。如果对数据中发现的错误无法纠正,


就 需要对数据进行筛选



2


、数据筛选



数据筛选的形式:



将某些不符合要求的数据或有明显错误的数据予以剔除;



将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除。

< br>


3


、数据排序



数据排序是按一定顺序将数据排列,


以便于研究者通过浏览数据发现一些明显 的


特征或趋势,


找到解决问题的线索。


排序还有助于对数据检查纠错,


以及为重新


归类或分组提供方便 。



4


、数据透视表


为了从复杂的数据中提取有用的信息,


可以利用


Excel


提供的


[


数据透视表

< br>]


工具



利用数据透视表可以对数据表的重要信息按使用者的习惯或分析要求进行汇总


和作图 ,形成一个符合需要的交叉表,又称列联表。



在利用数据透视 表时。数据源表中的首行


必须有列标题





二、品质数据的整理与展示



品质数据包括


分类数据和顺序数据。



对品质数据做分类整理,对数值型数据则主要是做分组整理。



1


、频数与频数分布



落在某一特定类别(或组)中的数据个数称为


频数


。< /p>



数据在各类别(或组)中的分配,称为


频数分布


。我们把各个类别及其相应的频


数全部列出,并用表格 形式表现出来,就是频数分布。



将频数分布用表格的形式表现出来就是频数分布表。



2


、比例



一 个总体


(或样本)


中各个部分的数值占全部数值的比重,


通常用于反映总体的


构成或结构。



3


、百分比



将比例乘以


100


就是百分比或百分数,


它是将对比的基数抽象化为


100


而计算出

< br>来的,用


%


表示。



4


、比率



比 率是各不相同类别数值之间的比值。比如,国内生产总值中第一、二、三产业


之比;



比率也可以是同一现象在


不同时间或空间 上


的数量之比。


比如本年国内生产总值


与上年国内生产总值进行对比,


可以计算出经济增长率。


不同地 区国内生产总值


进行对比,反映两个地区的经济发展水平差异。





(



)


分类数据的图示




1


)、条形图




1


条形图是用宽度相同的条形的高度 或长短来表示数据多少的图形




2


条形图可以纵置或横置。




2


)、帕累托图



帕累托图是以意大利经济学家


V. Pareto


的名字命名的。



它是按各类别数据出现的频数多少排序后绘制的柱形图。



容易看出哪类数据出现的多。




3


)、饼图



饼图是用圆形及圆内扇形的


角度


来表示 数值大小的图形,


它主要用于表示一个样


本(或总体)中各组数 据占全部数据的比例,对于研究结构性问题十分有用。




(二)顺序数据的整理与图示



1


、累积频数和累积频率



累积频数就是将各有序类别或组的频数逐级累加起来。



累积频率或累积百分比是将各有序类别或组的百分比逐级累加起来。



2


、累积频数与累积频率的方法



向上累积


,从小到大(或从低到高)的方向把频数顺序累加。



向下累积,


从大到小(或从高到低)的方向 把频数顺序累加。



累积频率有


向上累 积和向下累积


两种方法。





1


)累积频数分布图



根据累积频数或累积频率,可以绘制累积频数分布或频率图。



350


300


250

< br>200


150


100


50


0


1


2


3

< p>
4


5












向上累积





2


)环形图



环形图与饼图类似,


但又有区别。


环形 图的圆心是空的,


样本或总体中的每一部


分数据用环中的一段表 示。



饼图只能显示一个样本或总体各部分所占的比例,


而环形图可以同时绘制多个样


本或总体的数据系列。

< br>


有利于进行比较研究。



相同 的地方都是用扇形圆心角的大小量度来表示数据。结构性比较。




非常不满意


非常满意


8%


10%


7%


13%


非常不满意


满意


15%


21%


33%


不满意


36%


不满意


一般


满意


非常满 意


一般


31%


26%

< br>




三、数值型数据的整理与展示



知识点回顾:



数据预处理——审核、筛选、排序



品质数据的整理与展示







分类数据:频数、频数分布、比例、比率







顺序数据:累积频数、累积频率



品质数据:


条形图,帕累托图,饼图




(



)


数据分组



数据分组是根据统计研究的需要


,


将原始数据按照某种标准化分成不同的组别。



分组后的数据称为分组数据



1




分组方法



单变量值分组


:把每一个变量值作为一组。



组距分组

< p>


将全部变量值依次划分为若干个区间,


并将这一 区间的变量值作为一


组。



在组距分组 中,一个组的最小值称为下限,一个组的最大值称为上限。



单 变量分组:把每一个变量值作为一组;适合离散变量且变量值较少


组距分组:将全部变量值依次划分为若干个区间(上下限);适合连续变量或变


量值 较多的情况下





数值型数据的整理(基本问题)



1< /p>


要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是


不同的



2


对分类数据和顺 序数据主要是做分类整理



3


对数值型数据则主要是做分组整理



4


适合于低层次数据的整理和显示方法也适合于高层次的数据;


但适合于高层次


数据的整理和显示方法并不适合于低层次的数据




单变量值分组(要点)



1


将一个变量值作为一组



2


适合于离散变量



3


适合于变量值较少的情况



[



]


某生产车间


50


名工人日加工零件数如下(单位:个)。试采用单变量值对


数据进行分组



117



122



124



129



139



107



117



130



122



125


108



131



125



117



122



133



126



122



118



108


110



118



123



126



133



134



127



123



118



112


112



134



127



123



119



113



120



123



127



135


137



114



120



128



124



115



139



128



124



121



组距分组(要点)



将变量值的一个区间作为一组



适合于连续变量



适合于变量值较多的情况



必须遵循“不重不漏”的原则



可采用等距分组,也可采用不等距分组



组距分组(步骤)






1


确定组数



l


g(


n


)


K


?


1


?


l


g(


2


)



2


确定各组的组距



:组距=


(


最大值



-


最小值)÷



组数




3


根据分组整理成频数分布表




组距分组(几个概念




1.








限:一个组的最小值



2.








限:一个组的最大值



3.








距:上限与下限之差



4.



组中值:下限与上限之间的中点值



组中值


=


(下限值

+


上限值)


/2



在组距分组中,


如果全部数据中的


最大值和最小值与 其他数据相差悬殊



为了避


免出现空白 组或者个别极端值被遗漏,


所以将第一组和最后一组采用以下和以上

的这样的


开口组


,注意的是开口组通常以相邻组的组距作为 其组距的。




开口组组中值:





缺少下限组其组中值


=


该组上限—邻组组距


/ 2




缺少上限组其组中值


=


该组下限


+


邻组组距


/ 2




二)数值型数据的图示


< p>
1


条形图、饼图、环形图及累积分布图都适用于数值型数据。



2


除此之外,还有直方图、茎叶图、箱线图、线图 、散点图、气泡图、雷达图等。




1


、分组数据:直方图



直方图是用于展示分组数据分布的一种图形,


它是用矩形的

< br>宽度和高度


来表示频


数分布的。



方法:利用平面直角坐标系,横轴表示分组,纵轴表示频数或频率。


直方图与条形图不同:



◆面积——长度



◆连接——分开



◆展示数值数据——展示分类数据



◆直方图的宽度和长度都有意义




2


、未分组数据:茎叶图和箱线图




1


)茎叶图



茎叶图是反映原始数据分布的图形。







叶——末位同位数








茎——除末位



外的高位数









茎在左,叶在右,横置。



茎叶图既能给出数据的分布状况,又能给出每一个原始数值。



茎叶图适用于小批量数据。




2


)箱线图




Q


U






Q


L





左偏分布



3


、时间序列数据


-


-


-


-


-


-


-


-



本文更新与2021-02-05 19:43,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/603115.html

统计与统计学含义的相关文章