统计学原理课件PPT 40页

  • 488.50 KB
  • 2022-04-29 14:24:15 发布

统计学原理课件PPT

  • 40页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'第三章统计整理教学目的通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。1东莞电大廖继标 第三章统计整理教学目的通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。2东莞电大廖继标 第三章统计整理在学习过程中主要解决以下几个问题统计整理的方法和意义统计分组的含义和种类统计分组的方法统计分布和分配数列的编制统计表的结构和种类3东莞电大廖继标 第三章统计整理统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。一、统计整理的意义和方法4东莞电大廖继标 统计整理又称数据整理,根据统计研究任务的要求,对调查、搜集到的原始资料进行分组汇总使其条理化、系统化的工作过程,就是统计整理。统计整理的意义:通过统计调查所取得的总体单位的资料,是不系统的、分散的,还只是事物的表象、事物的某一侧面或外部联系的感性材料。统计整理的任务就是对这些资料进行加工处理,借助总量指标,对总体内部规律、相互联系、结构关系,作出概括性的说明。统计整理实现了从个别单位的标志值向说明总体特征的指标值的过度,使人们对社会经济现象的认识从感性认识上升到理性认识的过度阶段,为统计分析提供了基础。它在统计研究中起着承前启后的作用。5东莞电大廖继标 根据某班40名学生统计学考试成绩分析该班学生考试情况。578949848687757372687582978167815479879576716090657672708685898964578381788772616东莞电大廖继标 按成绩等级分组人数(人)各组人数占总人数比重(%)不及格410.0及格615.0中1230.0良1537.5优37.5合计40100.07东莞电大廖继标 第三章统计整理再如:通过调查取得100个商业企业某月销售额资料:(单位:万元)20,60,45,90,105,56,250,89,130,30,98,…300。将这些数据资料按“销售额”的多少进行整理,得到下列整理结果:8东莞电大廖继标 销售额(万元)企业数(个)0—501250—10025100—15030150—20023250—30010合计100第三章统计整理统计整理的方法:分组、汇总、编表9东莞电大廖继标 第三章统计整理统计分组的含义和种类(p51)统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。统计分组应达到的要求同一组内的单位性质相同,不同组所包括的单位性质有差异。二、例如:工业企业按经济类型分组,可分为以下几组:经济类型企业数(个)国有企业1000合资企业200合作经营企业300股份制企业500工业企业按职工人数分组,可分为以下几组:职工人数企业数(个)500人以下50500—10002001000—1500100工业企业按地区分组,可分为以下几组:地区企业数(个)北京市10000天津市8000上海市1100010东莞电大廖继标 统计分组的特点统计分组是在总体内进行的一种定性分类,它是把总体进一步划分为一个个性质不同的范围更小的总体。这些被称为亚总体的组,同样具有总体的特征(只是变成小一点的总体而已),它们可以继续分组。如在进行工业企业的统计调查时,我们可以按工业企业所在的地域进行分类,一个省的为一组,每一个省的工业企业又可以按不同的市进行分组。11东莞电大廖继标 分组标志的选择选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。选择分组标志的一般原则必须根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。(P54)统计分组必须遵循两个原则:穷尽原则和互斥原则即不重复不遗漏如我们在进行城乡青少年接受教育水平的比较分析,应按城乡进行分组,如果按年龄进行分组或按性别进行分组就不能到达研究分析的目的。12东莞电大廖继标 统计分组的种类按研究任务和作用不同按分组标志的多少不同按分组标志的性质不同类型分组结构分组分析分组简单分组复合分组品质分组(按品质标志进行分组)变量分组(按数量标志进行分组)通常认为总体按品质标志分组属于类型分组,按数量标志分组属于结构分组仅按一个标志来进行分组称为简单分组;按两个或两个以上的标志进行分组并且层叠在一起称为复合分组13东莞电大廖继标 分析分组:为了研究总体的各标志之间的依存关系而进行的分组。即为了研究某个标志表现和另一个标志表现之间有何关系而进行的分组,如要研究在东莞打工的外来劳动者的工资报酬是否与他们的学历有关,则把他们按学历进行分组来进行研究。分析分组的分组标志称为原因标志,与原因标志相对应的叫结果标志。如上例中学历是原因标志,报酬是结果标志。14东莞电大廖继标 第三章统计整理品质分组方法变量分组方法以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。如对家庭构成情况进行分析时,可按家庭人数进行分组以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。如学生成绩、工厂职工数按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。一般的情况下该品质标志的标志表现有多少就分成多少组,或按统一规定的分组标准进行分组如:人口按性别分组、按职业分组、企业按经济类型分组等。单项式分组组距式分组三、统计分组方法15东莞电大廖继标 第三章统计整理等距分组各组组距均相等。如:10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。不等距分组各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。按组距式分组会使资料的真实性受到一些损害16东莞电大廖继标 组距的计算对于重叠组距式分组,可以用组距=上限—下限进行计算如成绩分组中,60~70分、70~80分、80~90分,其组距就是10分。对于间断式分组,使用的公式为组距=本组上限—前组上限=本组下限—上组下限如商店按职工规模分组分为:1~5人、6~10人11~15人,则组距为10—5=5而不是4。17东莞电大廖继标 组限(p57)组限就是每一组两端的数值。10—2020—3030—40下限上限确定组限的方法有两种:间断式确定组限和重叠式确定组限。职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90间断式确定组限适用于离散变量(分组时要注意满足不重不漏原则,上、下限都要包含在内,有特殊说明的除外)重叠式确定组限适用于连续变量上面的60、70、80归于哪一组呢?P57一般把此值归并到作为下限的那一组18东莞电大廖继标 例:某地区对企业按工人人数的多少进行分未两组,下列五种分组方法中正确的是()A.300人以下300~500人B.300人以下300~500人(不含300)C.300人以下301~500人D.300人以下310~500人E.300人以下300~499人注意区分重叠式组限和间断式组限的不同之处,分组时应该做到不重复不遗漏19东莞电大廖继标 第三章统计整理组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=7520东莞电大廖继标 第三章统计整理(一)统计分布统计分布又称分配数列。它是把总体的所有单位按组归并排列后形成总体中各个单位在各组间的分布。这里的单位有个、次的含义,所以分配数列又称此书发布。它由两部分组成:总体所分的各个组和各组所拥有的单位数(次数或频数)。四、统计分布和分配数列的编制21东莞电大廖继标 第三章统计整理工资分组职工人数(人)各组人数所占比重(元)(次数或频数)(%)(频率)500—60010025600—70020050700—80010025合计400100频率:各组的频率大于0,各组的频率总和等于1或100%。22东莞电大廖继标 (二)分配数列的种类分配数列是在分组的基础上形成的,根据分组时采用的分组标志不同,分配数列可分为:品质分配数列(简称品质数列)变量分配数列(简称变量数列)单项式分配数列组距分配数列等距数列不等距数列分配数列(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。)第三章统计整理23东莞电大廖继标 (三)分配数列的编制1、品质分配数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:第三章统计整理100250合计4032208100805020国有企业股份制企业合资企业独资企业比重(%)企业数经济类型24东莞电大廖继标 第三章统计整理2、变量分配数列的编制:其基本步骤为:第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型(按什么标志进行分组)和分组方法(单项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:全距=最大变量值-最小变量值组距=全距÷组数25东莞电大廖继标 组数确定经验公式第三章统计整理26东莞电大廖继标 分组组数参考表N15~2425~4445~8990~179180~359n3~54~65~76~87~9第三章统计整理27东莞电大廖继标 第三章统计整理第四步:确定组限。注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)第五步:汇总出各组的单位数,计算频率,(频率=频数/总体单位数)并编制统计表。注意:不同方法确定的组限在汇总各组单位数时不一样(见教材P59例题)28东莞电大廖继标 间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。职工人数(人)499以下500—599600—699700—799重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。产值(万元)50—6060—7070—8080—90单位数(个)单位数(个)因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。29东莞电大廖继标 序计划完成工人数比重向上累计向下累计号程度(%)(人)(%)人数比重人数比重160—7021.0270—8052.5380—90147.0490—1003115.55100—1106532.56110—1205226.07120—1302311.58130—14084.0合计2001003、累计频数或频率分配数列的编制方法通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。第三章统计整理2721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.010030东莞电大廖继标 第三章统计整理(四)统计分布的类型钟型分布、U型分布、J型分布、洛伦茨分布钟型分布:特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。(见教材P62)U型分布:特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状宛如英文字母U。(见教材P62)J型分布:特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母J。(见教材P63)洛伦茨分布:专门用以检定社会收入分配的平等程度。31东莞电大廖继标 频率分布的类型对称分布右偏分布左偏分布正J型分布反J型分布U型分布第三章统计整理32东莞电大廖继标 第三章统计整理(五)统计表的结构和种类从表的内容上看:由主词和宾词组成。主词指总体所分的各个组,宾词用来说明主词的各个指标。统计表是表现统计资料整理结果的表格从表的形式看:由标题、横行和纵栏、数字资料等部分组成。统计表的结构统计表的种类按照主词是否分组和分组的程度分为:简单表:主词未经分组的统计表。分组表:主词按某一标志进行分组的统计表。33东莞电大廖继标 统计表的结构1999~2000年城镇居民家庭抽样调查资料项目单位1999年2000年调查户数平均每户家庭人口平均每户就业人口平均每户就业面平均一名就业者负担人数平均每人全部年收入#可支配收入平均每人消费性支出户人人%人元元元400443.141.7756.431.775888.775854.024615.914222.03.131.6853.671.866316.816279.984998.00资料来源:《中国统计年鉴2001》,中国统计出版社,2001,第305页。注:本表为城市和县城的城镇居民家庭抽样调查材料。行标题列标题数字资料表头附加第三章统计整理34东莞电大廖继标 合理安排统计表的结构总标题内容应满足3W要求(when、who、what)(如P66页表3-16)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“—”表示必要时可在表的下方加上注释统计表的设计第三章统计整理35东莞电大廖继标 统计表的设计第三章统计整理36东莞电大廖继标 一、判断(2006.01)统计分组以后,掩盖了各组内部各单位的差异。()(2007.01)按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。()(中央2005.07)1、按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。()2、统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。()(中央2006.07)2、统计分组的关键是确定组限和组距。(37东莞电大廖继标 二、单选(2005.07)简单分组和复合分组合的区别在于()。A.选择的分组标志的性质不同B.选择的分组标志多少不同C.组数的多少不同D.组距的大小不同(2007.01)1、统计分组的关键在于()。A、分组标志的正确选择B、分组形式C、平均指标D、变异指标2、对总体按某个标志进行分组,得到的统计表属于()。A、分组表B、复合表C、简单表D、整理表(中央2005.07)次数分配数列是()A、按数量标志分组开成的数列B、按品质标志分组开成的数列C、按统计指标分组所形成的数列D、按数量标志和品质标志分组所形成的数列38东莞电大廖继标 (中央2006.07)3、简单分组和复合分组的区别在于()A、选择的分组标志性质不同B、选择的分组标志多少不同C、组数的多少不同D、组距的大小不同(中央2007.01)4、下列分组中属于按品质标志分组的是()A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组39东莞电大廖继标 三、多选(2005.07)统计整理是()。A.统计调查的继续B.统计设计的继续C..统计调查的基础D.统计分析的前提E.统计分析的基础(2006.07)统计表按主词是否分组及分组的程度,可分为()。A、简单表B、一览表C、分组表D、复合表E、单一表(中央2007.01)9、在组距数列中,组中值()A、上限和下限之间的中点数值B、用来代表各组标志值的平均水平C、在开放式分组中无法确定D、就是组平均数E、在开放式分组中,可以参照相邻组的组距来确定40东莞电大廖继标'