• 2.76 MB
  • 2022-04-29 14:33:54 发布

最新山东省中学教师资格认证考试课件PPT.ppt

  • 87页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'山东省中学教师资格认证考试 第二章数据的初步整理与图表呈现2 主要内容2.1数据的初步整理与统计图表2.2次数分布表2.3次数分布图3 2.1.1数据的收集1明确研究问题数据收集的第一个问题是要清楚我们研究的是什么。例如,我们对家庭生活感兴趣。我们问一个问题:“你是否是独生子?”这个问题我们可能已经非常清楚了,但是回答问题的人(一般称为被试)对此有不同的理解。例如,我们非常肯定地认为“独生子”就是指家里唯一的孩子,但有的被试会认为独生子是家里唯一的儿子。得到好数据的原则7 2.1.1数据的收集2确定研究对象(明确研究总体)例如,研究小学儿童,那么哪些儿童是小学儿童,城市的还是农村的?包不包括特殊学校的小学儿童?超过正常的小学儿童的年龄,但还在小学读书的儿童是否包括在内?8 2.1.1数据的收集3确定样本容量4确定抽样方法简单随机抽样等距抽样分层随机抽样两阶段随机抽样5确定恰当的测量方法9 1.审核资料审核资料的目的,是为了剔除不合格的资料,以确保资料的可靠性和可信性。审核是对原始资料进行初步的审查和核实。不符合要求的数据主要有三种:缺失、可疑、失误。2.1.2数据的初步整理步骤10 缺失:指数据不全或缺项未填;例如一份资料中未回答的问题占10%以上,或者缺少关键性资料。可疑:指难以辨认或怀疑其真实性的数据;例如,有的被试填答的问卷全部选同一个选项;有的被试填答的结果可以看到是一种规则的排列方式。失误:指存在明确差错的数据或答案。2.1.2数据的初步整理步骤11 在剔除不合格问卷的过程中,注意不能把一些不符合自己主观假设的数据随意去掉。这一点非常重要。极端数据的剔除,应遵循三个标准差法则。2.1.2数据的初步整理步骤12 2.数据排序和统计分组排序就是按照某种标准对收集到的杂乱无章的数据按照一定的顺序标准进行排列统计分组就是根据被研究对象的特征,将所得数据划分到各个组别中分组要以被研究对象的本质特性为基础分类标志要明确,要能包括所有的数据数据分组的标志性质类别:按事物的不同性质进行分类。数量类别:按数值大小进行分类,并排序。2.1.2数据的初步整理步骤13 统计表是用来表达研究变量与被说明的事物之间数量关系的表格。它可以将大量数据的分类结果清晰、概括、一目了然地表达出来,便于分析、比较和计算。2.1.3统计表14 2.1.3.1、统计表的构成横标目的总标目纵标目横标目数字表2-1统计表的格式顶线底线表线表号标题标目标目表注注:2.1.3统计表15 例:表2-2北京市四街道智力落后患者分布街道检查人数病人数患病率(‰)甲518411593.1乙760302633.5丙495081903.8丁517881703.3总计2291687823.4资料来源:见《心理学报》1979年第1期103页,选部分引用16 2.统计表的种类简单表:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。分组表:只按一个标志分组的统计表称为分组表。复合表:按两个或两个以上标志分组的统计表称为复合表。17 简单表表2-3各校学生数一览表学校A校B校C校D校人数985762893105118 分组表表2-4某市区男幼儿20米跑步用时年龄组3岁~4岁~5岁~6岁~平均用时(秒)7.717.166.045.5319 复合表表2-5某年级操行评定结果班别甲乙丙丁合计男女男女男女男女一班6588642140二班55910331137三班7698430138合计1816262613103311520 例:表2-6中学生心理烦恼调查被试分布21 2.1.4统计图统计图是整理和呈现数据的另一种方法,它把研究变量与被说明事物之间的数量关系用图形表现,直观、形象地表达出事物的全貌及其数据的分布特征,使人一目了然,便于理解和记忆,印象深刻。22 1、统计图的构成统计图一般由图号、标题、标目、图形、图注等几部分构成。统计图中的标目由基线和尺度线构成。对于有纵、横轴的统计图,一般以基线表示被观察的现象,而尺度线则表示其数量。23 2、统计图的分类条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。24 单式条形图图2-1某年级操行评定结果条形图基线尺度线图形25 复式条形图图2-2某年级操行评定结果条形图26 例:图2-3三项影响较大的SARS信息对不同文化程度民众的影响27 圆形图图2-4某年级操行评定结果圆形图基线尺度线28 绘制圆形图的步骤求出各组成部分所占的百分比求出各部分的中心角度以顺时针方向画出扇形标出不同颜色及百分比29 30 线形图线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。31 例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉记忆再现率的情况。图2-5有意义的材料再现率比较线形图32 次数分布表是用来表示数据在各个分组区间内分布状况的一种统计表。次数分布表分为简单次数分布表、分组次数分布表、相对次数分布表、累计次数分布表等。2.2次数分布表33 2.2.1简单次数分布表简单次数分布表(simplefrequencytable)是一句每一个分数值在一列数据中出现的次数或总计数资料编制的统计表34 2.2.1简单次数分布表员工对主管尽职情况的评定人数①非常不尽职②不尽职③不置可否④尽职⑤非常尽职93010256总计80表2-780名员工对部门主管尽职程度调查结果35 2.2.2分组次数分布表分组次数分布表(groupedfrequencytable)是表示数据在各个分组区间内分布状况的一种统计表36 2.2.2分组次数分布表成绩组中值频数累积频数95~97.52290~92.52485~87.53780~52.551275~77.582070~72.5113165~67.594060~62.554555~57.544950~52.525145~17.5152合计5252表2-8某班学生数学成绩次数分布表37 编制分组次数分布表的步骤求全距R=Xmax-Xmin决定组距i和组数k列出分组区间登记次数计算每组数据的次数f抄录新表38 次数分布表中涉及到的基本概念次数,亦称频数,是指对于一个随机事件进行重复观测时,某一事件在某一类别中出现的数目。组距,是指次数分布中每组的区间长度,等于组上限与组下限之差。当组数确定后,可用全距除以组数得到。组限,是指分组资料中每一组的端点值。上端点值称为上限,下端点值称为下限。39 次数分布表中涉及到的基本概念精确上限(La),连续变量某一分组区间真正的上限。一个连续变量观测值代表从下半个单位到上半个单位的一个区间,区间的上端点称为该观测值的精确上限。精确下限(Lb),连续变量某一分组区间真正的下限。一个连续变量观测值代表从下半个单位到上半个单位的一个区间,区间的下端点称为该观测值的精确上限。组中值(Xc),各分组区间的精确下限加上组距的一半或精确下限与精确上限之和的一半。40 次数分布表的优缺点次数分布表是对数据初步整理的一个很重要的步骤,可以将一堆杂乱无序的数据排列成序,从表中可以看出一组数据的大致分布形态,还可显示出这组数据的集中情况和离散情况等。但是在次数分布表中,原始数据不见了,用次数分布表计算的一些统计特征数误差较大。41 2.2.3相对次数分布表相对次数也称为频率,指重复观测或实验中某一事件出现的数目与总观测次数的比值,一般用小数或百分数表示。若在次数分布表中想知道落入某一区间的数目占总数目的比例,要用到相对次数分布表,只用在次数分布表的基础上求出相对次数即可。例如,想知道80分至90这个区间的学生人数占总人数的多少,就要用到相对次数。42 2.2.3相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f/N)或百分比(    )来表示次数,就可以制成相对次数分布表。43 2.2.4累加次数分布表在一般的次数分布表中,只是列出各分组区间的数据次数,若要知道某个数值以上或以下的数据个数,要用到累加次数。累加次数的计算方法有两种一种是从分布表的小数值端,逐个区间的进行次数累加,这种累加次数可回答次数分布表某一分组区间上限以下的次数有多少,称为上限以下累加次数。例如,60分以下的人数另一种是从分布表的大数值端,逐个区间的进行次数累加,这种累加次数可回答次数分布表某一分组区间下限以上的次数有多少,称为下限以上累加次数。例如,85分以上的人数44 2.2.4累加次数分布表用累加次数表示次数分布情况的统计表称为累加次数分布表。累加次数可以用实际次数,也可以用相对次数,若用相对次数,则称为相对累加次数分布表。例如,60分以下的人数占总人数的多少?这是上限以下的相对累加次数而85人以上的人数占总人数的多少?这是下限以上的相对累加次数。45 2.2.4累加次数分布表46 2.2.5双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。47 表3-431名学生视、听反应时测验结果听视100~120~140~160~180~200~220~Y230~210~190~170~150~130~110~1111211322331112111112478451X15984313148 2.3次数分布图在编制次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。绘制次数分布图可以用已有的计算机程序,如EXCEL,也可以用专门的统计程序。49 2.3.1频数分布直方图直方图(histogram)又称为等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用横轴表示数据的等距分组点,即各分组区间的上下限。直方图中每一部分矩形的面积为该矩形表示的分组区间内的次数与总次数的比值。50 例:根据前面52个学生的数学成绩所作直方图图3-152名学生数学成绩分布的频数直方图455055606570758085909510051 还可以做成下面这种形式图3-252名学生数学成绩次数分布直方图52 2.3.2次数分布多边图次数分布多边形图(frequencypolygon)是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。53 图3-352名学生数学成绩分布图人数54 图3-452名学生数学成绩分布图人数成绩55 利用次数分布多边图还可以把几组资料放在一起进行比较。但需要注意的是,这时必须把数据的次数换算成百分比。56 图3-545页数据的次数分布图57 图3-6不正确的比较图58 2.3.3累积次数分布图根据累积次数,可以绘制累积次数分布图。右图是累积次数分布直方图。59 累积次数分布曲线当数据的总数较多时,将累积次数分布图中的横坐标以每一分组区间的精确上限或精确下限表示,纵坐标以累积次数表示,则可绘制累积次数分布曲线,即累积曲线。图3-8累积次数分布曲线60 累积曲线可用于判断一组数据的大致分布形态。图3-9正态分布数据的累积曲线61 图3-10正偏态数据累积曲线图3-11负偏态数据累积曲线62 MATLAB作为线性系统的一种分析和仿真工具,是理工科大学生应该掌握的技术工具,它作为一种编程语言和可视化工具,可解决工程、科学计算和数学学科中许多问题。MATLAB建立在向量、数组和矩阵的基础上,使用方便,人机界面直观,输出结果可视化。矩阵是MATLAB的核心MATLAB的进入与运行方式(两种) MATLAB入门一、变量与函数二、数组三、矩阵四、MATLAB编程五、实验作业 1、变量MATLAB中变量的命名规则是:(1)变量名必须是不含空格的单个词;(2)变量名区分大小写;(3)变量名最多不超过19个字符;(4)变量名必须以字母打头,之后可以是任意字母、数字或下划线,变量名中不允许使用标点符号.一、变量与函数 特殊变量表 2、数学运算符号及标点符号(1)MATLAB的每条命令后,若为逗号或无标点符号,则显示命令的结果;若命令后为分号,则禁止显示结果.(2)“%”后面所有文字为注释.(3)“...”表示续行. 3、数学函数 MATLAB的内部函数是有限的,有时为了研究某一个函数的各种性态,需要为MATLAB定义新函数,为此必须编写函数文件.函数文件是文件名后缀为M的文件,这类文件的第一行必须是一特殊字符function开始,格式为:function因变量名=函数名(自变量名)函数值的获得必须通过具体的运算实现,并赋给因变量.4、M文件M文件建立方法:1.在Matlab中,点:File->New->M-file2.在编辑窗口中输入程序内容3.点:File->Save,存盘,M文件名必须与函数名一致。Matlab的应用程序也以M文件保存。 例:定义函数f(x1,x2)=100(x2-x12)2+(1-x1)2functionf=fun(x)f=100*(x(2)-x(1)^2)^2+(1-x(1))^21.建立M文件:fun.mMATLAB(fun)2.可以直接使用函数fun.m例如:计算f(1,2),只需在Matlab命令窗口键入命令:x=[12]fun(x)返回 x=logspace(first,last,n)创建从开始,到结束,有n个元素的对数分隔行向量.1、创建简单的数组二、数组MATLAB(shuzu1)x=[abcdef]创建包含指定元素的行向量x=first:last创建从first开始,加1计数,到last结束的行向量x=first:increment:last创建从first开始,加increment计数,last结束的行向量x=linspace(first,last,n)创建从first开始,到last结束,有n个元素的行向量 2、数组元素的访问MATLAB(shuzu2)(3)直接使用元素编址序号.x([abcd])表示提取数组x的第a、b、c、d个元素构成一个新的数组[x(a)x(b)x(c)x(d)].(2)访问一块元素:x(a:b:c)表示访问数组x的从第a个元素开始,以步长为b到第c个元素(但不超过c),b可以为负数,b缺损时为1.(1)访问一个元素:x(i)表示访问数组x的第i个元素. 3、数组的方向前面例子中的数组都是一行数列,是行方向分布的.称之为行向量.数组也可以是列向量,它的数组操作和运算与行向量是一样的,唯一的区别是结果以列形式显示.产生列向量有两种方法:直接产生例c=[1;2;3;4]转置产生例b=[1234];c=b’说明:以空格或逗号分隔的元素指定的是不同列的元素,而以分号分隔的元素指定了不同行的元素. 4、数组的运算(1)标量-数组运算数组对标量的加、减、乘、除、乘方是数组的每个元素对该标量施加相应的加、减、乘、除、乘方运算.设:a=[a1,a2,…,an],c=标量则:a+c=[a1+c,a2+c,…,an+c]a.*c=[a1*c,a2*c,…,an*c]a./c=[a1/c,a2/c,…,an/c](右除)a.c=[c/a1,c/a2,…,c/an](左除)a.^c=[a1^c,a2^c,…,an^c]c.^a=[c^a1,c^a2,…,c^an]MATLAB(shuzu3) (2)数组-数组运算当两个数组有相同维数时,加、减、乘、除、幂运算可按元素对元素方式进行的,不同大小或维数的数组是不能进行运算的.设:a=[a1,a2,…,an],b=[b1,b2,…,bn]则:a+b=[a1+b1,a2+b2,…,an+bn]a.*b=[a1*b1,a2*b2,…,an*bn]a./b=[a1/b1,a2/b2,…,an/bn]a.b=[b1/a1,b2/a2,…,bn/an]a.^b=[a1^b1,a2^b2,…,an^bn]MATLAB(shuzu4)返回 三、矩阵逗号或空格用于分隔某一行的元素,分号用于区分不同的行.除了分号,在输入矩阵时,按Enter键也表示开始一新行.输入矩阵时,严格要求所有行有相同的列.例m=[1234;5678;9101112]p=[111122223333]1、矩阵的建立 特殊矩阵的建立:.MATLAB(matrix1)d=eye(m,n)产生一个m行、n列的单位矩阵c=ones(m,n)产生一个m行、n列的元素全为1的矩阵b=zeros(m,n)产生一个m行、n列的零矩阵a=[]产生一个空矩阵,当对一项操作无结果时,返回空矩阵,空矩阵的大小为零. 2、矩阵中元素的操作MATLAB(matrix2)(1)矩阵A的第r行:A(r,:)(2)矩阵A的第r列:A(:,r)(4)取矩阵A的第i1~i2行、第j1~j2列构成新矩阵:A(i1:i2,j1:j2)(5)以逆序提取矩阵A的第i1~i2行,构成新矩阵:A(i2:-1:i1,:)(6)以逆序提取矩阵A的第j1~j2列,构成新矩阵:A(:,j2:-1:j1)(7)删除A的第i1~i2行,构成新矩阵:A(i1:i2,:)=[](8)删除A的第j1~j2列,构成新矩阵:A(:,j1:j2)=[](9)将矩阵A和B拼接成新矩阵:[AB];[A;B](3)依次提取矩阵A的每一列,将A拉伸为一个列向量:A(:) (2)矩阵-矩阵运算[1]元素对元素的运算,同数组-数组运算。3、矩阵的运算(1)标量-矩阵运算同标量-数组运算。MATLAB(matrix3)[2]矩阵运算:矩阵加法:A+B矩阵乘法:A*B方阵的行列式:det(A)方阵的逆:inv(A)方阵的特征值与特征向量:[V,D]=eig[A]返回 关系与逻辑运算1、关系操作符 2、逻辑运算符 1、for循环:允许一组命令以固定的和预定的次数重复forx=array{commands}end在for和end语句之间的命令串{commands}按数组(array)中的每一列执行一次.在每一次迭代中,x被指定为数组的下一列,即在第n次循环中,x=array(:,n)控制流MATLAB提供三种决策或控制流结构:for循环、while循环、if-else-end结构.这些结构经常包含大量的MATLAB命令,故经常出现在MATLAB程序中,而不是直接加在MATLAB提示符下.例对n=1,2,…,10,求xn=的值MATLAB(for1) whileexpression{commands}end只要在表达式(expression)里的所有元素为真,就执行while和end语句之间的命令串{commands}.2、While循环与for循环以固定次数求一组命令相反,while循环以不定的次数求一组语句的值.MATLAB(while1)例设银行年利率为11.25%。将10000元钱存入银行,问多长时间会连本带利翻一番? 3、If-Else-End结构(1)有一个选择的一般形式是:ifexpression{commands}end如果在表达式(expression)里的所有元素为真,就执行if和end语句之间的命令串{commands}.MATLAB(fun1)先建立M文件fun1.m定义函数f(x),再在Matlab命令窗口输入fun1(2),fun1(-1)即可。 2)有三个或更多的选择的一般形式是:if(expression1){commands1}elseif(expression2){commands2}elseif(expression3){commands3}elseif………………………………………else{commands}endendend……end 先建立M文件fun2.m定义函数f(x),再在Matlab命令窗口输入fun2(2),fun2(0.5),fun2(-1)即可。MATLAB(fun2)返回 对以下问题,编写M文件:(1)用起泡法对10个数由小到大排序.即将相邻两个数比较,将小的调到前头.(2)有一个矩阵,编程求出其最大值及其所处的位置.(3)编程求(4)一球从100米高度自由落下,每次落地后反跳回原高度的一半,再落下.求它在第10次落地时,共经过多少米?第10次反弹有多高?(5)有一函数,写一程序,输入自变量的值,输出函数值.实验作业返回'