• 3.84 MB
  • 2022-04-29 14:35:34 发布

试验数据处理教学课件PPT

  • 60页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'第二章试验数据处理试验的目的通常是要以最小的代价从一系列的方案(工艺、配方)中选出最佳方案,方案效果要通过试验结果来表现,试验结果只能从实际测得的数据得到反映。由于各种因素的影响,测量的数据往往不一致,常常具有随机变化成份。要得到可以真正反映试验结果的信息,必须对测得的数据进行必要的处理。 2.1试验设计与数据处理的基本概念2.1.1常用术语一.质量特性值表现质量特性的数据称为质量特性值,简称为特性值。根据其性质可以分为三类:1.计量特性值:用连续变化的变量表示的特性值(即浮点数)。2.计数特性值:用离散变量表示的特性值(即整型数)。3.0、1数据:实际上是布尔数,如“真”与“假”、“合格”与“不合格”。 二.试验指标在试验设计中,根据试验目的而选定的用来判断试验结果的特性值称为试验指标。试验指标分为二种:数量指标(定量):可用数量来表示,如重量、强度、合格率等。非数量指标(定性):难以用数量来表示,如光泽、味道、手感等。试验指标可以是一个或多个,应尽量选取计数计量特性值作为试验指标。 用是否可控,把因素分为可控因素(如温度、压力、切削速度、走刀量等)水平可以比较并且可以人为选择的因素。如:压力、催化剂的各类、电阻值、电容值等。不可控因素(如:刀具的振动、磨损等)三.试验因素对试验指标可能有影响的原因或因素称为试验因素,简称因素,有时称为因子,它是试验中重点考察的内容。用大写字母表示,如:因素A,因素B。 误差因素:影响试验结果或产品质量的内外干扰、随机干扰的总和。按因素的作用,可以分为:标示因素:指外界环境条件(如:湿度、温度等)、产品的使用条件(如:电压、频率、转速等)等。它不能人为的选择和控制。区组因素:为了减少试验误差而确定的因素,如:加工某零件时,不同的操作者、不同的原料批次、不同班次、不同机床等。信号因素:可人为调整并影响目标值的因素。如:在切削加工时,改变切削速度V可以影响加工质量,切削速度就是信号因素。 四.因素水平不同的因素状态和条件(大小)可引起试验指标的变化。因素变化的状态和条件叫做水平或级位。 选择水平时应注意以下几点所选水平应具体(水平具体是指水平应该是可以直接控制的,并且水平的变化可能直接影响试验指标的变化。)水平宜选取三水平(因为三水平因素的试验结果分析的效因图分布多呈二次函数曲线,而二次函数曲线有利于观察试验结果的趋势)水平取等间隔原则 2.1.2常用统计量和指数据的总和,常用T表示:,为观察值。平均值是表示平均水平的定量指标,一.极差R又称为变异幅,是一组数据中最大值同最小值之差。它表示一组数据中的最大离散程度。二.和、平均值 三.偏差与偏差平方和1.为观测值(1)与目标值的偏差:x1-x0,x2-x0,…xn-x0(2)与平均值的偏差:2.表征数据的分散程度时,采用偏差平方和,常用S表示。存在目标值时:不存在目标值时: 四.自由度与平均偏差平方和(方差)、标准差自由度f就是平均偏差平方和中独立平方的数据个数。存在目标值时,不存在目标值时,存在目标值时,总的方差:不存在目标值时,总的方差: 标准差又称为均方差或根方差,也是数据离散程度的一个特征值。存在目标值时,不存在目标值时, 2.2随机变量及随机误差2.2.1常用术语1.频率与概率在既定条件下进行N次试验,而事件A发生的次数为,则,事件A的频率为。N趋于无穷大时的频率即为概率,记为p(A)即:2.总体与样本研究对象的全体称为总体。从总体中随机抽取的n个用来研究的个体称为样本。 2.2.2随机量的表示数学期望值或(1)一阶矩(p(x)为概率密度函数)(2)二阶矩(3)n阶矩 2.随机变量x的方差x的真差平方的期望值称为方差,记为Var(x)或D(x),则:x服从正态分布时,称为x的标准误差。方差越大,说明x在其期望值符近的波动越大,分布越不集中,故越不精确。随机变量x、y的协方差x,y分别为随机变量,则它们的协方差为x,y相互独立时,Cov(x,y)=0 4.相关系数两随机变量的相关程度通常用相关系数表示:它是个无量纲量。 2.2.3随机误差的测量理论对某量直接测量时,都是在有限次测量条件下获得的,只能得到随机变量的一个样本。只能利用数理统计的有关理论,对被测量做出可靠的估计。某量的真值为X,在一定条件下测量N次测得的结果为,是测量的真差,是一个随机变量。 1最小二乘法在多组等精度、误差不同且相互独立的测量中,其最可信赖值是当测量值的“剩余误差平方和”为最小时所求得的值。设最可信赖值为,剩余误差平方和为:必须满足:可以求得:说明,有限次直接测量后的算术平均值就是最可信赖值。 2标准误差及其意义通常假定测量值满足正态分布的:E(x)表示了的集聚中心位置。标准差表示确定了分布曲线的胖瘦。越小,分布的越窄,说明测定时误差小的占优势,测定值对真值的离散程度小、精度高。 标准差意义的说明(1)的大小决定于测定条件。尽管N次等精度测定的误差的大小和正负都不同,但它们的是相同的,单次测定的质量都可用一个来评定。(2)标准差计算时,必须具备以下条件:a已知真差b测量中不存在系统误差c测量次数尽量多,最好是实际做法是:a选定一标准件或检定过的仪表,真值就算已知了。b测量条件要非常严格、稳定,以便消除系统误差c测量次数尽量多。 3标准误差的估计-贝塞尔公式由最小二乘原理,算术平均值是测量的最佳估计值:标准差的估计值用表示,上式称为贝塞尔公式。该式求出的是标准误差的最佳估计。 2.3坏值剔除对某一量进行了N次测量,得到样本通常,各个测量值同真值相比,出现大误差的可能性是很小的。如果某个测量值同其它相比明显超出正常范围,则称其为“坏值”。坏值的存在势必对产生较大的影响。 2.3.1出现“坏值”时先做以下处理(1)检查测量过程中是否读错、记错、写错,如肯定无误,则应从某瞬变原因方面查找(如电压突变等),原因找到后即可去掉坏值。(2)如条件允许,可在误差大处加大测量次数,借以发现大误差的原因。(3)用已知的统计学判据,确认“坏值”的存在。 2.3.2剔除坏值的莱依塔判据1找出中的最大值和最小值2计算3分别对和进行判断,如果:(其中)则予以剔除(R称为残差)。4剔除后,再按1,2,3步骤进行处理,直到以上不等式不成立为止。以上是假定测量值x满足正态分布 例1对某合金导线的电阻值进行了24次测量,结果如下表所示,试用伊莱达准则判断结果中有无异常数据。 解:(1)计算数据的平均值和标准差:(2)求数据的最大残差计算结果如下表所示: 可见,第21次测量值的残差最大,(3)比较因此,X21是异常数据,应予以剔除。(4)剔除X21后,重新计算均值和标准差,并判断是否存在数据异常:所以,剩余的23个数据无异常。(5)结论原测量的24个数据中,X21是坏值应当除去,其余数据均有效。 2.3.3剔除坏值的其它判据其它判据主要有:概率积分判据肖维涅判据格拉布斯判据等由于课时有限,这些不详细介绍,有兴趣的同学可以参考《实验数据处理与曲线拟合》石振东、刘国庆编哈尔滨船舶工程学院出版社 2.4系统误差的测定方法与技巧系统误差的数值往往远大于随机误差,数据里必须对系统误差及时发现并做适当处理,否则一定会歪曲测定结果。 2.4.1系统误差的特点及处理方法系统误差分为两种:(1)大小及符号固定不变,称为系统常差(2)按一定的规律变化称为系统变差系统误差产生的原因:(1)仪器、设备、实验装备的不完备,或环境条件发生变化。(2)试验方案、试验方法、试验原理不完善、不正确。 减少系统误差的有效方法(1)试验前,尽可能考虑全面些,充分预计试验中可能产生系统误差的来源和因素,并设法消除它们的影响或将这些影响减弱到最小。(2)试验中,采用合理、正确的测定方法,以减弱系统误差的影响。(3)试验后,若发现存在系统误差,应查明原因,等消除后再重做试验,以达到满意结果。 2.4.2系统误差的发现一实验对比法对不同实验条件下的结果进行对比,若具有相同的误差,则可以认为存在系统误差。高精度的仪器的测量结果同一般仪器的结果相对比,若有误差,则认为一般仪器存在系统误差。二剩余误差观察法计算均值和各剩余误差,做出图,并观察大致趋势,以便判断是否存在系统误差。 某量的真值为u,测量值xi,其中包含有系统误差和随机误差,即:测量值的平均值为:因剩余差为:当系统误差较大时,可以认为剩余误差的大小和符号由系统误差确定。 1若各Si大体是正负相间且稳定在一个水平上又无过大的波动,如右图所示,则认为数据中没有系统变差(不一定没有常差) 2如右图所示,各Si呈有规律的增或减,类似于,则认为数据中有线性系统误差。 3若Si的大小、符号等有规律地由正变负、由负变正交替变化,可以认为其中含有周期性的系统误差,如右图所示。 4若各个Si值类似于右图一样变化,则可以认为数据中存在有线性系统误差和周期性系统误差。 三计算比较法对同一量值重复测量N次,将N次测量结果再分为M组,每组中有K个测定值,分别计算出各组的统计量。误差之间相互独立,的标准差,任意两组之间不存在系统误差的标志是: 2.5间接测定误差---误差的传递间接测量就是将直接测得的量代入已知的函数,从而求得被测量。如:测量密度、面积、体积等。直接测得的量中难免存在误差,这些误差对间接测量的结果的影响是通过误差的传递来表现的。不同的函数关系,误差的传递有相当大的差别。 2.5.1函数为和与差的关系这是一种最简单的情况,如测量两电阻串联后的阻值,或两电容并联后的电容值等。函数关系可表示为:其中,是直接测定的真值。函数的最可信赖关系是:真差关系是:标准差关系是:方差关系是:若X为真值或均值,由于真值不知,取均值则有: 以上公式是建立在是相互独立基础上的,若不独立,则有以下关系:是的协方差。是的相关系数。 2.5.2函数为直接测量值的倍数关系一的最简单情况x是直接测定值,c是常数。最可信赖值关系:真差关系:方差关系: 二当时最可信赖值关系:真差关系:方差关系: 2.5.3函数为两直接测量值的积函数为时:最可信赖关系是:真差关系是:方差关系是: 2.5.4误差传递普遍公式一直接测定值为函数的唯一变量,即:最可依赖关系:真差关系:相对误差关系:方差关系: 二直接测量值为函数的两个独立变量最可信赖关系:真差关系:方差关系: 2.5.5误差传递的反问题:精度分配若已规定间接测定值的总的误差,如何确定直接测定值的精度?该部分就是要解决这个问题。一般来说,这个问题只能在一定的假设条件下才能得以解决。 一按照相等效应原则进行精度分配该原则把各直接测量值的分量误差对总误差所起的作用和影响看做是相等的。即:所以,可以导出标准差的分配公式: 二按实际情况进行误差调整原则按等效应原则分配精度时,各个误差值并不相等,而是同成反比关系。实际上,的大小与测量方案及试验设计有关,而与测量、制造的难易程度无关,会产生一些不合理现象:有些容易加工的尺寸却分配了较大的误差,而另外一些不容易加工的尺寸却分配了较小的误差,从而造成了极大的浪费。调整原则是:对于难以实现、难以保证的误差项要适当放大;对于容易实现和保证的误差项要适当缩小。 调整后的误差分配是否合理,主要取决于调整者的专业知识是否深广,实践经验是否丰富。为保证良好的效果,调整后应该:1按精度的计算进行校核。2对于特别重要的实验,在调整时要对误差限制严些,以便留有安全系数以较大的概率确保实验质量。 2.5.6间接测量值误差呈现最小、最有利测量条件的确定方法间接测量值是一个或多个直接测量值的函数。要使间接测量误差值最小,实际上是一个求最小值的问题。测量误差通常以标准差来表示。若:则: 一间接测量值同直接测量值勤的函数关系应该为最简洁的形式,函数中的独立变量越少,引起函数误差的来源也越少。二间接测量值应选择那些易于加工、易于测量的量,这样间接测量值的误差会小些,总的误差也会有相应的减少。对于机械来说,一般情况下,内尺寸(如:孔)比外尺寸(如:轴)难以加工、难以测量,这时就应尽量选择含有外尺寸的表达式,即选择那些易于测量的值作为间接测量值的函数变量。 三寻找使或趋近于零的条件使间接测量绝对误差为最小的最佳测试条件的确定若:真差关系为:只要保证:即可。若要保证相对误差或方差为最小,只要将上式中的真差改为相对误差或方差即可。 2.5.7试验测定数据处理步骤一算术平均值及其校核算术平均值:剩余误差:理论上说:实际上:原因是:1平均值计算有误2计算平均值时存在“四舍五入”造成的误差 剩余误差和校核规则1剩余误差和的绝对值应满足下列公式:上式中,A是中的最小单位2为正时:为负时:为零时: 二直接测定时数据处理一般步骤1坏值剔除2判断各个测定值中有无系统误差存在,如果有,应设法消除来允许范围。3计算样本平均值,并进行校核。4计算标准差 三间接测量值的数据处理步骤1根据确定已知函数关系,按直接测量结果计算出最可信赖值。2计算各误差的传递系数值。3按确定的函数关系,写出真差(微分)关系、方差关系,并计算出结果。 例2散热器的散热量Q与热水流量L和散热器的进出口温度T1、T2有以下关系:式中,分别为热水的密度和比热容。为测定某散热器的散热量,用量程为40~400L/h的转子流量计测热水量,用玻璃水银温度计测热水温度。在进水温度为T1=95度,出水温度为70度,L=50L/h的设计工况下,为使散热量的测试误差不大于10%,如何选择转子流量计和玻璃水银温度计的精度?解:这是一个间接测量问题,直接测量量为热水流量L、进出口温度T1和T2,要求选用转子流量泵的精度等级G和玻璃水银温度计的误差限从而使散热量的测试误差限 '