'概率与统计开课系:非数学专业教师:叶梅燕e-mail:yemeiyan@ncu.edu.cn
教材:《概率论与数理统计》王松桂等编科学出版社2002参考书:1.《概率论与数理统计》浙江大学盛骤等编高等教育出版社2.《概率论与数理统计》魏振军编中国统计出版社
序言概率论是研究什么的?随机现象:不确定性与统计规律性概率论——研究和揭示随机现象的统计规律性的科学
目录第一章随机事件及其概率第二章随机变量第三章随机变量的数字特征第四章样本及抽样分布第五章参数估计第六章假设检验
第一章随机事件及其概率随机事件及其运算概率的定义及其运算条件概率事件的独立性
1.1随机事件及其概率一、随机试验(简称“试验”)随机试验的特点(p1)1.可在相同条件下重复进行;2.一次试验之前无法确定具体是哪种结果出现,但能确定所有的可能结果。随机试验常用E表示
E1:抛一枚硬币,分别用“H”和“T”表示出正面和反面;E2:将一枚硬币连抛三次,考虑正反面出现的情况;E3:某城市某年某月内发生交通事故的次数;E4:掷一颗骰子,可能出现的点数;E5:记录某网站一分钟内受到的点击次数;E6:在一批灯泡中任取一只,测其寿命;E7:任选一人,记录他的身高和体重。随机实验的例子随机事件
二、样本空间(p2)1、样本空间:试验的所有可能结果所组成的集合称为样本空间,记为={e};2、样本点:试验的单个结果或样本空间的单元素称为样本点,记为e.3.由样本点组成的单点集称为基本事件,也记为e.幻灯片6
随机事件1.定义样本空间的任意一个子集称为随机事件,简称“事件”.记作A、B、C等任何事件均可表示为样本空间的某个子集.称事件A发生当且仅当试验的结果是子集A中的元素。2.两个特殊事件:必然事件S、不可能事件.(p3)例如对于试验E2,以下A、B、C即为三个随机事件:A=“至少出一个正面”={HHH,HHT,HTH,THH,HTT,THT,TTH};B=“两次出现同一面”={HHH,TTT}C=“恰好出现一次正面”={HTT,THT,TTH}再如,试验E6中D=“灯泡寿命超过1000小时”={x:1000
m),要求第i组恰有ni个球(i=1,…m),共有分法:
4随机取数问题例4从1到200这200个自然数中任取一个,(1)求取到的数能被6整除的概率(2)求取到的数能被8整除的概率(3)求取到的数既能被6整除也能被8整除的概率解:N(S)=200,N(3)=[200/24]=8N(1)=[200/6]=33,N(2)=[200/8]=25(1),(2),(3)的概率分别为:33/200,1/8,1/25
某人向目标射击,以A表示事件“命中目标”,P(A)=?定义:(p8)事件A在n次重复试验中出现nA次,则比值nA/n称为事件A在n次重复试验中出现的频率,记为fn(A).即fn(A)=nA/n.1.3频率与概率
历史上曾有人做过试验,试图证明抛掷匀质硬币时,出现正反面的机会均等。实验者nnHfn(H)DeMorgan204810610.5181Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.5005
频率的性质(1)0fn(A)1;(2)fn(S)=1;fn()=0(3)可加性:若AB=,则fn(AB)=fn(A)+fn(B).实践证明:当试验次数n增大时,fn(A)逐渐趋向一个稳定值。可将此稳定值记作P(A),作为事件A的概率
1.3.2.概率的公理化定义注意到不论是对概率的直观理解,还是频率定义方式,作为事件的概率,都应具有前述三条基本性质,在数学上,我们就可以从这些性质出发,给出概率的公理化定义
1.定义(p8)若对随机试验E所对应的样本空间中的每一事件A,均赋予一实数P(A),集合函数P(A)满足条件:(1)P(A)≥0;(2)P()=1;(3)可列可加性:设A1,A2,…,是一列两两互不相容的事件,即AiAj=,(ij),i,j=1,2,…,有P(A1A2…)=P(A1)+P(A2)+….(1.1)则称P(A)为事件A的概率。
2.概率的性质P(10-13)(1)有限可加性:设A1,A2,…An,是n个两两互不相容的事件,即AiAj=,(ij),i,j=1,2,…,n,则有P(A1A2…An)=P(A1)+P(A2)+…P(An);(3)事件差A、B是两个事件,则P(A-B)=P(A)-P(AB)(2)单调不减性:若事件AB,则P(A)≥P(B)
(4)加法公式:对任意两事件A、B,有P(AB)=P(A)+P(B)-P(AB)该公式可推广到任意n个事件A1,A2,…,An的情形;(3)互补性:P(A)=1-P(A);(5)可分性:对任意两事件A、B,有P(A)=P(AB)+P(AB).
某市有甲,乙,丙三种报纸,订每种报纸的人数分别占全体市民人数的30%,其中有10%的人同时定甲,乙两种报纸.没有人同时订甲乙或乙丙报纸.求从该市任选一人,他至少订有一种报纸的概率.EX解:设A,B,C分别表示选到的人订了甲,乙,丙报
例1.3.2.在110这10个自然数中任取一数,求(1)取到的数能被2或3整除的概率,(2)取到的数即不能被2也不能被3整除的概率,(3)取到的数能被2整除而不能被3整除的概率。解:设A—取到的数能被2整除;B--取到的数能被3整除故
袋中有十只球,其中九只白球,一只红球,十人依次从袋中各取一球(不放回),问第一个人取得红球的概率是多少?第二个人取得红球的概率是多少?1.4条件概率
若已知第一个人取到的是白球,则第二个人取到红球的概率是多少?已知事件A发生的条件下,事件B发生的概率称为A条件下B的条件概率,记作P(B|A)若已知第一个人取到的是红球,则第二个人取到红球的概率又是多少?
一、条件概率例1设袋中有3个白球,2个红球,现从袋中任意抽取两次,每次取一个,取后不放回,(1)已知第一次取到红球,求第二次也取到红球的概率;(2)求第二次取到红球的概率(3)求两次均取到红球的概率设A——第一次取到红球,B——第二次取到红球
S=ABA——第一次取到红球,B——第二次取到红球
显然,若事件A、B是古典概型的样本空间S中的两个事件,其中A含有nA个样本点,AB含有nAB个样本点,则称为事件A发生的条件下事件B发生的条件概率(p14)一般地,设A、B是S中的两个事件,则
“条件概率”是“概率”吗?概率定义若对随机试验E所对应的样本空间S中的每一事件A,均赋予一实数P(A),集合函数P(A)满足条件:P(A)≥0;(2)P(S)=1;(3)可列可加性:设A1,A2,…,是一列两两互不相容的事件,即AiAj=,(ij),i,j=1,2,…,有P(A1A2…)=P(A1)+P(A2)+….则称P(A)为事件A的概率。
例2.(p14)一盒中混有100只新,旧乒乓球,各有红、白两色,分类如下表。从盒中随机取出一球,若取得的是一只红球,试求该红球是新球的概率。红白新4030旧2010设A--从盒中随机取到一只红球.B--从盒中随机取到一只新球.
二、乘法公式(p15)设A、B,P(A)>0,则P(AB)=P(A)P(B|A).(1.4.2)式(1.4.2)就称为事件A、B的概率乘法公式。式(1.4.2)还可推广到三个事件的情形:P(ABC)=P(A)P(B|A)P(C|AB).(1.4.3)一般地,有下列公式:P(A1A2…An)=P(A1)P(A2|A1)...P(An|A1…An-1).(1.4.4)
例3合中有3个红球,2个白球,,每次从袋中任取一只,观察其颜色后放回,并再放入一只与所取之球颜色相同的球,若从合中连续取球4次,试求第1、2次取得白球、第3、4次取得红球的概率。解:设Ai为第i次取球时取到白球,则
三、全概率公式与贝叶斯公式例4.(p16)市场上有甲、乙、丙三家工厂生产的同一品牌产品,已知三家工厂的市场占有率分别为1/4、1/4、1/2,且三家工厂的次品率分别为2%、1%、3%,试求市场上该品牌产品的次品率。
定义(p17)事件组A1,A2,…,An(n可为),称为样本空间的一个划分,若满足:A1A2……………AnB
定理1、(p17)设A1,…,An是的一个划分,且P(Ai)>0,(i=1,…,n),则对任何事件B有式(1.4.5)就称为全概率公式。
例5(P17)有甲乙两个袋子,甲袋中有两个白球,1个红球,乙袋中有两个红球,一个白球.这六个球手感上不可区别.今从甲袋中任取一球放入乙袋,搅匀后再从乙袋中任取一球,问此球是红球的概率?解:设A1——从甲袋放入乙袋的是白球;A2——从甲袋放入乙袋的是红球;B——从乙袋中任取一球是红球;甲乙
定理2(p18)设A1,…,An是S的一个划分,且P(Ai)>0,(i=1,…,n),则对任何事件BS,有式(1.4.6)就称为贝叶斯公式。思考:上例中,若已知取到一个红球,则从甲袋放入乙袋的是白球的概率是多少?答:
(P22,22.)商店论箱出售玻璃杯,每箱20只,其中每箱含0,1,2只次品的概率分别为0.8,0.1,0.1,某顾客选中一箱,从中任选4只检查,结果都是好的,便买下了这一箱.问这一箱含有一个次品的概率是多少?解:设A:从一箱中任取4只检查,结果都是好的.B0,B1,B2分别表示事件每箱含0,1,2只次品已知:P(B0)=0.8,P(B1)=0.1,P(B2)=0.1由Bayes公式:
例6(p18)数字通讯过程中,信源发射0、1两种状态信号,其中发0的概率为0.55,发1的概率为0.45。由于信道中存在干扰,在发0的时候,接收端分别以概率0.9、0.05和0.05接收为0、1和“不清”。在发1的时候,接收端分别以概率0.85、0.05和0.1接收为1、0和“不清”。现接收端接收到一个“1”的信号。问发端发的是0的概率是多少?)BA(P=)A(P)AB(P)A(P)AB(P)A(P)AB(P+==0.067解:设A---发射端发射0,B---接收端接收到一个“1”的信号.0(0.55)01不清(0.9)(0.05)(0.05)1(0.45)10不清(0.85)(0.05)(0.1)
条件概率条件概率小结缩减样本空间定义式乘法公式全概率公式贝叶斯公式
1.5事件的独立性一、两事件独立(P19)定义1设A、B是两事件,P(A)≠0,若P(B)=P(B|A)(1.5.1)则称事件A与B相互独立。式(1.5.1)等价于:P(AB)=P(A)P(B)(1.5.2)
从一付52张的扑克牌中任意抽取一张,以A表示抽出一张A,以B表示抽出一张黑桃,问A与B是否独立?定理、以下四件事等价:(1)事件A、B相互独立;(2)事件A、B相互独立;(3)事件A、B相互独立;(4)事件A、B相互独立。
二、多个事件的独立定义2、(p20)若三个事件A、B、C满足:(1)P(AB)=P(A)P(B),P(AC)=P(A)P(C),P(BC)=P(B)P(C),则称事件A、B、C两两相互独立;若在此基础上还满足:(2)P(ABC)=P(A)P(B)P(C),(1.5.3)则称事件A、B、C相互独立。
一般地,设A1,A2,…,An是n个事件,如果对任意k(1kn),任意的1i1i2…ikn,具有等式P(Ai1Ai2…Aik)=P(Ai1)P(Ai2)…P(Aik)(1.5.4)则称n个事件A1,A2,…,An相互独立。思考:1.设事件A、B、C、D相互独立,则2.一颗骰子掷4次至少得一个六点与两颗骰子掷24次至少得一个双六,这两件事,哪一个有更多的机会遇到?答:0.518,0.496
三、事件独立性的应用1、加法公式的简化:若事件A1,A2,…,An相互独立,则(1.5.5)2、在可靠性理论上的应用P23,24.如图,1、2、3、4、5表示继电器触点,假设每个触点闭合的概率为p,且各继电器接点闭合与否相互独立,求L至R是通路的概率。
设A---L至R为通路,Ai---第i个继电器通,i=1,2,…5由全概率公式
EX1:一个学生欲到三家图书馆借一本参考书.每家图书馆购进这种书的概率是1/2,购进这种书的图书馆中该书被借完了的概率也是1/2.各家图书馆是否购进该书相互独立.问该学生能够借到书的概率是多少?第一章小结本章由六个概念(随机试验、事件、概率、条件概率、独立性),四个公式(加法公式、乘法公式、全概率公式、贝叶斯公式)和一个概型(古典概型)组成
第二章随机变量离散型随机变量随机变量的分布函数连续型随机变量一维随机变量函数的分布二维随机变量的联合分布多维随机变量的边缘分布与独立性条件分布多维随机变量函数的分布
关于随机变量(及向量)的研究,是概率论的中心内容.这是因为,对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而这些量就是随机变量.也可以说:随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,一如数学分析中的常量与变量的区分那样.变量概念是高等数学有别于初等数学的基础概念.同样,概率论能从计算一些孤立事件的概念发展为一个更高的理论体系,其基础概念是随机变量
2.1随机变量的概念(p24)定义.设S={e}是试验的样本空间,如果量X是定义在S上的一个单值实值函数即对于每一个eS,有一实数X=X(e)与之对应,则称X为随机变量。随机变量常用X、Y、Z或、、等表示。随机变量的特点:1X的全部可能取值是互斥且完备的2X的部分可能取值描述随机事件
请举几个实际中随机变量的例子EX.引入适当的随机变量描述下列事件:①将3个球随机地放入三个格子中,事件A={有1个空格},B={有2个空格},C={全有球}。②进行5次试验,事件D={试验成功一次},F={试验至少成功一次},G={至多成功3次}
随机变量的分类:随机变量
2.2离散型随机变量(P25)定义若随机变量X取值x1,x2,…,xn,…且取这些值的概率依次为p1,p2,…,pn,…,则称X为离散型随机变量,而称P{X=xk}=pk,(k=1,2,…)为X的分布律或概率分布。可表为X~P{X=xk}=pk,(k=1,2,…),或…Xx1x2…xK…Pkp1p2…pk…
(1)pk0,k=1,2,…;(2)例1设袋中有5只球,其中有2只白3只黑。现从中任取3只球(不放回),求抽得的白球数X为k的概率。解k可取值0,1,22.分布律的性质
例2.某射手对目标独立射击5次,每次命中目标的概率为p,以X表示命中目标的次数,求X的分布律。解:设Ai第i次射击时命中目标,i=1,2,3,4,5则A1,A2,…A5,相互独立且P(Ai)=p,i=1,2,…5.SX={0,1,2,3,4,5},(1-p)5
·几个常用的离散型分布(一)贝努里(Bernoulli)概型与二项分布1.(0-1)分布(p26)若以X表示进行一次试验事件A发生的次数,则称X服从(0-1)分布(两点分布)X~P{X=k}=pk(1-p)1-k,(01时,X的全部取值为:m,m+1,m+2,…P{X=m+1}=P{第m+1次试验时成功并且在前m次试验中成功了m-1次}
想一想:离散型随机变量的统计特征可以用分布律描述,非离散型的该如何描述?如:熊猫彩电的寿命X是一个随机变量,对消费者来说,你是否在意{X>5年}还是{X>5年零1分钟}
2.3随机变量的分布函数一、分布函数的概念.定义(P29)设X是随机变量,对任意实数x,事件{Xx}的概率P{Xx}称为随机变量X的分布函数。记为F(x),即F(x)=P{Xx}.易知,对任意实数a,b(a1时,F(x)=1当0≤x≤1时,特别,F(1)=P{0≤x≤1}=k=1
用分布函数描述随机变量不如分布律直观,对非离散型随机变量,是否有更直观的描述方法?ab
2.4连续型随机变量一、概率密度1.定义(p33)对于随机变量X,若存在非负函数f(x),(-0的指数分布。其分布函数为
例.电子元件的寿命X(年)服从参数为3的指数分布(1)求该电子元件寿命超过2年的概率。(2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少?解
例.某公路桥每天第一辆汽车过桥时刻为T,设[0,t]时段内过桥的汽车数Xt服从参数为t的泊松分布,求T的概率密度。解当t≤0时,当t>0时,=1-{在t时刻之前无汽车过桥}于是
正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。3.正态分布ABA,B间真实距离为,测量值为X。X的概率密度应该是什么形态?
其中为实数,>0,则称X服从参数为,2的正态分布,记为N(,2),可表为X~N(,2).若随机变量
(1)单峰对称密度曲线关于直线x=对称;(p38)f()=maxf(x)=.正态分布有两个特性:
(2)的大小直接影响概率的分布越大,曲线越平坦,越小,曲线越陡峻,。正态分布也称为高斯(Gauss)分布
4.标准正态分布(p38)参数=0,2=1的正态分布称为标准正态分布,记作X~N(0,1)。
分布函数表示为其密度函数表示为
一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值。(P226附表1)如,若Z~N(0,1),(0.5)=0.6915,P{1.323}的值.如在质量控制中,常用标准指标值±3作两条线,当生产过程的指标观察值落在两线之外时发出警报.表明生产出现异常.正态分布表
(p67)14一种电子元件的使用寿命X(小时)服从正态分布N(100,152),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率.解:设Y为使用的最初90小时内损坏的元件数,故则Y~B(3,p)其中正态分布表
一、离散型随机变量函数的分布律2.5一维随机变量函数的分布(p55)设X一个随机变量,分布律为X~P{X=xk}=pk,k=1,2,…若y=g(x)是一元单值实函数,则Y=g(X)也是一个随机变量。求Y的分布律.例:已知XPk-101求:Y=X2的分布律YPk10
或Y=g(X)~P{Y=g(xk)}=pk,k=1,2,…(其中g(xk)有相同的,其对应概率合并。)一般地XPkY=g(X)
二、连续型随机变量函数的密度函数1、一般方法(p56)若X~f(x),-Y}
求:(1)常数A;(2)F(1,1);(3)(X,Y)落在三角形区域D:x0,y0,2X+3y6内的概率。例4.设解(1)由归一性
(3)(X,Y)落在三角形区域D:x0,y0,2X+3y6内的概率。解
3.两个常用的二维连续型分布(1)二维均匀分布(p45)若二维随机变量(X,Y)的密度函数为则称(X,Y)在区域D上(内)服从均匀分布。易见,若(X,Y)在区域D上(内)服从均匀分布,对D内任意区域G,有
例5.设(X,Y)服从如图区域D上的均匀分布,(1)求(X,Y)的概率密度;(2)求P{Y<2X};(3)求F(0.5,0.5)
其中,1、2为实数,1>0、2>0、||<1,则称(X,Y)服从参数为1,2,1,2,的二维正态分布,可记为(2)二维正态分布N(1,2,1,2,)若二维随机变量(X,Y)的密度函数为(P101)
分布函数的概念可推广到n维随机变量的情形。事实上,对n维随机变量(X1,X2,…,Xn),F(x1,x2,…,xn)=P(X1x1,X2x2,…,Xnxn)称为的n维随机变量(X1,X2,…,Xn)的分布函数,或随机变量X1,X2,…,Xn的联合分布函数。定义2.4.6.n维随机变量(X1,X2,...Xn),如果存在非负的n元函数f(x1,x2,...xn)使对任意的n元立方体
定义2.4.7.若(X1,X2,...Xn)的全部可能取值为Rn上的有限或可列无穷多个点,称(X1,X2,...Xn)为n维离散型的,称P{X1=x1,X2=x2,...Xn=xn},(x1,x2,...xn)为n维随机变量(X1,X2,...Xn)的联合分布律。则称(X1,X2,...Xn)为n维连续型随机变量,称f(x1,x2,...xn)为(X1,X2,...Xn)的概率密度。
求:(1)P{X0},(2)P{X1},(3)P{Yy0}EX:随机变量(X,Y)的概率密度为xyD答:P{X0}=0
FY(y)=F(+,y)==P{Yy}称为二维随机变量(X,Y)关于Y的边缘分布函数.2.7.边缘分布与独立性一、边缘分布函数(p46)FX(x)=F(x,+)==P{Xx}称为二维随机变量(X,Y)关于X的边缘分布函数;边缘分布实际上是高维随机变量的某个(某些)低维分量的分布。
例1.已知(X,Y)的分布函数为求FX(x)与FY(y)。
二、边缘分布律若随机变量X与Y的联合分布律为(p47)(X,Y)~P{X=xi,Y=yj,}=pij,i,j=1,2,…则称P{X=xi}=pi.=,i=1,2,…为(X,Y)关于X的边缘分布律;P{Y=yj}=p.j=,j=1,2,…为(X,Y)关于Y的边缘分布律。边缘分布律自然也满足分布律的性质。
例2.已知(X,Y)的分布律为xy1011/103/1003/103/10求X、Y的边缘分布律。解:xy10pi.11/103/1003/103/10p.j故关于X和Y的分布律分别为:X10Y10P2/53/5P2/53/52/53/52/53/5
三、边缘密度函数为(X,Y)关于Y的边缘密度函数。设(X,Y)~f(x,y),(x,y)R2,则称(p48)为(X,Y)关于X的边缘密度函数;同理,称易知N(1,2,12,22,)的边缘密度函数fX(x)是N(1,12)的密度函数,而fX(x)是N(2,22)的密度函数,故二维正态分布的边缘分布也是正态分布。
例3.设(X,Y)的概率密度为(1)求常数c;(2)求关于X的边缘概率密度解:(1)由归一性
设(X,Y)服从如图区域D上的均匀分布,求关于X的和关于Y的边缘概率密度x=yx=-yEX
四、随机变量的相互独立性定义2.4.1称随机变量X与Y独立,如果对任意实数a0,则称同理,对固定的i,pi.>0,称为X=xi的条件下,Y的条件分布律;
EX.设某昆虫的产卵数X服从参数为50的泊松分布,又设一个虫卵能孵化成虫的概率为0.8,且各卵的孵化是相互独立的,求此昆虫产卵数X与下一代只数Y的联合分布律.
二连续型随机变量的条件概率密度定义.给定y,设对任意固定的正数>0,极限存在,则称此极限为在条件条件下X的条件分布函数.记作可证当时
若记为在Y=y条件下X的条件概率密度,则由(3.3.3)知,当时,.类似定义,当时
例2.已知(X,Y)的概率密度为(1)求条件概率密度(2)求条件概率xy1解:=…p55
2.8多维随机变量函数的分布一、二维离散型随机变量函数的分布律设二维离散型随机变量(X,Y),(X,Y)~P(X=xi,Y=yj)=pij,i,j=1,2,…则Z=g(X,Y)~P{Z=zk}==pk,k=1,2,…(X,Y)(x1,y1)(x1,y2)…(xi,yj)…pijp12p13p14Z=g(X,Y)g(x1,y1)g(x1,y2)g(xi,yj)或
EX设随机变量X与Y独立,且均服从0-1分布,其分布律均为X01Pqp(1)求W=X+Y的分布律;(2)求V=max(X,Y)的分布律;(3)求U=min(X,Y)的分布律。(4)求w与V的联合分布律。
(X,Y)(0,0)(0,1)(1,0)(1,1)pijW=X+YV=max(X,Y)U=min(X,Y)011201110001VW01012000
二、多个随机变量函数的密度函数1、一般的方法:分布函数法(p60)若(X1,X2,…,Xn)~f(x1,x2,…,xn),(x1,x2,…,xn)Rn,Y=g(X1,X2,…,Xn),则可先求Y的分布函数:然后再求出Y的密度函数:
2、几个常用函数的密度函数(1)和的分布已知(X,Y)~f(x,y),(x,y)R2,求Z=X+Y的密度。zx+y=zx+yz若X与Y相互独立,则Z=X+Y的密度函数
例1.设随机变量X与Y独立且均服从标准正态分布,求证:Z=X+Y服从N(0,2)分布。一般地,设随机变量X1,X2,...,Xn独立且Xi服从正态分布N(i,i2),i=1,...,n,则p62
例2.卡车装运水泥,设每袋水泥的重量X(kg)服从N(50,2.52)分布,该卡车的额定载重量为2000kg,问最多装多少袋水泥,可使卡车超载的概率不超过0.05.解:设最多装n袋水泥,Xi为第i袋水泥的重量.则由题意,令查表得
(2)商的分布已知(X,Y)~f(x,y),(x,y)R2,求Z=的密度。yG10xG2特别,当X,Y相互独立时,上式可化为其中fX(x),fY(y)分别为X和Y的密度函数。
3、极大(小)值的分布设X1,X2,…,Xn相互独立,其分布函数分别为F1(x1),F2(x2),…,Fn(xn),记M=max{X1,X2,…,Xn},N=min{X1,X2,…,Xn}则,M和N的分布函数分别为:FM(z)=F1(z)…Fn(z)
特别,当X1,X2,…,Xn独立同分布(分布函数相同)时,则有FM(z)=[F(z)]n;FN(z)=1-[1-F(z)]n.进一步地,若X1,X2,…,Xn独立且具相同的密度函数f(x),则M和N的密度函数分别由以下二式表出fM(z)=n[F(z)]n-1f(z);fN(z)=n[1-F(z)]n-1f(z).
例3.设系统L由两个相互独立的子系统联接而成,联接的方式分别为(i)串联,(ii)并联,如图所示设L1,L2的寿命分别为X与Y,已知它们的概率密度分别为其中>0,>0,试分别就以上两种联结方式写出L的寿命Z的概率密度.
小结
第三章随机变量的数字特征随机变量的数学期望随机变量的方差随机变量的协方差和相关系数大数定律中心极限定理
3.1数学期望一.数学期望的定义例1设某班40名学生的概率统计成绩及得分人数如下表所示:分数4060708090100人数1691572则学生的平均成绩是总分÷总人数(分)。即数学期望——描述随机变量取值的平均特征
定义1.若X~P{X=xk}=pk,k=1,2,…n,则称定义2.(p73)若X~P{X=xk}=pk,k=1,2,…,且为r.v.X的数学期望,简称期望或均值。,则称为r.v.X的数学期望
例2掷一颗均匀的骰子,以X表示掷得的点数,求X的数学期望。定义3若X~f(x),-0)
(p77)定理2若X~f(x),-0,DY>0,则称为X与Y的相关系数.注:若记称为X的标准化,易知EX*=0,DX*=1.且
2.相关系数的性质(1)|XY|1;(2)|XY|=1存在常数a,b使P{Y=aX+b}=1;(3)X与Y不相关XY=0;1.设(X,Y)服从区域D:00,使得则称{Xn}依概率收敛于X.可记为切比雪夫不等式
如意思是:当a而意思是:时,Xn落在内的概率越来越大.,当
二.几个常用的大数定律1.切比雪夫大数定律设{Xk,k=1,2,...}为独立的随机变量序列,且有相同的数学期望,及方差2>0,则即若任给>0,使得
证明:由切比雪夫不等式这里故
2.伯努里大数定律设进行n次独立重复试验,每次试验中事件A发生的概率为p,记fn为n次试验中事件A发生的频率,则证明:设第i次试验事件A发生第i次试验事件A不发生则由切比雪夫大数定理
3.辛钦大数定律若{Xk,k=1.2,...}为独立同分布随机变量序列,EXk=<,k=1,2,…则推论:若{Xi,i=1.2,...}为独立同分布随机变量序列,E(X1k)=<,则
3.6.3.中心极限定理一.依分布收敛设{Xn}为随机变量序列,X为随机变量,其对应的分布函数分别为Fn(x),F(x).若在F(x)的连续点,有则称{Xn}依分布收敛于X.可记为
二.几个常用的中心极限定理1.独立同分布中心极限定理(Levy-Lindeberg)设{Xn}为独立同分布随机变量序列,若EXk=<,DXk=2<,k=1,2,…,则{Xn}满足中心极限定理。根据上述定理,当n充分大时
例1.将一颗骰子连掷100次,则点数之和不少于500的概率是多少?解:设Xk为第k次掷出的点数,k=1,2,…,100,则X1,…,X100独立同分布.由中心极限定理
设随机变量n(n=1,2,...)服从参数为n,p(060000}=P{1000012-aX>60000}=P{X60000/a}0.9;(2)设赔偿金为a元,则令由中心极限定理,上式等价于
第四章样本及抽样分布引言随机样本抽样分布run
4.1随机样本一、总体与样本1.总体:研究对象的全体。通常指研究对象的某项数量指标。组成总体的元素称为个体。从本质上讲,总体就是所研究的随机变量或随机变量的分布。
2.样本:来自总体的部分个体X1,…,Xn如果满足:(1)同分布性:Xi,i=1,…,n与总体同分布.(2)独立性:X1,…,Xn相互独立;则称为容量为n的简单随机样本,简称样本。而称X1,…,Xn的一次实现为样本观察值,记为x1,…,xn
来自总体X的随机样本X1,…,Xn可记为显然,样本联合分布函数或密度函数为或
3.总体、样本、样本观察值的关系总体样本样本观察值理论分布统计是从手中已有的资料——样本观察值,去推断总体的情况——总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体
二、统计量定义:称样本X1,…,Xn的函数g(X1,…,Xn)是总体X的一个统计量,如果g(X1,…,Xn)不含未知参数几个常用的统计量:
3.样本k阶矩
4.2抽样分布一、2—分布统计量的分布称为抽样分布。数理统计中常用到如下三个分布:2—分布、t—分布和F—分布。
2.2—分布的密度函数f(y)曲线
3.分位点设X~2(n),若对于:0<<1,存在满足则称为分布的上分位点。P228附表3
4.性质:((p124)a.分布可加性若X~2(n1),Y~2(n2),X,Y独立,则X+Y~2(n1+n2)b.期望与方差若X~2(n),则E(X)=n,D(X)=2n1.构造若~N(0,1),~2(n),与独立,则t(n)称为自由度为n的t—分布。二、t—分布
t(n)的概率密度为(p125)
2.基本性质:(1)f(t)关于t=0(纵轴)对称。(2)f(t)的极限为N(0,1)的密度函数,即3.分位点设T~t(n),若对:0<<1,存在t(n)>0,满足P{Tt(n)}=,则称t(n)为t(n)的上侧分位点
注:
三、F—分布1.构造若1~2(n1),2~2(n2),1,2独立,则称为第一自由度为n1,第二自由度为n2的F—分布,其概率密度为
2.F—分布的分位点对于:0<<1,若存在F(n1,n2)>0,满足P{FF(n1,n2)}=,则称F(n1,n2)为F(n1,n2)的上侧分位点;
证明:设F~F(n1,n2),则注:得证!
4.3正态总体的抽样分布定理证明:是n个独立的正态随机变量的线性组合,故服从正态分布
(3)证明:且U与V独立,根据t分布的构造得证!
(P127)
例1:设总体X~N(10,32),X1,…,Xn是它的一个样本(1)写出Z所服从的分布;(2)求P(Z>11).
例2:设X1,…,X10是取自N(0,0.32)的样本,求
例3:设X1,…,Xn是取自N(,2)的样本,求样本方差S2的期望与方差。
第五章参数估计点估计估计量的评选标准区间估计正态总体参数的区间估计5.2
5.1点估计一、参数估计的概念定义设X1,…,Xn是总体X的一个样本,其分布函数为F(x;),。其中为未知参数,为参数空间,若统计量g(X1,…,Xn)可作为的一个估计,则称其为的一个估计量,记为注:F(x;)也可用分布律或密度函数代替.
若x1,…,xn是样本的一个观测值。由于g(x1,…,xn)是实数域上的一个点,现用它来估计,故称这种估计为点估计。点估计的经典方法是矩估计法与极大似然估计法。
二、矩估计法(简称“矩法”)关键点:1.用样本矩作为总体同阶矩的估计,即2.约定:若是未知参数的矩估计,则g()的矩估计为g(),
例1:设X1,…,Xn为取自总体B(m,p),的样本,其中m已知,0
0为一给定实数。求p=P{X0未知,求参数的极大似然估计。
5.2估计量的评选标准一、一致性
例1.设已知00,b>0,a+b=1统计量都是E(X)的无偏估计,并求a,b使所得统计量最有效
5.3区间估计一、概念定义:设总体X的分布函数F(x;)含有未知参数,对于给定值(0<<1),若由样本X1,…,Xn确定的两个统计量使则称随机区间为的置信度为1的置信区间注:F(x;)也可换成概率密度或分布律。
5.4正态总体参数的区间估计1、2已知
/2/21-可取
(1-)1-的置信度为1的置信区间为注:的1置性区间不唯一。都是的1置性区间.但=1/2时区间长最短.
求正态总体参数置信区间的解题步骤:(1)根据实际问题构造样本的函数,要求仅含待估参数且分布已知;(2)令该函数落在由分位点确定的区间里的概率为给定的置信度1,要求区间按几何对称或概率对称;(3)解不等式得随机的置信区间;(4)由观测值及值查表计算得所求置信区间。
P152,27(1)解:已知时,的置信度为1的置信区间为这里
2、2未知m的1-a置信区间为1-即得
P152,27(2)解:未知时,的置信度为1的置信区间为这里
二、单正态总体方差的置信区间假定m未知,
s2的置信度为1的置信区间为
三、双正态总体均值差的置信区间
其中可解得1-2的置信区间
四、双正态总体方差比的置信区间假定1,2未知
小结
第六章假设检验6.1假设检验的基本概念和思想6.2单正态总体的假设检验6.3双正态总体均值差与方差比的假设检验
6.1假设检验的基本概念和思想一、基本概念(一)两类问题1、参数假设检验总体分布已知,参数未知,由观测值x1,…,xn检验假设H0:=0;H1:≠02、非参数假设检验总体分布未知,由观测值x1,…,xn检验假设H0:F(x)=F0(x;);H1:F(x)≠F0(x;)
以样本(X1,…,Xn)出发制定一个法则,一旦观测值(x1,…,xn)确定后,我们由这个法则就可作出判断是拒绝H0还是接受H1,这种法则称为H0对H1的一个检验法则,简称检验法。样本观测值的全体组成样本空间S,把S分成两个互不相交的子集W和W*,即S=W∪W*,W∩W*=假设当(x1,…,xn)∈W时,我们就拒绝H0;当(x1,…,xn)∈W*时,我们就接受H0。子集WS就称为检验的拒绝域(或临界域)。(二)检验法则与拒绝域
(三)检验的两类错误称H0真而被拒绝的错误为第一类错误或弃真错误;称H0假而被接受的错误为第二类错误或取伪错误。记p(I)=p{拒绝H0|H0真};=p{接受H0|H0假}对于给定的一对H0和H1,总可找出许多临界域,人们自然希望找到这种临界域W,使得犯两类错误的概率都很小。奈曼—皮尔逊(Neyman—Pearson)提出了一个原则:“在控制犯第一类错误的概率不超过指定值的条件下,尽量使犯第二类错误小”按这种法则做出的检验称为“显著性检验”,称为显著性水平或检验水平。
怎样构造的拒绝域方可满足上述法则?如:对总体X~N(,1),要检验H0:=0;H1:=1显著性检验的思想和步骤:(1)根据实际问题作出假设H0与H1;(2)构造统计量,在H0真时其分布已知;(3)给定显著性水平的值,参考H1,令P{拒绝H0|H0真}=,求出拒绝域W;(4)计算统计量的值,若统计量W,则拒绝H0,否则接受H0
6.2单正态总体的假设检验一、单总体均值的假设检验1、2已知的情形---U检验对于假设H0:=0;H1:0,构造查表,计算,比较大小,得出结论
说明:(1)H0:=0;H1:m0称为双边HT问题;而H0:=0;H1:>0(或<0),则称为单边问题;(2)H0:0;H1:>0或H0:0;H1:u0,
现考虑完备的右边HT问题H0:0;H1:>0,若取拒绝域为则犯第一类错误的概率为
于是故是H0:0;H1:>0,的水平为的拒绝域
例1:设某厂生产一种灯管,其寿命X~N(,2002),由以往经验知平均寿命=1500小时,现采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命1675小时,问采用新工艺后,灯管寿命是否有显著提高。(=0.05)解:这里拒绝H0
·左边HT问题H0:=0;H1:<0,或H0:0;H1:<0,可得显著性水平为的拒绝域为
(P173,5)已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N(4.55,0.112).某日测得5炉铁水含碳量如下:4.28,4.40,4.42,4.35,4.37.如果标准差不变,该日铁水的平均含碳量是否显著偏低?(取=0.05)解:得水平为的拒绝域为这里拒绝H0
注:上题中,用双边检验或右边检验都是错误的.若用双边检验,H0:=4.55;H1:4.55,则拒绝域为由|U|=3.78>1.96,故拒绝H0,说明可以认为该日铁水的平均含碳量显著异于4.55.但无法说明是显著高于还是低于4.55.不合题意若用右边检验,H0:4.55;H1:>4.55,则拒绝域为由U=-3.78<-1.96,故接受H0,说明不能认为该日铁水的平均含碳量显著高于4.55.但无法区分是等于还是低于4.55.不合题意.
2、2未知的情形·双边检验:对于假设H0:=0;H1:0由p{|T|t/2(n1)}=,得水平为的拒绝域为|T|t/2(n1),
(P173,4)用热敏电阻测温仪间接温量地热勘探井底温度,重复测量7次,测得温度(℃):112.0113.4111.2112.0114.5112.9113.6而用某种精确办法测得温度为112.6(可看作真值),试问用热敏电阻测温仪间接测温有无系统偏差(设温度测量值X服从正态分布,取=0.05)?解:H0:=112.6;H1:112.6由p{|T|t0.025(n1)}=0.05,得水平为=0.05的拒绝域为|T|t0.025(6)=2.4469这里接受H0
·右边HT问题H0:=0;H1:>0,或H0:0;H1:>0,由p{Tt(n1)}=,得水平为的拒绝域为Tt(n1),
(P173,7)某厂生产镍合金线,其抗拉强度的均值为10620(kg/mm2)今改进工艺后生产一批镍合金线,抽取10根,测得抗拉强度(kg/mm2)为:10512,10623,10668,10554,10776,10707,10557,10581,10666,10670.认为抗拉强度服从正态分布,取=0.05,问新生产的镍合金线的抗拉强度是否比过去生产的合金线抗拉强度要高?解:H0:=10620;H1:>10620由p{Tt0.05(9)}=0.05,得拒绝域为Tt0.05(9)=1.8331这里接受H0
·左边HT问题H0:=0;H1:<0,或H0:0;H1:<0,由p{T-t(n1)}=,得水平为的拒绝域为T-t(n1)
EX设正品镍合金线的抗拉强度服从均值不低于10620(kg/mm2)的正态分布,今从某厂生产的镍合金线中抽取10根,测得平均抗拉强度10600(kg/mm2),样本标准差为80.,问该厂的镍合金线的抗拉强度是否不合格?(=0.1)解:H0:10620;H1:<10620由p{T-t0.1(9)}=0.1,得拒绝域为T-t0.1(9)=1.383这里接受H0
二、单总体方差的假设检验假定未知,·双边检验:对于假设
得水平为的拒绝域为
(P173,11.)电工器材厂生产一批保险丝,取10根测得其熔化时间(min)为42,65,75,78,59,57,68,54,55,71.问是否可以认为整批保险丝的熔化时间的方差小于等于80?(=0.05),熔化时间为正态变量.)得水平为=0.05的拒绝域为这里接受H0
设保险丝的融化时间服从正态分布,取9根测得其熔化时间(min)的样本均值为62,标准差为10.(1)是否可以认为整批保险丝的熔化时间服从N(60,92)?(=0.05)(2)是否可以认为整批保险丝的熔化时间的方差显著大于70?(=0.05)EX答:(1)|t|=0.6<2.306,接受60;2.181.3304,故拒绝H0,认为甲安眠药比乙安眠药疗效显著EX2上题中,试检验是否乙安眠药比甲安眠药疗效显著?
二、方差比的假设检验两样本独立,给定检验水平,由观测值假定1,2未知
由p{FF1/2(n11,n21)或FF/2(n11,n21)}=F1/2F/2得拒绝域FF1/2(n11,n21)或FF/2(n11,n21)
而对应的单边问题拒绝域为FF(n11,n21)FF1(n11,n21)拒绝域为
P174,21.有甲乙两种机床,加工同样产品,从这两台机床加工的产品中随机地抽取若干产品,测得产品直径为(单位:mm):甲:20.5,19.8,19.7,20.4,20.1,20.9,19.6,19.9.乙:19.7,20.8,20.5,19.8,19.4,20.6,19.2.假定甲,乙两台机床的产品直径都服从正态分布,试比较甲,乙两台机床加工的精度有无显著差异?(=0.05)解:拒绝域为FF10.025(7,6)=1/5.12=0.1953或FF0.025(7,6)=5.7这里:接受H0'