- 767.50 KB
- 2022-04-29 14:29:17 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
'计量经济学-2一元线性回归模型
4、回归分析(RegressionAnalysis)研究一个变量(因变量)对于一个或多个其他变量(解释变量)的数量依存关系的计算方法和理论。其目的在于根据已知的解释变量的数值来估计和(或)预测因变量的(总体)平均值。这里:前一个变量被称为被解释变量(ExplainedVariable)或应变量(DependentVariable),后一个(些)变量被称为解释变量(ExplanatoryVariable)或自变量(IndependentVariable)。回归分析构成计量经济学的方法论基础,其主要内容包括:(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。
例如,函数关系:统计依赖关系/统计相关关系:对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的:相关系数:统计依赖关系回归分析正相关相关分析不相关负相关正相关线性相关不相关负相关有因果关系无因果关系非线性相关
二、回归模型总体回归模型:样本回归模型:总体回归模型YX5512016020024080样本回归模型
1、几个概念条件分布(Conditionaldistribution):以X取定值为条件的Y的条件分布。条件概率(Conditionalprobability):给定X的Y的概率,记为P(Y|X)。例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。条件期望(conditionalExpectation):给定X的Y的期望值,记为E(Y|X)。例如,E(Y|X=80)=55×1/5+60×1/5+65×1/5+70×1/5+75×1/5=65总体回归曲线(PopularRegressionCurve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。2、总体回归函数(PopularRegressionFunction,PRF)E(Y|Xi)=f(Xi)当PRF的函数形式为线性函数,则有,E(Y|Xi)=0+1Xi其中0和1为未知而固定的参数,称为回归系数。0和1也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。3、“线性”的含义“线性”可作两种解释:对变量为线性,对参数为线性。一般“线性回归”一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。
4、PRF的随机设定将个别的Yi围绕其期望值的离差(Deviation)表述如下:ui=Yi-E(Y|Xi)或Yi=E(Y|Xi)+ui其中ui为随机误差项(Stochasticerror)或随机干扰项(Stochasticdisturbance)。线性总体回归函数:PRF:Yi=0+1Xi+ui=E(Y|Xi)+ui5、随机扰动项的意义随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的:(1)理论的含糊性:理论不能完全说明影响因变量的所有影响因素。(2)数据的欠缺:无法获得有关数据。(3)主要变量与次要变量:希望能找到与有较大影响的核心变量的关系。(4)内在随机性:因变量具有内在的随机性。(5)替代变量差异:替代变量和被替代变量之间总是存在一定的差异。(6)简化原则:研究中尽可能使回归式简单。
6、样本回归函数(SRF,SampleRegression Function)由于在大多数情况下,我们不可能得到X、Y的所有可能的数值,只能用抽样的方法,取得X、Y的样本观测值,用样本回归方程SRF去拟合总体回归方程PRF。X(收入)80100120140160180200220240260Y(支出)55657980102110120135137150样本1X(收入)80100120140160180200220240260Y(支出)708094103116130144152165178样本2样本回归函数SRF:在回归分析中,我们用SRF估计PRF。
(一)基本假定1、零均值。随机扰动项ui的均值为零。即,E(ui|Xi)=02、同方差。随机扰动项ui的方差相等。即Var(ui|Xi)=E[(ui-E(ui))|Xi]2=E(ui2|Xi]2=23、无自相关。各个扰动项无自相关。即:三、参数的最小二乘估计(LeastSquaresEstimation,LSE)考虑回归模型:其中ui是除了X以外的其它若干因素。4、随机扰动项ui解释变量Xi不相关。即Cov(ui,Xi)=E[ui-Eui][Xi-EXi]=0i=1,2,…,n
(二)普通最小二乘估计(OrdinaryLeastSquares,OLS)基本思路:用样本回归函数估计总体回归函数。以估计估计出的参数使残差的平方和最小。真实值5、ui服从正态分布,即ui~N(0,δ2),i=1,2,…,n
求解这一最小化问题,根据最大化的一阶条件:
例1,已知某商品的需求量Y(万吨)随价格X(元)变化的统计资料如下,求需求量Y随价格X变化的回归方程。年份1981198219831984198519861987198819891990需求量10075807050659010011065价格5766875439
几个常用结果:
(三)最小二乘估计OLS的性质(高斯-马尔柯夫定理)在所有线性无偏估计量中,OLS估计量有最小方差,即OLS是BLUE(BestLinearUnbiasedEstimator)。(1)线性性:为Yi的线性函数
(2)无偏性:最小二乘估计的数学期望值分别等于总体回归系数的值
(3)最小方差性:在所有线性无偏估计量中,具有最小方差。即OLS估计量
(四)最小二乘估计的方差
四、模型检验(一)经济意义检验检验所建的模型的是否符合经济理论,主要是检验模型参数的符号和大小是否与经济理论以及人们的经验一致。(二)统计检验1、拟合优度检验(判定系数检验)拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数R2。基本思路:因变量Y的总变异,能够被X的变异解释的比例越大,则说明OLS回归线对总体的解释程度越好,反之就越差。总的离差平方和的分解:
总平方和(TSS):说明实际的Y值围绕其均值的总变异PRFXiXSRFY
估计的Y值围绕其均值的总变异未被解释的Y值围绕回归线的Y值的变异
R2测度了在Y的总变异中,由回归模型解释的部分所占的比例。R2越高,回归模型拟合的程度就越好。R2的性质:(1)非负。(2)0≤R2≤1其它表达方式:定义拟合优度R2:
例2:对例1进行拟合优度检验,并说明其意义。
2、相关系数检验相关系数:表示两个随机变量之间的相关程度。定义为:以样本方差和样本协方差估计X、Y的方差和协方差,样本相关系数为:样本相关系数的平方与拟合优度相等,但二者的意义不同。(拟合优度是回归分析中提出的,而相关系数是相关分析中提出的。)
相关系数检验的步骤:例3,对例1进行相关系数检验。
3、F检验(总体回归方程显著性检验)三大分布:
t:标准正态除以卡方开方的分布(注意自由度)F:两个独立的卡方变量之商的分布(注意自由度):若干个独立的标准正态平方和的分布
F检验的步骤:
离差平方和平方和SS自由度DF均方差MSF值F临界值显著性ESS1ESS/1***/RSSn-2RSS/n-2TSSn-1方差分析(analysisofvariance,ANOVA)表思路:若ESS/RSS比较大,则X对Y的解释程度就比较高,可以推测总体存在线性关系。拟合优度R2与F检验具有一致性:
例4,对例1进行F检验解:TSS=3272.5ESS=2707.5RSS=565F*=(2707.5×8)/565=38.3338.33>F0.05(1,8)=5.32因此,回归方程显著成立.方差分析表:AnalysisofVarianceSOURCEDFSSMSFpRegression12707.52707.538.340.000Error8565.070.6Total93272.5四、t检验(参数显著性检验)
T检验的步骤:
例5,对例1进行t检验。
五、预测(PredictionForecast)(一)点预测点预测的两种解释:YX12
区间估计:为了判断点估计与真值的接近程度,可以通过构造以估计值为中心的一个区间(随机的),以该区间包括了真值的概率来确定估计值接近真值的把握程度:(二)区间预测(IntervalEstimation)1、总体均值E(Y0|X0)的区间预测
2、总体个别值Y0的区间预测
-t/2t/2o/2/2
例6,在例1中,若X0=10,求Y0及E(Y0|X0)的预测值和预测区间
六、案例分析
小结:一元线性回归分析的主要步骤1、建立回归模型研究某一经济现象,先根据经济理论,选择具有因果关系的两个变量(Y,X),建立线性回归模型,确定解释变量和被解释变量。如果不明确两个变量是否为线性关系,也可以根据散点图来分析。建立回归模型可以是根据经济理论,也可以根据相同或相似经济现象的历史分析经验来建立回归模型。建立模型时,不仅要考虑理论或经验的依据,同时也要考虑数据的可利用程度。2、收集数据,并经过适当的加工整理,得到适于回归分析的样本数据集。3、估计模型参数。利用样本数据,以OLS得到模型参数的估计值。4、对回归模型和参数估计值进行检验。检验回归结果是否正确反映经济现象,是否与理论相符。包括理论检验和统计检验。经济理论检验:参数的符号,大小是否与理论和实际相符。若不符,寻找原因(数据?模型设定?理论错误?)统计检验:拟和优度检验,估计量、回归方程的显著性检验。
5、预测对于解释变量的特定值,带入回归方程得到因变量的预测值;在给定的置信水平上,得到因变量预测值的置信区间。6、回归结果的表述:并说明参数的显著水平()。
以回归分析为工具的实证分析文章的结构一、研究的来源和基础对研究的经济现象的描述;研究该现象的意义;相同或相似的代表性研究的方法、结论,并作总结评价;本研究的出发点;文章的结构介绍。二、理论分析选择合适的经济理论,利用理论对要研究的经济想象做定性分析,得到大致的结果;建立理论模型。三、建立回归模型根据理论模型,建立合理、可分析的回归模型。回归模型的形式、解释变量的个数和选择,不一定与数理模型完全相同。四、对所使用的数据做出说明数据的来源;数据加工的原因和处理方式;替代数据的说明等。五、回归结果及对结果的分析列出回归的结果(包括参数的估计值和统计检验结果);结合理论分析回归结果六、结论/总结/应用
第一章有理数1.1正数和负数
正数与负数:对于具有相反意义的两个量,我们规定其中一个量为正,则与其相反意义的量则为负.小学所学的数统称为正数,在其前面加上负号"-"的数为负数.例1.找出下列各题相反意义的量:在日常生活中,常会遇到这样一些量(事情):(1)汽车向东行驶3千米和向西行驶2千米.相反意义的量:()和()(2)温度是零上10℃和零下5℃.相反意义的量:()和()(3)收入500元和支出237元.相反意义的量:()和()(4)水位升高1.2米和下降0.7米.相反意义的量:()和()(5)买进100辆自行车和卖出20辆自行车.相反意义的量:()和()向东向西零上零下收入支出升高下降买进卖出
例2.填空:(1)某种食用油的价格随着市场经济的变化涨落,规定上涨记为正,则-5.8元的意义是;如果这种油的原价是76元,那么现在的卖价是。(2)一种零件的内径尺寸在图纸上是30±0.05(单位:毫米),表示这种零件的标准尺寸是30毫米,加工要求最大不超过标准尺寸______毫米,最小不低于标准尺寸______毫米.(3)如果全班某次数学测试的平均成绩为83分,某同学考了85分,记作+2分,得分90分和80分应分别记作__________________(4)甲冷库的温度是-120C,乙冷库的温度比甲冷库低50C,则乙冷库的温度是.价格下降5.8元70.2元30.0529.95+2,+7,-3-170C
例3.出租车司机小李某天的运营全是在东西走向的人民大街进行的,如果规定向东为正,向西为负,他这天下午的行车里程如下(单位:km)+10、-3、-8、+11、-10、+12、+4、-15、-16、+15(1)将最后一名乘客送到目的地时,小李距下午出车地点的距离是多少?(2)若汽车的耗油量为0.5L/㎞,那么这天下午汽车共耗油多少?(1)解:(+10)+(-3)+(-8)+(+11)+(-10)+(+12)+(+4)+(-15)+(-16)+(+15)=0所以小李又回到了原点.(2)解:〔(+10)+(+3)+(+8)+(+11)+(+10)+(+12)+(+4)+(+15)+(+16)+(+15)〕×0.5=104×0.5=52所以这天下午汽车共耗油52L.
有理数分类有理数定义:无理数定义:有限小数和无限循环小数统称有理数.无限不循环小数统称有理数.如π整数分数正整数0负整数正分数负分数正有理数负有理数0正整数正分数负整数负分数
把一些数放在一起,就组成一个数的集合,简称数集。所有正数组成的集合,叫做;所有负数组成的集合叫做;所有整数组成的集合叫;所有分数组成的集合叫;所有有理数组成的集合叫;所有正整数和零组成的集合叫做。例4.把下列各数分别填入相应的大括号内:自然数集合{…};整数集合{…};正分数集合{…};非正数集合{…};有理数集合{…};正数集合负数集合整数集合负数集合有理数集合自然数集合非负整数集合
1.填空:如果-10表示支出10元,那么+50表示;如果零上5度记作5°C,那么零下2度记作;如果上升10m记作10m,那么-3m表示;太平洋中的马里亚纳海沟深达11034米,可记作海拔米(即低于海平面11034米)。比海平面高50m的地方,它的高度记作海拨;比海平面低30m的地方,它的高度记作海拨;2.填空:数学测验班平均分80分,小华85分,高出平均分5分记作+5,小松78分,记作。某物体向右运动为正,那么-2m表示,0表示。一种零件的内径尺寸在图纸上是10±0.15(单位mm),表示这种零件的标准尺寸是10mm,加工要求最大不超过标准尺寸,最小不超过标准尺寸。课堂同步练习收入50元-2℃下降3m-11034+50m-30m-2向左运动2m物体在出发点10.15mm9.85mm
3.下列说法中正确的是()A.有最小的负整数,有最大的正整数B.有最小的负数,没有最大的正数C.有最大的负数,没有最小的正数D.没有最大的有理数和最小的有理数4.文具店、书店和玩具店依次座落在一条东西走向的大街上,文具店在书店西边20米处,玩具店位于书店东边100米处,小明从书店沿街向东走了30米,接着又向东走了-50米,此时小明的位置在()A.文具店B.玩具店C.文具店西30米处D.玩具店西50米处课堂同步练习5.下列有正数和负数表示相反意义的量,其中正确的是()A.一天凌晨的气温是-50C,中午比凌晨上升100C,所以中午的气温是+100CB.如果生产成本增加12%,记作+12%,那么-12%表示生产成本降低12%C.如果+5.2米表示比海平面高5.2米,那么-6米表示比海平面低-6米D.如果收入增加10元记作+10元,那么-8表示支出减少8元DAB
课堂同步练习6.某一出租车一天下午以鼓楼为出发地在东西方向营运,向东为正,向西为负,行车里程(单位:km)依先后次序记录如下:+9、-3、-5、+4、-8、+6、-3、-6、+4、+10.(1)将最后一名乘客送到目的地,出租车离鼓楼出发点多远?在鼓楼的什么方向?(2)若每千米的价格为2.4元,司机一个下午的营业额是多少?(1)解:(+9)+(-3)+(-5)+(+4)+(-8)+(+6)+(-3)+(-6)+(+4)+(+10)=+8所以出租车在鼓楼东面8米.(2)解:〔(+9)+(-3)+(-5)+(+4)+(-8)+(+6)+(-3)+(-6)+(+4)+(+10)〕×2.4=58×2.4=139.2所以这天下午汽车共耗油139.2元.
谢谢'
您可能关注的文档
- 最新计算机体系结构浙江课件PPT.ppt
- 最新计算机体系结构浙江(1)课件PPT.ppt
- 最新计算机学科的科学问题-PowerPointPresentation.课件PPT.ppt
- 最新计算机基础知识治疗MQ课件PPT.ppt
- 最新计算机控制技术第三章-数字控制器的模拟化设计课件PPT.ppt
- 最新计算机硬件课件PPT.ppt
- 最新计算机硬件系统的基本组成概要课件PPT.ppt
- 最新计算机硬件第3章-4串操作指令课件PPT.ppt
- 最新计算机组成原理复习-任国林版课件PPT课件.ppt
- 最新计量经济学---第三章--3.3-多元线性回归(课件)课件PPT.ppt
- 最新认为器官的功效-医先心理学-课件1-09课件PPT.ppt
- 最新计量经济学课件第1章课件PPT.ppt
- 最新计量经济学课件PPT4课件ppt.ppt
- 最新计量经济学课件PPT3ppt课件.ppt
- 最新认证考试地图艺术设计-地图色彩课件PPT.ppt
- 最新认识周长刘老师---修改-2课件PPT.ppt
- 最新认识头颈癌治疗药物课件PPT.ppt
- 最新认识自我的方法.课件PPT.ppt