J9集团

English J9集团集团企业邮箱
icon_searchclose

第三节 直线回归方程

作者:徐荣祥 出版社:中国科学技术出版社 刊行日期:2009年7月

一、直线回归方程的概想
所谓回归  ,是说当一种观象(y)受另一种景象(x)的影响  ,以至(y)随着景象(x)的改观而有法规的改观时  ,这种协同变异的关系在统计学中称之为回归;毓榉治鍪堑弊暄辛街质挛锛涞幕ビ泄叵凳  ,描述其中一种事物依存另一种事物改观的法规。其表白式为:


201134153053372

式中y为估计值;α为常数  ,也称为截距  ,即当x蹬宗零时在回归直线轴上的交点;b为回归系数  ,它是回归直线的斜率  ,其意思是每当x改观一个单元  ,则y随之改观b个单元。
直线回归分析的主张是求出一条能确切反映本资料的回归改观法规的直线方程式  ,以通过此式由x值估计y值。通常要求回归方程能满足下述前提:即从回归方程推算出的y值与现实y值之差的平方和[∑(y-y)]2是最幼值。确立直线回归方程式的关键是求出回归系数b和截距α  ,它们的推算公式为:
201134153643421
二、求直线回归方程的根基步骤
(一)幼样本的推算步骤
当原始数据不多(n<40)时  ,可直接按实测数据X、Y  ,求∑X、∑Χ2、∑Y、∑Y2及∑XY。代入下列公式(396)、(397) 、(398) 、(399)  ,求α、b和直线回归方程。
201134153129355

式中Ixx=∑(x-x)(y-y)(离均差积和)
Ixx=∑(x-X)2(离均差平方和)

201134153154337

示例393某钻研人员观察胃肠营养胶囊的营养价值  ,用大白鼠做试验  ,对每只大白鼠在观察期间胃肠营养胶囊的用量(g)和体沉增长量(g)汇入表(394)中  ,凭据原始资料试作直线回归分析。
201134153210729

【解题步骤】
1先列出直线回归分析推算表  ,求基础数值(表395):
201134153244806

2凭据表395中的基础数值推算x、y的均数(x、y)、离均差平方和(Ixx、Iyy)、离均差积和(Ixy)。
201134153332809

3凭据公式(396)、(397) 、(398)  ,求b、α和回归方程。
201134153351949

4按求得的直线回归方程  ,在X值领域内肆意取两点(x1y1)  ,(x22)  ,相连即得回归直线。
(二)大样本的求法
当原始资料比力多时  ,接幼样本处置公式推算其工作量相当的大  ,可按直线有关系数的简捷步骤先绘造双变量频数表  ,而后再凭据表中的基础数值别离推算x、y的均数(x、y)、离均差平方和(Ixx、Iyy)、离均差积和(Ixy)。现以示例392为例  ,试用简捷步骤推算回归方程。

示例392样本数n=40  ,组距ix=02  ,组距iy=10  ,(∑fxdx)=43  ,∑fxd2x=139  ,∑fYdY=-3  ,∑fyd2y=79  ,∑fdXdY=39。
【解题步骤】
1推算均数:本例假定均数(取组中值  ,x0为“~20”组的组中值)。

20113415348676

2离均差的平方和:

201134153425197

3离均差积和:
201134153643683

4按公式(396)  ,求回归系数b:
20113415365807

直线回归方程:=2932+2276x
答:其直线回归方程为=2932+2276x。
三、回归系数的显著性检验
回归系数显著性检验的意思与有关系数的显著性检验的意思一样  ,其回归系数(b)也是因抽样钻研得来的  ,即便严格按随机抽样  ,回归系数也存在抽样误差的问题  ,也应进行显著性检验。当y变量遵从正态散布时  ,回归系数的显著性检验能够用t检验  ,也能够用方差分析步骤求得。本节仅介绍t检验步骤。
用t检验步骤检验回归系数(b)是否显著  ,先凭据以下公式别离推算sy、x和回归系数的尺度误(sb)  ,而后推算t值。其公式别离为 (3910)、(3911) 、(3912):
201134153616580

当求得t值后  ,凭据自由度(n-2)查t值表  ,重要主张是与P=005相当的临界值[t(n′)005]进行比力。若是求得的t值< t(n′)005  ,则P>005  ,回归系数无显著意思;相反  ,若是求得的t值> t(n′)005  ,则P<005  ,回归系数有显著意思;若是求得的t值> t(n′)001  ,则P<001  ,回归系数有极度显著意思。
现以例393为例  ,检验其回归系数有无显著意思。
由于已知Iyy=42341  ,  Ixx=759064  ,  Ixy=168432  ,n=10  , b=02219  ,将以上数据别离代入公式(3910)、(3911)、(3912)  ,得:
201134153630676

查t界值表(附表4):n′=8(10-2)时  ,t(8)001=3355。本例t=77587  ,p<001  , 回归系数有极度显著意思。
四、有关和回归分析该把稳的事项
1 明确有关与回归分析的内容内容
有关系数注明两变量间关系的亲昵水平  ,回归方程注明两变量间的数量关系  ,两者注明的问题分歧  ,之间有有关关系。因而  ,若是回归系数显著性检验有显著性的话  ,有关系数也肯定是显著的  ,反之亦然。
2佚确理解有关分析的作用
有关分析只是以有关系数来描述两个变量间互有关系的亲昵水平和方向  ,并不能说明两事物或景象间存在联系的性质。并且有关并不愿定就是因果关系  ,切不成单纯依附有关系数或回归系数的显著性证明因果关系之存在。要证明两事物间的因果关系  ,必须凭藉专业知识从理论上加以说明。但是  ,当事物间的因果关系未被意识前  ,有关分析可为理论钻研提供线索。
3不要把毫无关联的两个事物或景象用来作有关或回归分析  ,不然是没有意思的。另表  ,有关分析只注明有关。
4不要把有关显著性大幼误会为有关水平的大幼。有关系数是注明两事物间亲昵水平的  , r的绝对值越靠近于1  ,有关越亲昵;越靠近0  ,则有关水平越疏松。有关系数的显著性检验是注明由抽样误差引起这样大的r值的可能性有多大。P>005注明由抽样误差引起这样大的r值的可能性大于5%  ,因而而不排除它抽自于无有关的总体。只有P≤005  , r才有意思。
5在回归分析中  ,由x推算y或由y推算x  ,其回归方程分歧  ,不能混用。推算公式如下:
201134153641397

6有关与回归的区别和联系
有关暗示两变量间的互有关系是双方向的。而回归则暗示y随x而变动  ,这种关系是单方面向的。医学资猜中的有些资料用有关暗示较合适  ,好比兄弟与姐妹间的身长关系、人的身长与前臂长之间的关系等资料。但有些资料用有关和回归都不合适  ,此时须视钻研必要而定。就通常推算法式来说  ,是先求出有关系数r并对其进行如果检验  ,若是r显著并有进行回归分析之必要  ,再成立回归方程。
7适合作有关和回归分析的资料通常有两种资料
(1)一个变量x是选定的  ,另一个变量y是从正态散布的总体中随机抽取的  ,宜作回归分析。
(2)两变量x、y(或x1、x2)都是从正态散布的总体中随机抽取的  ,即是正态双变量中的随机样本。这时  ,若必要由一个变量推算另一个变量可作回归分析;若只需注明两变量间的互有关系可作有关分析。若是变量(一个或两个)呈显著偏态时  ,须经过适当的变量代换(如对数代换等)  ,使资料接受正态散布后再做有关与回归分析  ,或者选取秩有关法。

【网站地图】