5、二元线回归
[回归方程] 对应自变量x1与x2的值的值为,于是得到n个点,其回归方程为
式中为回归系数,它由下面方程决定:
这里
而其中是为了简化计算所作的数据变换(不需整数化),即
(1)式中的常数项
[复相关系数和偏项关系数]
称为复相关系数,式中
这里如(2)所示。复相关系数R满足,其意义与一元线性回归分析中的相关系数r类似,用于衡量y与x1 , x2的线性关系的密切程度。
如果只要表示y与其中某一个变量(x1或x2)的相关关系,那末必须除去另一个变量的影响之后再计算它们的相关系数,这称为偏相关系数。x1,y在除去x2的影响之后的相关系数称为x1,y对x2的偏相关系数,记作,它可用普通的相关系数表示:
同样的,对的偏相关系数表为
[剩余标准差]
称为剩余标准差,其意义同一元线性回归分析中的剩余标准差s类似。
[标准回归系数与偏回归平方和] 在两因素x1 , x2之间关系不密切的情况下,可用下述方法判断哪个因素是主要的。
1°
称为标准回归系数,式中b1,b2为回归系数,l11, l22如(2)所示, l00如(4)所示。若,则表明在影响变量的两个因素中,x1是主要因素,x2是次要因素。
2°
称为偏回归平方和,式中b1 , b2为回归系数,l11,l12,l22如(2)所示。若p1>p2,则表明是x1主要因素,x2是次要因素。
[t值]
分别称为x1 , x2的t值,式中s为剩余标准差,p1 , p2为偏回归平方和。若t值越大,则表明该因素越重要。根据经验,当 ti>1时,该因素xi对y有一定的影响;当ti>2时,该因素xi看作是重要因素;当ti<1时,则认为该因素xi对y影响不大,可以忽略,不参加回归计算。
[二元线性回归计算表] 表中x k i为简化后的数据。
序 号 |
x1i |
|
yi |
x |
x |
|
|
|
|
1 2
n |
x11 x12
x1n |
x21 x22
x2n |
y1 y2
yn |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
结 果 |
|
|
|
|
|
|
由,根据(2)(3)分别计算出,得到回归方程
并且继续计算复相关系数R,标准回归系数B1和B2 ,偏回归平方和p1 ,, p2,以及t值t1和t2,根据这些数据进行二元回归的分析。
关于二元非线性回归问题,可做适当的变量替换,使新变量之间构成线性关系,再作回归分析。