第3章 统计案例
3.1 回归分析的基本思想及其初步应用
学 习 目 标
|
核 心 素 养
|
1.了解随机误差、残差、残差图的概念.(重点)
2.会通过分析残差判断线性回归模型的拟合效果.(重点)
3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)
|
1.通过回归分析的学习,培养了学生数据分析的素养.
2.借助回归模型的建立,培养学生数学建模、数据分析及数学运算的素养.
|
1.回归分析的相关概念
(1)回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)回归直线方程
方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数,其最小二乘估计分别为:
其中=i,=i,(,)称为样本点的中心.
(3)线性回归模型
线性回归模型为y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差,自变量x称为解释变量,因变量y称为预报变量.
思考:在线性回归模型y=bx+a+e中,e产生的原因主要有哪几种?
[提示]随机误差产生的原因主要有以下几种:
(1)所用的确定性函数不恰当引起的误差;
(2)忽略了某些因素的影响;
(3)存在观测误差.
2.残差的概念
对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为i=yi-i=yi-xi-,i=1,2,…,n,i称为相应于点(xi,yi)的残差.
3.刻画回归效果的方式
残差图
|
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图
|
残差
图法
|
残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高
|
残差
平方和
|
残差平方和为(yi-i)2,残差平方和越小,模型的拟合效果越好
|
相关
指数R2
|
R2=1-,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示模型的拟合效果越好
|
1.在如图所示的四个散点图中,适合用线性回归模型拟合其中两个变量的是( )
A.①② B.①③
C.②③ D.③④
B [结合散点图可知①③中的散点大体分布在一条直线的左右两侧,故选B.]
2.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是( )
A.模型1的相关指数R2为0.98
B.模型2的相关指数R2为0.80
C.模型3的相关指数R2为0.50
D.模型4的相关指数R2为0.25
A [R2越大拟合效果越好,故选A.]