fccjxxw.com
非常超级学习网 学习超级帮手
当前位置:首页 >> 数学 >>

苏教版高中数学(选修2-3)3.2《回归分析》word教案2篇

3.2 回归分析(1)

教学目标

(1)通过实例引入线性回归模型,感受产生随机误差的原因;

(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;

(3)能求出简单实际问 题的线性回归方程.

教学重点,难点

线性回归模型的建立和线性回归系数的最佳估计值的探求方法.

教学过程

一.问题情境

1. 情境:对一作直线运动的质点的运动过程观测了 8 次,得到如下表所示的数据,试估计

当 x=9时的位置 y 的值.

时刻 x /s

1

2

3

4

5

6

7

8

位置观测值 y /cm 5.54 7.52 10.02 11.73 15.69 16.12 16.98 21.06

根据《数学 3 (必修)》中的有关内容,解决这个问题的方法是:

先作散点图,如下图所示:

从散点图中可以看出,样本点
呈直线趋势,时间 x 与位置观测值
y 之间 有着较好的线性关系.因此 可以用线性回归方程来刻画它们 之间的关系.根据线性回归的系数

? ?
?

n
xi yi ? nx y

公式, ??b ?

i ?1 n

? ? ?

? xi2 ? n(x)2
i ?1

??a ? y ? bx

可以得到线性回归方为 y ? 3.5361? 2.1214x ,所以当 x ? 9 时,由线性回归方程可以

估计其位置值为 y ? 22.6287

2.问题:在时刻

x

?

9

时,质点的运动位置一定是

22.6287cm

吗? ]

二.学生活动

思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映 x 与 y 之

间的关系, y 的值不能由 x 完全确定,它们之间是统计相关关系,y 的实际值与估计值

之间存在着误差.

三.建构数学

1.线性回归模型的定义:

我们将用于估计 y 值的线性函数 a ? bx 作为确定性函数;

y 的实 际值与估计值之间的误差记为 ? ,称之为随机误差;

将 y ? a ? bx ? ? 称为线性回归模型.

说明:(1)产生随机误差的主要原因有:

①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差. (2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决);
②在模型合理的情况下,如何估计 a , b ?
2.探求线性回归系数的最佳估计值:
对于问题②,设有 n 对观测数据 (xi , yi ) (i ? 1, 2,3, , n) ,根据线性回归模型,对

于每一个 xi ,对应的随机误差项 ?i ? yi ? (a ? bxi ) ,我们希望总误差越小越好,即要

n

n

? ? 使

?

2 i

越小越好.所以,只要求出使 Q(? ,

?

)

?

( yi ? ? xi ? ? )2 取得最小值时的? ,

i ?1

i ?1

? 值作为 a , b 的估计值,记为 a , b .

注:这里的 ?i 就是拟合直线上的点 ? xi , a ? bxi ? 到点 Pi ? xi , yi ? 的距离.

用什么方法求 a , b ?
回忆《数学 3(必修)》“2.4 线性回归方程”P71“ 热茶问题”中求 a ,b 的方法:
最小二乘法.

利用最小二乘法可以得到 a , b 的计算公式为

? ? ?
? ??b ?

n

(xi ? x)( yi ? y)

i ?1 n

?

n
i?1 xi yi ? n x y , n

? ? ?

? (xi ? x)2
i ?1

? xi2 ? n(x)2
i ?1

??a ? y ? bx

? ? 其中 x

?

1 n

n i ?1

xi



y

?

1 n

n i ?1

yi

由此得到的直线 y ? a ? bx 就称为这 n 对数据的回归直线,此直线方程即为线性回

归方程.其中 a ,b 分别为 a ,b 的估计值, a 称为回归截距,b 称为回归系数, y 称
为回归值.
在前面质点运动的线性回归方程 y ? 3.5361? 2.1214x 中,a ? 3.5361 ,b ? 2.1214 .

3. 线性回归方程 y ? a ? bx 中 a ,b 的意义是:以 a 为基数, x 每增加 1 个单位, y 相应

地平均增加 b 个单位;
4. 化归思想(转化思想)

在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业

知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为

线性回归方程, 从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的

化为线性回归方程的换元公式.

(1) y ? a ? b ,令 y ' ? y , x ' ? 1 ,则有 y ' ? a ? bx ' .

x

x

(2) y ? axb ,令 y ' ? ln y , x' ? ln x , a' ? ln a ,则有 y ' ? a '? bx ' .

(3) y ? aebx ,令 y ' ? ln y , x ' ? x , a' ? ln a ,则有 y ' ? a '? bx ' .

(4)

y

?

b
ae x

,令

y

'

?

ln

y



x'

?

1



a'

?

ln

a

,则有

y

'

?

a

'?

bx

'.

x

(5) y ? a ? b ln x ,令 y ' ? y , x' ? ln x ,则有 y ' ? a ? bx ' .
四.数学运用 1.例题:
例 1.下表给出了我国从1949 年至1999 年人口数据资料,试根据表中数据估计我国 2004 年的人口数.

年份 1949 1954 1959 1964 1969 1974 1979 1984 1989 1994 1999 人口数/百万 542 603 672 705 807 909 975 1035 1107 1177 1246
解:为了简化数据,先将年份减去1949 ,并将所得值用 x 表示,对应人口数用 y 表示,
得到下面的数据表:
x 0 5 10 15 20 25 30 35 40 45 50 y 542 603 672 705 807 909 975 1035 1107 1177 1246
]
作出11个点 ? x, y? 构成的散点
图, 由图可知,这些点在一条直线 附近,可以用线性回归模型
y ? a ? bx?? 来 表 示 它 们 之
间的关系. 根据公式(1)可得
??b ? 14.453, ? ??a ? 527.591.
这里的 a, b 分别为 a, b 的估
计值,因此线性回归方程
为 y ? 527.591?14.453x

由 于 2004 年 对 应 的 x ? 55 , 代 入 线 性 回 归 方 程 y ? 5 2 7 . 5 ?9 1 1 4x. 4可5得3

y ?1 3 2 2 . 5(0 6百万),即 2004 年的人口总数估计为 13.23 亿.

例 2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业

的人均资本 x (万元)与人均产出 y (万元)的数据:

人均

资本

3 4 5.5 6.5 7

8

9

10.5 11.5 14

x /万元

人均

产出 4.12 4.67 8.68 11.01 13.04 14.43 17.50 25.46 26.66 45.20 y /万元

(1)设 y 与 x 之间具有近似关系 y ? axb( a, b 为常数),试根据表中数据估计 a 和 b 的

值;
(2)估计企业人均资本为16 万元时的人均产出(精确到 0.01). 分析:根据 x , y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归

方程处理.但由对数运算的性质可知,只要对 y ? axb 的两边取对数,就能将其转化为

线性关系.

解(1)在 y ?ax b 的两边取常用对数,可得 lg y ? lg a ? b lg x ,设 lg y ? z ,lg a ? A ,

lg x ? X ,则 z ? A? bX .相关数据计算如图 3? 2 ? 7 所示.

A

B

人均资

1 本 x /万 3



人均产

2 出 y /万 4.12



C
4
4.67

D

E

F

G

H

I

J

5.5

6.5

7

8

9

10.5 11.5

8.68 11.01 13.04 14.43 17.5 25.46 26.66 4

3 X ? lg x 0.47712 0.60 206 0.74036 0.81291 0. 8451 0.90309 0.95424 1.02119 1.0607 1.

4 z ? lg y 0.6149 0.66932 0.93852 1.04179 1.11528 1.15927 1.24304 1.40586 1.42586 1.

仿照问题情境可得

A

,b

的估计值

A

,b



别为

?? ?

A

?

?0.2155,



lg

a

?

?0.2155

可得

??b ? 1.5677,

a ? 0.6088 ,即 a , b 的估计值分别为 0.6088和1.5677 .

(2)由(1)知 y ? 0.6088 x516.7
页)

.样本数据及回归曲线的图形如图 3? 2 ?8(见书本 P102

当 x ?16 时, y ? 0.6088?161.5677 ? 47.01(万元),故当企业人均资本为16 万元时, 人均产值约为 47.01万元. 2.练习: P104 练习第1题.
五.回顾小结:
1. 线性回归模型 y ? a ? bx ? ? 与确定性函数 y ? a ? bx 相比,它表示 y 与 x 之间是统计 相关关系(非确定性关系)其中的随机误差 ? 提供了选择模型的准则以及在模型合理的 情况下探求最佳估计值 a , b 的工具;
2. 线性回归方程 y ? a ? bx 中 a ,b 的意义是:以 a 为基数, x 每增加 1 个单位, y 相应
地平均增加 b 个单位;
3.求线性回归方程的基本步骤. 六.课外作业:.

3.2 回归分析(2)
教学目标 (1)通过实例了解相关系数的概念和性质,感受相关性检验的作用; (2)能对相关系数进行显著性检验,并解决简单的回归分析问题; (3)进一步了解回归的基本思想、方法及初步应用.
教学重点,难点 相关系数的性质及其显著性检验的基本思想、操作步骤.
教学过程 一.问题情境 1.情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可
以用作预测和估计吗?

10

10

8

8

6

6

系列1

4

4

2

2

系列1

2.问题:思考、讨论:求得的线性回归方程是否有实际意义. 二.学生活动
对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的 线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟 合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我 们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为 精确地刻画线性相关关系呢?
这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需
要对变量 x 与 y 的线性相关性进行检验(简称相关性检验).
三.建构数学 1.相关系数的计算公式:

对于 x , y 随机取到的 n 对数据 (xi , yi ) (i ? 1, 2,3, , n) ,样本相关系数 r 的计算
公式为

n

? (xi ? x)( yi ? y)

r?

i ?1

?

n

n

? ? (xi ? x)2 ? ( yi ? y)2 ?

i ?1

i ?1

2.相关 系数 r 的性质:

n

? xi yi ? nx y

i ?1

. ?2?

n

n

? ? ( xi2 ? n(x)2 )( yi2 ? n( y)2 )

i ?1

i ?1

(1)| r |? 1;

(2)| r | 越接近与 1, x , y 的线性相关程度越强;

(3)| r | 越接近与 0, x , y 的线性相关程度越弱.
可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.
3.对相关系数 r 进行显著性检验的步骤: 相关系数 r 的绝对值与 1 接近到什么程度才表明利用线性回归模型比较合理呢?这
需要对相关系数 r 进行显著性检验 .对此,在统计上有明确的检验方法,基本步骤是 :
(1)提出统计假设 H0 :变量 x , y 不具有线性相关关系;
(2)如果以 95%的把握作出推断,那么可以根据1? 0.95 ? 0.05 与 n ? 2 ( n 是样本容
量)在附录 2 (教材 P111)中查出一个 r 的临界值 r0.05 (其中1? 0.95 ? 0.05 称为检验
水平);
(3)计算样本相关系数 r ;

(4)作出统计推断:若 | r |? r0.05 ,则否定 H0 ,表明有 95% 的把握认为 变量 y 与 x 之
间具有 线性相关关系;若 | r |? r0.05 ,则没有理由拒绝 H0 ,即就目前数据而言,没有充 分理由认为变量 y 与 x 之间 具有线性相关关系. 说明:1.对相关系数 r 进行显著性检验,一般取检验水平? ? 0.05,即可靠程度为 95%. 2.这里的 r 指的是线性相关系数, r 的绝对值很小,只是说明线性相关程度低,不一定
不相关,可能是非线性相关的某种关系.
3.这里的 r 是对抽样数据而言的.有时即使| r |? 1,两者也不一定是线性相关的.故在
统计分析时,不能就数据论数据,要结合实际情况进行合理解释. 4.对于上节课的例 1,可按下面的过程进行检验:
(1)作统计假设 H0 : x 与 y 不具有线性相关关系;
(2)由检验水平 0.05 与 n ? 2 ? 9 在附录 2 中查得 r0.05 ? 0.602 ;
(3)根据公式 ?2? 得相关系数 r ? 0.998 ;

(4)因为 r ? 0.998 ? 0.602,即 r ? r0.05 ,所以有 95 ﹪的把握认为 x 与 y 之间具有

线性相关关系,线性回归方程为 y ? 527.591?14.453x 是有意义的.
四.数学运用 1.例题:

例 1.下表是随机抽取的 8 对母女的身高数据,试根据这些数据探讨 y 与 x 之间的关系.

母亲身高 x / cm

154 157 158 159 160 161 162 163

女儿身高 y / cm

155 156 159 162 161 164 165 166

解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,

因为
x ? ?1 5 ? 4

?1? 5 ? 7 , y ???1515 ??1566 ? 3?166? ?88 ?1611, 5 9 . 2 5

8
? ? ? xi2 ? 8(x)2 ? 1542 ? ?1632 ? 8?159.252 ? 59.5 ,
i ?1

8
? ? ? yi2 ? 8( y)2 ? 1552 ? ?1662 ? 8?1612 ? 116 ,
i ?1

8
? xi yi ? 8x y ?154?155 ? ?163?166? ? 8?159.25?161 ? 80 ,
i ?1

所以 r ?

80

? 0.963 ,

59.5 ?116

由检验水平 0.05 及 n ? 2 ? 6 ,在附录 2 中查得 r0.05 ? 0.707 ,因为 0.963 ? 0.707 ,所

以可以认为 x 与 y 之间具有较强的线性相关关系.线性回归模型 y ? a ? bx ? ? 中 a, b

的估计值 a, b 分别为

8

? xi yi ? 8x y

? ? ? b ?

i ?1 8
xi2 ? 8

? 1.345,
2
x

i ?1

a ? y ?bx ? ?53.191,

故 y 对 x 的线性回归方程为 y? ? ?53.191?1.345x .

例 2.要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一 年级学生中

随机抽取10 名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩如下表:

学生编号

1 2 3 4 5 6 7 8 9 10

入学成绩 x

63 67 45 88 81 71 52 99 58 76

高一期末成绩 y 65 78 52 82 92 89 73 98 56 75

(1)计算入学成绩 x 与高一期末成绩 y 的相关系数;

(2)如果 x 与 y 之间具有线性相关关系,求线性回归方程;

(3)若某学生入学数学成绩为 80 分,试估计他高一期末数学考试成绩.

解:(1)因为 x ? 1 ??63 ? 67 ? ? 76? ? 70 , y ? 1 ??65 ? 78 ? ? 75? ? 76 ,

10

10

10

10

2

? ? Lxy ? (xi ? x)( yi ? y) ? 1894 , Lxx ? (xi ? x) ? 2474 ,

i ?1

i?1

10
? Lyy ? ( yi ? y)2 ? 2056 . i ?1

因此求得相关系数为 r ?

10

? (xi ? x)( yi ? y)

i ?1

?

10

10

? ? (xi ? x)2 ( yi ? y)2

i ?1

i ?1

Lxy ? 0.840 . Lxx Lyy

结果说明这两组数据的相关程度是比较高的; 小结解决这类问题的解题步骤: (1)作出散点图,直观判断散点是否在一条直线附近;
(2)求相关系数 r ; (3)由检验水平和 n ? 2 的值在附录中查出临界值,判断 y 与 x 是否具有较强的线性相 关关系; (4)计算 a , b ,写出线性回归方程. 2.练习: P104 练习 第1题.
五.回顾小结:
1.相关系数的计算公式与回归 系数 b 计算公式的比较;
2.相关系数的性质; 3.探讨相关关系的基本步骤.
六.课外作业: P106 习题 3.2 第1题.
5、关于坚持的名言,

你既然期望辉煌伟大的一生,那么就应该从今天起,以毫不动摇的决心和坚定不移的信念,凭自己的智慧和毅力,去创造你和人类的快乐。——佚名 6、最可怕的敌人,就是没有坚强的信念。——罗曼·罗兰 7、只要持续地努力,不懈地奋斗,就没有征服不了的东西。——塞内加 8、无论是美女的歌声,还是鬓狗的狂吠,无论是鳄鱼的眼泪,还是恶狼的嚎叫,都不会使我动摇。——恰普曼 9、书不记,熟读可记;义不精,细思可精;惟有志不立,直是无着力处。——朱熹 10、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 11、坚强的信念能赢得强者的心,并使他们变得更坚强。——白哲特 12、三军可夺帅也,匹夫不可夺志也。——佚名 13、立志不坚,终不济事。——朱熹 14、富贵不能淫,贫贱不能移,威武不能屈。——孟子 15、关于坚持的名言,意志目标不在自然中存在,而在生命中蕴藏。——武者小路实笃 关于坚持不懈的 50 条励志名人名言 16、意志若是屈从,不论程度如何,它都帮助了暴力。——但丁 17、只要有坚强的意志力,就自然而然地会有能耐、机灵和知识。——陀思妥耶夫斯基 18、功崇惟志,业广惟勤。——佚名

19、能够岿然不动,坚持正见,度过难关的人是不多的。——雨果 20、立志用功如种树然,方其根芽,犹未有干;及其有干,尚未有枝;枝而后叶,叶而后花。——王守仁 21、谁有历经千辛万苦的意志,谁就能达到任何目的。——米南德 22、不作什么决定的意志不是现实的意志;无性格的人从来不做出决定。——黑格尔 23、执着追求并从中得到最大快乐的人,才是成功者。——梭罗 24、有了坚定的意志,就等于给双脚添了一对翅膀。——乔·贝利 25、有百折不挠的信念的所支持的人的意志,比那些似乎是无敌的物质力量有更强大的威力。——爱因斯坦


更多相关文章:

非常超级学习网 fccjxxw.com

copyright ©right 2010-2021。
非常超级学习网内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图