fccjxxw.com
非常超级学习网 学习超级帮手
当前位置:首页 >> 数学 >>

高考理科第一轮复习练习(9.4相关性、最小二乘估计)

课时提升作业(六十四)
一、选择题 1.下面是 2×2 列联表: y1 x1 x2 总计 a 22 b y2 21 25 46 总计 73 47 120

则表中 a,b 的值分别为( ) (A)94,72 (B)52,50 (C)52,74 (D)74,52 2.对于给定的两个变量的统计数据,下列说法正确的是( ) (A)都可以分析出两个变量的关系 (B)都可以用一条直线近似地表示两者的关系 (C)都可以作出散点图 (D) 都可以用确 定的表达式表示两者的关系 3.(20 13·铜陵模拟)相关系数度量( ) (A)两个变量之间线性关系的强度 (B)散点图是否显示有意义的模型 (C)两个变量之间是否存在因果关系 (D)两个变量之间是否存在关系 4.遗传学研究发现,子女的身高与父母的身高相关,且子女的身高向人类的平均身高靠近,这种现象称为 “回归”.现用 x(单位:米)表示父母的身高,y(单位:米)表示子女的身高,则在下列描述子女身高与父母身 高关系的回归直线中,拟合比较好的是( )

5.(2013·新余模拟)若回归方程中的回归系数 b=0,则相关系数为( ) (A)r=1 (B)r=-1 (C)r=0 (D)无法确定 6.(2013·佛山模拟)变量 X 与 Y 相对应的一组数据为(10,1),(11.3,2), (11.8,3),(12.5,4),(13,5),变量 U 与 V 相对应的一组数据为(10,5),(11.3,4), (11.8,3),(12.5,2),(13,1).r1 表示变量 Y 与 X 之间的线性相关系数,r2 表示变量 V 与 U 之间的线性相关系 数,则( ) (A)r2<r1<0 (B)0<r2<r1 (C)r2<0<r1 (D)r2=r1 7.(2013·鞍山模拟)设(x1,y1),(x2,y2),?,(xn,yn)是变量 x 和 y 的 n 个 样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如 图),以下结论中正确的是 ( ) (A)x 和 y 的相关系数为直线 l 的斜率 (B)x 和 y 的相关系数在 0 到 1 之间 (C)当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 (D)直线 l 过点( , ) 8.(2013·九江模拟)已知数组(x1,y1),(x2,y2),?,(x10,y10)满足线性回归方程 y=a+bx,则“(x0,y0)满足线性 回归方程 y=bx+a”是“x0= ,y0= ”的( )

(A)充分不必要条件 (B)必要不充分条件 (C)充要条件 (D)既不充分也不必要条件 9.由一组样本数据(x1,y1),(x2,y2),?,(xn,yn)得到回归直线方程 y=a+bx,那么下面正确说法的序号是 ( ) ①直线 y=a+bx 必经过点( , ); ②直线 y=a+bx 至少经过点(x1,y1),(x2,y2),?,(xn,yn)中的一个点;

③直线 y=a+bx 的斜率 b=

;

④直线 y=a+bx 和各点(x1,y1),(x2,y2),?,(xn,yn)的偏差

[yi-(bxi+a)] 是该坐标平面上所有直线与这些点

2

的偏差中最小的. (A)①②③ (B)②③④ (C)①③④ (D)①②④ 10.(2013·安庆模拟)某著名纺织集团为了减轻生产成本继续走高的压力,计划提高某种产品的价格,为此 销售部在 10 月 1 日 至 10 月 5 日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查, 其中该产品的价格 x(元)与销售量 y(万件)之间的数据如表所示: 日期 价格 x(元) 销售量 y(万件) 10 月 1 日 9 11 10 月 2 日 9.5 10 10 月 3 日 10 8 10 月 4 日 10.5 6 10 月 5 日 11 5

已知销售量 y 与价格 x 之间具有线性相关关系,其回归直线方程为:y=a-3.2x,若该集团提高价格后该批发 市场的日销售量为 7.36 万件,则该产 品的价格约为 ( ) (A)14.2 元 (B)10.8 元 (C)14.8 元 (D)10.2 元 二、填空题 11.(2013·芜湖模拟)许多因素都会影响贫穷,教育也是其中之一,在研究这两个因素的关系时收集了 美国 50 个州的成年人受过 9 年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分 比(y)的数据,建立的回归直线方程为 y=0.8x+4.6,斜率的估计值等于 0.8 说明 ,成年 人受过 9 年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)之间的相 关系数 (填“大于 0”或“小于 0”). 12.(2013·南昌模拟)对一些城市进行职工人均工资水平 x(千元)与居民人均消费水平 y(千元)统计调查后 知,y 与 x 具有相关关系,满足回归方程 y=1.562+0.66x.若某被调查城市的居民人均消费水平为 7.675(千 元),则可以估计该城市人均消费额占人均工资收入的百分比约为 %(结果保留两个有效数字). 13.在 500 人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外 500 名未用血清的人的感 冒记录作比较,结果如表所示.问:能否有 99%的把握认为该种血清 (填“能”或“不能”)起到预防 感冒的作用. 未感冒 使用血清 未使用血清 总计 258 216 474 感冒 242 284 526 总计 500 500 1 000

14.(能力挑战题)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月 1 号

到 5 号每天打篮球时间 x(单位:小时)与当天投篮命中率 y 之间的关系: 时间 x 命中率 y 1 0.4 2 0.5 3 0.6 4 0.6 5 0.4

小李这 5 天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月 6 号打 6 小时篮球的投篮 命中率为 . 三、解答题 15.某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了 180 件产品进行分析,其中设备 改造前的合格品有 36 件,不合格品有 49 件,设备改造后生产的合格品有 65 件,不合格品有 30 件.根据所给 数据: (1)写出 2×2 列联表; (2)判断产品是否合格与设备改造是否有关.

答案解析 1.【解析】选 C.∵a+21=73,∴a=52,又 a +22=b, ∴b=74. 2.【解析】选 C.给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一 定符合线性相关或函数关系,故选 C. 3.【解析】选 A.相关系数是度量两个变量之间线性关系强弱程度的. 4.【思路点拨】描述子女身高与父母身高关系的回归直线中,拟合效果越好,则两条直线的倾斜角越接近, 我们逐一分析四个图形,寻找四个答案中直线的倾斜角最接近的图象,即为答案. 【解析】选 B.回归直线拟合效果越好,则两条直线的倾斜角越接近,我们逐一分析四个图形,直线的倾斜角 最接近的图象为 B,故选 B. 5.【解析】选 C.因为回归系数 b 的计算公式与相关系数 r 的计算公式中分子相同,故 b=0 时有 r=0. 6.【思路点拨】先根据数据作出 X 与 Y 及 U 与 V 的散点图,再根据散点图判断出变量之间的正负相关性. 【解析】选 C.结合散点图可得:变量 X 与 Y 成正相关,变量 V 与 U 成负相关,故 r1>0,r2<0. 7.【思路点拨】根据最小二乘法的有关概念:样本点的中心、相关系数、线性回归方程的意义等进行判断. 【解析】选 D.在 A 中,相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度,它们 的计算公式也不相同,故 A 不正确;在 B 中,相关系数的值有正有负,还可以是 0;当相关系数在 0 到 1 之间时, 两个变量为正相关,在-1 到 0 之间时,两个变量负相关,故 B 不正确;在 C 中,l 两侧的样本点的个数分布与 n 的奇偶性无关,也不一定是平均分布,故 C 不正确;由回归直线方程的计算公式 = 可知直线 l 必过点

( , ),故 D 正确. 8. 解析】 B.x0,y0 为这 10 组数据的平均值,又因为线性回归方程 y=a+bx 必过样本中心( , ),因此( , ) 【 选 一定满足线性回归方程,但满足线性回归方程的除了( , )处,可能还有其他样本点. 9.【解析】选 C.回归直线 y=a+bx 经过样本中心点( , ),可能不经过(x1,y1),(x2,y2),…,(xn,yn)中的任何 一点,这些点分布在这条直线附近. 10. 解析】 D.依题意 =10, =8.因为线性回归直线必过样本中心点( , ),所以 8=-3.2×10+a,解得a=40. 【 选 所以回归直线方程为 y=40-3.2x.令 y=7.36,则 7.36=40-3.2x,解得 x=10.2.所以该产品的价格约为 10.2 元. 11.【解析】由回归方程知 a=4.6,b=0.8,再由 x,y 表示的实际意义可知 0.8 的含义,相关系数 r>0. 答案:一个地区受 9 年或更少教育的百分比每增加 1%,收入低于官方规定的贫困线的人数占本州人数的百分 比将增加 0.8%左右 大于 0 12.【解析】依题意得,当 y=7.675 时,有 0.66x+1.562=7.675,x≈9.262.因此,可以估计该城市人均消费额 占人均工资收入的百分比为 答案:83 13.【思路点拨】在使用该种血清的人中,有 =48.4%的人患过感冒;在没有使用该种血清的人中,有 ≈83%.

=56.8%的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大. 从直观上来看,使用 过血清的人与没有使用过血清的人患感冒的可能性存在差异. 【解析】由列联表中的数据,求得 χ=
2

≈7.075.

∵7.075>6.635,因此有 99%的把握认为该种血清能起到预防感冒的作用. 答案:能 【方法技巧】两个分类变量是否有关的直观判断 在列联表中,可以估计满足条件 X=x1 的个体中具有 Y=y1 的个体所占的比重 有 Y=y1 的个体所占的比重 和 ,和满足条件 X=x2 的个体中具 ≈ ,因此两个比重

,若两个分类变量无关,则两个比重应差别不大,即

相差越大,两个分类变量有关的可能性就越大.

14.【解析】平均命中率 = ×(0.4+0.5+0.6+0.6+0.4)=0.5,而 =3,

(xi- )(yi- )=(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)=0.1,

(xi- ) =(-2) +(-1) +0 +1 +2 =10,于是 b=0.01,a= -b =0.47,∴y=0.47+0.01x,令 x=6,得 y=0.53. 答案:0.5 0.53

2

2

2

2

2

2

15.【思路点拨】列表后利用χ 的值进行检验. 【解析】(1)由已知数据得 合格品 设备改造后 设备改造前 合计 (2)∵χ =
2

2

不合格品 30 49 79

合计 95 85 180

65 36 101 ≈12.38.

由于 12.38>6.635,所以有 99%以上的把握认为产品是否合格与设备改造有关. 【变式备 选】对某校学生进行心理障碍测试,得到如下列联表. 焦虑 女生 男生 总计 5 20 25 说谎 10 10 20 懒惰 15 50 65 总计 30 80 110

试说明在这三种心理障碍中哪一种与性别关系最大? 【解析】对于上述三种心理障碍分别构造三个随机变量 由表中数据可得 = ≈0.863<2.706, = ≈6.366>3.841, = ≈1.410<2.706 , , .

所以没有充分的证据显示焦虑 与性别有关,有 95%的把握认为说谎与性别有关,没有充分的证据显示懒惰与 性别有关.


更多相关文章:

非常超级学习网 fccjxxw.com

copyright ©right 2010-2021。
非常超级学习网内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图