fccjxxw.com
非常超级学习网 学习超级帮手
当前位置:首页 >> 数学 >>

2018-2019年数学高中学业水平测试课件:专题五第21讲统计图表、用样本估计总体_图文

专题 五 统计

第 21 讲 统计图表、用样 本估计总体

1.统计图表 统计图表是表达和分析数据的重要工具,常用的统 计图表有条形统计图、扇形统计图、折线统计图、茎叶 图等.

2.数据的数字特征
(1)众数、中位数、平均数. 众数:在一组数据中,出现次数最多的数据叫作这 组数据的众数. 中位数:将一组数据按大小依次排列,把处在最中 间位置的一个数据(或最中间两个数据的平均数)叫作这 组数据的中位数.

平均数:样本数据的算术平均数,即-x =
__n1_(_x_1_+__x_2+__…__+__x_n_)____. 在频率分布直方图中,中位数左边和右边的直方图的 面积应该相等.

(2)样本方差、标准差. ①标准差 s= n1[(x1--x )2+(x2--x )2+…+(xn--x )2], 其中 xn 是样本数据的第 n 项,n 是样本容量,-x 是 平均数. ②标准差是刻画数据的离散程度的特征数,样本方 差是标准差的平方.通常用样本方差估计总体方差,当 样本容量接近总体容量时,样本方差很接近总体方差.

3.用样本估计总体
(1)通常我们对总体作出的估计一般分成两种,一种 是用样本的频率分布估计总体的频率分布,另一种是用样 本的数字特征估计总体的数字特征.
频率 (2)在频率分布直方图中,纵轴表示__组__距___,数据落 在各小组内的频率用各小长方形的面积表示,各小长方形 的面积总和等于 1.

(3)在频率分布直方图中,按照分组原则,再在左边 和右边各加一个区间.从所加的左边区间的中点开始, 用线段依次连接各个矩形的顶端中点,直至右边所加区 间的中点,就可以得到一条折线,称之为频率折线图.
(4)当样本数据较少时,用茎叶图表示数据的效果较 好,它没有信息的缺失,而且可以随时记录,方便表示 与比较.

1.频率分布直方图的绘制与应用
【例 1】 (1)为了研究某药品的疗效,选取若干名志 愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa) 的分组区间为[12,13),[13,14),[14,15),[15,16), [16,17],将其按从左到右的顺序分别编号为第一组,第 二组,…,第五组,如图是根据试验数据制成的频率分 布直方图.已知第一组与第二组共有 20 人,第三组中没 有疗效的有 6 人,则第三组中有疗效的人数为( )

A.6

B.8

C.12

D.18

(2)某校从参加高一年级期中考试的学生中随机抽出 60 名学生,将其物理成绩(均为整数)分成六段[40,50), [50,60),…,[90,100]后得到如图所示的频率分布直方 图,观察图形的信息,回答下列问题:

①求分数在[70,80)内的频率,并补全这个频率分布 直方图;
②统计方法中,同一组数据常用该组区间的中点值 作为代表,据此估计本次考试中的平均分.
(1)解析:志愿者的总人数为(0.16+200.24)×1=50,
所以第三组人数为 50×0.36=18,有疗效的人数为
18-6=12.
答案:C

(2)解:①设分数在[70,80)内的频率为 x,根据频率 分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得 x=0.3,所以频率分布直方图如图所示.

②平均分为 45×0.1+55×0.15+65×0.15+75×0.3 +85×0.25+95×0.05=71(分).
剖析:(1)明确频率分布直方图的意义,即图中的每 一个小矩形的面积是数据落在该区间上的频率,所有小矩 形的面积和为 1.
(2)对于统计图表类题目,最重要的是认真观察图表, 从中提炼有用的信息和数据.

2.茎叶图的应用 【例 2】 某市为了考核甲、乙两部门的工作情况, 随机访问了 50 位市民.根据这 50 位市民对这两部门的评 分(评分越高表明市民的评价越高),绘制茎叶图如下:

(1)分别估计该市的市民对甲、乙两部门评分的中位 数;
(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评 价.
解:(1)由所给茎叶图知,50 位市民对甲部门的评分
由小到大排序,排在第 25,26 位的是 75,75,故样本中
位数为 75,

所以该市的市民对甲部门评分的中位数的估计值是 75.
50 位市民对乙部门的评分由小到大排序,排在第 25, 66+68
26 位的是 66,68,故样本中位数为 2 =67,所以该 市的市民对乙部门评分的中位数的估计值是 67.

(2)由所给茎叶图知,50 位市民对甲、乙部门的评分 高于 90 的比率分别为550=0.1,580=0.16,故该市的市民 对甲、乙部门的评分高于 90 的概率的估计值分别为 0.1, 0.16.

(3)由所给茎叶图知,市民对甲部门的评分的中位数 高于对乙部门的评分的中位数,而且由茎叶图可以大致看 出对甲部门的评分的标准差要小于对乙部门的评分的标 准差,说明该市市民对甲部门的评价较高、评价较为一致, 对乙部门的评价较低、评价差异较大(注:考生利用其他 统计量进行分析,结论合理的同样给分).

剖析:茎叶图的优缺点. 由茎叶图可以清晰地看到数据的分布情况,这一点同 频率分布直方图类似.它优于频率分布直方图的第一点是 从茎叶图中能看到原始数据,没有任何信息损失,第二点 是茎叶图便于记录和表示.其缺点是当样本容量较大时, 作图较烦琐.

3.用样本的数字特征估计总体的数字特征 【例 3】 某工厂 36 名工人的年龄数据如下表.

工人编号年龄 工人编号年龄 工人编号年龄 工人编号年龄

1 40

10 36

19 27

28 34

2 44

11 31

20 43

29 39

3 40

12 38

21 41

30 43

4 41

13 39

22 37

31 38

5 33

14 43

23 34

32 42

6 40 7 45 8 42 9 43

15 45 16 39 17 38 18 36

24 42 25 37 26 44 27 42

33 53 34 37 35 49 36 39

(1)用系统抽样法从 36 名工人中抽取容量为 9 的样 本,且在第一分段里用随机抽样法抽到的年龄数据为 44, 列出样本的年龄数据;

(2)计算(1)中样本的均值-x 和方差 s2; (3)36 名工人中年龄在-x -s 与-x +s 之间的有多少 人?所占的百分比是多少(精确到 0.01%)? 解:(1)44,40,36,43,36,37,44,43,37.
(2)-x =44+40+36+43+396+37+44+43+37=40.

s2=19[(44-40)2+(40-40)2+(36-40)2+(43-40)2+ (36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2] =1090.
(3)40-130=1130,40+130=1330在???1130,1330???的有 23 个,占 63.89%.

剖析:平均数与方差都是重要的数字特征,是对总体 的一种简明的描述,它们所反映的情况有着重要的实际意 义,平均数、中位数、众数描述其集中趋势,方差和标准 差描述其波动大小.

1.已知下表是某班学生的一次数学考试成绩的分布



分数 段

[0,90)

[90, 100)

[100, [110, [120, [130, 110) 120) 130) 150)

人数

7

6

8

12

6

6

那么,分数在区间[100,110)内的频率和分数不满 110

的频率分别是( )

A.0.38,1

B.0.18,1

C.0.47,0.18

D.0.18,0.47

解析:分数在区间[100,110)内的学生共有 8 人,该 班的总人数为 7+6+8+12+6+6=45,则分数在区间 [100,110)内的概率为485≈0.18,分数不满 110 分的共有 7+6+8=21,则分数不满 110 分的频率是2415≈0.47.
答案:D

2.如图是某学校抽取的学生体重 的频率分布直方图,已知图中从左到 右的前 3 个小组的频率之比为 1∶2∶3, 第 2 小组的频数为 10,则抽取的学生人数为( )
A.20 B.30 C.40 D.50 解析:前 3 组的频率之和等于 1-(0.0125+0.0375) ×5=0.75,第 2 小组的频率是 0.75×1+22+3=0.25,设 样本容量为 n,则1n0=0.25,即 n=40. 答案:C

3.某班的全体学生参加英语测试,成绩的频率分布 直方图如图,数据的分组依次为[20,40),[40,60),[60, 80),[80,100].若低于 60 分的人数是 15,则该班的学 生人数是( )
A.45 B.50 C.55 D.60

解析:由频率分布直方图知低于 60 分的频率为(0.01 +0.005)×20=0.3.故该班的学生人数 n=01.53=50.
答案:B

4.在某次测量中得到的 A 样本数据如下:42,43, 46,52,42,50,若 B 样本数据恰好是 A 样本数据每个 都减 5 后所得数据,则 A,B 两样本的下列数字特征对应 相同的是( )
A.平均数 B.标准差 C.众数 D.中位数

解析:利用平均数、标准差、众数、中位数等统计特 征数的概念求解.由 B 样本数据恰好是 A 样本数据每个 都减 5 后所得数据,可得平均数、众数、中位数分别是原 来结果减去 5,即与 A 样本不相同,标准差不变.
答案:B

5.一位同学种了甲、乙两种树苗各 1 株,分别观察 了 9 次、10 次后,得到树苗高度的数据的茎叶图如图(单 位:厘米),则甲、乙两种树苗高度的数据的中位数之和 是( )

A.44 C.50

B.54 D.52

解析:根据茎叶图可得,观察甲树苗 9 次得到的树 苗高度分别为:19,20,21,23,24,31,32,33,37; 观察乙树苗 10 次得到的树苗高度分别为:10,10,14, 24,26,30,44,46,46,47,则甲树苗高度的中位数为 24,乙树苗高度的中位数26+2 30=28,因此 24+28=52.
答案:D

6.将某选手的 9 个得分去掉 1 个最高分和 1 个最低 分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎 叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示:
则 7 个剩余分数的方差为( )
A.1196 B.376 C.36 D.677

87+94+90+91+90+90+x+91

解析:由题意知

7



91,解得 x=4.故 s2=17[(87-91)2+(94-91)2+(90-91)2

+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+

9+1+0+1+9+0)=376.

答案:B

7.在一样本中共有五个个体,其值分别为 a,0,1, 2,3.若该样本的平均值为 1,则样本方差为________.

a+0+1+2+3

解析:因为样本的平均值为 1,所以

5



1,解得 a=-1. 所以样本的方差为15[(-1-1)2+(0-1)2

+(1-1)2+(2-1)2+(3-1)2]=2.

答案:2

8.一个社会调查机构就某地居民的月收入调查了 10 000 人,并根据所得数据画出了样本的频率分布直方图(如 图),为了分析居民的收入与年龄、学历、职业等方面的 关系,要从这 10 000 人中再用分层抽样方法抽取 100 人 作进一步调查,则在(1 500,2 000)(元)月收入段应抽取的 人数为________.

解析:因为(1 500,2 000)(元)月收入段的频率是 0.000 4×500=0.2,
所以从该月收入段中应抽取 100×0.2=20 人. 答案:20

9.某学校为了了解学生的日平均睡眠时间(单位:h),

随机选择了 n 名同学进行调查,下表是这 n 名同学的日

睡眠时间的频率分布表.

序号(i)
1 2 3 4 5

分组(睡眠 时间) [4,5) [5,6)
[6,7)
[7,8)
[8,9)

频数(人数) 6
a b

频率 0.12 0.20
0.08

(1)求 n 的值;若 a=20,将表中数据补全,并画出频 率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值 (例如区间[4,5)的中点值是 4.5)作为代表.若据此计算的 上述数据的平均值为 6.52,求 a,b 的值,并由此估计该 学校学生的日平均睡眠时间在 7 小时以上的概率.
解:(1)由频率分布表可知 n=0.612=50. 补全数据如下表:

序号(i)

分组(睡 眠时间)

频数(人数)

1

[4,5)

6

2

[5,6)

10

3

[6,7)

20

4

[7,8)

10

5

[8,9)

4

频率分布直方图如下:

频率
0.12 0.20 0.40 0.20 0.08

(2)由题意知,
???510(6×4.5+10×5.5+a×6.5+b× ??7.5+4×8.5)=6.52, ??6+10+a+b+4=50, 解得 a=15,b=15. 设“该学校学生的日平均睡眠时间在 7 小时以上”为 事件 A,则 P(A)=P(x≥7)=155+0 4=0.38. 答:该学校学生的日平均睡眠时间在 7 小时以上的概 率约为 0.38.


更多相关文章:

非常超级学习网 fccjxxw.com

copyright ©right 2010-2021。
非常超级学习网内容来自网络,如有侵犯请联系客服。zhit325@126.com|网站地图