突破点7 用样本估计总体
提炼1 频率分布直方图 (1)频率分布直方图中横坐标表示组距,纵坐标表示频率频率,频率=组距×. 组距组距
(2)频率分布直方图中各小长方形的面积之和为(3)利用频率分布直方图求众数、中位数与平均数,在频率分布直方图中: ①最高的小长方形底边中点的横坐标即是众数; ②中位数左边和右边的小长方形的面积和是相等的; ③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形
提炼2 茎叶图的优点 (1)所有的信息都可以从茎叶图中得到.
(2)可以帮助分析样本数据的大致频率分布情况.
提炼3 样本的数字特征 (1)众数、中位数.
1(2)样本平均数x=n(x1+x2+?+xn).
1(3)样本方差s2=nx1-x)2+(x2-x)2+?+(xn-x)2].
(4)样本标准差
s=222[?x1-x?+?x2-x?+?+?xn-x?]. n
回访 用样本估计总体
1.(2016·全国乙卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同
1
时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
图
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
解] (1)当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700,
所以y与x的函数解析式为
?3 800,x≤19,y=?(x∈N).4分 500x-5 700,x>19?
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.6分
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这
1100台机器在购买易损零件上所需费用的平均数为100×70+4 300×20+4
800×10)=4 000.8分
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损
1零件上所需费用的平均数为100(4 000×90+4 500×10)=4 050. 10分
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.12分
2.(2014·全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
2
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
解] (1)
4分
-
(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.6分
质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.8分
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.10分
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.12分
3
3.(2013·全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?
图
解] (1)设A药观测数据的平均数为x,B药观测数据的平均数为y.
由观测结果可得 1x=20(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+
2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,2分 1y=20(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+
1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.4分
由以上计算结果可得x>y,因此可看出A药的疗效更好.6分
(2)由观测结果可绘制茎叶图如图:
9分
4
7从以上茎叶图可以看出,A药疗效的试验结果有10“2.”,“3.”上,
7而B药疗效的试验结果有10的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更
好.12分
热点题型1 频率分布直方图
题型分析:频率分布直方图多以生活中的实际问题为背景,考查学生运用已知数据分析问题的能力,难度中等.
(2016·合肥三模)某高中为了解全校学生每周参与体育运动的情况,随机从全校学生中抽取100名学生,统计他们每周参与体育运动的时间如下:
(2)①估计该校学生每周参与体育运动的时间的中位数及平均数;
②若该校有学生3 000人,根据以上抽样调查数据,估计该校学生每周参与体育运动的时间不低于8小时的人数.
解] (1)频率分布直方图如图所示:
26(2)①由数据估计中位数为4+404=6.6,8分
估计平均数为2×0.24+6×0.4+10×0.28+14×0.06+18×0.02=6.88.10分 ②将频率看作概率知P(t≥8)=0.36,
∴3 000×0.36=1 080.12分
解决该类问题的关键是正确理解已知数据的含义.掌握图表中各个量的意义,通过图表对已知数据进行分析.
5
提醒:(1)小长方形的面积表示频率,其纵轴是频率,而不是频率. 组距
(2)各组数据频率之比等于对应小长方形的高度之比.
变式训练1] 某电子商务公司随机抽取1 000名网络购物者进行调查.这1 000名购物者2015年网上购物金额(单位:万元)均在区间0.3,0.9]内,样本分组为:0.3,0.4),0.4,0.5),0.5,0.6),0.6,0.7),0.7,0.8),0.8,0.9],购物金额的频率分布直方图如下:
图7-3
电子商务公司决定给购物者发放优惠券,其金额(单位:元)与购物金额关系如下:
(2)以这1 000名购物者购物金额落在相应区间的频率作为概率,求一个购物者获得优惠券金额不少于150元的概率.
解] (1)购物者的购物金额x与获得优惠券金额y的频率分布如下表:
这50×400+100×300+150×280+200×20=96.4分 1 000
(2)由获得优惠券金额y与 购物金额x的对应关系,有
P(y=150)=P(0.6≤x<0.8)=(2+0.8)×0.1=0.28,
P(y=200)=P(0.8≤x≤0.9)=0.2×0.1=0.02,10分
从而,获得优惠券不少于150元的概率为
P(y≥150)=P(y=150)+P(y=200)=0.28+0.02=0.3.12分
6
热点题型2 茎叶图
题型分析:结合样本数据和茎叶图对总体作出估计是高考命题的热点,应引起足够的重视,难度中等.
(2016·福州模拟)长时间用手机上网严重影响着学生的身体健康,某
校为了解A,B两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本,绘制成茎叶图如图7-4所示(图中的茎表示十位数字,叶表示个位数字).
图7-4
(1)分别求出图中所给两组样本数据的平均值,并据此估计哪个班的学生平均上网时间较长;
(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机提取一个不超过21的数据记为b,求a>b的概率.
1解] (1)A班样本数据的平均值为5+11+14+20+31)=17.3分
由此估计A班学生每周平均上网时间17小时;
1B班样本数据的平均值为5+12+21+25+26)=19,由此估计B班学生每周
平均上网时间较长.6分
(2)A班的样本数据中不超过19的数据a有3个,分别为9,11,14,B班的样本数据中不超过21的数据b也有3个,分别为11,12,21,从A班和B班的样本数据中各随机抽取一个共有:9种不同情况,分别为(9,11),(9,12),(9,21),(11,11),(11,21),(11,21),(14,11),(14,12),(14,21),
其中a>b的情况有(14,11),(14,12)两种,
2故a>b的概率P=9.12分
作茎叶图时先要弄清“茎”和“叶”分别代表什么,根据茎叶图,可以得到数据的众数、中位数,也可从图中直接估计出两组数据的平均数大小与稳定性.
变式训练2] (名师押题)某车间20名工人年龄数据如下表:
7
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解] (1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.2分
(2)这20名工人年龄的茎叶图如下:
6分
1(3)这20名工人年龄的平均数x=20(19×1+28×3+29×3+30×5+31×4+
32×3+40×1)=30,8分
1故方差s2=201×(19-30)2+3×(28-30)2+3×(29-30)2+5×(30-30)2+
14×(31-30)2+3×(32-30)2+1×(40-30)2]=20×(121+12+3+0+4+12+100)
=12.6.12分
8
www.99jianzhu.com/包含内容:建筑图纸、PDF/word/ppt 流程,表格,案例,最新,免费下载,施工方案、工程书籍、建筑论文、合同表格、标准规范、CAD图纸等内容。