2023版高考数学一轮总复习第八章统计与统计分析第二讲用样本估计总体课件
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
1/58
2/58
3/58
4/58
剩余54页未读,查看更多内容需下载
第二讲 用样本估计总体
课标要求考情分析1.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.能用样本估计总体的取值规律,能用样本估计百分位数,理解百分位数的统计含义1.考查平均数、方差的计算及频率分布直方图的简单应用.2.题型以选择题、填空题为主,出现解答题时常与概率结合
1.总体取值规律的估计(1)绘制频率分布直方图的步骤①求极差:即一组数据中最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12组,组距=
③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组.④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映各个数据在每组所占比例的大小.
⑤画频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于频率该组的组距,这样得到一系列的长方形,每个长方形的面积恰好是该组的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于1.
(2)不同统计图的特点扇形图主要用于直观描述各类数据占总数的比例;条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;折线图主要用于描述数据随时间的变化趋势.条形图适用于描述离散型数据,直方图适用于描述连续性数据.
2.总体百分位数的估计(1)第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
3.总体集中趋势的估计(1)众数在一组数据中,出现次数最多的数据叫做这组数据的众数.(2)中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)平均数
4.总体离散程度的估计(3)标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
【名师点睛】(1)频率分布直方图中的常见结论①众数的估计值为最高矩形的中点对应的横坐标.②平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.③中位数的估计值的左边和右边的小矩形的面积和是相等的.
题组一走出误区1.(多选题)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为44,中位数为55,标准差为19,则5年后,下列说法中正确的是()A.这七人岁数的众数变为40B.这七人岁数的平均数变为49C.这七人岁数的中位数变为60D.这七人岁数的标准差变为24答案:ABC
2.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,)第50百分位数为b,则有(A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=15答案:D
题组二走进教材3.(教材改编题)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()B.8D.16A.4C.12答案:B
4.(教材改编题)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积________.答案:50
题组三真题展现5.(2021年天津)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图8-2-1,则评分在区间[82,86)内的影视作品数量是()
图8-2-1A.20B.40C.64D.80答案:D
6.(多选题)(2021年新高考Ⅱ)下列统计量中,能度量样本x1,x2,…,xn的离散程度的有()A.样本x1,x2,…,xn的标准差B.样本x1,x2,…,xn的中位数C.样本x1,x2,…,xn的极差D.样本x1,x2,…,xn的平均数答案:AC
考点一频率分布直方图[例1](1)为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图8-2-2所示的频率分布直方图,根据统计图的数据,下列结论错误的是()
图8-2-2
A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32
解析:由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故选D.答案:D
(2)(2019年全国Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图(如图8-2-3):
甲离子残留百分比直方图乙离子残留百分比直方图图8-2-3
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.①求乙离子残留百分比直方图中a,b的值;②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:①由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.②甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
【题后反思】频率、频数、样本容量的计算方法
【变式训练】1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图(如图8-2-4),由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()
图8-2-4A.64B.54C.48D.27
解析:前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组频数和为38.所以第三组频数为38-16=22.又最大频率为0.32,对应的最大频数为0.32×100=32.所以a=22+32=54.故选B.答案:B
2.(2021年石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图8-2-5所示的频率分布直方图,已知第一组有6人.
图8-2-5(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定.(感想合理即可)
考点二样本的数字特征[例2](1)(2021年天河一模)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作实验基地,这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是()A.x1,x2,…xn的平均数B.x1,x2,…xn的标准差C.x1,x2,…xn的最大值D.x1,x2,…xn的中位数
解析:表示一组数据x1,x2,…xn的稳定程度是方差或标准差.故选B.答案:A
A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同(2)(多选题)(2021年新高考Ⅰ)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则()
解析:对于A,两组样本数据的平均数的差为c,故A错误;对于B,两组样本数据的样本中位数的差是c,故B答案:CD错误;对于C,∵标准差D(yi)=D(xi+c)=D(xi),∴两组样本数据的样本标准差相同,故C正确;对于D,∵yi=xi+c(i=1,2,…,n),c为非零常数,x的极差为xmax-xmin,y的极差为(xmax+c)-(xmin+c)=xmax-xmin,∴两组样本数据的样本极差相同,故D正确.故选CD.
【变式训练】1.(多选题)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x,方差为s2,则()
答案:AC
运动员第1次第2次第3次第4次第5次甲8791908993乙89909188922.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下表:则成绩较为稳定的那位运动员成绩的方差为______.
答案:2
⊙统计图表及其应用[例3]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图(如图8-2-6):
图8-2-6则下面结论中错误的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
收入类型新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%×2a=74%a增加A错其他收入4%a5%×2a=10%a增加了一倍以上B对解析:设新农村建设前农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后各项收入的对比如下表:
收入类型新农村建设前新农村建设后新农村建设后变化情况结论养殖收入30%a30%×2a=60%a增加了一倍C对养殖收入+第三产业收入(30%+6%)a=36%a(30%+28%)×2a=116%a超过经济收入2a的一半D对(续表)答案:A
[例4]某企业2020年12个月的收入与支出数据的折线图如图8-2-7:图8-2-7
已知利润=收入-支出,根据该折线图,下列说法正确的是()A.该企业2020年1月至6月的总利润低于2020年7月至12月的总利润B.该企业2020年1月至6月的平均收入低于2020年7月至12月的平均收入C.该企业2020年8月至12月的支出持续增长D.该企业2020年11月份的月利润最大
解析:对于A,由收入曲线与支出曲线差的幅度可得,企业2020年1月至6月的总利润低于2020年7月至12月的总利润,故A正确;对于B,2020年下半年的收入曲线的点明显高于2020年上半年的收入曲线的点,故该企业2020年1月至6月的平均收入低于2020年7月至12月的平均收入,故B正确;对于C,企业2020年8月至12月的支出曲线逐月上升,故C正确;对于D,7月,8月利润都大于11月,故D错误.故选ABC.答案:ABC
【反思感悟】(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的变化趋势.
【高分训练】1.已知某地区中小学生人数和近视情况分别如图8-2-8①和图8-2-8②所示.为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,)则样本容量和抽取的高中生近视人数分别为(图8-2-8A.200,20B.100,20C.200,10D.100,10
解析:由题意得样本容量为(3500+2000+4500)×2%=10000×2%=200,抽取的高中生人数为2000×2%=40,则近视人数为40×50%=20.故选A.答案:A
2.“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图8-2-9是2020年9月到2021年2月这半年来,某个关键词的搜索指数变化的统计图.图8-2-9
根据该统计图判断,下列结论正确的是()A.这半年来,网民对该关键词相关的信息关注度呈周期性变化B.这半年来,网民对该关键词相关的信息关注度不断减弱C.从该关键词的搜索指数来看,2020年10月的方差小于11月的方差D.从该关键词的搜索指数来看,2020年12月的平均值大于2021年1月的平均值
解析:由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,A错误;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,B错误;由统计图可知,2020年10月该关键词的搜索指数波动较大,11月的波动较小,所以2020年10月的方差大于11月的方差,C错误;由统计图可知,2020年12月该关键词的搜索指数大多高于10000,该月平均值大于10000,2021年1月该关键词的搜索指数大多低于10000,该月平均值小于10000,D正确.故选D.答案:D
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)