首页

2023高考数学二轮复习专题练三核心热点突破专题四概率与统计第1讲统计与统计案例含解析202303112179

资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。

1/21

2/21

剩余19页未读,查看更多内容需下载

第1讲 统计与统计案例高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率、回归分析与概率是近年命题的热点,2018年、2019年和2020年在解答题中均有考查.真题感悟1.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(  )A.中位数B.平均数C.方差D.极差解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,中位数是不变的,平均数、方差、极差均受影响.答案 A2.(2020·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且pi=1,则下面四种情形中,对应样本的标准差最大的一组是(  )A.p1=p4=0.1,p2=p3=0.4B.p1=p4=0.4,p2=p3=0.1C.p1=p4=0.2,p2=p3=0.3D.p1=p4=0.3,p2=p3=0.2解析 X的可能取值为1,2,3,4,四种情形的数学期望E(X)=1×p1+2×p2+3×p3+4×p4都为2.5,方差D(X)=[1-E(X)]2×p1+[2-E(X)]2×p2+[3-E(X)]2×p3+[4-E(X)]2×p4,标准差为.A选项的方差D(X)=0.65;B选项的方差D(X)=1.85;C选项的方差D(X)=1.05;D选项的方差D(X)=1.45.可知选项B的情形对应样本的标准差最大.故选B.答案 B3.(2020·天津卷)\n从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(  )A.10B.18C.20D.36解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.故选B.答案 B4.(2020·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1200,(xi-)2=80,(yi-)2=9000,(xi-)(yi-)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.解 (1)由已知得样本平均数=yi=60,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(xi,yi)(i=1,2,…,20)的相关系数\nr===≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考点整合1.抽样方法抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即=(x1+x2+…+xn).(4)方差与标准差.s2=[(x1-)2+(x2-)2+…+(xn-)2],s=.3.直方图的两个结论(1)小长方形的面积=组距×=频率.(2)各小长方形的面积之和等于1.4.回归分析与独立性检验(1)回归直线=x+经过样本点的中心(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值.(2)独立性检验对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:\ny1y2总计x1aba+bx2cdc+d总计a+cb+dn则K2=(其中n=a+b+c+d为样本容量).热点一 抽样方法【例1】(1)总体由编号为01,02,…,49,50的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为(  )附:第6行至第9行的随机数表2748 6198 7164 4148 7086 2888 8519 16207477 0111 1630 2404 2979 7991 9683 51253211 4919 7306 4916 7677 8733 9974 67322635 7900 3370 9160 1620 3882 7757 4950A.3B.19C.38D.20(2)(2020·百校大联考)在新冠肺炎疫情期间,大多数学生都进行网上上课.我校高一、高二、高三共有学生1800名,为了了解同学们对“钉钉”授课软件的意见,计划采用分层抽样的方法从这1800名学生中抽取一个容量为72的样本.若从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,则我校高三年级的人数为(  )A.800B.750C.700D.650解析 (1)由题意知,编号为01~50的个体才是需要的个体.由随机数表依次可得41,48,28,19,16,20,……故第4个个体的编号为19.故选B.(2)设从高三年级抽取的学生人数为2x人,则从高二、高一年级抽取的人数分别为2x-2,2x-4.由题意可得2x+(2x-2)+(2x-4)=72,∴x=13.设我校高三年级的学生人数为N,且高三抽取26人,由分层抽样,得=,∴N=650(人).\n答案 (1)B (2)D探究提高 解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.【训练1】(1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行第6列的数字开始,由左到右依次选取两个数字,则选出来的第5个个体的编号为________.附:第1行至第2行的随机数表21166508 90342076 43812634 91641750 7159450691273536 80727467 21335025 83120276 11870526(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.解析 (1)从随机数表的第1行第6列的数字开始,按规则得到的编号依次为50,89,03,42,07,64,38,12,63,49,16,41,75,07,15,94,50,……其中编号在01至20之间的依次为03,07,12,16,07,15,……按照编号重复的删除后一个的原则,可知选出来的第5个个体的编号为15.(2)因为样本容量n=60,总体容量N=200+400+300+100=1000,所以抽取比例为==.因此应从丙种型号的产品中抽取300×=18(件).答案 (1)15 (2)18热点二 用样本估计总体角度1 数字特征与统计图表的应用【例2】(1)(2020·衡水检测)甲、乙两名同学高三以来6次数学模拟考试的成绩统计如下图,甲、乙两组数据的平均数分别为甲、乙,标准差分别为s甲、s乙,则(  )\nA.甲<乙,s甲<s乙B.甲<乙,s甲>s乙C.甲>乙,s甲<s乙D.甲>乙,s甲>s乙(2)2020年初,我国突发新冠肺炎疫情,疫情期间中小学生“停课不停学”.已知某地区中小学生人数情况如甲图所示,各学段学生在疫情期间“家务劳动”的参与率如乙图所示.为了进一步了解该地区中小学生参与“家务劳动”的情况,现用分层抽样的方法抽取4%的学生进行调查,则抽取的样本容量、抽取的高中生中参与“家务劳动”的人数分别为(  )A.2750,200B.2750,110C.1120,110D.1120,200解析 (1)由统计图知,甲同学的总体成绩要好于乙同学的成绩,且乙同学的成绩波动较大,甲同学成绩较稳定.∴甲>乙,且s甲<s乙.(2)学生总数为15500+5000+7500=28000人,由于抽取4%的学生进行调查,则抽取的样本容量为28000×4%=1120(人).故高中生应抽取的人数为5000×4%=200(人),而高中生中参与“家务劳动”的比率为0.55,故高中生中参与“家务劳动”的人数为200×0.55=110(人).答案 (1)C (2)C角度2 用样本的频率分布估计总体分布【例3】(2019·全国Ⅲ卷)\n为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解 (1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.2.在例3中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(1)(2020·新高考海南卷)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是(  )\nA.这11天复工指数和复产指数均逐日增加B.这11天期间,复产指数增量大于复工指数的增量C.第3天至第11天复工复产指数均超过80%D.第9天至第11天复产指数增量大于复工指数的增量解析 由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11天复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;故选C、D.答案 CD(2)(2019·全国Ⅱ卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80]企业数22453147①分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;②求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:≈8.602.解 ①根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.所以用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.②100个企业的产值增长率平均数为\n=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=ni(yi-)2=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,s==0.02×≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.热点三 回归分析在实际问题中的应用【例4】如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年\n开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.探究提高 1.求回归直线方程的关键及实际应用(1)关键:正确理解,的计算公式和准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.相关系数(1)当r>0时,表明两个变量正相关;当r<0时,两个变量负相关.(2)当|r|>0.75时,认为两个变量具有较强的线性相关关系.【训练3】(1)(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是(  )A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx(2)(2020·百强名校领军考试)已知变量x,y的关系可以用模型y=cekx拟合,设z=lny,其变换后得到一组数据如下:x16171819z50344131\n由上表可得线性回归方程=-4x+,则c=(  )A.-4B.e-4C.109D.e109解析 (1)由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选D.(2)由数据表知=17.5,=39.∵样本点中心(,)在回归直线上,∴=39+4×17.5=109.又z=lny=ln(cekx)=kx+lnc,∴lnc==109,则c=e109.答案 (1)D (2)D热点四 独立性检验【例5】(2020·新高考山东、海南卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:  SO2PM2.5  [0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:  SO2PM2.5  [0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=,P(K2≥k0)0.0500.0100.001\nk03.8416.63510.828解 (1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.(2)根据抽查数据,可得2×2列联表:  SO2PM2.5  [0,150](150,475][0,75]6416(75,115]1010(3)根据(2)的列联表得K2的观测值k=≈7.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.探究提高 1.独立性检验的一般步骤(1)根据样本数据列成2×2列联表;(2)根据公式K2=,计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断.2.K2的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.【训练4】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=.P(K2≥k0)0.0500.0100.001k03.8416.63510.828\n解 (1)由调查数据,男顾客中对该商场服务满意的比率为=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K2的观测值k=≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.A级 巩固提升一、选择题1.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为(  )A.0.5B.0.6C.0.7D.0.8解析 法一 设调查的100位学生中阅读过《西游记》的学生人数为x,则x+80-60=90,解得x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7.故选C.法二 用Venn图表示阅读过《西游记》和《红楼梦》的人数之间的关系如图:易知调查的100位学生中阅读过《西游记》的学生人数为70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7.答案 C2.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(  )A.0.01B.0.1C.1D.10解析 10x1,10x2,…,10xn的方差为102×0.01=1.故选C.答案 C\n3.给出如下列联表患心脏病患其他病总计高血压201030非高血压305080总计5060110P(K2≥10.828)≈0.001,P(K2≥6.635)≈0.010,参照公式k=,得到的正确结论是(  )A.有99%以上的把握认为“高血压与患心脏病无关”B.有99%以上的把握认为“高血压与患心脏病有关”C.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”D.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关”解析 由列联表中的数据可得K2的观测值k=≈7.486>6.635,根据参考数据P(K2≥6.635)≈0.01,P(K2≥10.828)≈0.001,所以有1-0.01=99%的把握认为高血压与患心脏病有关,即有99%以上的把握认为高血压与患心脏病有关.答案 B4.(多选题)(2020·济南调研)某企业对本企业1644名职工关于复工的态度进行调查,调查结果如图所示,下列结论成立的是(  )疫情防控期间某企业复工职工调查A.x=0.384B.从该企业中任取一名职工,该职工是倾向于在家办公的概率为0.178C.不到80名职工倾向于继续申请休假D.倾向于复工后在家办公或在公司办公的职工超过986名\n解析 由图表知x%=1-5.1%-17.8%-42.3%,得x=34.8,则A错.在家办公的人员占17.8%,B正确.由1644×5.1%>1644×5%=82.2>80,∴超过80名职工倾向于休假,故C错误.又1644×(17.8%+42.3%)≈988,所以超过986名职工倾向于在家办公或在公司办公,D正确.综上可知,正确的结论为BD.答案 BD5.(多选题)某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论正确的是(  )A.得分在[40,60)之间的共有40人B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5C.估计得分的众数为55D.这100名参赛者得分的中位数为65解析 根据频率和为1,由(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,得分在[40,60)的频率是0.40,估计得分在[40,60)的有100×0.40=40(人),A正确;得分在[60,80)的频率为0.5,可得从这100名参赛者中随机选取一人,得分在[60,80)的概率为0.5,B正确;根据频率分布直方图知,最高的小矩形对应的底边中点为=55,即估计得分的众数为55,C正确;由0.05+0.35=0.4<0.5,知中位数位于[60,70)内,所以中位数的估计值为60+≈63.3.答案 ABC二、填空题6.(2020·深圳调研)为了响应中央号召,某日深圳环保局随机抽查了本市市区汽车尾气排放污染物x(单位:ppm)与当天私家车路上行驶的时间y(单位:小时)之间的关系,从某主干路随机抽取10辆私家车,根据测量数据的散点图可以看出x与y\n之间具有线性相关关系,其回归直线方程为=0.3x-0.4,若该10辆车中有一辆私家车的尾气排放污染物为6(单位:ppm),据此估计该私家车行驶的时间为________小时.解析 由=0.3x-0.4,取x=6,得=0.3×6-0.4=1.4,∴估计该私家车行驶的时间为1.4小时.答案 1.47.(2020·济宁联考)由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m,中位数为n,则m-n=________.解析 第一块小矩形的面积S1=0.3,第二块小矩形的面积S2=0.4,故n=2000+=3000;又第四、五块小矩形的面积均为S=0.06,故a=[1-(0.3+0.4+0.06×2)]=0.00009,所以m=1000×0.3+3000×0.4+5000×0.18+(7000+9000)×0.06=3360,故m-n=360.答案 3608.(2002·中原名校联考)“关注夕阳、爱老敬老”——某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x年(2013年是第一年)与捐赠的现金y(万元)的对应数据,由此表中的数据得到了y关于x的线性回归方程=mx+0.35,则预测2021年捐赠的现金大约是________万元.x3456y2.5344.5解析 由已知,得==4.5,==3.5,所以样本中心点的坐标为(4.5,3.5),代入=mx+0.35中,得3.5=4.5m+0.35,解得m=0.7,所以=0.7x+0.35.取x=9,得=0.7×9+0.35=6.65,故预测2021年捐赠的现金大约是6.65万元.\n答案 6.65三、解答题9.(2020·济南联考)2019年10月1日是中华人民共和国成立70周年纪念日.70年砥砺奋进,70年波澜壮阔,感染、激励着一代又一代华夏儿女,为祖国的繁荣昌盛努力拼搏,奋发图强.为进一步对学生进行爱国教育,某校社会实践活动小组,在老师的指导下,从学校随机抽取四个班级160名同学对这次国庆阅兵受到激励情况进行调查研究,记录的情况如下图:(1)如果从这160人中随机选取1人,此人非常受激励的概率和此人是很受激励的女同学的概率都是,求a,b,c的值;(2)根据“非常受激励”与“很受激励”两种情况进行研究,判断是否有95%的把握认为受激励程度与性别有关.附:参考数据P(K2≥k0)0.0500.0100.001k03.8416.63510.828解 (1)由题意知==,且a+b+c=120.解之得a=20,b=60,c=40.(2)由题意可得2×2列联表:非常受激励很受激励合计男206080女204060合计40100140∴K2的观测值k==≈1.17.由于1.17<3.841,∴没有95%的把握认为受激励程度与性别有关.\n10.某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7]频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6]频数151310165(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).解 (1)所求的频率分布直方图如下:\n(2)由题可知使用节水龙头后50天的用水量在[0.3,0.4)的频数为10,所以可估计在[0.3,0.35)的频数为5,故用水量小于0.35m3的频数为1+5+13+5=24,其频率为=0.48.因此,估计该家庭使用节水龙头后,日用水量小于0.35m3的概率为0.48.(3)该家庭未使用节水龙头50天的日用水量的平均数为1=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48(m3).该家庭使用了节水龙头后50天的日用水量的平均数为2=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35(m3).估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).B级 能力突破11.(多选题)(2020·海南质检)刘女士的网店经营坚果类食品,2019年各月份的收入、支出(单位:百元)情况的统计如图所示,下列说法中正确的是(  )A.4至5月份的收入的变化率与11至12月份的收入的变化率相同B.支出最高值与支出最低值的比是5∶1C.第三季度平均收入为5000元D.利润最高的月份是3月份和10月份解析 对于A,4至5月份的收入的变化率为=-20,11至12月份收入的变化率为=-20,故相同,A正确.对于B,支出最高值是2月份60百元,支出最低值是5月份的10百元,故支出最高值与支出最低值的比是6∶1,故B错误.对于C,第三季度的7,8,9月每个月的收入分别为40百元,50百元,60百元,故第三季度的平均收入为=50(百元),故C正确.对于D,利润最高的月份是3月份和10月份都是30百元,故D正确.答案 ACD12.(2020·西安模拟)某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y\n(单位:万件)的统计表:月份代码t1234567销售量y(万件)y1y2y3y4y5y6y7但其中数据污损不清,经查证yi=9.32,tiyi=40.17,=0.55.(1)请用相关系数说明销售量y与月份代码t有很强的线性相关关系;(2)求y关于t的回归方程(系数精确到0.01);(3)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)参考公式及数据:≈2.646,相关系数r=,当|r|>0.75时认为两个变量有很强的线性相关关系,回归方程=t+中斜率和截距的最小二乘估计公式分别为=,=-.解 (1)由统计表中的数据和附注中的参考数据得=4,(ti-)2=28,=0.55,则(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,∴r=≈≈0.99,因为0.99>0.75,所以销售量y与月份代码t有很强的线性相关关系.(2)由=≈1.331及(1)得==≈0.103.=-≈1.331-0.103×4≈0.92,所以y关于t的回归方程为=0.10t+0.92.\n(3)当t=8时,代入回归方程得=0.10×8+0.92=1.72(万件),第8个月的毛利润为z=10×1.72-≈17.2-2×1.414=14.372(万元).由14.372<15,预测第8个月的毛利润不能突破15万元.

版权提示

  • 温馨提示:
  • 1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
  • 2. 本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
  • 3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
  • 4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)

文档下载

发布时间:2022-08-25 22:20:53 页数:21
价格:¥3 大小:771.00 KB
文章作者:U-336598

推荐特供

MORE