2023高考数学统考一轮复习第10章计数原理概率随机变量及其分布第8节概率统计的综合题教师用书教案理新人教版202303081186
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
概率、统计的综合题[考试要求] 能从研究对象中获取数据,会用数学方法对数据进行整理、分析和推断,构建模型等.考点一 概率与统计的综合应用 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.[典例1] 从某技术公司开发的某种产品中随机抽取200件,测量这些产品的一项质量指标值(记为Z),由测量结果得如下频率分布直方图:(1)公司规定:当Z≥95时,产品为正品;当Z<95时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元.记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和数学期望;(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2(同一组中的数据用该区间的中点值作代表).①利用该正态分布,求P(87.8<Z<112.2);②某客户从该公司购买了500件这种产品,记X表示这500件产品中该项质量指标值位于区间(87.8,112.2)内的产品件数,利用①的结果,求E(X).附:≈12.2.若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.6827,P(μ-2σ<Z<μ+2σ)=0.9545.[解] (1)由频率估计概率,产品为正品的概率为(0.033+0.024+0.008+0.002)×10=0.67,\n所以随机变量ξ的分布列为ξ90-30P0.670.33所以E(ξ)=90×0.67+(-30)×0.33=50.4.(2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数和样本方差s2分别为=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150.①因为Z~N(100,150),从而P(87.8<Z<112.2)=P(100-12.2<Z<100+12.2)=0.6827.②由①知,一件产品中该项质量指标值位于区间(87.8,112.2)内的概率为0.6827,依题意知X~B(500,0.6827),所以E(X)=500×0.6827=341.35.点评:本题以统计图表为载体,将正态分布、二项分布、频率分布直方图巧妙的融合在一起,体现了知识的整合性与交汇融合性,搞清这些统计图表的含义,掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算是解决问题的关键.经销商经销某种农产品,在一个销售季度内,每售出1t该产品获得利润500元,未售出的产品,每1t亏损300元.根据以往资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的均值.[解] (1)当X∈[100,130)时,T=500X-300(130-X)=800X-39000.当X∈[130,150]时,T=500×130=65000.\n所以T=(2)由(1)知利润T不少于57000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0.7.(3)依题意可得T的分布列为T45000530006100065000P0.10.20.30.4所以E(T)=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.考点二 概率与统计案例的综合应用 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.[典例2](2020·西安五校联考)为加快经济转型升级,加大技术研发力度,某市建立高新科技研发园区,并力邀某高校入驻该园区.为了解教职工意愿,该高校在其所属的8个学院的教职工中作了“是否愿意将学校整体搬迁至研发园区”的问卷调查,8个学院的调查人数及统计数据如下:调查人数x1020304050607080愿意整体搬迁人数y817253139475566(1)请根据上表提供的数据,用最小二乘法求出变量y关于变量x的线性回归方程=x+(保留小数点后两位有效数字);若该校共有教职工2500人,请预测该校愿意将学校整体搬迁至研发园区的人数.(2)若该校的8位院长中有5位院长愿意将学校整体搬迁至研发园区,现该校拟在这8位院长中随机选取4位院长组成考察团赴研发园区进行实地考察,记X为考察团中愿意将学校整体搬迁至研发园区的院长人数,求X的分布列及数学期望.参考公式及数据:=,=-·,xiyi=16310,x=20400.[解] (1)由已知得=45,=36,==≈0.80,=36-0.80×45=0,\n故变量y关于变量x的线性回归方程为=0.80x.所以当x=2500时,y=2500×0.80=2000,所以该校愿意将学校整体搬迁至研发园区的人数约为2000.(2)由题意可知X的可能取值为1,2,3,4.P(X=1)==,P(X=2)==,P(X=3)==,P(X=4)==.所以X的分布列为X1234P故E(X)=1×+2×+3×+4×=.点评:在两个变量的回归分析中要注意以下两点(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算.(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.某健身馆在2020年7,8两个月推出优惠项目吸引了一批客户.为预估2021年7,8两个月客户投入的健身消费金额,健身馆随机抽样统计了2020年7,8两个月100名客户的消费金额(单位:元),分组如下:[0,200),[200,400),[400,600),…,[1000,1200],得到如图所示的频率分布直方图:(1)请用抽样的数据预估2021年7,8两个月健身客户人均消费的金额(同一组中的数据用该组区间的中点值作代表).(2)若把2020年7,8两个月健身消费金额不低于800元的客户称为“健身达人”.经数据处理,现在列联表中得到一定的相关数据,请补全空格处的数据,并根据列联表判断是否有95%的把握认为“健身达人”与性别有关?健身达人非健身达人总计\n男10女30总计(3)为吸引顾客,在健身项目之外,该健身馆特推出健身配套营养品的销售,现有两种促销方案.方案一:每满800元可立减100元;方案二:金额超过800元可抽奖三次,每次中奖的概率为,且每次抽奖互不影响,中奖1次打9折,中奖2次打8折,中奖3次打7折.若某人打算购买1000元的营养品,请从实际付款金额的数学期望的角度分析应该选择哪种促销方案.附:P(K2≥k)0.1500.1000.0500.0100.005k2.0722.7063.8416.6357.879K2=.[解] (1)因为2020年7,8两个月这100名客户消费金额的平均值为(100×0.00050+300×0.00075+500×0.00100+700×0.00125+900×0.00100+1100×0.00050)×200=620(元),所以预估2021年7,8两个月健身客户人均消费金额为620元.(2)列联表如下:健身达人非健身达人总计男104050女203050总计3070100因为K2=≈4.762>3.841,所以有95%的把握认为“健身达人”与性别有关.(3)若选择方案一,则需付款900元;若选择方案二,设需付款X元,则X的可能取值为700,800,900,1000,P(X=700)=C=,P(X=800)=C=,\nP(X=900)=C=,P(X=1000)=C=,所以E(X)=700×+800×+900×+1000×=850(元).因为850<900,所以选择方案二更划算.考点三 概率、统计与函数、数列的交汇问题 由于随机变量ξ对应的概率P∈[0,1],故常先借助概率统计的知识建立有关P的函数解析式或递推关系式,在此基础上借助函数或导数、数列等知识求解相应问题.[典例3] 某商场以分期付款方式销售某商品,根据以往资料统计,顾客购买该商品选择分期付款的期数ξ的分布列为ξ234P0.4ab其中0<a<1,0<b<1.(1)求购买该商品的3位顾客中,恰有2位选择分2期付款的概率;(2)商场销售一件该商品,若顾客选择分2期付款,则商场获得的利润为200元;若顾客选择分3期付款,则商场获得的利润为250元;若顾客选择分4期付款,则商场获得的利润为300元.商场销售两件该商品所获得的利润记为X(单位:元).①求X的分布列;②若P(X≤500)≥0.8,求X的数学期望E(X)的最大值.[解] (1)设购买该商品的3位顾客中,选择分2期付款的人数为η,依题意得η~B(3,0.4),则P(η=2)=C(0.4)2×(1-0.4)=0.288,∴购买该商品的3位顾客中,恰有2位选择分2期付款的概率为0.288.(2)①依题意X的取值分别为400,450,500,550,600,P(X=400)=0.4×0.4=0.16,P(X=450)=2×0.4a=0.8a,P(X=500)=2×0.4b+a2=0.8b+a2,P(X=550)=2ab,P(X=600)=b2.∴X的分布列为:X400450500550600P0.160.8a0.8b+a22abb2②P(X≤500)=P(X=400)+P(X=450)+P(X=500)\n=0.16+0.8(a+b)+a2,根据0.4+a+b=1,得a+b=0.6,∴b=0.6-a,∵P(X≤500)≥0.8,∴0.16+0.48+a2≥0.8,解得a≥0.4或a≤-0.4,∵a>0,∴a≥0.4,∵b>0,∴0.6-a>0,解得a<0.6,∴a∈[0.4,0.6),E(X)=400×0.16+450×0.8a+500×(0.8b+a2)+1100ab+600b2=520-100a,当a=0.4时,E(X)的最大值为480,∴X的数学期望E(X)的最大值为480.点评:本例融概率、分布列、函数于一体,体现了高考命题的最新动向,求解时可先借助分布列的性质及题设条件“P(X≤500)≥0.8”探求得到参数a的范围,然后借助数学期望公式建立关于参数a的函数关系式,并通过二次函数求得数学期望E(X)的最大值.某市有一家大型共享汽车公司,在市场上分别投放了黄、蓝两种颜色的汽车,已知黄、蓝两种颜色的汽车的投放比例为3∶1.监管部门为了了解这两种颜色汽车的质量,决定从投放到市场上的汽车中随机抽取5辆汽车进行试驾体验,假设每辆汽车被抽取的可能性相同.(1)求抽取的5辆汽车中恰有2辆是蓝色汽车的概率;(2)在试驾体验过程中,发现蓝色汽车存在一定质量问题,监管部门决定从投放的汽车中随机地抽取一辆送技术部门作进一步抽样检测,并规定:若抽到的是黄色汽车,则将其放回市场,并继续随机地抽取下一辆汽车;若抽到的是蓝色汽车,则抽样结束.抽样的次数不超过n(n∈N*)次.在抽样结束时,若已抽到的黄色汽车数以ξ表示,求ξ的分布列和数学期望.[解] (1)随机地抽取一辆汽车是蓝色汽车的概率为,用X表示“抽取的5辆汽车中蓝色汽车的辆数”,则X服从二项分布,即X~B,所以抽取的5辆汽车中恰有2辆是蓝色汽车的概率P=C=.(2)ξ的可能取值为0,1,2,…,n.P(ξ=0)=,P(ξ=1)=×=,P(ξ=2)=×,…,P(ξ=n-1)=×,P(ξ=n)=.所以ξ的分布列为ξ012…n-1n\nP××…×ξ的数学期望E(ξ)=1××+2××+3××+…+(n-1)××+n× ①,E(ξ)=1×2×+2××+…+(n-2)××+(n-1)××+n× ②.①-②得E(ξ)=×+×+×+…+n-1×+=×+×+3×+…+×+×,所以E(ξ)=+++…++==3=3-3×.核心素养6 用数学语言表达世界——数据分析与建模求解数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型对信息进行分析、推断,获得结论.在数据分析核心素养的形成过程中,学生能够提升数据处理的能力,增强基于数据表达现实问题的意识,养成通过数据思考问题的习惯,积极依托数据探索事物本质、关联和规律的活动经验. 某学校为了了解全校学生的体重情况,从全校学生中随机抽取了100人的体重数据,结果这100人的体重全部介于45公斤到75公斤之间,现将结果按如下方式分为6组:第一组[45,50),第二组[50,55),…,第六组[70,75),得到如图①所示的频率分布直方图,并发现这100人中,其体重低于55公斤的有15人,这15人体重数据的茎叶图如图②所示,以样本的频率作为总体的概率.\n图① 图②(1)求频率分布直方图中a,b,c的值;(2)从全校学生中随机抽取3名学生,记X为体重在[55,65)的人数,求X的概率分布列和数学期望;(3)由频率分布直方图可以认为,该校学生的体重ξ近似服从正态分布N(μ,σ2),其中μ=60,σ2=25.若P(μ-2σ≤ξ<μ+2σ)>0.9545,则认为该校学生的体重是正常的.试判断该校学生的体重是否正常?并说明理由.[解] (1)由题图②知,100名样本中体重低于50公斤的有2人,用样本的频率估计总体的概率,可得体重低于50公斤的概率为=0.02,则a==0.004,在[50,55)上有13人,该组的频率为0.13,则b==0.026,所以2c==0.14,即c=0.07.(2)用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在[55,65)的概率为0.07×10=0.7,随机抽取3人,相当于三次独立重复试验,随机变量X服从二项分布B(3,0.7),则P(X=0)=C0.700.33=0.027,P(X=1)=C0.710.32=0.189,P(X=2)=C0.720.31=0.441,P(X=3)=C0.730.30=0.343,所以,X的概率分布列为:X0123P0.0270.1890.4410.343E(X)=3×0.7=2.1.(3)由N(60,25)得σ=5,由图①知P(μ-2σ≤ξ<μ+2σ)=P(50≤ξ<70)=0.96>0.9545.所以可以认为该校学生的体重是正常的.[评析] \n本题以学生体重情况为背景,设计概率与统计、正态分布的综合应用.体现了数学建模(用频率估计概率、正态分布)、数学运算(求平均数、方差、求概率)、数据分析、逻辑推理(以直方图中求平均数方差,由正态分布求概率及期望)的学科素养,培养了统计意识,经历“收集数据—整理数据—分析数据—作出推断”的全过程.某基地蔬菜大棚采用无土栽培的方式种植各类蔬菜.根据过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图.(1)依据折线图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01).(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量X(单位:小时)30<X≤5050≤X≤70X>70光照控制仪最多可运行台数321若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数公式r=,参考数据:≈0.55,≈0.95.[解] (1)由已知数据可得==5,==4.因为(xi-)(yi-)=(-3)×(-1)+0+0+0+3×1=6,==2,==.\n所以相关系数r===≈0.95.因为r>0.75,所以可用线性回归模型拟合y与x的关系.(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪.①安装1台光照控制仪可获得周总利润3000元.②安装2台光照控制仪的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=3000-1000=2000(元),P(Y=2000)==0.2,当30<X≤70时,2台光照控制仪都运行,此时周总利润Y=2×3000=6000(元),P(X=6000)==0.8,故Y的分布列为Y20006000P0.20.8所以E(Y)=2000×0.2+6000×0.8=5200(元).③安装3台光照控制仪的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=1×3000-2×1000=1000(元),P(Y=1000)==0.2,当50≤X≤70时,有2台光照控制仪运行,此时周总利润Y=2×3000-1×1000=5000(元),P(Y=5000)==0.7,当30<X<50时,3台光照控制仪都运行,周总利润Y=3×3000=9000(元),P(Y=9000)==0.1,故Y的分布列为Y100050009000\nP0.20.70.1所以E(Y)=1000×0.2+5000×0.7+9000×0.1=4600(元).综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪.
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)