五类概率与统计-高考数学大题秒杀技巧(新高考专用)(解析版)
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
1/29
2/29
3/29
4/29
5/29
6/29
7/29
8/29
9/29
10/29
剩余19页未读,查看更多内容需下载
五类概率与统计题型-高考数学大题秒杀技巧概率与统计问题一般分为五类:类型1:独立性检验问题;类型2:线性回归及非线性回归问题;类型3:超几何分布问题;类型4:二项分布问题类型5:正态分布问题。下面给大家对每一个类型进行秒杀处理.类型1:独立性检验问题1.分层抽样一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样。分层抽样适用于已知总体是由差异明显的几部分组成的。注:①求某层应抽个体数量:按该层所占总体的比例计算.②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.样本容量各层样本数量③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==”总体容量各层个体数量2.频率分布直方图(1)频率、频数、样本容量的计算方法频率①×组距=频率.组距频数频数②=频率,=样本容量,样本容量×频率=频数.样本容量频率③频率分布直方图中各个小方形的面积总和等于1.3.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为x,利用x左(右)侧矩形面积之和等于0.5,即可求出x.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有x=x1p1+x1p1+⋯+xnpn,其中xn为每个小长方形底边的中点,pn为每个小长方形的面积.4.独立性检验2(1)定义:利用独立性假设、随机变量K来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.·1·
22n(ad-bc)(2)公式:K=,其中n=a+b+c+d为样本容量.(a+b)(c+d)(a+c)(b+d)(3)独立性检验的具体步骤如下:2①计算随机变量K的观测值k,查下表确定临界值k0:2pK≥k00.50.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.8282②如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过pK≥k0;否则,就认为在犯错误2的概率不超过pK≥k0的前提下不能推断“X与Y有关系”.独立性检验问题专项训练1为提升学生实践能力和创新能力,某校在高一,高二年级开设“航空模型制作"选修课程.为考察课程开设情况,学校从两个年级选修该课程的学生中各随机抽取20名同学分别制作一件航空模型.并根据每位同学作品得分绘制了如图所示的茎叶图.若作品得分不低于80,评定为“优良”,否则评定为“非优良”.高一同学作品高二同学作品88326579654322107138799622182345677899539078(1)请完成下面的2×2列联表;优良非优良合计高一高二合计(2)判断是否有90%的把握认为作品是否“优良”与制作者所处年级有关?2nad-bc2附:K=,n=a+b+c+d.a+bc+da+cb+d2PK≥k0.1500.1000.0100.001k2.0722.7066.63510.828【答案】(1)答案见解析;(2)有90%的把握认为作品是否“优良”与制作者所处年级有关.【分析】(1)根据茎叶图完成列联表即可;2(2)求出K,再对照临界值表即可得出结论.【详解】(1)由茎叶图可知高一优良的有7个,非优良的有13个,高二优良的有13个,非优良的有7个,完成的2×2列联表如下:·2·
优良非优良合计高一71320高二13720合计2020402407×7-13×132(2)∵K==3.6>2.706,20×20×20×20∴有90%的把握认为作品是否“优良”与制作者所处年级有关.24月15日是全民国家安全教育日.以人民安全为宗旨也是“总体国家安全观”的核心价值.只有人人参与,人人负责,国家安全才能真正获得巨大的人民性基础,作为知识群体的青年学生,是强国富民的中坚力量,他们的国家安全意识取向对国家安全尤为重要.某校社团随机抽取了600名学生,发放调查问卷600份(答卷卷面满分100分).回收有效答卷560份,其中男生答卷240份,女生答卷320份.有效答卷中75分及以上的男生答卷80份,女生答卷80份,其余答卷得分都在10分至74分之间.同时根据560份有效答卷的分数,绘制了如图所示的频率分布直方图.(1)求频率分布直方图中m的值,并求出这560份有效答卷得分的中位数和平均数n(同一组数据用该组中点值代替).(2)如果把75分及以上称为对国家安全知识高敏感人群,74分及以下称为低敏感人群,请根据上述数据,完成下面2×2列联表,并判断能否有95%的把握认为学生性别与国家安全知识敏感度有关.高敏感低敏感总计男生80女生80总计560附:独立性检验临界值表P0.000.10.050.010.0012K≥k052.706.637.872K3.84110.8286592nad-bc2公式:K=,其中n=a+b+c+d.a+bc+da+cb+d【答案】(1)m=0.02,中位数62,平均数60.2·3·
(2)列联表见解析,有【详解】(1)因为10m=1-10×0.003+2×0.006+0.009+2×0.012+2×0.016,所以m=0.02.又10(0.003+0.006+0.009+0.012+0.016)=0.46<0.5,故设中位数为x,则x-60×0.02=0.5-0.46=0.04,所以x=62.平均数n=0.03×15+0.06×25+0.09×35+0.12×45+0.16×55+0.20×65+0.16×75+0.12×85+0.06×95=60.2.(2)由题意可得列联表如下:高敏感低敏感总计男生80160240女生80240320总计1604005602256080×240-80×16014K==≈4.667>3.841,160×400×240×3203故有95%的把握认为学生性别与国家安全知识敏感度有关.3某学生兴趣小组随机调查了某市200天中每天的空气质量等级和当天到江滨公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200200,400400,6001(优)1220442(良)1519303(轻度污染)1616144(中度污染)752(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;并求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(2)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有99.9%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好2nad-bc2附:K=.a+bc+da+cb+d【答案】(1)0.38,0.32,0.23,0.07,340(2)列联表见解析,有12+20+44【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为=0.38,20015+19+3016+16+14等级为2的概率为=0.32,等级为3的概率为=0.23,200200·4·
7+5+2等级为4的概率为=0.07,200100×50+300×60+500×90由频数分布表可知,一天中到该公园锻炼的人次的平均数为=340.200(2)2×2列联表如下:人次≤400人次>400空气质量好6674空气质量不好441622200×(66×16-74×44)K=≈11.640>10.828,110×90×140×60因此,有99.9%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.4某市阅读研究小组为了解该城市中学生阅读与语文成绩的关系,在参加市中学生语文综合能力竞赛的各校学生中随机抽取了500人进行调查,并按学生成绩是否高于75分(满分100分)及周平均阅读时间是否少于10小时,将调查结果整理成列联表.现统计出成绩不低于75分的样本占样本总数的30%,周平均阅读时间少于10小时的人数占样本总数的一半,而不低于75分且周平均阅读时间不少于10小时的样本有100人.周平均阅读时间少于10小时周平均阅读时间不少于10小时合计75分以下s不低于75分t100合计500(1)根据所给数据,求出表格中s和t的值,并分析能否有99.9%以上的把握认为语文成绩与阅读时间是否有关;(2)先从成绩不低于75分的样本中按周平均阅读时间是否少于10小时分层抽样抽取9人进一步做问卷调查,然后从这9人中再随机抽取3人进行访谈,记抽取3人中周平均阅读时间不少于10小时的人数为X,求X的分布列与均值.22n(ad-bc)参考公式及数据:χ=,n=a+b+c+d.a+bc+da+cb+dα0.010.0050.001xα6.6357.87910.828【答案】(1)s=150,t=50,有99.9%的把握认为语文成绩与阅读时间有关(2)分布列见解析,数学期望为2【详解】(1)根据已知条件,列联表如下:周平均阅读时间少于10小时周平均阅读时间不少于10小时合计75分以下200150350不低于75分50100150合计250250500·5·
22500×(200×100-150×50)所以s=150,t=50,由表知χ=≈23.8>10.828,350×150×250×250所以有99.9%的把握认为语文成绩与阅读时间有关.(2)依题意,成绩不低于75分的学生中周平均阅读时间少于10小时和不少于10小时的人数比是1:2,按分层抽样抽取9人,则周平均阅读时间少于10小时有3人,不少于10小时的有6人,从这9人中再随机抽取3人进行访谈,则X可能的取值为0,1,2,3,321123C31C3C63C3C615C65PX=0==,PX=1==,PX=2==,PX=3==.C384C314C328C3219999分布列如下:X012313155P841428213155∴EX=1×+2×+3×=2.1428215一个航空航天的兴趣小组,对500名男生和500名女生关于航空航天是否感兴趣的话题进行统计,情况如下表所示.男生女生感兴趣380220不感兴趣1202802P(K≥k)0.0500.0250.0100.0050.001k3.8415.0246.6357.87910.8282nad-bc2附:K=,n=a+b+c+d.a+bc+da+cb+d(1)是否有99.9%的把握认为对航空航天感兴趣的情况与性别相关联?(2)一名兴趣小组成员在试验桌上进行两艘飞行器模型间的“交会对接”游戏,左边有2艘“Q2运输船”和1艘“M1转移塔”,右边有3艘“M1转移塔”.假设两艘飞行器模型间的“交会对接”重复了n次,记左边剩余2艘“Q2运输船”的概率为Pn,剩余1艘“Q2运输船”的概率为qn,求2pn+qn与2pn-1+qn-1的递推关系式;(3)在(2)情况下,求Xn的分布列与数学期望EXn.【答案】(1)有99.9%的把握认为对航空航天感兴趣的情况与性别相关联1(2)2pn+qn-1=2pn-1+qn-1-131n(3)分布列见解析,EXn=1+3,n∈N*21000×380×280-120×2202【详解】(1)解:K=≈106.67>10.828500×500×600×400∴有99.9%的把握认为对航空航天感兴趣的情况与性别相关联.1111C1C31C2C32(2)p1=1⋅1=3,q1=1⋅1=3,C3C3C3C3·6·
111111C1C3C2C3127C2C3p2=1⋅1⋅p1+1⋅1⋅q1+0⋅1-p1-q1=3p1+9q1=27,q2=1⋅1⋅p1C3C3C3C3C3C3111111C2C2C1C1C3C21216+1⋅1+1⋅1⋅q1+1⋅1⋅1-p1-q1=-9q1+3=27.C3C3C3C3C3C31111C1C3C2C112当n≥2时pn=1⋅1⋅pn-1+1⋅1⋅qn-1+0⋅1-pn-1-qn-1=3pn-1+9qn-1,①C3C3C3C311111111C2C3C2C2C1C1C3C212qn=1⋅1⋅pn-1+1⋅1+1⋅1⋅qn-1+1⋅1⋅1-pn-1-qn-1=-9qn-1+3,②C3C3C3C3C3C3C3C32412122×①+②,得2pn+qn=pn-1+qn-1-qn-1+=2pn-1+qn-1+.3993331从而2pn+qn-1=2pn-1+qn-1-1.3111(3)由(2)得2p1+q1-1=,2pn+qn-1=2pn-1+qn-1-1,∴数列2pn+qn-1是首项为,公比333111n-11n1*为3的等比数列,∴2pn+qn-1=3×3=3,即2pn+qn=1+n,n∈N③,3联立②③得q-3=-1q-3,又q-3=1,则数列q-3是首项为1,公比为-1的等n59n-151515n5159比数列,11n-13*1131n11n1∴qn=15×-9+5,n∈N由③得pn=21+3n-qn=10×-9+2×3+5,n∈N*31n11n1*∴1-pn-qn=10×-9-2×3+5,n∈NXn的概率分布列为:Xn012P1-pn-qnqnpn1n则EXn=0×1-pn-qn+1×qn+2×pn=1+3,n∈N*.类型2:线性回归及非线性回归问题①线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),⋯,(xn,yn),其回归方程y=bx+a的求法为nn(x-x)(y-y)xy-nxyiiiib=i=1=i=1nn222(xi-x)xi-nxi=1i=1a=y-bxnn11其中,x=xi,y=yi,(x,y)称为样本点的中心.ni=1ni=1②非线性回归建立非线性回归模型的基本步骤(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、·7·
指数函数、对数函数、幂函数模型等);(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;(6)消去新元,得到非线性回归方程;(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.线性回归及非线性回归问题专项训练6某旅游公司针对旅游复苏设计了一款文创产品来提高收益.该公司统计了今年以来这款文创产品定价x(单位:元)与销量y(单位:万件)的数据如下表所示:产品定价x(单位:元)99.51010.511销量y(单位:万件)1110865(1)依据表中给出的数据,判断是否可用线性回归模型拟合y与x的关系,请计算相关系数并加以说明(计算结果精确到0.01);(2)建立y关于x的回归方程,预测当产品定价为8.5元时,销量可达到多少万件.nnxi-xyi-yxi-xyi-yi=1i=1参考公式:r=,b=,a=y-bx.nnn222xi-xyi-yxi-xi=1i=1i=1参考数据:65≈8.06.【答案】(1)r≈-0.99,说明y与x的线性相关性很强,可以用线性回归模型拟合y与x的关系(2)12.8万件1【详解】(1)由题条件得x=(9+9.5+10+10.5+11)=10,51y=(11+10+8+6+5)=8.55xi-xyi-y=(9-10)(11-8)+(9.5-10)(10-8)+(10-10)(8-8)+(10.5-10)(6-8)+i=1(11-10)(5-8)=-8,5222222xi-x=(9-10)+(9.5-10)+(10-10)+(10.5-10)+(11-10)=2.5,i=1n5xi-xyi-y222222i=1yi-y=(11-8)+(10-8)+(8-8)+(6-8)+(5-8)=26∴r=nni=122xi-xyi-yi=1i=1-8=≈-0.99.65∵y与x的相关系数近似为-0.99,说明y与x的线性相关性很强,从而可以用线性回归模型拟合y与x的关系.5xi-xyi-yi=1-8(2)∵b===-3.2,a=y+3.2x=40,52.52xi-xi=1∴y关于x的线性回归方程为y=-3.2x+40.·8·
当x=8.5时,y=12.8.∴当产品定价为8.5元时,预测销量可达到12.8万件.72023年,国家不断加大对科技创新的支持力度,极大鼓舞了企业投入研发的信心,增强了企业的创新动能.某企业在国家一系列优惠政策的大力扶持下,通过技术革新和能力提升,极大提升了企业的影响力和市场知名度,订单数量节节攀升,右表为该企业今年1~4月份接到的订单数量.月份t12345.5.5.5.订单数量y(万件)2378n(xi-x)(yi-y)i=1附:相关系数,r=nn22(xi-x)(yi-y)i=1i=1回归方程y=a+bx中斜率和截距的最小二乘法估计公式分别为n(xi-x)(yi-y)i=1b=,a=y-bx,1.3≈1.14.n2(xi-x)i=1(1)试根据样本相关系数r的值判断订单数量y与月份t的线性相关性强弱(0.75≤|r|≤1,则认为y与t的线性相关性较强,|r|<0.75,则认为y与t的线性相关性较弱).(结果保留两位小数)(2)建立y关于t的线性回归方程,并预测该企业5月份接到的订单数量.【答案】(1)0.96,订单数量y与月份t的线性相关性较强(2)y=0.22t+4.95,6.05万件1+2+3+41【详解】(1)t==2.5,y=(5.2+5.3+5.7+5.8)=5.5,444(ti-t)(yi-y)=(-1.5)×(-0.3)+(-0.5)×(-0.2)+0.5×0.2+1.5×0.3=1.1,i=1422222(ti-t)=(-1.5)+(-0.5)+0.5+1.5=5,i=1422222(yi-y)=(-0.3)+(-0.2)+0.2+0.3=0.26,i=14(ti-t)(yi-y)i=11.11.1∴r==≈≈0.96>0.75,441.31.1422(ti-t)(yi-y)i=1i=1∴订单数量y与月份t的线性相关性较强;4(ti-t)(yi-y)i=11.1(2)∵b===0.22,452(ti-t)i=1∴a=y-bt=5.5-0.22×2.5=4.95,∴线性回归方程为y=0.22t+4.95,·9·
令t=5,y=0.22×5+4.95=6.05(万件),即该企业5月份接到的订单数量预计为6.05万件.8据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第n年12345678910居民年收入x32.231.132.935.737.138.039.043.044.646.0商品销售额y25.030.034.037.039.041.042.044.048.051.0依据表格数据,得到下面一些统计量的值.1010i=1i=1i=122∑xi∑yixi-xyi-yxi-xyi-yi=1i=1101010379.6391247.624568.9m(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x的线性相关程度是否很强?(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01);(3)根据(2)的经验回归方程,计算第1个样本点32.2,25.0对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,b的值将变大还是变小?(不必说明理由,直接判断即可).nxi-xyi-yi=1附:样本xi,yii=1,2,⋯,n的相关系数r=nn,22xi-xyi-yi=1i=1nxi-xyi-yi=12.297≈1.516,b=,a=y-bx.n2xi-xi=1【答案】(1)线性相关程度很强(2)y=1.44x-15.56(3)-5.81,变小【详解】(1)根据样本相关系数r≈0.95,可以推断线性相关程度很强.nnxi-xyi-yxi-xyi-yi=1i=1(2)由r=≈0.95及b=,nnn2x-x2y-y2xi-xiii=1i=1i=1nnn222xi-xyi-yyi-ybi=1i=1i=1可得==≈2.297,rnn22xi-xxi-xi=1i=1所以b=r2.297≈0.95×1.516≈1.440,又因为x=37.96,y=39.1,所以a=y-bx≈-15.56,所以y与x的线性回归方程y=1.44x-15.56.(3)第一个样本点32.2,25.0的残差为:25.0-1.44×32.2-15.56=-5.808≈-5.81,·10·
由于该点在回归直线的左下方,故将其剔除后,b的值将变小.9数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018-2022年中国车载音乐市场规模(单位:十亿元),其中年份2018-2022对应的代码分别为1-5.年份代码x12345车载音乐市场规模y2.83.97.312.017.0x(1)由上表数据知,可用指数函数模型y=a⋅b拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1);(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.参考数据:50.5240.472vxivieei=11.9433.821.71.651其中vi=lnyi,v=vi.5i=1参考公式:对于一组数据u1,v1,u2,v2,⋯,un,vn,其回归直线v=a+βu的斜率和截距的最小二乘法nuivi-nu⋅vi=1估计公式分别为β=,a=v-βu.n22ui-nui=1x【答案】(1)y=1.7×1.6(2)28.73十亿元x【详解】(1)解:因为y=a⋅b,所以两边同时取常用对数,得lny=lna+xlnb,设v=lny,所以v=lna+xlnb,设α=lna,β=lnb,因为x=3,v=1.94,5xivi-5x⋅vi=133.82-5×3×1.94所以β===0.472,522255-5×3xi-5xi=1α=v-βx=1.94-0.472×3=0.524,所以lna=0.524,lnb=0.4720.5240.472所以a=e=1.7,b=e=1.6x所以y=1.7×1.6(2)由(1)知2023年与2024年这两年的年平均增长率1.6-1.3=0.3,2022年中国车载音乐市场规模为17,·11·
2故预测2024年的中国车载音乐市场规模171+0.3=28.73(十亿元).10某新能源汽车公司对其产品研发投资额x(单位:百万元)与其月销售量y(单位:千辆)的数据进行统计,得到如下统计表和散点图.x12345y0.691.611.792.082.20(1)通过分析散点图的特征后,计划用y=lnbx+a作为月销售量y关于产品研发投资额x的回归分析模型,根据统计表和参考数据,求出y关于x的回归方程;(2)公司决策层预测当投资额为11百万元时,决定停止产品研发,转为投资产品促销.根据以往的经验,当投资11百万元进行产品促销后,月销售量ξ的分布列为:ξ345321Pppp+26结合回归方程和ξ的分布列,试问公司的决策是否合理.nnxi-xyi-yxiyi-nx⋅yi=1i=1参考公式及参考数据:b==,a=y-bx,ln7≈1.95.nn222xi-xxi-nxi=1i=1y0.691.611.792.082.20ye(保留整数)25689【答案】(1)y=ln1.7x+0.9;(2)公司的决策合理.y【详解】(1)因为y=lnbx+a,令z=bx+a,所以z=e.11由题可得x=1+2+3+4+5=3,z=2+5+6+8+9=6,555xizi-5x⋅zi=1107-5×3×617则b====1.7,a=z-bx=6-1.7×3=0.9,555-5×91022xi-5xi=1所以z=1.7x+0.9,所以回归方程为y=ln1.7x+0.9.2×49(2)当x=11时,y=ln1.7×11+0.9=ln19.6=ln=ln2+2ln7-ln5=2.98.5·12·
3211因为p+p+p+=1且0<p<1,所以p=,26311113所以EX=3×+4×+5×=>2.98,6323所以公司的决策合理.类型3:超几何分布问题超几何分布(1)在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件X=k发生的概率为P(X=k)=kn-kCMCN-M*n,k=0,1,2,⋯,m,其中m=minM,n,且n≤N,M≤N,n,M,N∈N,称分布列为超几何分布CN列.如果随机变量X的分布列为超几何分布列,则称随机变量X服从超几何分布.X01⋯m0n-01n-1mn-mCMCN-MCMCN-MCMCN-MP⋯nnnCNCNCN超几何分布和二项分布的区别(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是“不放回”抽取,在每次试验中某一事件发生的概率是不相同的;而二项分布是“有放回”抽取(独立重复),在每次试验中某一事件发生的概率是相同的.超几何分布专项训练11某校举行“强基计划”数学核心素养测评竞赛,竞赛以抽盲盒答题的形式进行,现有甲、乙两个盲盒箱,甲中有4个选择题和2个填空题,乙中有3个选择题和3个填空题,竞赛可以以不同的方式进行.(1)若已知A班选择了甲箱,且派出5人参赛,每个人盲抽一个题作答,答完后仍放回甲箱.每个人答对选32择题的概率为,答对得3分,答错得0分,每个人答对填空题的概率为,答对得5分,答错得0分,求A43班总得分X的数学期望.(2)若已知A班班长先从甲箱中依次抽取了两道题目,答题结束后将题目一起放入乙箱中,然后B班班长再从乙箱中抽取一道题目,已知B班班长从乙箱中抽取的是选择题,求A班班长从甲箱中取出的是两道选择题的概率.235【答案】(1)186(2)134221【详解】(1)A班在甲箱抽取时,每个人抽到选择题的概率为=,抽到填空题的概率为=,6363231247∴每个人得分的平均值=××3+××5=,34331847235A班得分的数学期望=×5=;1818(2)设A班班长抽取0道、1道、2道选择题的事件为A0,A1,A2,B班班长抽到的是选择题的事件为B1,2112C23C2⋅C41C4513则PB1=PA0B1+PA1B1+PA2B1=2⋅8+2⋅2+2⋅8=24,C6C6C6·13·
1PA2B146则PA2B1===.PB113132412乡村民宿立足农村,契合了现代人远离喧嚣、亲近自然、寻味乡愁的美好追求.某镇在旅游旺季前夕,为了解各乡村的普通型民宿和品质型民宿的品质,随机抽取了8家规模较大的乡村民宿,统计得到各家的房间数如下表:民宿点甲乙丙丁戊己庚辛普通型民宿16812141318920品质型民宿6164101110912(1)从这8家中随机抽取3家,在抽取的这3家的普通型民宿的房间均不低于10间的条件下,求这3家的品质型民宿的房间均不低于10间的概率;(2)从这8家中随机抽取4家,记X为抽取的这4家中普通型民宿的房间不低于15间的家数,求X的分布列和数学期望.1【答案】(1)53(2)2【详解】(1)由题可知这8家乡村民宿中普通型民宿的房间不低于10间的有6家,品质型民宿和普通型民宿的房间均不低于10间的有4家.记“这3家的普通型民宿的房间均不低于10间”为事件A“这,3家的品质型民宿的房间均不低于1033C65C41间”为事件B,则PA==,PAB==,C314C31488PAB1所以PB∣A==.PA5(2)这8家乡村民宿中普通型民宿的房间不低于15间的有3家,故X的所有可能取值为0,1,2,3.0413C3⋅C551C3⋅C5303PX=0===,PX=1===,C47014C4707882231C3⋅C5303C3⋅C551PX=2===,PX=3===,C4707C4701488所以X的分布列如下表:X01231331P14771413313所以EX=0×+1×+2×+3×=.147714213已知某排球特色学校的校排球队来自高一、高二、高三三个年级的学生人数分别为7人、6人、2人.(1)若从该校队随机抽取3人拍宣传海报,求抽取的3人中恰有1人来自高三年级的概率.(2)现该校的排球教练对“发球、垫球、扣球”这3个动作技术进行训练,且在训练阶段进行了多轮测试,规定:在一轮测试中,这3个动作至少有2个动作达到“优秀”,则该轮测试记为“优秀”.已知在某一轮测试12的3个动作中,甲同学每个动作达到“优秀”的概率均为,乙同学每个动作达到“优秀”的概率均为,且23·14·
每位同学的每个动作互不影响,甲、乙两人的测试结果互不影响.记X为甲、乙二人在该轮测试结果为“优秀”的人数,求X的分布列和数学期望.12【答案】(1)3567(2)分布列见解析;期望为5421C13C212【详解】(1)设事件A为“抽取的3人中恰有1人来自高三年级”,则有PA==C335151(2)设甲同学在一轮测试中3个动作“优秀”的个数为Y,则有Y∼B3,;22设乙同学在一轮测试中3个动作“优秀”的个数为Z,则有Z~B3,;3所以甲同学在一轮测试结果为优秀的概率21211313101PY≥2=PY=2+PY=3=C32×2+C32×2=2,乙同学在一轮测试结果为优秀的概率222113231020PZ≥2=PZ=2+PZ=3=C33×3+C33×3=27.由题意,得X可取0,1,2;12071201201则有PX=0=1-2×1-27=54;PX=1=2×1-27+1-2×27=2;12010PX=2=×=.22727所以X的分布列为:X0127110P54227711067因此X的数学期望EX=0×+1×+2×=.542275414为了丰富农村儿童的课余文化生活,某基金会在农村儿童聚居地区捐建“悦读小屋”.自2018年以来,某村一直在组织开展“悦读小屋读书活动”.下表是对2018年以来近5年该村少年儿童的年借阅量的数据统计:年份20182019202020212022年份代码x12345年借阅量y(册)y1y236921425(参考数据:yi=290)i=1(1)在所统计的5个年借阅量中任选2个,记其中低于平均值的个数为X,求X的分布列和数学期望EX;2(2)通过分析散点图的特征后,计划分别用①y=35x-47和②y=5x+m两种模型作为年借阅量y关于年份代码x的回归分析模型,请根据统计表的数据,求出模型②的经验回归方程,并用残差平方和比较哪个模型拟合效果更好.6【答案】(1)分布列见解析,EX=5·15·
2(2)y=5x+3;模型②的拟合效果更好290【详解】(1)由题知,5年的借阅量的平均数为:=58,又y1+y2=290-36-92-142=20,则y1,5y2<58k2-kC3C2所以低于平均值的有3个,所以X服从超几何分布,PX=k=,k=0,1,2,2C5021120C3C21C3C263C3C23所以PX=0==,PX=1===,PX=2==,C210C2105C210555所以X的分布列为:X012133105101336所以EX=0×+1×+2×=;105105i=122222∑yi1+2+3+4+55290(2)因为=11,==58555所以58=5×11+m,即m=3.2所以模型②的经验回归方程为:y=5x+3根据模型①的经验回归方程可得:y1=-12,y2=23,y3=58,y4=93,y5=128根据模型②的经验回归方程可得:y1=8,y2=23,y3=48,y4=83,y5=12822222因为y1+12+y2-23+36-58+92-93+142-128-22222222222y1-8+y2-23+36-48+92-83+142-128=y1+12-y1-8+22-12+1-9=40y1+340,且y1≥0所以模型①的残差平方和大于模型②的残差平方和,所以模型②的拟合效果更好.152023年是全面贯彻落实党二十大精神的开局之年,也是实施“十四五”规划承上启下的关键之年,今年春季以来,各地出台了促进经济发展的各种措施,经济增长呈现稳中有进的可喜现象.服务业的消费越来越火爆,绍兴一些超市也纷纷加大了广告促销.现随机抽取7家超市,得到其广告支出x(单位:万元)与销售额y(单位:万元)数据如下:超市ABCDEFG广告支出1246101320销售额19324440525354(1)建立y关于x的一元线性回归方程(系数精确到0.01);(2)若将超市的销售额y与广告支出x的比值称为该超市的广告效率值μ,当μ≥10时,称该超市的广告为“好广告”.从这7家超市中随机抽取4家超市,记这4家超市中“好广告”的超市数为X,求X的分布列与期望.77722附注:参考数据xiyi=2788,xi=726,yi=13350,回归方程y=a+bx中斜率和截距的最小二乘估i=1i=1i=1·16·
nxiyi-nxyi=1计公式分别为:b=,a=y-bx.n22xi-nxi=1【答案】(1)y=1.57x+29.4512(2)分布列见解析,期望为71+2+4+6+10+13+2056【详解】(1)由数据可得x===8;7719+32+44+40+52+53+54y==42,7772又xiyi=2788,xi=726,i=1i=17xiyi-7xyi=12788-7×8×42∴b===1.56835≈1.57,7222726-7×8xi-7xi=1436a=y-bx=42-×8=29.4532≈29.45.278∴y=1.57x+29.45.(2)由题知,7家超市中有3家超市的广告是“好广告”,X的可能取值是0,1,2,3413C41C3C412PX=0==,PX=1==.C435C435772231C3C418C3C44PX=2==,PX=3==.C435C43577所以X的分布列为X0123112184P353535351121846012所以EX=0×+1×+2×+3×==.35353535357类型4:二项分布问题二项分布(1)一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,不发kkn-k生的概率q=1-p,那么事件A恰好发生k次的概率是PX=k=Cnpq(k=0,1,2,⋯,n)于是得到X的分布列X01⋯k⋯n00n11n-1kkn-knn0pCnpqCnpq⋯Cnpq⋯Cnpq由于表中第二行恰好是二项式展开式n00n11n-1kkn-knn0q+p=Cnpq+Cnpq+⋯+Cnpq+⋯+Cnpq各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记作X~B(n,p),并称p为成功概率.注:·17·
①各次试验中的事件是相互独立的;②每次试验只有两种结果:事件要么发生,要么不发生;③随机变量是这n次独立重复试验中事件发生的次数.④二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.(2)若X~B(n,p),则E(X)=np,D(X)=np(1-p).二项分布问题专项训练*16甲、乙两选手进行一场体育竞技比赛,采用2n-1局n胜制n∈N的比赛规则,即先赢下n局比赛者最终获胜.已知每局比赛甲获胜的概率为p,乙获胜的概率为1-p,比赛结束时,甲最终获胜的概*率为Pnn∈N.1(1)若p=,n=2,结束比赛时,比赛的局数为X,求X的分布列与数学期望;2(2)若采用5局3胜制比采用3局2胜制对甲更有利,即P3>P2.(i)求p的取值范围;(ii)证明数列Pn单调递增,并根据你的理解说明该结论的实际含义.5【答案】(1)分布列见解析,21(2)(i)<p<1;(ii)证明见解析,比赛局数越多,对实力较强者越有利21【详解】(1)p=,n=2,即采用3局2胜制,X所有可能取值为2,3,212121112111121PX=2=2+2=2,PX=3=C222+C222=2,X的分布列如下表:X2311P22115所以X的数学期望为EX=2×+3×=.222(2)采用3局2胜制:不妨设赛满3局,用ξ表示3局比赛中甲胜的局数,则ξ~B3,p,甲最终获胜的概率为:22332232p1=Pξ=2+Pξ=3=C3p1-p+C3p=pC31-p+C3p=p3-2p,采用5局3胜制:不妨设赛满5局,用η表示5局比赛中甲胜的局数,则η~B5,p,甲最终获胜的概率为:3324455p2=Pη=3+Pη=4+Pη=5=C5p1-p+C5p1-p+C5p33245232=pC51-p+C5p1-p+C5p=p6p-15p+10,322232p2-p1=p6p-15p+10-p3-2p=p6p-15p+10p-3+2p2322222=3p2p-5p+4p-1=3pp-12p-3p+1=3p1-p2p-1>0,1得<p<1.21(ii)由(i)知<p<1.2nnn-12n-1局比赛中恰好甲赢了n局的概率为q1=C2n-1p1-p,n-1n-1n2n-1局比赛中恰好甲赢了n-1局的概率为q2=C2n-1p1-p,·18·
则2n-1局比赛中甲至少赢n+1局的概率为Pn-q1.考虑2n+1局比赛的前2n-1局:如果这2n-1局比赛甲至少赢n+1局,则无论后面结果如何都胜利,其概率为Pn-q1,2如果这2n-1局比赛甲赢了n局,则需要后两场至少赢一局,其概率为q11-1-p,2如果这2n-1局比赛甲赢了n-1局,则需要后两场都赢,其概率为q2p,22因此2n+1局里甲最终获胜的概率为:Pn+1=Pn-q1+q11-1-p+q2p,2222Pn+1-Pn=-q1+q11-1-p+q2p=q2p-q11-pn-1n-1n2nnn-12=C2n-1p1-p⋅p-C2n-1p1-p⋅1-pn-1n+1nnnn+1=C2n-1p1-p-C2n-1p1-pn-1nnn-1nn=C2n-1p1-pp-1-p=C2n-1p1-p2p-1>0因此Pn+1>Pn,即数列Pn单调递增.该结论的实际意义是:比赛局数越多,对实力较强者越有利.17为进一步加强学生的文明养成教育,推进校园文化建设,倡导真善美,用先进人物的先进事迹来感动师生,用身边的榜样去打动师生,用真情去发现美,分享美,弘扬美,某校以争做最美青年为主题,进行“最美青年”评选活动,最终评出了10位“最美青年”,其中6名女生4名男生。学校准备从这10位“最美青年”中每次随机选出一人做事迹报告.(1)若每位“最美青年”最多做一次事迹报告,记第一次抽到女生为事件A,第二次抽到男生为事件B,求PB,PB|A;(2)根据不同需求,现需要从这10位“最美青年”中每次选1人,可以重复,连续4天分别为高一、高二、高三学生和全体教师做4场事迹报告,记这4场事迹报告中做报告的男生人数为X,求X的分布列和数学期望.24【答案】(1)P(B)=;PB|A)=598(2)分布列见解析;E(X)=564432【详解】(1)解:由题意得,第二次抽到男生的概率为P(B)=×+×=,1091095“在第一次抽到女生的条件下,第二次抽到男生”的概率就是事件A发生的条件下,事件B发生的概率,3644P(AB)4而P(A)=,P(AB)=×=,所以P(B|A)==.510915P(A)92(2)解:被抽取的4次中男生人数X的取值为0,1,2,3,4且X∼B4,.5034208113321216可得P(X=0)=C455=625;P(X=1)=C455=625;232222163312396P(X=2)=C455=625;P(X=3)=C455=625;4302416P(X=4)=C455=625,所以随机变量X的分布列为:X01234812162169616P625625625625625·19·
28所以随机变量X的期望为:E(X)=4×=.5518某大型商场为了回馈广大顾客,设计了一个抽奖活动,在抽奖箱中放8个大小相同的小球,其中4个为红色,4个为黑色.抽奖方式为:每名顾客进行两次抽奖,每次抽奖从抽奖箱中一次性摸出两个小球.如果每次抽奖摸出的两个小球颜色相同即为中奖,两个小球颜色不同即为不中奖.(1)若规定第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,求中奖次数X的分布列和数学期望.(2)若规定第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,求中奖次数Y的分布列和数学期望.(3)如果你是商场老板,如何在上述问两种抽奖方式中进行选择?请写出你的选择及简要理由.6【答案】(1)分布列见解析;期望为76(2)分布列见解析;期望为7(3)答案见解析22C4+C4【详解】(1)若第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,则每次中奖的概率为p=2C83=,73因为两次抽奖相互独立,所以中奖次数X服从二项分布,即X∼B2,,所以X的所有可能取值为70,1,2,则0304216P(X=0)=C277=49,1314124P(X=1)=C277=49,232409P(X=2)=C277=49,所以X的分布列为X01216249P49494936所以X的数学期望Ex=2×=.77(2)若第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,中奖次数Y的所有可能取值为0,1,2,则1111C4C4C3C312P(Y=0)=∙=,C2C2358622111122C4+C4C2C4C4C4C3+C316P(Y=1)=∙+∙=,C2C2C2C23586862222C4+C4C2+C41P(Y=2)=∙=,C2C2586所以Y的分布列为Y01212161P35355·20·
121616所以Y的数学期望为EX=0×+1×+2×=.35355791(3)因为(1)(2)两问的数学期望相等,第(1)问中两次奖的概率比第(2)问的小,即<,4951612第(1)问中不中奖的概率比第2问小,即<,4935回答一:若商场老板希望中两次奖的顾客多,产生宣传效应,则选择按第(2)问方式进行抽;回答二:若商场老板希望中奖的顾客多,则选择按第(1)问方式进行抽奖.19某种抗病毒疫苗进行动物实验,将疫苗注射到甲乙两地一些小白鼠体内,小白鼠血样某项指标X值满足12.2≤X≤21.8时,小白鼠产生抗体.从注射过疫苗的小白鼠中用分层抽样的方法抽取了210只进行X值检测,其中甲地120只小白鼠的X值平均数和方差分别为14和6,乙地90只小白鼠的X值平均22数和方差分别为21和17,这210只小白鼠的X值平均数与方差分别为μ,σ(μ与σ均取整数).用这2102只小白鼠为样本估计注射过疫苗小白鼠的总体,设X∼Nμ,σ.2(1)求μ,σ;(2)小白鼠注射疫苗后是否产生抗体相互独立,已知注射过疫苗的N只小白鼠中有102只产生抗体,试估计N的可能值(以使得P(K=102)最大的N的值作为N的估计值);(3)对这些小白鼠进行第二次疫苗注射后,有99.1%的小白鼠产生了抗体,再对这些小白鼠血样的X值进行分组检测,若每组n(n≤50)只小白鼠混合血样的X值在特定区间内,就认为这n只小白鼠全部产生抗体,否则要对n只小白鼠逐个检测.已知单独检验一只小白鼠血样的检测费用为10元,n只小白鼠混合血样的检测费用为n+9元.试给出n的估计值,使平均每只小白鼠的检测费用最小,并求出这个最小值(精确到0.1元).2附:若X∼Nμ,σ,则P(|X-μ|≤σ)=0.68,P(|X-μ|≤2σ)=0.95.参考数据:21≈4.6,22≈4.7,23≈4.8,24≈4.9.【答案】(1)17,23(2)N的估计值为149或150(3)每只小白鼠平均检测费用的最小值约为2.8元,n的估计值为10【详解】(1)法1:22记甲地小白鼠样本X值的平均数为x,方差为s1;记乙地小白鼠样本X值的平均数为y,方差为s2,则22x=14,y=21,s1=6,s2=17,所以2222120x+90y120×14+90×212120s1+(x-μ)+90s2+(y-μ)μ===17.σ==210210210224×6+(14-17)+3×17+(21-17)≈23,72法2:记甲地小白鼠样本的X值为x1,x2,⋯,x120,平均数为x,方差为s1;记乙地小白鼠样本的X值2为y1,y2,⋯,y90,平均数为y,方差为s2.22120x+90y120×14+90×21因为x=14,y=21,s1=6,s2=17.所以μ===17.21021012012022由xk-x=120s1,xk-x=0,可得k=1k=11201201202222xk-μ=xk-x+x-μ=xk-x+2xk-x(x-μ)+(x-μ)k=1k=1k=11201201202222=xk-x+2(x-μ)xk-x+(x-μ)=120s1+120(x-μ)=30×60.k=1k=1k=1·21·
90222同理yk-μ=90s2+90(y-μ)=30×99,于是k=112090212230×60+30×99s=xk-μ+yk-μ=≈23.210k=1k=1210(2)法1:因为σ=23=4.8,所以P(12.2≤X≤21.8)=P(μ-σ≤X≤μ-σ)≈0.68.从注射过疫苗的小白鼠取出N只,其中产生抗体的有K只,则K~B(N,0.68),k102N17P(K=k)=CN0.328(k=0,1,2,⋯,N).17102102N当N<102时,P(K=102)=0;当N≥102时,P(K=102)=8CN0.32.10217102102Nα(N)CNN-101记α(N)=CN0.32,则==.8α(N+1)0.32C1020.32(N+1)N+1α(N)101.32由<1等价于N-101<0.32(N+1),当且仅当N<=149,知当103≤N≤148时,α(N+1)0.68α(N)<α(N+1);当N=149时,α(N)=α(N+1);当N>149时,α(N)>α(N+1);故N=149或N=150时,α(N)最大,所以N的估计值为149或150.法2:因为σ=23=4.8,所以P(12.2≤X≤21.8)=P(μ-σ≤X≤μ-σ)≈0.68.从注射过疫苗的小白鼠取出N只,其中产生抗体的有K只,则K~B(N,0.68),k102N17P(K=k)=CN0.328(k=0,1,2,⋯,N).17102102N当N<102时,P(K=102)=0;当N≥102时,P(K=102)=8CN0.32.17若N=102,则P(K=102)=P(K=101)<P(K=101).8×102若N≥103,则17102C1020.32N≥17102C1020.32N+1,8N8N+117102102N102N-18CN0.32≥CN-10.32.0.32(N+1)≤N-101,化简得解得149≤N≤150.0.32N≥N-102.综上,N的估计值为149或150.(3)记n只小白鼠检测费用为Y元,当n只小白鼠全部产生抗体时,Y=n+9,当n只小白鼠不都产生抗体时,Y=11n+9,则P(Y=n+9)=0.991n,P(Y=11n+9)=1-0.991n.nnE(Y)(n+9)0.991+(11n+9)1-0.991n9因此==11-10×(1-0.009)+.nnnn112233因为n≤50,所以(1-0.009)=1-Cn0.009+Cn0.009-Cn0.009+⋯≈1-0.009n.E(Y)99故=0.09n++1≥20.09n×+1=2.8,当且仅当n=10时取等号.nnn于是每只小白鼠平均检测费用的最小值约为2.8元,n的估计值为10.20某公司对新生产出来的300辆新能源汽车进行质量检测,每辆汽车要由甲、乙、丙三名质检员各进行一次质量检测,三名质检员中有两名或两名以上检测不合格的将被列为不合格汽车,有且只有一名质检员检测不合格的汽车需要重新由甲、乙两人各进行一次质量检测,重新检测后,如果甲、乙两名质检员中还有一人或两人检测不合格,也会被列为不合格汽车.假设甲、乙、丙三名质检员的检测相互独立,每一·22·
次检测不合格的概率为p0<p<1.(1)求每辆汽车被列为不合格汽车的概率q;(2)公司对本次质量检测的预算支出是4万元,每辆汽车不需要重新检测的费用为60元,需要重新检测的前后两轮检测的总费用为100元,所有汽车除检测费用外,其他费用估算为1万元,若300辆汽车全部参与质量检测,实际费用是否会超出预算?5432【答案】(1)-3p+12p-17p+9p(2)不会2233【详解】(1)由题意知,每辆汽车第一轮质量检测被列为不合格汽车的概率为C3p1-p+C3p,122每辆汽车重新检测被列为不合格汽车的概率为C3p1-p1-1-p,综上可知,每辆汽车被列为不合格汽车的概率为22331225432q=C3p1-p+C3p+C3p1-p1-1-p=-3p+12p-17p+9p.(2)设每辆汽车质量检测的费用为X元,则X的可能取值为60,100,1212由题意知PX=100=C3p1-p,PX=60=1-C3p1-p,所以随机变量X的数学期望为12122EX=60×1-C3p1-p+100×C3p1-p=60+120p1-p(元),p∈0,1,2令fx=60+120x1-x,x∈0,1,2则fx=1201-x-2x1-x=1203x-1x-1,11所以当0<x<时,fx>0;当x∈,1时,fx<0;3311所以函数fx在0,3上单调递增,在3,1上单调递减,1112700700所以fx≤f3=60+120×31-3=9,即EX≤9(元).700-410所以此方案的最高费用为1+300××10=(万元),93综上可知,实际费用估计不会超过预算.类型5:正态分布问题b(1)随机变量X落在区间(a,b]的概率为P(a<X≤b)=φμ,σ(x)dx,即由正态曲线,过点(a,0)和点(b,0)的a两条x轴的垂线,及x轴所围成的平面图形的面积,如下图中阴影部分所示,就是X落在区间(a,b]的概率的近似值.b一般地,如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=φμ,σ(x)dx,则称随机变量X服从正a2态分布.正态分布完全由参数μ,σ确定,因此正态分布常记作N(μ,σ).如果随机变量X服从正态分布,则2记为X∼N(μ,σ).其中,参数μ是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;σ是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.·23·
(2)3σ原则μ+a2若X∼N(μ,σ),则对于任意的实数a>0,P(μ-a<X≤μ+a)=φμ,σ(x)dx为下图中阴影部分的面积,对μ-a于固定的μ和a而言,该面积随着σ的减小而变大.这说明σ越小,X落在区间(μ-a,μ+a]的概率越大,即X集中在μ周围的概率越大特别地,有P(μ-σ<X≤μ+σ)=0.6826;P(μ-2σ<X≤μ+2σ)=0.9544;P(μ-3σ<X≤μ+3σ)=0.9974.由P(μ-3σ<X≤μ+3σ)=0.9974,知正态总体几乎总取值于区间(μ-3σ,μ+3σ)之内.而在此区间以外取值的概率只有0.0026,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用中,通2常认为服从于正态分布N(μ,σ)的随机变量X只取(μ-3σ,μ+3σ)之间的值,并简称之为3σ原则.正态分布问题专项训练21人勤春来早,实干正当时.某工厂春节后复工复产,为满足市场需求加紧生产,但由于生产设备超2负荷运转导致某批产品次品率偏高.已知这批产品的质量指标X∼N80,σ,当X∈60.100时产品为正品,其余为次品.生产该产品的成本为20元/件,售价为40元/件.若售出次品,则不更换,需按原售价退款并补偿客户10元/件.(1)若某客户买到的10件产品中恰有两件次品,现从中任取三件,求被选中的正品数量ξ的分布列和数学期望:(2)已知PX≤60=0.02,工厂欲聘请一名临时质检员检测这批产品,质检员工资是按件计费,每件x元.产品检测后,检测为次品便立即销毁,检测为正品方能销售.假设该工厂生产的这批产品都能销售完,工厂对这批产品有两种检测方案,方案一:全部检测;方案二:抽样检测.若要使工厂两种检测方案的盈利均高于不检测时的盈利,求x的取值范围,并从工厂盈利的角度选择恰当的方案.12【答案】(1)分布列见解析;期望为5(2)x∈0,0.4,从工厂盈利的角度应选择方案一【详解】(1)由题意可知ξ的可能取值为1,2,3,21C2⋅C881Pξ=1===C3120151012C2⋅C8567Pξ=2===.C3120151003C2⋅C8567Pξ=3===.C31201510∴ξ的分布列如下:ξ123177P151515.17712∴Eξ=1×+2×+3×=.1515155·24·
2(2)∵X∼N80,σ且PX≤60=0.02,∴PX≥100=0.02.∴这批产品的次品率为p=0.04.设该工厂生产的这批产品有n件,记Y为这批产品的次品数量,则Y∼Bn,0.04,EY=0.04n.若这批产品不检测,则该工厂的利润的期望为y1=n×40-20-0.04n×50=18n.若选择方案一,则该工厂的利润的期望为y2=0.96n×40-20-nx-0.04n×20=18.4n-nx令y2>y1,解得0<x<0.4.若选择方案二,假设抽样检测mm<n件,则检测出的次品的期望为0.04m件,不检测的产品有n-m件,则该工厂的利润的期望为y3=18.4m-mx+18n-m=0.4-xm+18n.令y3>y1,解得0<x<0.4.则y3-y2=n-mx-0.4,∵0<x<0.4,且m<n,∴y3<y2.∴x∈0,0.4,并从工厂盈利的角度应选择方案一、.22某手机APP公司对喜欢使用该APP的用户年龄情况进行调查,随机抽取了100名喜欢使用该APP的用户,年龄均在15,65周岁内,按照年龄分组得到如下所示的样本频率分布直方图:(1)根据频率分布直方图,估计使用该视频APP用户的平均年龄的第85%分位数(小数点后保留2位);2(2)若所有用户年龄X近似服从正态分布Nμ,σ,其中μ为样本平均数的估计值,σ≈10.5,试估计喜欢使用该APP且年龄大于61周岁的人数占所有喜欢使用该APP的比例;(3)用样本的频率估计概率,从所有喜欢使用该APP的用户中随机抽取8名用户,用PX=k表示这8名用户中恰有k名用户的年龄在区间25,35岁的概率,求PX=k取最大值时对应的k的值;2附:若随机变量X服从正态分布Nμ,σ,则:P(μ-σ<X<μ+σ)≈0.6827,P(μ-2σ<X<μ+2σ)≈0.9545,P(μ-3σ<X<μ+3σ)≈0.9973【答案】(1)51.67(岁)(2)2.275%(3)k=1【详解】(1)∵由直方图可知,第85%分位数位于区间[45,55),0.85-0.65∴第85%分位数=45+×10=51.67(岁).0.30·25·
(2)∵x=20×0.01+30×0.02+40×0.035+50×0.03+60×0.005×10=40(岁)∴μ=401-0.9545∴P(X>61)=P(X>μ+2σ)==0.022752∴使用该APP且年龄大于61周岁的人数占所有喜欢使用该APP的2.275%.(3)根据题意X∼B8,0.2,PX=k≥PX=k+1要使P(X=k)取最大值,则,PX=k≥PX=k-1kk8-kk+1k+17-kC80.20.8≥C80.20.849∴kk8-kk-1k-19-k,解得≤k≤,C80.20.8≥C80.20.855因为k∈N,所以k=1.23锚定2060碳中和,中国能源演进“绿之道”,为响应绿色低碳发展的号召,某地在沙漠治理过程中,计划在沙漠试点区域四周种植红柳和梭梭树用于防风固沙,中间种植适合当地环境的特色经济作物,通过大量实验发现,单株经济作物幼苗的成活率为0.8,红柳幼苗和梭梭树幼苗成活的概率均为p,且已知任取三种幼苗各一株,其中至少有两株幼苗成活的概率不超过0.896.(1)当p最大时,经济作物幼苗的成活率也将提升至0.88,求此时三种幼苗均成活的概率(10.24=3.2);2(2)正常情况下梭梭树幼苗栽种5年后,其树杆地径服从正态分布N250,5(单位:mm).㈠梭梭树幼苗栽种5年后,若任意抽取一棵梭梭树,则树杆地径小于235mm的概率约为多少?(精确到0.001)㈡为更好地监管梭梭树的生长情况,梭梭树幼苗栽种5年后,农林管理员随机抽取了10棵梭梭树,测得其树杆地径均小于235mm,农林管理员根据抽检结果,认为该地块土质对梭梭树的生长产生影响,计划整改地块并选择合适的肥料,试判断该农林管理员的判断是否合理?并说明理由.2附:若随机变量Z服从正态分布Nμ,σ,则Pμ-σ≤Z≤μ+σ≈0.6827,Pμ-2σ≤Z≤μ+2σ≈0.9545,Pμ-3σ≤Z≤μ+3σ≈0.9973.【答案】(1)0.5632(2)(1)0.001;(2)答案见解析【详解】(1)由题意得,任取三种幼苗各一株,至少有两株幼苗成活,包括恰有两株幼苗成活,三株幼苗均成活两种情况,22故概率为1-0.8×p+2×0.8×p1-p+0.8×p≤0.896,2428即3p-8p+4.48≥0,解得p≤或p≥(舍去)5154又p>0,故p的取值范围为0,5,故p的最大值为0.8,·26·
记红柳和梭梭树幼苗均成活为事件A,经济作物幼苗成活为事件B,则有PA=0.8×0.8=0.64,PBA=0.88.故所求概率为PAB=PA⋅PBA=0.64×0.88=0.5632.(2)㈠设正常情况下,任意抽取一株梭梭树,树杆地径为Xmm,2由题意可知X∼N250,5,因为235=250-3×5,所以由正态分布的对称性及“3σ”原则可知:11PX<235=×1-P235≤X≤265≈×0.0027≈0.001.22㈡理由①:农林管理员的判断是合理的.如果该地块土质对梭梭树的生长没有影响,由(1)可知,10随机抽取10棵梭梭树,树杆地径都小于235mm的概率约为0.001,为极小概率事件,几乎不可能发生,但这样的事件竟然发生了,所以有理由认为该地块对梭梭树的生长产生影响,即农林管理员的判断是合理的.理由②:农林管理员的判断是不合理的.由于是随机抽取了10棵梭梭树,所以不可控因素比较多,例如有可能这10颗树的幼苗栽培深度较浅,也有可能是自幼苗栽种后的浇水量或浇水频率不当所致.(答案不唯一,言之有理即可)243D打印即快速成型技术的一种,又称增材制造,它是一种以数字模型文件为基础,运用粉末状金属或塑料等可粘合材料,通过逐层打印的方式来构造物体的技术.中国的3D打印技术在飞机上的应用已达到规模化、工程化,处于世界领先位置.我国某企业利用3D打印技术生产飞机的某种零件,8月1日质检组从当天生产的零件中抽取了部分零件作为样本,检测每个零件的某项质量指标,得到下面的检测结果:质量指标6,77,88,99,1010,1111,1212,13频率0.020.090.220.330.240.080.022(1)根据频率分布表,估计8月1日生产的该种零件的质量指标的平均值x和方差s(同一组的数据用该组区间的中点值作代表);22(2)由频率分布表可以认为,该种零件的质量指标X~Nμ,σ,其中μ近似为样本平均数x,σ近似为样本2方差s.①若P(X≥a)=0.9772,求a的值;②若8月1日该企业共生产了500件该种零件,问这500件零件中质量指标不少于7.06的件数最有可能是多少?2附参考数据:6≈2.45,若X~Nμ,σ,则P(μ-σ<X≤μ+σ)=0.6827,P(μ-2σ<X≤μ+2σ)=0.9544,P(μ-3σ<X≤μ+3σ)=0.9973.2【答案】(1)x=9.5,s=1.5(2)①7.06;②489【详解】(1)由题意可得:x=6.5×0.02+7.5×0.09+8.5×0.22+9.5×0.33+10.5×0.24+11.5×0.08+12.5×0.02=9.5,222222s=6.5-9.5×0.02+7.5-9.5×0.09+8.5-9.5×0.22+9.5-9.5×0.33+10.5-9.522×0.24+11.5-9.5×0.08+12.5-9.5×0.02=1.5·27·
23(2)由(1)可得:μ=x=9.5,σ=1.5,σ=1.5=≈1.22,6即X~N9.5,1.5.11①因为PX≥μ-2σ=+P(μ-2σ<X≤μ+2σ)=0.9772,22所以a=μ-2σ=9.5-2×1.22=7.06.②由①可知:PX≥7.06=0.9772,设这500件零件中质量指标不少于7.06的件数为Y,则Y~B500,0.9772,kk500-k可得PY=k=C500×0.9772×1-0.9772,k=0,1,⋅⋅⋅,500,PY=k≥PY=k+1令,即PY=k≥PY=k-1kk500-kk+1k+1499-kC500×0.9772×1-0.9772≥C500×0.9772×1-0.9772kk500-kk-1k-1501-k,C500×0.9772×1-0.9772≥C500×0.9772×1-0.9772解得488.62≤k≤489.58,且k∈N,则k=489,即当k=489时,概率最大,所以这500件零件中质量指标不少于7.06的件数最有可能是489.25某校数学组老师为了解学生数学学科核心素养整体发展水平,组织本校8000名学生进行针对性检测(检测分为初试和复试),并随机抽取了100名学生的初试成绩,绘制了频率分布直方图,如图所示.(1)根据频率分布直方图,求样本平均数的估计值;2(2)若所有学生的初试成绩X近似服从正态分布Nμ,σ,其中μ为样本平均数的估计值,σ≈14.初试成绩不低于90分的学生才能参加复试,试估计能参加复试的人数;(3)复试共三道题,规定:全部答对获得一等奖;答对两道题获得二等奖;答对一道题获得三等奖;全部答错不获奖.已知某学生进入了复试,他在复试中前两道题答对的概率均为a,第三道题答对的概率为b.若1他获得一等奖的概率为,设他获得二等奖的概率为P,求P的最小值.82附:若随机变昰X服从正态分布Nμ,σ,则P(μ-σ<X≤μ+σ)≈0.6827,P(μ-2σ<X≤μ+2σ)≈0.9545,P(μ-3σ<X≤μ+3σ)≈0.9973.【答案】(1)62(2)1823(3)8【详解】(1)设样本平均数的估计值为x则x=10(40×0.01+50×0.02+60×0.03+70×0.024+80×0.012+90×0.004).解得:x=62.所以样本平均数的估计值为62.2(2)因为学生的初试成绩X近似服从正态分布Nμ,σ,其中μ=62,σ≈14.·28·
1所以μ+2σ≈62+2×14=90.所以P(x≥90)=P(x≥μ+2σ)=(1-0.9545)=0.02275.2所以估计能参加复试的人数为0.02275×8000=182.121(3)由该学生获一等奖的概率为可知:ab=.882123213则P=a1-b+C2a1-ab=a+2ab-=a+-.84a83(2a-1)4a2+4a+121318a-1令P=f(a)=a+-,0<a<1.f(a)=2a-==.4a84a24a24a211当0<a<时,f(a)<0;当<a<1时,f(a)>0.2211所以f(a)在区间0,2上是减函数,在区间2,1上是增函数.111333所以f(a)min=f2=4+2-8=8.所以P的最小值为8.·29·
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)