【技巧归纳 能力拓展】专项突破三 概率与统计(考点1 回归分析与独立性检验)(解析版)
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
专项三概率与统计考点1回归分析与独立性检验大题拆解技巧【母题】(2021年全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k)0.0500.0100.001k3.8416.63510.828【拆解1】题目条件不变,甲机床、乙机床生产的产品中一级品的频率分别是多少?【解析】甲机床生产的产品中的一级品的频率为150200=75%,乙机床生产的产品中的一级品的频率为120200=60%.【拆解2】题目条件不变,能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k)0.0500.0100.001k3.8416.63510.828【解析】由题意得K2=400×(150×80-120×50)2270×130×200×200=40039≈10.256>6.635,故能有99%的把握认为甲机床生产的产品与乙机床生产的产品质量有差异.小做变式训练某高科技研发公司生产某种过滤材料,该过滤材料主要质量指标是对直径为0.075um±0.020um的漂浮固体颗粒的过滤效率达到0.95以上.当前该过滤材料供应紧缺,该公司要扩大产能,在原来A生产线的基础上,增设B生产线,为了监控该过滤材料生产线的生产过程,检验员每天需要从两条生产线上分别随机抽取该过滤材料检测过滤效率.公司规定过滤效率大于0.970的产品为一等品,并根据检验员抽测产品中一等品的数量对两条生产线进行评价.下面是检验员某一天抽取的20个该过滤材料的过滤效率值:
序号12345678910过滤效率0.9580.9670.9640.9760.9560.9730.9650.9680.9720.973A生产线过滤效率B生产线过滤效率序号12345678910过滤效率0.9780.9820.9740.9660.9760.9820.9770.9740.9760.972(1)根据检验员抽测的数据,完成下面的2×2列联表,并判断是否有95%的把握认为生产线与所生产的产品为一等品有关.生产线产品是一等品产品不是一等品总计AB总计(2)在这20件产品中,从A,B两条生产线生产的产品中各随机抽取1件,求恰有一件为一等品的概率.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.0500.0100.001k03.8416.63510.828【拆解1】题目条件不变,根据检验员抽测的数据,完成下面的2×2列联表.生产线产品是一等品产品不是一等品总计AB总计【解析】由题意可得2×2列联表如下:生产线产品是一等品产品不是一等品总计A4610B9110总计13720【拆解2】已知条件不变,根据上问的2×2列联表,判断是否有95%的把握认为生产线与所生产的产品为一等品有关.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.0500.0100.001
k03.8416.63510.828【解析】由2×2列联表可得K2=20×(4×1-6×9)210×10×13×7≈5.495>3.841,所以有95%的把握认为生产线与所生产的产品为一等品有关.【拆解3】已知条件不变,在这20件产品中,从A,B两条生产线生产的产品中各随机抽取1件,求恰有一件为一等品的概率.【解析】在这20件产品中,A生产线生产的10件产品中,有4件一等品,6件不是一等品,B生产线生产的10件产品中,有9件一等品,1件不是一等品,所以从A,B两条生产线生产的产品中各抽取1件,共有C101C101=100种情况,其中恰有一件一等品共有C61C91+C41C11=58种情况,所以恰有一件为一等品的概率P=58100=2950.通法技巧归纳1.在2×2列联表中,如果两个变量没有关系,那么应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)根据公式K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d),其中n=a+b+c+d,计算K2的观测值k;(3)比较观测值k与参考临界值的大小关系,做统计推断.突破实战训练<基础过关>1.2021年2月25日举行的全国脱贫攻坚总结表彰大会上,国家电网共有23名(个)先进个人、先进集体获得表彰.其中,国网西藏电力有限公司农电工作部从习近平总书记手中接过了“全国脱贫攻坚楷模”奖牌.过去8年,在党中央坚强领导下,经过世界规模最大、力度最强的脱贫攻坚战,近1亿人摆脱绝对贫困.长期以来,贫困地区的农产品面临“种得出、卖不出”“酒香也怕巷子深”的困境.深谙互联网思维的国家电网人,搭平台、建渠道,以一款APP让众多贫困地区的产品销售易如反掌.2020年“6.18”期间,带货主播和直播运营两大岗位高达去年同期的11.6倍.针对这一市场现象,为了加强监管,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出100次成功交易,并对其评价进行统计,对商品的好评率为0.6,对商品和服务都做出好评的交易为40次,对商品和服务都不满意的交易为5次.(1)完成关于商品和服务评价的2×2列联表.对服务好评对服务不满意合计对商品好评40对商品不满意5合计100
(2)判断能否在犯错误的概率不超过0.025的前提下,认为商品好评与服务好评有关.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828【解析】(1)由题意可知,100次交易中对商品好评的交易共有100×0.6=60次,故其中对服务不满意的有60-40=20次.100次交易中对服务好评同时对商品不满意的有100-60-5=35次,可得关于商品和服务评价的2×2列联表如下:对服务好评对服务不满意合计对商品好评402060对商品不满意35540合计7525100(2)K2=100×(40×5-20×35)275×25×60×40≈5.556>5.024,故能在犯错误的概率不超过0.025的前提下,认为商品好评与服务好评有关.2.为弘扬劳动精神,让学生树立“劳动最美,劳动最光荣”的观念,某校持续开展“家庭劳动大比拼”活动.某班统计了本班同学1~7月份的人均月劳动时间(单位:小时),并建立了人均月劳动时间y关于月份x的线性回归方程y^=b^x+4,y与x的原始数据如下表所示:月份x1234567人均月劳动时间y89m12n1922由于某些原因导致部分数据丢失,但已知∑i=17xiyi=452.(1)求m,n的值;(2)求该班6月份人均月劳动时间数据的残差值(残差即样本数据与预测值之差).参考公式:在线性回归方程y^=b^x+a^中,b^=∑i=1nxiyi-nx−y−∑i=1n(xi-x−)2,a^=y−-b^x−.【解析】(1)由表知x−=17×(1+2+3+4+5+6+7)=4,y−=17×(8+9+m+12+n+19+22)=70+m+n7,所以∑i=17(xi-x−)2=(-3)2+(-2)2+(-1)2+02+12+22+32=28,所以b^=∑i=17xiyi-7x−y−∑i=17(xi-x−)2=452-7×4×70+m+n728,即m+n=43-7b^,①因为回归直线恒过样本点的中心(x−,y−),所以70+m+n7=4b^+4,即m+n=28b^-42,②由①②,得b^=177,m+n=26,③
因为∑i=17xiyi=8+18+3m+48+5n+114+154=452,所以3m+5n=110,④由③④,得m=10,n=16.(2)由(1)知,线性回归方程为y^=177x+4,所以当x=6时,预测值y^=177×6+4=1307,此时残差为19-1307=37.3.“一本书,一条街,一教堂,一条江”曾是哈尔滨的城市名片,而现在“哈马”又成为了哈尔滨的另一张名片,随着全民运动健康意识的提高,马拉松运动不仅在哈尔滨,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加.为此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到下表:平均每周进行长跑训练的天数不大于2天3天或4天不少于5天人数3013040若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;(2)根据上表的数据,填写下列2×2列联表,并通过计算判断是否有99%的把握认为是否热烈参与马拉松与性别有关.热烈参与者非热烈参与者合计男140女55合计参考公式及数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828【解析】(1)以200人中“热烈参与者”的频率作为概率,则该市2万人参与马拉松运动,其中“热烈参与者”的人数约为20000×40200=4000.(2)由题意,可得2×2列联表如下:热烈参与者非热烈参与者合计男35105140女55560合计40160200因为K2=200×(35×55-105×5)240×160×140×60≈7.292>6.635,
所以有99%的把握认为是否热烈参与马拉松与性别有关.4.近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本y(单位:元)与当天揽收的快递件数x(单位:千件)之间的关系,对该网点近5天的每日揽件量xi(单位:千件)与当日收发一件快递的平均成本yi(单位;元)(i=1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.xyw∑i=15(xi-x)·(yi-y)∑i=15(wi-w)·(yi-y)∑i=15(xi-x)2∑i=15(wi-w)245.160.415-13.22.028300.507表中wi=1xi,w=15∑i=15wi.(1)根据散点图,判断y=a+bx与y=c+dx哪一个适宜作为y关于x的回归方程类型,并根据判断结果及表中数据求出y关于x的回归方程.(2)各快递业为提高快递揽收量,实现总利润的增长,除了提升服务质量、提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数x(单位:千件)与单件快递的平均价格t(单位:元)之间的关系是x=25-2t(5≤t≤12),收发一件快递的利润等于单件快递的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:①预测该网点某天揽收2000件快递可获得的总利润.②单件快递的平均价格t为何值时,该网点一天内收发快递所获利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率、截距的最小二乘估计分别为β^=∑i=1n(ui-u)(vi-v)∑i=1n(ui-u)2,α^=v-β^u.【解析】(1)y=c+dx适宜作为y关于x的回归方程类型.令1x=w,则y=d^w+c^,d^=2.0280.507=4,c^=y-d^·w=5.16-4×0.415=3.5,
∴y^=4w+3.5,即所求回归方程为y^=4x+3.5.(2)设收发x千件快递获利z千元,则z=(t-y)x=(25-x2-4x-3.5)x=9x-12x2-4,x∈[1,15].①当x=2时,z=12,故该网点某天揽收2000件快递可获得的总利润约为12000元.②∵z=-12(x-9)2+732,∴当x=9,即t=8时,z取得最大值,故当单件快递的平均价格t为8元时,该网点一天内收发快递所获利润的预报值最大.<能力拔高>5.马拉松(Marathon)长跑是国际上非常普及的长跑比赛项目,分全程马拉松(FullMarathon)、半程马拉松(HalfMarathon)和四分马拉松(QuarterMarathon)三种.以全程马拉松比赛最为普及,一般提及马拉松,即指全程马拉松.2021年沈阳国际马拉松将于9月19日在辽宁沈阳举行,本次“沈马”获评“2021世界田联标牌”赛事.为了调查学生喜欢跑步是否与性别有关,某高中选取了200名学生进行了问卷调查,得到如下的2×2列联表:喜欢跑步不喜欢跑步总计男生80女生20总计已知在这200名学生中随机抽取1人,抽到喜欢跑步的概率为0.6.(1)判断是否有90%的把握认为喜欢跑步与性别有关;(2)从上述不喜欢跑步的学生中按性别分层抽样的方法抽取8名学生,再在这8人中抽取3人调查其喜欢的运动,用X表示3人中女生的人数,求X的分布列及数学期望.参考公式及数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.500.400.250.150.100.050.0250.010.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【解析】(1)∵从200名学生中随机抽取1人,抽到喜欢跑步的概率为0.6,∴喜欢跑步的人数为200×0.6=120,可得列联表如下:喜欢跑步不喜欢跑步合计男生8060140女生402060合计12080200∴K2=200×(80×20-60×40)2120×80×140×60≈1.587<2.706,∴没有90%的把握认为喜欢跑步与性别有关.(2)由题意可知,按性别分层抽样的方法抽取的8名学生中,男生有6人,女生有2人,再从这8人中抽取3人,用X表示其中女生的人数,则X的所有可能取值为0,1,2.P(X=0)=C20C63C83=514,P(X=1)=C21C62C83=1528,P(X=2)=C22C61C83=328,
∴X的分布列为X012P5141528328故数学期望E(X)=0×514+1×1528+2×328=34.6.某电器公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,结果如表所示:年份2020年2021年月份9月10月11月12月1月2月月份代码x123456市场占有率y(%)111316152021(1)用相关系数说明月度市场占有率y与月份代码x之间的关系是否可用线性回归模型拟合.(2)求y关于x的线性回归方程,并预测何时该种产品的市场占有率超过30%.(3)根据市场供需情况统计,得到该公司产品2020年的平均月产量X(单位:万件)的分布列为X11.2P0.60.42020年的该公司产品的平均市场价格Y(单位:万元/件)对应的概率分布为P(Y)=0.8,Y=0.3,0.2,Y=0.35.假设每月生产产品的固定成本为200万元,求该产品平均每月利润的分布列和数学期望.参考数据:∑i=16(xi-x)2=17.5,∑i=16(xi-x)(yi-y)=35,1330≈36.5.参考公式:相关系数r=∑i=1nxiyi-nxy(∑i=1nxi2-nx 2)(∑i=1nyi2-ny 2)=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,回归直线y=bx+a的斜率、截距的最小二乘估计分别为b^=∑i=1nxiyi-nxy∑i=1nxi2-nx 2,a^=y-b^x.【解析】(1)因为y=16×(11+13+16+15+20+21)=16,∑i=16(yi-y)2=76,所以r=∑i=16(xi-x)(yi-y)∑i=16(xi-x)2∑i=16(yi-y)2=3517.5×76=351330≈3536.5≈0.96,即两变量y与x之间具有较强的线性相关关系,故可以用线性回归模型拟合两变量y与x之间的关系.(2)由题意得,b^=∑i=16(xi-x)(yi-y)∑i=16(xi-x)2=3517.5=2,而x=16×(1+2+3+4+5+6)=3.5,所以a^=y-b^x=16-2×3.5=9,所以y关于x的线性回归方程为y^=2x+9,
令y^>30,即2x+9>30,解得x>10.5,又x∈N,所以x≥11,故预测从2021年7月开始,该种产品的市场占有率超过30%.(3)设该产品平均每月利润为Z万元,则Z的所有可能取值为2800,3300,3400,4000,故P(Z=2800)=0.6×0.8=0.48,P(Z=3300)=0.6×0.2=0.12,P(Z=3400)=0.4×0.8=0.32,P(Z=4000)=0.4×0.2=0.08,所以Z的分布列为Z2800330034004000P0.480.120.320.08故平均每月利润的数学期望E(Z)=2800×0.48+3300×0.12+3400×0.32+4000×0.08=3148(万元).<拓展延伸>7.随着互联网的兴起,越来越多的人选择网上购物.某购物平台为了吸引顾客,提升销售额,每年“双十一”都会进行某种商品的促销活动.该商品促销活动规则如下:①“价由客定”,即所有参与该商品促销活动的人进行网络报价,每个人并不知晓其他人的报价,也不知道参与该商品促销活动的总人数;②报价时间截止后,系统根据当年“双十一”该商品数量配额,按照参与该商品促销活动人员的报价从高到低分配名额;③每人限购一件,且参与人员分配到名额时必须购买.某位顾客拟参加2019年“双十一”该商品促销活动,他为了预测该商品的最低成交价,根据该购物平台的公告,统计了最近5年“双十一”参与该商品促销活动的人数(见下表).年份20142015201620172018年份编号t12345参与人数(百万人)0.50.611.41.7(1)由收集数据的散点图发现,可用线性回归模型拟合参与人数y(百万人)与年份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程y^=b^t+a^,并预测2019年“双十一”参与该商品促销活动的人数.(2)该购物平台调研部门对2000位拟参与2019年“双十一”该商品促销活动人员的报价进行了一个调查,得到如下的一份频数表:报价区间(千元)[1,2)[2,3)[3,4)[4,5)[5,6)[6,7)频数200600600300200100①求这2000位参与人员报价X的平均值x−和样本方差s2(同一区间的报价可用该价格区间的中点值代替);②假设所有参与该商品促销活动人员的报价X可视为服从正态分布N(μ,σ2),且μ和σ2可分别由①中所求的样本平均值x−和样本方差s2估值.若预计2019年“双十一”该商品最终销售量为317300,请你合理预测(需说明理由)该商品的最低成交价.
参考公式及数据:回归方程y^=b^t+a^,其中b^=
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)