【世纪金榜】2022届高考数学总复习 课时提升作业(五十三) 9.4变量间的相关关系与统计案例 文 新人教A版
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
课时提升作业(五十三)变量间的相关关系与统计案例一、选择题(每小题5分,共25分)1.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要的时间为()A.6.5hB.5.5hC.3.5hD.0.5h【解析】选A.将x=600代入回归方程即得A.2.下列关于K2的说法中正确的是()A.K2在任何相互独立问题中都可以用来检验有关还是无关B.K2的值越大,两个事件的相关性就越大C.K2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.K2的观测值k的计算公式为k=【解析】选C.K2值是用来判断两个分类变量是否有关系的一个随机变量,并不是适应于任何独立问题的相关性检验.3.某卫生机构对366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,在犯错误的概率不超过的前提下认为糖尿病患者与遗传有关系.()附表:A.0.1%B.0.5%C.99.9%D.2.5%【解题提示】由K2公式求出观测值,然后结合附表判断.【解析】选D.可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表12\n根据列联表中的数据,得到K2的观测值为≈6.067>5.024.故我们在犯错误的概率不超过2.5%的前提下认为糖尿病患者与遗传有关系.4.(2022·临川模拟)小乐与小波在学了变量的相关性之后,两人约定回家去利用各自记录的6~10岁的身高作为实验数据,进行回归分析,探讨年龄x(岁)与身高y(cm)之间的线性相关性.经计算小乐与小波求得的线性回归直线分别为l1,l2.在认真比较后,两人发现他们这五年身高的平均值都为110cm,而且小乐的五组实验数据均满足所求的直线方程,小波则只有两组实验数据满足所求的直线方程.下列说法错误的是()A.直线l1,l2一定有公共点(8,110)B.在两人的回归分析中,小乐求得的线性相关系数r=1,小波求得的线性相关系数r∈(0,1)C.在小乐的回归分析中,他认为x与y之间完全线性相关,所以自己的身高y(cm)与年龄x(岁)成一次函数关系,利用l1可以准确预测自己20岁的身高D.在小波的回归分析中,他认为x与y之间不完全线性相关,所以自己的身高y(cm)与年龄x(岁)成相关关系,利用l2只可以估计预测自己20岁的身高【解析】选C.回归分析只能预测,得到估计值,不是准确值.5.(2022·南昌模拟)已知x,y的值如表所示如果y与x呈线性相关且回归直线方程为=x+,则=()12\n【解析】选B.根据所给的三对数据,得到==3,==5,所以这组数据的样本中心点是(3,5).因为线性回归直线的方程一定过样本中心点,所以5=3+,所以=,故选B.二、填空题(每小题5分,共15分)6.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是.①在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.【解析】K2≈3.918>3.841,而P(K2≥3.841)≈0.05,所以在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.答案:①7.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为=1.197x-3.660,由此估计,当股骨长度为50cm时,肱骨长度的估计值为cm.【解析】根据线性回归方程=1.197x-3.660,将x=50代入得y=56.19,则肱骨长度的估计值为56.19cm.答案:56.198.(2022·咸阳模拟)某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:12\n由上表,可得回归直线方程=x+中的=-4,据此模型预计零售价定为15元时,每天的销售量为.【解析】=17.5,=39,因为=-4,=x+,所以=39+4×17.5=109,所以回归直线方程为=-4x+109,所以x=15时,=-4×15+109=49(件).答案:49三、解答题(每小题10分,共20分)9.(2022·重庆模拟)假设关于某市的房屋面积x(平方米)与购房费用y(万元),有如下的统计数据:(1)用最小二乘法求出y关于x的线性回归方程=x+.(假设已知y对x呈线性相关)(2)若在该市购买120平方米的房屋,估计购房费用是多少?【解析】(1)=95,=50代入公式求得=0.58,=-5.1.线性回归方程为=0.58x-5.1.(2)将x=120代入线性回归方程得=64.5(万元).所以购买120平方米的房屋时,估计购房费用是64.5万元.【加固训练】假定小麦基本苗数x(千棵)与成熟期有效穗数y(千棵)之间存在相关关系,今测得5组数据如下:12\n(1)以x为解释变量,y为预报变量,作出散点图.(2)求y与x之间的线性回归方程.(3)求相关指数R2,并说明基本苗数对有效穗数变化的贡献率.【解析】(1)散点图如图所示:(2)由散点图可以看出x与y之间具有线性相关关系,设线性回归方程为=x+.计算可得≈0.291,≈34.664.故所求线性回归方程为=0.291x+34.664.(3)相关指数R2=所以基本苗数对有效穗数约贡献了83.2%.10.某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:如图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯.(2)根据以上数据完成2×2列联表:12\n(3)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关,并写出简要分析.【解题提示】(1)根据茎叶图的叶上数字的多少明确其亲属30人的饮食习惯.(2)根据茎叶图完成列联表.(3)由(2)得出的列联表计算K2得出观测值.【解析】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主.(2)如表所示:所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.(20分钟40分)1.(5分)(2022·福建高考)已知x与y之间的几组数据如下表:12\n假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是()A.>b′,>a′B.>b′,<a′C.<b′,>a′D.<b′,<a′【解题提示】审题时,要注意“直线方程”和“回归直线”的区别.【解析】选C.过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然b′>,>a′.2.(5分)(2022·吉林模拟)某社区医院为了了解社区老人与儿童每月感冒的人数y(人)与月平均气温x(℃)之间的关系,随机统计了某4个月的月患病(感冒)人数与当月平均气温,其数据如下表:由表中数据算出线性回归方程=x+中的=-2,气象部门预测下个月的平均气温约为6℃,据此估计该社区下个月老年人与儿童患病人数约为()A.38B.40C.46D.58【解析】选C.由表格得(,)为(10,38),12\n因为=x+中的=-2,所以38=10×(-2)+,解得:=58,所以=-2x+58,当x=6时,=-2×6+58=46.故选C.【加固训练】某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产1000吨钢中,约有吨钢是废品.【解析】因为176.5=105.492+42.569x,所以x≈1.668,即成本控制在176.5元/吨时,废品率约为1.668%.所以生产1000吨钢中,约有1000×1.668%=16.68(吨)钢是废品.答案:16.683.(5分)(2022·淄博模拟)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,判断该学校15至16周岁的男生的身高和体重之间在犯错误概率不超过的前提下有关系.附:独立性检验临界值表【解析】由表可得a+b=5,c+d=15,a+c=7,b+d=13,ad=48,bc=3,n=20,所以K2的观测值k=12\n≈5.934,由于5.934>5.024,所以在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.答案:0.025【方法技巧】两个分类变量是否有关的直观判断在列联表中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比重,和满足条件X=x2的个体中具有Y=y1的个体所占的比重,若两个分类变量无关,则两个比重应差别不大,即,因此两个比重相差越大,两个分类变量有关的可能性就越大.4.(12分)(2022·大庆模拟)2022年春晚过后,为了研究演员上春晚次数与受关注度的关系,某网站对其中一位经常上春晚的演员上春晚次数与受关注度进行了统计,得到如下数据:(1)若该演员的粉丝数量y与上春晚次数x满足线性回归方程,试求回归方程=x+,并就此分析,该演员上春晚12次时的粉丝数.(2)若用(i=1,2,3,4,5)表示统计数据时粉丝的“即时均值”(精确到整数),①求这5次统计数据时粉丝的“即时均值”的方差;②从“即时均值”中任选3组,求这三组数据之和不超过20的概率.12\n【解析】(1)由题意可知,=(2+4+6+8+10)=6,=(10+20+40+80+100)=50,所以=-=50-12×6=-22,所以=12x-22.当x=12时,=12×12-22=122.即该演员上春晚12次时的粉丝数约为122万人.(2)经计算可知,这五组数据对应的“即时均值”分别为:5,5,7,10,10.①这五组“即时均值”的平均数为:7.4,则方差为:s2=[2(5-7.4)2+(7-7.4)2+2(10-7.4)2]=5.04.②这五组“即时均值”可以记为A1,A2,B,C1,C2.从“即时均值”中任选3组,选法共有(A1,A2,B),(A1,A2,C1),(A1,A2,C2),(A1,B,C1),(A2,B,C1),(A2,B,C2),(A1,B,C2),(A1,C1,C2),(A2,C1,C2),(B,C1,C2)共10种情况,其中和不超过20的情况有(A1,A2,B),(A1,A2,C1),(A1,A2,C2)共3种情况.故所求概率为:P=.5.(13分)(2022·邢台模拟)为调查某市学生百米运动成绩,从该市学生中按照男女生比例随机抽取50名学生进行百米测试,学生成绩全部介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15)…第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)设m,n表示样本中两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18],求事件“|m-n|>2”的概率.12\n(2)根据有关规定,成绩小于16秒为达标,如果男女生使用相同的达标标准,则男女生达标情况如附表:根据表中数据,能否有99%的把握认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?【解析】(1)成绩在[13,14)的人数有:50×0.04=2人,设为a,b,成绩在[17,18]的人数有:50×0.06=3人,设为A,B,C,m,n∈[13,14)时有ab一种情况.m,n∈[17,18]时有AB,AC,BC三种情况.m,n分别在[13,14)和[17,18]时有aA,aB,aC,bA,bB,bC六种情况.12\n基本事件总数为10,事件“|m-n|>2”由6个基本事件组成.所以P(|m-n|>2)=.(2)依据题意得相关的2×2列联表如下:故有99%的把握认为“体育达标与性别有关”.故可以根据男女生性别划分达标的标准.12
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)