首页

2021-2022高二数学新教材下学期暑假作业8 成对数据的统计分析

资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。

1/17

2/17

剩余15页未读,查看更多内容需下载

8成对数据的统计分析一、单选题.1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若的观测值为,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误C.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病D.以上三种说法都不正确2.对四组数据进行统计,获得以下散点图,关于其线性相关系数比较,正确的是()A.B.C.D.3.某调查者在调查中获知某公司近年来科研费用支出(万元)与公司所获得利润(万元)的统计资料如下表:序号科研费用支出利润\n合计则利润关于科研费用支出的经验回归方程为()参考公式:,.A.B.C.D.4.某公司年月至月空调销售完成情况如图所示,其中为月份,为销售量,下面四个回归方程类型中,最适合作为销售量和月份的回归方程类型的是()A.B.C.D.5.有两个分类变量X,Y,其列联表如下所示,a\n其中a,均为大于5的整数,若在犯错误的概率不超过的前提下认为X,Y有关,则a的值为()A.8B.9C.8或9D.6或86.下列有关线性回归分析的六个命题:①在回归直线方程中,当解释变量x增加1个单位时,预报变量平均减少个单位②回归直线就是散点图中经过样本数据点最多的那条直线③当相关性系数时,两个变量正相关④如果两个变量的相关性越强,则相关性系数r就越接近于1⑤残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高⑥甲、乙两个模型的相关指数分别约为和,则模型乙的拟合效果更好其中真命题的个数为()A.1个B.2个C.3个D.4个7.已知变量y关于x的非线性经验回归方程为,其一组数据如下表所示:x1234ye若,则预测y的值可能为()A.B.C.D.二、多选题.8.下列结论正确的是()A.函数关系是一种确定性关系B.相关关系是一种非确定性关系C.在研究身高与年龄的关系时,散点图中可用横轴表示年龄,纵轴表示身高D.散点图能准确反映变量间的关系\n9.设某大学的女生体重(单位:kg)与身高(单位:cm)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归直线方程为,则下列结论中正确的是()A.与具有正的线性相关关系B.若该大学女生的平均身高为,则平均体重约为C.若该大学某女生身高增加,则其体重约增加D.若该大学某女生身高为,则可断定其体重必为10.下列说法,其中正确的是()A.对于独立性检验,的值越大,说明两事件相关程度越大B.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则c,k的值分别是和C.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则高一学生被抽到的概率最大D.通过回归直线及回归系数可以精确反映变量的取值和变化趋势11.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,得到如图所示的等高条形统计图,则下列说法中正确的有()A.被调查的学生中喜欢登山的男生人数比不喜欢登山的女生人数多B.被调查的男生中喜欢登山的人数比不喜欢登山的人数多C.是否有99%的把握认为喜欢登山和性别有关不会受到被调查的男女生人数影响\nD.是否有99%的把握认为喜欢登山和性别有关会受到被调查的男女生人数影响12.在检验A与B是否有关的过程中,根据所得数据算得的值,则下列说法不正确的是()A.若,则认为A与B独立,该推断犯错误的概率不超过B.若,则认为A与B独立,该推断犯错误的概率不超过C.若,则认为A与B不独立,该推断犯错误的概率不超过D.若,则认为A与B不独立,该推断犯错误的概率不超过三、解答题.13.某社区对居民参加体育活动进行随机调查,参与调查的60岁以下和60岁以上的(含60岁)人数如下表:60岁以下60岁以上(含60岁)男性居民3040女性居民5020(1)判断能否有的把握认为参加体育活动与性别有关;(2)用分层抽样方法,在60岁以下的居民中抽取8人,再从这8人中随机抽取3人,记抽到的男性居民数为随机变量X,求X的分布列和数学期望.附:k,其中.\n14.近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.(1)该校教职工有410人,高二学生有620人,高三学生有610人,①用分层抽样的方法,求高一学生每天抽检人数;②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理,并给出理由.(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:第天12345用时(小时)①计算变量和的相关系数(精确到),并说明两变量线性相关的强弱;②根据①中的计算结果,判定变量和是正相关,还是负相关,并给出可能的原因.\n参考数据和公式:,相关系数.15.A,B是河道分布密集、水患严重的西部两邻县,从2015年开始,沿海C市对A县对口整治河道,C市2015年对A县河道整治投入40亿元,以后河道整治投入逐年减少亿元(a是常数,).B县则由当地市级机关下派第一书记,单位承包到镇(乡)河道,实行河长负责,市民承包到河段的责任制,下表是从2015年到2019年,对B县以年为单位的河道整治投入额:投入年份20152016201720182019年分代号t12345年河道整治投入额y(亿元)3024221816(1)用最小二乘法求对B县的河道整治投入额y与投入年份代号t的回归方程;(2)①A,B两县人口分别为58万和42万,请比较对A,B两县从2015年至2020年这6年人均河道整治投入的大小(对B县2020年的河道整治投入取回归方程的\n估计值).②统计得出两县2020年河道整治是否达标与人均河道整治投入额分布列联表(人数单位:万人):未达标达标合计6年的人均河道整治投入不低于3亿元/万人2038586年的人均河道整治投入低于3亿元/万人241842合计4456100结合此表,是否有把握认为河道整治达标与对当地市民的河道整治投入有关?参考公式及数据:,,,.,.检验临界值表:\n16.随着科技进步,近年来,我国新能源汽车产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年我国新能源乘用车的年销售量数据:年份201620172018201920202021年份代码x123456新能源乘用车年销售量y(万辆)5078126121137352(1)根据表中数据,求出y关于x的线性回归方程;(结果保留整数)(2)若用模型拟合y与x的关系,可得回归方程为,经计算该模型和第(1)问中模型的(为相关指数)分别为和,请分别利用这两个模型,求2022年我国新能源乘用车的年销售量的预测值;(3)你认为(2)中用哪个模型得到的预测值更可靠?请说明理由.参考数据:设,其中.144841380528参考公式:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为,\n.\n答案与解析一、单选题.1.【答案】B【解析】对于A,的观测值时,有的把握认为吸烟与患肺病有关系,不是指“在100个吸烟的人中必有99人患有肺病”,故A错误;对于B,根据独立性原理知,从统计量中求出有的把握认为吸烟与患肺病有关系,是指有的可能性使得判断出现错误,B正确;对于C,从独立性检验可知有的把握认为吸烟与患肺病有关系时,不能说某人吸烟,那么他有的可能性患有肺病,C错误,故选B.2.【答案】B【解析】由题中的散点图可以看出,图1和图3是正相关,相关系数大于0,则,,图2和图4是负相关,相关系数小于0,则,,图3和图4的点相对于图1和图2更加集中,所以相关性较强,所以更接近于1,更接近于,由此可得,故选B.3.【答案】A【解析】由表格数据知:,,,,所求经验回归方程为,故选A.4.【答案】B【解析】对于A,散点显然不符合一次函数的大致图象,A错误;对于B,散点的增长幅度符合二次函数的图象特征,B正确;对于C,以和月份为例,,,无法有一个固定的\n常数,使得对应的值与散点对应的值相符,即散点图不符合指数函数模型,C错误;对于D,散点的增长幅度不符合对数函数的大致图象,D错误,故选B.5.【答案】C【解析】因为且,,所以或7或8或9,根据公式,得,即,当时,;当时,;当时,;当时,,即当或9时满足题意,故选C.6.【答案】B【解析】对于①,根据回归系数的含义,可得回归直线方程中,当解释变量x增加1个单位时,预报变量平均减少个单位,故①正确;对于②,回归直线就是散点图中经过样本数据点最多的那条直线,不正确.回归直线也可能不过任何一个点;故②不正确;对于③,当相关性系数时,两个变量正相关,故③正确;对于④,如果两个变量的相关性越强,则相关性系数的绝对值就越接近于,故④不正确;对于⑤,残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越低,故⑤不正确;对于⑥,甲、乙两个模型的分别约为和,则模型甲的拟合效果更好,故⑥不正确,\n则正确的个数为2,故选B.7.【答案】C【解析】由题意,将两边同时取对数,得,设,则12341345,,由,得,解得,所以,所以当时,,故选C.二、多选题.8.【答案】ABC【解析】对于A:因为函数关系是确定关系,所以A正确;对于B:因为相关关系是非确定性关系,所以B正确;对于C:两个变量转换成数据后,一个对应点的横坐标,一个对应点的纵坐标,所以C正确;对于D:散点图只能大致反映变量间的关系,所以D错误,故选ABC.9.【答案】ABC【解析】根据与的线性回归方程为,其中,说明与具有正的线性相关关系,A正确;回归直线过样本点的中心,由,B正确;由回归方程知,若该大学某女生身高增加,则其体重约增加,故C正确;若该大学某女生身高为,则可预测其体重约为,不可断定其体重必\n为,D错误,故选ABC.10.【答案】AB【解析】由独立性检验得A说法是正确的;B中模型两边取对数得,由线性方程得,知c,k的值分别是,,故B说法正确;根据简单随机抽样,每个个体被抽到的概率相同,故C错误;回归直线及回归系数是预测变量的取值和变化趋势,并不是精确反映,故D错误,故选AB.11.【答案】BD【解析】因为不知道被调查的学生中,男生与女生的人数,所以不能确定喜欢登山的男生人数比不喜欢登山的女生人数多,因此选项A不正确;由统计图中可以确定被调查的男生中喜欢登山的人数的百分比为,所以被调查的男生中喜欢登山的人数比不喜欢登山的人数多,因此选项B正确;因为不知道被调查的学生中,男生与女生的人数,所以不能由卡方公式进行计算判断,所以选项C不正确,选项D正确,故选BD.12.【答案】ABC【解析】当时,我们认为A与B不独立,该推断犯错误的概率不超过,只有D说法正确,故选ABC.三、解答题.13.【答案】(1)有的把握认为;(2)分布列见解析,期望为.【解析】(1)由题意可得,\n故有把握认为参加体育活动与性别有关.(2)以下居民共人,其中男性人,女性人,用分层抽样的方法从中抽人,则男性有人,女性有人,从这位男性和位女性中随机抽取3人,抽到的男性居民数可能有,,,,故X的所有可能取值为,,,,,,,,的分布列如下:.14.【答案】(1)①人;②方案二,理由见解析;(2)①,线性相关性很强;②负相关,理由见解析.【解析】(1)解:①高一学生每天抽检人数为(人).②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛查工作.(2)解:①,,所以,,,变量和的相关系数为,\n因为,可知两变量线性相关性很强.②由可知变量和是负相关,可能的原因:随着抽检工作的开展,学校相关管理协调工作效率提高,因此用时缩短.15.【答案】(1);(2)①对A县的人均河道整治投入大于对B县的人均河道整治投入;②有的把握.【解析】(1)由表可知,,,∵,,∴,∴,所以,所求回归方程为.(2)①由条件可知,对A县的河道整治总投入(亿元),∴这6年对A县人均河道整治投入为(亿元/万人).对B县2020年的河道整治投入为(亿元),∴对B县的河道整治总投入为(亿元),∴这6年对B县人均河道整治投入为(亿元/万人).所以,对A县的人均河道整治投入大于对B县的人均河道整治投入.②由列联表知,,所以,有的把握认为河道整治达标与当地市民的河道整治投入有关.16.【答案】(1);(2)当回归方程为时,2022年我国新能源乘用车的年销售量的预测值是万辆;当回归方程为时,2022\n年我国新能源乘用车的年销售量的预测值是万辆.(3)由于相关指数越接近于,两个变量之间的关系就强,相应的拟合程度也越好,所以模型得到的预测值更可靠.【解析】(1)由表中数据得,,,,,,,y关于x的线性回归方程为.(2)由(1)知,y关于x的线性回归方程为,当时,2022年我国新能源乘用车的年销售量的预测值(万辆);对于回归方程,当时,2022年我国新能源乘用车的年销售量的预测值:(万辆).(3)依题意:模型和第(1)问中模型的(为相关指数)分别为和,由于相关指数越接近于,两个变量之间的关系就强,相应的拟合程度也越好,所以模型得到的预测值更可靠.

版权提示

  • 温馨提示:
  • 1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
  • 2. 本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
  • 3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
  • 4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)

文档下载

所属: 高中 - 数学
发布时间:2022-07-17 13:14:02 页数:17
价格:¥3 大小:637.94 KB
文章作者:随遇而安

推荐特供

MORE