福建专版2022高考数学一轮复习课时规范练50变量间的相关关系统计案例文
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
课时规范练50 变量间的相关关系、统计案例基础巩固组1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg2.根据如下样本数据:x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为y^=b^x+a^,则( ) A.a^>0,b^>0B.a^>0,b^<0C.a^<0,b^>0D.a^<0,b^<03.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若在统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确4.两个随机变量x,y的取值如下表:x0134y2.24.34.86.7若x,y具有线性相关关系,且y^=b^x+2.6,则下列结论错误的是( )A.x与y是正相关12\nB.当x=6时,y的估计值为8.3C.x每增加一个单位,y大约增加0.95个单位D.样本点(3,4.8)的残差为0.565.2022年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015则下面的结论正确的是( )A.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”6.(2022山东潍坊二模,文12)某公司未来对一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元456789销量y/件908483807568由表中数据,求得线性回归方程为y^=-4x+a^,当产品销量为76件时,产品定价大致为 元. 7.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得∑i=110xi=80,∑i=110yi=20,∑i=110xiyi=184,∑i=110xi2=720.(1)求家庭的月储蓄y^对月收入x的线性回归方程y^=b^x+a^;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.12\n〚导学号24190950〛综合提升组8.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:男女总计爱 好402060不爱好203050总 计6050110附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”12\nD.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”9.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程y^=b^x+a^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是( )A.b^>b',a^>a'B.b^>b',a^<a'C.b^<b',a^>a'D.b^<b',a^<a'10.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm,170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm. 11.(2022宁夏石嘴山第三中学模拟,文18)为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班进行教学实验,为了解教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出的茎叶图如下图,记成绩不低于70分者为“成绩优良”.(1)分别计算甲、乙两班20个样本中,化学成绩前十的平均分,并据此判断哪种教学方式的教学效果更佳;(2)由以上统计数据填写下面2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”?甲班乙班总计成绩优良成绩不优良总 计附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(n=a+b+c+d).独立性检验临界值表:P(K2≥k0)0.100.050.0250.01012\nk02.7063.8415.0246.63512.某贫困地区2022年至2022年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2022202220222022202220222022年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2022年至2022年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2022年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b^=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2,a^=y-b^t.12\n〚导学号24190951〛创新应用组13.某同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x(单位:℃)与该奶茶店的这种饮料销量y(单位:杯),得到如下数据:日期1月11日1月12日1月13日1月14日1月15日平均气温x91012118销量y2325302621(1)若先从这5组数据中抽出2组,求抽出的2组数据恰好是相邻两天数据的概率;(2)请根据所给5组数据,求出y关于x的线性回归方程y^=b^x+a^;并根据线性回归方程预测当气象台预报1月16日的白天平均气温为7℃时该奶茶店这种饮料的销量.附:线性回归方程y^=b^x+a^中,b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2,a^=y-b^x,其中x,y为样本平均值.12\n14.(2022福建南平一模,文18)某单位N名员工参加“我爱阅读”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.下面是年龄的分布表区间[25,30)[30,35)[35,40)[40,45)[45,50]人数28ab12\n(1)求正整数a,b,N的值;(2)现要从年龄低于40岁的员工中用分层抽样的方法抽取42人,则年龄在第1,2,3组的员工分别抽多少?(3)为了了解该单位员工的阅读习惯,对第1,2,3组中抽出的42人是否喜欢阅读国学类书籍进行了调查,调查结果如下表所示:(单位:人)喜欢阅读国学类不喜欢阅读国学类合计男16420女81422合计241842根据表中数据,能否在犯错误的概率不超过0.5%的前提下认为该单位员工“是否喜欢阅读国学类书籍和性别有关系”?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828答案:1.D 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本点中心(x,y),因此B正确;由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,故C正确;当某女生的身高为170cm时,其体重估计值是58.79kg,而不是具体值,因此D不正确.2.B 由题表中数据画出散点图,如图,由散点图可知b^<0,a^>0,故选B.3.C 独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.4.D 由表格中的数据可知选项A正确;∵x=14(0+1+3+4)=2,y=14(2.2+4.3+4.8+6.7)=4.5,12\n∴4.5=2b^+2.6,解得b^=0.95,∴y^=0.95x+2.6.当x=6时,y^=0.95×6+2.6=8.3,故选项B正确;由y^=0.95x^+2.6可知选项C正确;当x=3时,y^=0.95×3+2.6=5.45,残差是5.45-4.8=0.65,故选项D错误.5.A 由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=100×(675-300)255×45×75×25≈3.030.因为3.030>2.706,所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”,故选A.6.7.5 ∵x=6.5,y=80,∴a^=80-(-4)×6.5,解得a^=106,∴回归方程为y^=-4x+106.当y=76时,76=-4x+106,∴x=7.5,故答案为7.5.7.解(1)由题意知n=10,x=110∑i=110xi=8010=8,y=110∑i=110yi=2022=2,又∑i=110xi2-10x2=720-10×82=80,∑i=110xiyi-10xy=184-10×8×2=24,由此得b^=2480=0.3,a^=y-b^x=2-0.3×8=-0.4,故所求线性回归方程为y^=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b^=0.3>0),因此x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y^=0.3×7-0.4=1.7(千元).8.A 依题意,由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),得K2=110×(40×30-20×20)260×50×60×50≈7.8>6.635,所以在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”,故选A.12\n9.C 由题意可知,b'=2,a'=-2,b^=∑i=16(xi-x)(yi-y)∑i=16(xi-x)2=57.a^=y-b^x=136-57×72=-13,故b^<b',a^>a',故选C.10.185 由题意,得父亲身高xcm与儿子身高ycm对应关系如下表:x173170176y170176182则x=173+170+1763=173,y=170+176+1823=176,∑i=13(xi-x)(yi-y)=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,∑i=13(xi-x)2=(173-173)2+(170-173)2+(176-173)2=18.∴b^=1818=1.∴a^=y-b^x=176-173=3.∴线性回归直线方程y^=b^x+a^=x+3.∴可估计孙子身高为182+3=185(cm).11.解(1)甲班化学成绩前十的平均分x甲=110(72+74+74+79+79+80+81+85+89+96)=80.9;乙班化学成绩前十的平均分x乙=110(78+80+81+85+86+93+96+97+99+99)=89.4.∵x甲<x乙,∴大致可以判断新课堂教学的教学效果更佳.(2)甲班乙班总计成绩优良101626成绩不优良10414总 计20204012\n根据2×2列联表中的数据,得K2的观测值为k=40(10×4-16×10)226×14×20×20≈3.956>3.841,∴能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.12.解(1)由所给数据计算得t=17(1+2+3+4+5+6+7)=4,y=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i=17(ti-t)2=9+4+1+0+1+4+9=28,∑i=17(ti-t)(yi-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b^=∑i=17(ti-t)(yi-y)∑i=17(ti-t)2=1428=0.5,a^=y-b^t=4.3-0.5×4=2.3,所求回归方程为y^=0.5t+2.3.(2)由(1)知,b^=0.5>0,故2022年至2022年该地区农村居民家庭人均纯收入逐年增加,平均每年约增加0.5千元.将2022年的年份代号t=9代入(1)中的回归方程,得y^=0.5×9+2.3=6.8,故预测该地区2022年农村居民家庭人均纯收入为6.8千元.13.解(1)设“选取的2组数据恰好是相邻两天数据”为事件A,∵所有基本事件(m,n)(其中m,n为1月11日至1月15日的日期数)有10个,事件A包括的基本事件有(11,12),(12,13),(13,14),(14,15),共4个,∴抽出的2组数据恰好是相邻两天数据的概率P(A)=410=25.(2)∵x=9+10+12+11+85=10,y=23+25+30+26+215=25.∴由公式,求得b^=2.1,a^=y-b^x=4,∴y关于x的线性回归方程为y^=2.1x+4.当x=7时,y^=2.1×7+4=18.7,12\n故该奶茶店这种饮料的销量大约为19杯(或18杯).14.解(1)总人数N=285×0.02=280,a=280×0.02×5=28.第3组的频率是1-5×(0.02+0.02+0.06+0.02)=0.4,所以b=280×0.4=112.(2)因为年龄低于40岁的员工在第1,2,3组,共有28+28+112=168(人),利用分层抽样在168人中抽取42人,每组抽取的人数分别为:第1组抽取的人数为28×42168=7(人),第2组抽取的人数为28×42168=7(人),第3组抽取的人数为112×42168=28(人),所以第1,2,3组分别抽7人、7人、28人.(3)假设H0:“是否喜欢阅读国学类书籍和性别无关系”,根据表中数据,求得K2的观测值k=42×(16×14-4×8)224×18×20×22≈8.145>7.879.从而能在犯错误的概率不超过0.5%的前提下,认为该单位的员工“是否喜欢阅读国学类书籍和性别有关系”.12
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)