首页

2023版新高考数学一轮总复习第9章第3讲成对数据的统计分析课件

资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。

1/84

2/84

3/84

4/84

剩余80页未读,查看更多内容需下载

第九章统计成对数据的统计分析\n第三讲 成对数据的统计分析\n知识梳理·双基自测考点突破·互动探究名师讲坛·素养提升\n知识梳理·双基自测\n知识点一 变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个______________另一个的程度,这种关系称为相关关系.(2)散点图每一个序号下的成对样本数据都可用直角坐标系中的______表示出来,由这些点组成的统计图称为散点图.去精确地决定点\n(3)正相关、负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现________的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现________的趋势,则称这两个变量负相关.(4)变量的线性相关如果两个变量的取值呈现__________________,而且散点落在____________附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量________________________.增加减小正相关或负相关一条直线非线性相关或曲线相关\n(5)样本相关系数称r=__________________________________为变量x和变量y的相关系数.r∈[-1,1],当r>0时,成对样本数据__________;当r<0时,成对样本数据__________;当|r|接近1时,成对样本数据的线性相关程度________;当|r|接近0时,成对样本数据的线性相关程度________.正相关负相关越强越弱\nbx+a+e0σ2因变量或响应变量自变量或解释变量\n\n经验回归直线最小二乘法最小二乘估计观测值预测值残差\n残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为____________.②残差的散点图残差比较均匀地集中分布在以横轴为对称轴的水平带状区域内,则满足一元线性回归模型对随机误差的假设.残差分析\n小好大差\n知识点三 独立性检验(1)分类变量:用以区别不同的现象或性质的随机变量.(2)2×2列联表设X,Y为两个分类变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:a+bb+da+b+c+d\n(3)独立性检验①零假设(或原假设)以Ω为样本空间的古典概型.设X和Y为定义在Ω上,取值于{0,1}的成对分类变量.H0:________________________________称为零假设.②临界值2=_________________________.P(Y=1|X=0)=P(Y=1|X=1)\n临界值对于任何小概率值α,可以找到相应的正实数xα,使得下面关系成立:P(2≥xα)=α.称xα为α的__________,这个临界值就可作为判断2大小的标准.概率值α越小,临界值xα越大.③独立性检验基于小概率值α的检验规则是:当2≥xa时,我们就推断H0不成立,即认为X和Y__________,该推断犯错误的概率不_________;不独立超过α\n当2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y________.这种利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验.独立\n(4)独立性检验解决实际问题的一般步骤:①提出零假设H0:X与Y相互独立,并给出在问题中的解释.②根据抽样数据整理出2×2列联表,计算2值,并与临界值xα比较.③根据经验规则得出推断结论.④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.\n1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性分布时,求出的经验回归方程才有实际意义,否则,求出的经验回归方程毫无意义.根据经验回归方程进行预报,仅是一个预报值,而不是真实发生的值.\n\n题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()(2)两个随机变量的线性相关性越强,相关系数的绝对值越接近于0.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()√×√\n×√×\nBD\n3.(选择性必修3P132例3)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名、治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析甲、乙两种疗法的效果,结论为________________________.附:两种疗法效果没有差异\n\n\nC\n\n5.(2019·高考全国Ⅰ卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?\n\n\n\n考点突破·互动探究\n(1)(2021·江西省南昌二中高二期末)如图是具有相关关系的两个变量的一组数据的散点图的回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是_____.例1E考点一相关关系的判断——自主练透\n(2)对四组数据进行统计,获得以下关于其相关系数的比较,正确的是()\nA.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3[解析](1)由于点越靠近回归直线,则相关性越强,相关系数越大,又由于点E到回归直线的距离最大,所以要去掉点E.(2)由相关系数的定义及散点图所表达的含义,可知r2<r4<0<r3<r1.故选A.[答案]A\n\n例2考点二一元线性回归模型——师生共研\nABC\n(2)(2021·安徽马鞍山市一模)天气寒冷,加热手套比较畅销,某商家为了解某种加热手套如何定价可以获得最大利润,现对这种加热手套进行试销售,统计后得到其单价x(单位:元)与销量y(单位:副)的相关数据如下表:①已知销量y与单价x具有线性相关关系,求y关于x的经验回归方程;②若每副该加热手套的成本为65元,试销售结束后,请利用(1)中所求的线性回归方程确定单价为多少元时,销售利润最大?(结果保留到整数)\n\n\n\n\n\n\n\n\n[解析](1)散点图如图所示:两个变量正相关,且具有线性相关关系.\n\n(2021·河南驻马店期末)近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的A县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量x(单位:千辆)与年使用人次y(单位:千次)的数例3考点三非线性经验回归问题——师生共研据如下表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.\n(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型y=a+blgx或指数函数模型y=c·dx(c>0,d>0)对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量x与年使用人次y的经验回归方程类型(给出判断即可,不必说明理由),并求出y关于x的经验回归方程;(2)已知每辆单车的购入成本为200元,年调度费以及维修等的使用成本为每人次0.2元,按用户每使用一次,收费1元计算,若投入8000辆单车,则几年后可实现盈利?\n\n\n\n\n(2)投入8千辆单车,则年使用人次为3.47×100.25×8=347千人次,每年的收益为347×(1-0.2)=277.6(千元),总投资8000×200=1600000=1600千元,假设需要n年开始盈利,则n×277.6>1600,即n>5.76,故需要6年才能开始盈利.\n非线性相关问题一般通过换元法转化为线性相关(线性回归分析)问题解决.\n〔变式训练2〕(2020·课标Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:\n由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的经验回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx[解析]观察题中散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的图象,故选D.D\n(1)(2021·全国高考)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:例4考点四独立性检验——师生共研一级品二级品合计甲机床15050200乙机床12080200合计270130400\n\n(2)(2021·四川大学附中期中)2020年,全球爆发了新冠肺炎疫情,为了预防疫情蔓延,某校推迟2020年的春季线下开学,并采取了“停课不停学”的线上授课措施.为了解学生对线上课程的满意程度,随机抽取了该校的100名学生(男生与女生的人数之比为3∶2)对线上课程进行评价打分,若评分不低于80分视为满意,其得分情况的频率分布直方图如图所示,若根据频率分布直方图得到的评分不低于70分的频率为0.85.\n①估计100名学生对线上课程评分的平均值;(每组数据用该组的区间中点值为代表)②结合频率分布直方图,请完成以下2×2列联表,并回答能否有99%的把握认为对“线上教学是否满意与性别有关”;\n\n\n(2)①由已知得(0.015+b+0.03)×10=0.85,解得b=0.04,又(0.005+a)×10=1-0.85,解得a=0.01,评分的平均值为55×0.05+65×0.1+75×0.3+85×0.4+95×0.15=80.\n②完成2×2列联表如下表:态度性别满意不满意合计男生253560女生301040合计5545100\n解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体.②明确研究的两个问题.(2)两个关键:①准确列出2×2列联表:②准确理解2.\n注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的xα值与求得的2相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1-p.\n〔变式训练3〕(2021·广西钦州、崇左质检)某出租汽车公司决定更换一批新的小汽车以代替原来的报废的出租车,现有A,B两款车型,根据以往这两种出租车车型的数据,得到两款出租车型使用寿命频数表如下:使用寿命年数4年5年6年7年总计A型出租车(辆)10204525100B型出租车(辆)15354010100\n(1)填写下表,并判断是否有99%的把握认为出租车的使用寿命年数与汽车车型有关?使用寿命不高于5年使用寿命不低于6年总计A型B型总计\nP(2≥xα)0.050.0100.001xα3.8416.63510.828\n[解析](1)根据题目所给数据得到如下2×2的列联考:使用寿命不高于5年使用寿命不低于6年总计A型3070100B型5050100总计80120200\n\n名师讲坛·素养提升\n重温高考(2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,例5\n(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.\n\n(3)由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样,先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样方法抽取样本即可.\n(2020·课标全国Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):例6\n(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?\n\n[解析](1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09\n(3)根据所给数据,可得2×2列联表:人次≤400人次>400空气质量好3337空气质量不好228

版权提示

  • 温馨提示:
  • 1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
  • 2. 本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
  • 3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
  • 4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)

文档下载

发布时间:2022-06-24 15:17:17 页数:84
价格:¥3 大小:1.59 MB
文章作者:随遇而安

推荐特供

MORE