2022年新教材高考数学一轮复习第10章统计与统计案例3成对数据的统计分析课件(人教版)
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
1/47
2/47
3/47
4/47
剩余43页未读,查看更多内容需下载
10.3成对数据的统计分析第十章2022高中总复习优化设计GAOZHONGZONGFUXIYOUHUASHEJI\n课标要求1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.会通过相关系数比较多组成对数据的相关性.2.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.3.针对实际问题,会用一元线性回归模型进行预测.4.通过实例,理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.\n备考指导本节内容在高考选择题、填空题、解答题中均有体现,难度中等.主要体现在一元线性回归模型的应用和独立性检验的应用.近几年高考中,尤其加强了这一部分内容.复习本节知识要加强数学运算、直观想象、数学建模的培养.鉴于新高考对于数学文化的加强,因此要强调本节知识在实际情境中的理解和应用.\n内容索引010203第一环节 必备知识落实第二环节 关键能力形成第三环节 学科素养提升\n第一环节 必备知识落实\n【知识筛查】1.变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)散点图:把成对样本数据用平面直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.(3)正相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.从散点图中看,满足正相关的点落在一条从左下角到右上角的直线附近.(4)负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,我们就称这两个变量负相关.从散点图中看,满足负相关的点落在一条从左上角到右下角的直线附近.\n(5)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.\n2.样本相关系数(1)样本相关系数的公式(2)样本相关系数r的取值范围为[-1,1].\n问题思考样本相关系数r是如何反映成对样本数据的线性相关程度的?(1)当r>0时,成对样本数据正相关;当r<0时,成对样本数据负相关.(2)当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.\n3.一元线性回归模型(1)假定随机误差e的均值为0,方差为定值σ2,Y与x之间的关系可以表示为我们称此式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a称为截距参数,b称为斜率参数,e是Y与bx+a之间的随机误差.\n\n\n4.列联表与独立性检验(1)分类变量:我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.(2)列联表:按研究问题的需要,将数据分类统计并做成表格加以保存,将下表这种形式的数据统计表称为2×2列联表.\n(4)独立性检验利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,简称独立性检验.(5)χ2独立性检验中几个常用的小概率值和相应的临界值.(6)应用独立性检验解决实际问题大致应包括以下几个主要环节:①提出零假设H0:X和Y相互独立,并给出在问题中的解释.②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.③根据检验规则得出推断结论.④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.\n【知识巩固】1.下列说法正确的画“√”,错误的画“×”.(1)相关关系与函数关系都是一种确定性关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)X与Y关系越密切,由观测数据计算得到的χ2的值越大.()(5)通过经验回归方程可以估计和观测变量的取值和变化趋势.()×√√√√\n2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()①②A.变量x与y线性相关,u与v非线性相关B.变量x与y线性相关,u与v不相关C.变量x与y线性相关,u与v线性相关D.变量x与y不相关,u与v不相关C由题中两个散点图可以判断,变量x与y线性相关,u与v线性相关,故选C.\nA\n4.为了解某班学生喜欢打篮球是否与性别有关,对本班50人进行了问卷调查,得到如下2×2列联表:依据小概率值α=0.005的独立性检验,推断喜欢打篮球与性别.(填“有关”或“无关”)有关\n零假设为H0:喜欢打篮球与性别无关.根据列联表的数据,根据小概率值α=0.005的独立性检验,推断H0不成立,即推断喜欢打篮球与性别有关,此推断犯错误的概率不大于0.005.\n5.在一次考试中,5名学生的数学和物理成绩如下表:已知数学成绩x与物理成绩y线性相关,其经验回归方程为,则估计数学成绩为90分的学生的物理成绩为分.(结果保留整数)73\n第二环节 关键能力形成\n能力形成点1相关关系的判断例1(1)下列各散点图中,两个变量x,y具有相关关系的是()A.①②B.①④C.③④D.②③C由散点图知③中的点都分布在一条直线附近,④中的点都分布在一条曲线附近,故③④中的两个变量x,y具有相关关系.①②中的点分布无规律,故①②中的两个变量x,y不具有相关关系.\n(2)对两个变量x,y进行线性相关检验,得样本相关系数r1=0.7859,对两个变量u,v进行线性相关检验,得样本相关系数r2=-0.9568,则下列判断正确的是()A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强C由样本相关系数r1=0.7859>0,知x与y正相关,由样本相关系数r2=-0.9568<0,知u与v负相关.又|r1|<|r2|,故变量u与v的线性相关性较强.\n解题心得1.根据样本数据画出散点图,由散点图可直观地判断两个变量是否具有相关关系.2.根据样本数据得到样本相关系数r,由r的正负可判断两个变量是正相关还是负相关;由|r|的大小可判断两个变量线性相关程度的强弱.\n对点训练1(1)已知x,y是两个变量,下列四个散点图中,x与y负相关的是()C若两个变量负相关,则当一个变量的值增加时,另一个变量的值呈减少的趋势,故选C.\n(2)对四组数据进行统计,获得的散点图如图所示,关于其样本相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3A由题图易知r1>0,r2<0,r3>0,r4<0,|r1|>|r3|,|r2|>|r4|,故r2<r4<0<r3<r1.\n能力形成点2经验回归方程的求法及回归分析例2下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程(3)已知该厂技术改造前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的经验回归方程,预测技术改造后,生产100吨甲产品的生产能耗比技术改造前降低了多少吨标准煤.\n解(1)由题设所给数据,可得散点图如图所示.\n(3)由(2)及题意可知降低的生产能耗约为90-(0.7×100+0.35)=19.65(吨标准煤).\n解题心得求经验回归方程的三个步骤(1)利用散点图或样本相关系数r判断两个变量是否具有线性相关关系.(2)若存在线性相关关系,则求出回归系数.(3)写出经验回归方程.\n对点训练2一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求经验回归方程;(3)根据求出的经验回归方程,预测加工200个零件所用的时间为多少?(结果保留整数)\n解(1)列出下表.\n\n能力形成点3独立性检验例3某小区采取一系列措施,宣传垃圾分类的知识与意义,并采购分类垃圾箱.为了解垃圾分类的效果,该小区物业随机抽取了200名居民进行问卷调查,每名居民对小区采取的措施给出“满意”或“不满意”的评价.根据调查结果统计并作出年龄分布条形图和持不满意态度的居民的结构比例图,如图所示.年龄分布条形图持不满意态度的居民的结构比例图在这200份问卷中,持满意态度的频率是0.65.\n(1)完成下面的2×2列联表,并依据小概率值α=0.05的独立性检验,分析“51岁及以上”和“50岁及以下”的居民对该小区采取的措施的评价是否有差异;\n(2)按“51岁及以上”和“50岁及以下”的年龄段采取分层随机抽样的方法,从中随机抽取5人,再从这5人中随机抽取2人进行电话回访,求电话回访的两名居民恰好一名年龄在51岁及以上,另一名年龄在50岁及以下的概率.附表及参考公式:\n解(1)根据题目所给数据,计算得到2×2列联表为零假设为H0:“51岁及以上”和“50岁及以下”的居民对该小区采取措施的评价没有差异.根据列联表中的数据,计算得到根据小概率值α=0.05的独立性检验,推断H0不成立,即认为“51岁及以上”和“50岁及以下”的居民对该小区采取措施的评价有差异,此推断犯错误的概率不大于0.05.\n(2)依题意,随机抽取的5人中有2人年龄在51岁及以上,有3人年龄在50岁及以下.故电话回访的两名居民恰好一名年龄在51岁及以上,另一名年龄在50岁及以下的概率为解题心得利用χ2进行独立性检验的步骤(1)列出2×2列联表.(2)提出零假设,并根据2×2列联表中的数据计算出χ2的值.(3)比较χ2的值与临界值的大小,并作出判断.\n对点训练3在一次恶劣气候的飞行航程中,调查男女乘客在飞机上晕机的情况,共调查了89名乘客,其中男乘客有24人晕机,31人不晕机;女乘客有8人晕机,26人不晕机.(1)根据题意,完成下面的2×2列联表;\n(2)依据小概率值α=0.1的独立性检验,分析在本次飞行中乘客晕机与性别是否有关;(3)已知8名晕机的女乘客中有5名是常坐飞机的乘客,另外3名是不常坐飞机的乘客,从这8名女乘客中任选3名,求这3名女乘客中至少有一名不常坐飞机的概率.附表及参考公式:\n解(1)根据题目所给数据,得到2×2列联表为(2)零假设为H0:在本次飞行中乘客晕机与性别无关.根据2×2列联表中的数据,计算得到根据小概率值α=0.1的独立性检验,推断H0不成立,即认为在本次飞行中乘客晕机与性别有关,此推断犯错误的概率不大于0.1.\n\n第三环节 学科素养提升\n一元线性回归模型的拟合问题典例某地区2002年至2018年环境基础设施投资额y(单位:亿元)的折线图如图所示.\n为了预测该地区2021年的环境基础设施投资额,建立了y与时间变量t的两个一元线性回归模型.根据2002年至2018年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2012年至2018年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2021年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,可得该地区2021年的环境基础设施投资额的预测值为=-30.4+13.5×20=239.6(亿元).利用模型②,可得该地区2021年的环境基础设施投资额的预测值为=99+17.5×10=274(亿元).\n(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2002年至2018年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2002年至2018年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2012年相对2011年的环境基础设施投资额有明显增加,2012年至2018年的数据对应的点位于一条直线的附近,这说明从2012年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2012年至2018年的数据建立的线性模型=99+17.5t可以较好地描述2012年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.\n(ⅱ)从计算结果看,相对于2018年的环境基础设施投资额220亿元,由模型①得到的预测值239.6亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(理由合理即可)解题心得建立一元线性回归模型分析问题时,注意排除数据中的极端值,否则建立的线性回归模型拟合效果差.对于已建立的多个一元线性回归模型,可利用样本相关系数r来判断模型的拟合效果,|r|越接近1,模型的拟合效果越好,从而选择拟合效果最好的模型对问题进行分析.
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)