2022年高考数学一轮复习第十章算法初步统计与统计案例4变量间的相关关系统计案例课件(新人教A版理)
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
1/35
2/35
3/35
4/35
剩余31页未读,查看更多内容需下载
10.4变量间的相关关系、统计案例\n-2-知识梳理双基自测234151.变量间的相关关系(1)定义:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种.(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些点分布在从左下角到右上角的区域,则称两个变量;若这些点分布在从左上角到右下角的区域,则称两个变量.(3)线性相关关系、回归直线:如果散点图中的点的分布从整体上看大致在,那么就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.非确定性关系正相关负相关一条直线附近\n-3-知识梳理双基自测23415(4)非线性相关:若散点图上所有点看上去都在附近波动,则称这两个变量为非线性相关.此时,可以用来拟合.(5)不相关:如果所有的点在散点图中,那么称这两个变量是不相关的.某条曲线(不是一条直线)一条曲线没有显示任何关系\n-4-知识梳理双基自测234152.回归分析对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为,因变量y称为.解释变量预报变量\n-5-知识梳理双基自测23415\n-6-知识梳理双基自测234154.相关系数,它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r>0时表示两个变量正相关,当r<0时表示两个变量负相关.|r|越接近1,表明两个变量的线性相关性;当|r|接近0时,表明两个变量间几乎不存在.越强线性相关性\n-7-知识梳理双基自测234155.独立性检验(1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量.(2)列联表:列出两个分类变量的,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表不同类别频数表\n-8-知识梳理双基自测23415(3)独立性检验:利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.a+b+c+d\n2-9-知识梳理双基自测34151.下列结论正确的打“√”,错误的打“×”.(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)若事件X,Y的关系越密切,则由观测数据计算得到的K2的观测值越大.()×√√√√\n-10-知识梳理双基自测23415答案解析解析关闭答案解析关闭\n-11-知识梳理双基自测234153.广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元):万元时的销售额约为()A.101.2万元B.108.8万元C.111.2万元D.118.2万元答案解析解析关闭答案解析关闭\n-12-知识梳理双基自测234154.高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三名学生.从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其两科总成绩名次靠前的学生是;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.答案解析解析关闭(1)由题图可知,甲的语文成绩名次比总成绩名次靠后;而乙的语文成绩名次比总成绩名次靠前.故填乙.(2)由题图可知,比丙的数学成绩名次还靠后的人比较多;而总成绩名次中比丙名次靠后的人数比较少,所以丙的数学成绩名次更靠前.故填数学.答案解析关闭(1)乙(2)数学\n-13-知识梳理双基自测234155.为了考察某种病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参照附表,在犯错误的概率最多不超过(填百分比)的前提下,可认为“该种疫苗有预防这种病毒感染的效果”.答案解析解析关闭答案解析关闭\n-14-考点1考点2考点3例1(1)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b的值为1.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系较弱,无研究价值答案解析解析关闭由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.答案解析关闭B\n-15-考点1考点2考点3(2)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪位同学的试验结果体现A,B两个变量有更强的线性相关性?()A.甲B.乙C.丙D.丁思考如何判断两个变量有无相关关系?答案解析解析关闭在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性,故选D.答案解析关闭D\n-16-考点1考点2考点3解题心得判断两个变量有无相关关系有两个方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强,相关系数就是描述相关性强弱的.\n-17-考点1考点2考点3对点训练1(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3A\n-18-考点1考点2考点3(2)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则这组样本数据的样本相关系数为()A.-3B.0C.-1D.1C解析:(1)易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,故r2<r4<0<r3<r1.(2)因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,所以回归直线方程是y=-3x+1,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,且所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则|r|=1,相关系数r=-1,故选C.\n-19-考点1考点2考点3例2PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少.\n-20-考点1考点2考点3思考对已知的两个变量的一组数据如何做回归分析?\n-21-考点1考点2考点3\n-22-考点1考点2考点3所以可以预测此时PM2.5的浓度为150.24微克/立方米.\n-23-考点1考点2考点3解题心得1.求线性回归直线方程的步骤(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;\n-24-考点1考点2考点32.对变量值的预测方法主要是由给出的变量的值预测与其有相关关系的变量的值.一般方法如下:\n-25-考点1考点2考点3对点训练2下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)\n-26-考点1考点2考点3解:(1)由题意,作散点图,如图所示.\n-27-考点1考点2考点3\n-28-考点1考点2考点3例3为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500名老年人,结果如下:\n-29-考点1考点2考点3(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.思考独立性检验的方法是什么?\n-30-考点1考点2考点3解(1)调查的500名老年人中有70名需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为由于9.967>6.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此,在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样的方法取得样本.可知分层抽样的方法比采用简单随机抽样方法更好.\n-31-考点1考点2考点3解题心得独立性检验的方法(1)构造2×2列联表;(2)计算K2的观测值k;(3)查表确定有多大的把握判定两个变量有关联.注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的K2的观测值k相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1-p.\n-32-考点1考点2考点3对点训练3(2020全国Ⅲ,理18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);\n-33-考点1考点2考点3(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?\n-34-考点1考点2考点3解:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:\n-35-考点1考点2考点3(3)根据所给数据,可得2×2列联表:由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)