人教A版选修1-2课件1.1 回归分析的基本思想及其初步应用
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
1/41
2/41
3/41
4/41
剩余37页未读,查看更多内容需下载
1.1回归分析的基本思想及其初步应用
1.回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(3)回归分析的基本步骤:画出两个变量的散点图,求回归直线方程,最后用回归直线方程进行预报.(4)回归直线方程的求法步骤:①确定两个变量具有相关关系;
答案:D
做一做2已知回归直线方程中斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为()解析:由于回归直线方程一定经过样本点的中心,代入检验可知A正确.答案:A
2.线性回归模型(1)线性回归模型为y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差.自变量x称为解释变量,因变量y称为预报变量.(2)随机误差产生的原因.
3.线性回归分析(1)残差(2)残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.
(3)残差分析残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:计算残差——画残差图——在残差图中分析残差特性.当残差点比较均匀地落在水平的带状区域中时,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
(4)相关指数可以用相关指数R2来刻画回归的效果,其计算公式是
做一做3已知回归直线方程为,而试验得到的一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01B.0.02C.0.03D.0.04解析:(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.答案:C
4.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.
思考辨析判断下列说法是否正确,正确的在后面的括号内打“√”,错误的打“×”.(1)判断两个变量是否相关,只能依靠散点图.()(2)若两个变量x与y之间不存在线性相关关系,则根据它们的一组数据(xi,yi)(i=1,2,…,n)不能写出一个线性方程.()(3)残差平方和越大,说明回归模型的拟合精度越高,预报越准确.()(4)相关指数越大,说明回归模型的拟合精度越高,预报越准确.()×××√
探究一探究二探究三当堂检测求回归直线方程【例1】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据:(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程.(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤;试根据(2)求出的线性回归方程,预测技术改造后生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
探究一探究二探究三当堂检测分析:(1)根据表中数据在直角坐标系中作出散点图;(2)根据回归系数的计算公式求出的值,代入即得回归直线方程;(3)将x=100代入回归直线方程计算求解.解:(1)散点图如下图所示:
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测变式训练1某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)试根据数据预报广告费支出1000万元的销售额;(2)若广告费支出1000万元的实际销售额为8500万元,求误差.
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测(2)8500万元即85百万元,实际数据与预报值的误差为85-82.5=2.5(百万元).
探究一探究二探究三当堂检测回归模型的误差分析:【例2】已知x,y的取值如表所示:(1)求y与x之间的回归方程;(2)计算残差平方和;(3)判断该回归模型的好坏.分析:首先画出散点图,通过散点图确定y与x之间的线性相关关系,然后套用公式求得回归直线方程;再根据公式计算残差平方和,最后可求出相关指数R2,同时进行模型好坏的评判.
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测变式训练2已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y关于x的回归直线方程,并说明回归模型拟合效果的好坏.
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测非线性回归分析【例3】在某一化学反应过程中,其化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了8组测验数据列于下表中,试建立y与x之间的回归方程.分析:先画出散点图,由此确定拟合曲线的类型,然后进行非线性回归分析.
探究一探究二探究三当堂检测解:根据测验数据可以作出散点图,如图所示:根据y与x的散点图,可以认为样本点集中在某一条指数函数曲线(c1,c2为待定的参数)的附近,令z=lny,则z=lny=c2x+lnc1,即变换变量后样本点应分布在直线z=bx+a(a=lnc1,b=c2)的附近.z与x的数据如下表所示:
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测变式训练3在一次抽样调查中测得样本的5个样本点,数值如下:试建立y与x之间的回归方程.
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测1.一项研究要确定是否能够根据施肥量预测作物的产量,这里的解释变量应该是()A.作物的产量B.施肥量C.试验者D.降雨量或其他因素解析:作物的产量为预报变量,故施肥量为解释变量.答案:B2.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R2解析:由残差平方和的定义及计算公式可知.答案:B
探究一探究二探究三当堂检测3.甲、乙、丙、丁四名同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:建立的回归模型拟合效果最好的同学是()A.甲B.乙C.丙D.丁解析:相关指数R2越大,表示回归模型的效果越好.答案:A
探究一探究二探究三当堂检测4.下表是某工厂6~9月份用电量(单位:万度)的一组数据:答案:14.5
探究一探究二探究三当堂检测5.某个服装店经营某种服装,在某周内获纯利y(单位:元),与该周每天销售这种服装件数x之间的一组数据关系见表:
探究一探究二探究三当堂检测
探究一探究二探究三当堂检测(3)列出残差表如下:所以残差的平方和为0.392+(-1.36)2+(-2.11)2+1.142+4.392+0.642+(-3.11)2=37.1072.
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)