高考数学总复习 10-3相关关系、回归分析与独立性检验 新人教B版
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
10-3相关关系、回归分析与独立性检验基础巩固强化1.(文)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )A.=-10x+200 B.=10x+200C.=-10x-200D.=10x-200[答案] A[解析] 由于销售量y与销售价格x成负相关,故x的系数应为负,排除B、D;又当x=10时,A中y=100,C中y=-300显然C不合实际,故排除C,选A.(理)(2012·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg[答案] D[解析] 本题考查线性回归方程.D项中身高为170cm时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系.2.(2012·东北三校模拟)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算χ2=7.069,则所得到的统计学结论是:有( )的把握认为“学生性别与支持活动有关系”.( )A.0.1% B.1%C.99%D.99.9%附:P(χ2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828[答案] C[解析] 由题意得,从给出的附表中可得P(χ2≥6.635)=0.010,又7.069∈(6.635,10.828),所以有99%的把握性认为学生性别与支持该活动有关系,故选C.14\n3.(2012·新课标全国,3)在一组样本数据(x1,y1)、(x2,y2)、…、(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )A.-1B.0C.D.1[答案] D[解析] 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1.要注意理清相关系数的大小与相关性强弱的关系.4.(2012·广州市检测)某中学高三从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x+y的值为( )A.7 B.8 C.9 D.10[答案] B[解析] 由茎叶图得,甲班学生的平均分是=85,解得x=5.因为乙班学生成绩的中位数是83,故只有80+y=83,解得y=3.所以x+y=8.故选B.5.(文)(2011·山东文,8)某产品的广告费用x与销售额y的统计数据如下表广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )A.63.6万元B.65.5万元C.67.7万元D.72.0万元14\n[答案] B[解析] 此题必须明确回归直线方程过定点(,).易求得=3.5,=42,则将(3.5,42)代入=x+中得:42=9.4×3.5+,即=9.1,则=9.4x+9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5万元.(理)(2012·石家庄市二模)从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x(cm)160165170175180体重y(kg)6366707274根据上表可得回归直线方程=0.56x+,据此模型预报身高为172cm的高三男生的体重为( )A.70.09kgB.70.12kgC.70.55kgD.71.05kg[答案] B[解析] ==170,==69.∵回归直线过点(,),∴将点(170,69)代入=0.56x+中得=-26.2,∴回归直线方程=0.56x-26.2,代入x=172cm,则其体重为70.12kg.6.(2011·山东烟台一模、江西吉安质检)下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(t)与相应的生产能耗y(t)的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,那么表中t的值为( )A.3B.3.15C.3.5D.4.5[答案] A[解析] 样本中心点是(,),即(4.5,).因为回归直线过该点,所以14\n=0.7×4.5+0.35,解得t=3.7.(2011·合肥模拟)已知x、y之间的一组数据如下表:x13678y12345对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=x+1与l2:y=x+,利用最小二乘法判断拟合程度更好的直线是________(填l1或l2).[答案] l2[解析] 用y=x+1作为拟合直线时,所得y值与y的实际值的差的平方和为s1=;用y=x+作为拟合直线时,所得y值与y的实际值的差的平方和为s2=.∵s2<s1,故用直线y=x+拟合程度更好.8.(2012·浙江调研)某工厂对一批元件进行了抽样检测,根据抽样检测后的元件长度(单位:mm)数据绘制了频率分布直方图(如图).若规定长度在[97,103)内的元件是合格品,则根据频率分布直方图估计这批产品的合格率是________.[答案] 80%[解析] 依题意,可估计这批产品的合格率是1-(0.0275×2+0.0450)×2=80%.9.以下四个命题:①从匀速传递的产品生产流水线上,质检员每20min从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;14\n④对分类变量X与Y,它们的随机变量χ2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.其中正确命题的序号是________.[答案] ②③10.(2012·扬州模拟)为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩:数学888311792108100112物理949110896104101106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;(2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理性建议.[解析] (1)=100+=100;=100+=100;∴s==142,s=,从而s>s,∴物理成绩更稳定.(2)由于x与y之间具有线性相关关系,根据回归系数公式得到==≈0.5,=-=100-0.5×100=50,∴回归直线方程为=0.5x+50.当y=115时,x=130,即该生物理成绩达到115分时,他的数学成绩大约为130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.能力拓展提升11.(2012·东北三校联考)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算χ2=7.069,则所得到的统计学结论是:有( )的把握认为“学生性别与是否支持该活动有关系”.14\nP(χ2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A.0.1%B.1%C.99%D.99.9%[答案] C[解析] 因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与是否支持该活动有关系”,选C.12.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程为=3-5x,变量x增加一个单位时,y平均增加5个单位;③线性相关系数r和相关指数R2都是描述线性相关强度的量,r和R2越大,相关强度越强.④在一个2×2列联表中,计算得χ2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( )A.0 B.1 C.2 D.3本题可以参考独立性检验临界值表:P(χ2≥k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(χ2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828[答案] C[解析] 方差反映的是波动大小的量,故①正确;②中由于-5<0,故应是负相关,当x每增加1个单位时,y平均减少5个单位,∴②错误;相关系数r是描述线性相关强度的量,|r|越接近于1,相关性越强,在线性相关的两个变量的回归直线方程中,R2是描述回归效果的量,R2越大,模型的拟合效果越好,故③错误;④显然正确.13.(2012·湖南文,13)下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.14\n(注:方差s2=[(x1-)2-(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)[答案] 6.8[解析] 本题考查茎叶图、方差的概念.由茎叶图知==11,∴s2=[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.814.(2011·辽宁文,19)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙.(1)假设n=2,求第一大块地都种植品种甲的概率;(2)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在各小块地的每公顷产量(单位:kg/hm2)如下表:品种甲403397390404388400412406品种乙419403412418408423400413分别求出品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?附:样本数据x1,x2,…,xn的样本方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为样本平均数.[解析] (1)设第一大块地中的两小块地编号为1,2,第二大块地中的两小块地编号为3,4.令事件A=“第一大块地都种品种甲”.从4块小地中任选2小块地种植品种甲的基本事件共6个:(1,2),(1,3),(1,4),(2,3),(2,4),(3,4).而事件A包含1个基本事件:(1,2).所以P(A)=.(2)品种甲的每公顷产量的样本平均数和样本方差分别为:甲=(403+397+390+404+388+400+412+406)=400s=(32+(-3)2+(-10)2+42+(-12)2+02+122+62)=57.25.品种乙的每公顷产量的样本平均数和样本方差分别为:14\n乙=(419+403+412+418+408+423+400+413)=412.s=(72+(-9)2+02+62+(-4)2+112+(-12)2+12)=56.由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.15.(2011·福建普通高中质检)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本中的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.甲班(A方式)乙班(B方式)总计成绩优秀成绩不优秀总计附:K2=(此公式也可写成χ2=P(χ2≥k)0.250.150.100.050.025k1.3232.0722.7063.8415.024[解析] (1)设“抽出的两个均‘成绩优秀’”为事件A.14\n从不低于86分的成绩中随机抽取2个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共15个.而事件A包含基本事件:(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共10个.所以所求概率为P(A)==.(2)由已知数据得甲班(A方式)乙班(B方式)总计成绩优秀156成绩不优秀191534总计202040根据列联表中数据,χ2=≈3.137,由于3.137>2.706,所以有90%的把握认为“成绩优秀”与教学方式有关.16.(文)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程=bx+a,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?14\n(注:b=,a=-b)[解析] (1)散点图如图.(2)由表中数据得iyi=52.5,=3.5,=3.5,=54,∴b=0.7.∴a=1.05.∴=0.7x+1.05.回归直线如图所示.(3)将x=10代入回归直线方程得,y=0.7×10+1.05=8.05(小时),∴预测加工10个零件需要8.05小时.(理)(2012·河南新乡、许昌、平顶山调研)在某医学实验中,某实验小组为了分析某药物用药量与血液中某种抗体水平的关系,选取六只实验动物进行血检,得到如下资料:动物编号123456用药量x(单位)134568抗体指标y(单位)3.43.73.84.04.24.3记s为抗体指标标准差,若抗体指标落在(-s,+s14\n)内,则称该动物为有效动物,否则称为无效动物.研究方案规定先从六只动物中选取两只,用剩下的四只动物的数据求线性回归方程,再对被选取的两只动物数据进行检验.(1)求选取的两只动物都是有效动物的概率;(2)若选取的是编号为1和6的两只动物,且利用剩余四只动物的数据求出y关于x的线性回归方程为=0.17x+a,试求出a的值;(3)若根据回归方程估计出的1号和6号动物抗体指标数据与检验结果误差都不超过抗体指标标准差,则认为得到的线性回归方程是可靠的.试判断(2)中所得线性回归方程是否可靠.参考公式:样本数据x1,x2,…,xn的标准差:S=,其中为样本平均数.[解析] (1)=3.9,s≈0.31.故1、6号为无效动物,2、3、4、5号为有效动物.记从六只动物中选取两只为事件A.所有可能结果为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15种.满足题意的有(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)共6种.故P(A)==.(2)对于2、3、4、5号动物,=4.5,=3.925,代入=0.17x+a得a=3.16.(3)由=0.17x+3.16得1=3.33,6=4.52.误差e1=0.07,e6=0.22,均比标准差s≈0.31小,故(2)中回归方程可靠.1.(2011·济南模拟)对于回归分析,下列说法错误的是( )A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.回归分析中,如果r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)[答案] D[解析] ∵相关系数|r|≤1,∴D错.2.(2012·湖北武汉市训练)已知一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a714\n成等比数列,则此样本的平均数和中位数分别是( )A.13,12B.13,13C.12,13D.13,14[答案] B[解析] 设数列{an}的公差为d,由a1,a3,a7成等比数列,得a=a1a7,则82=(8-2d)(8+4d),解得d=0(舍去)或d=2.故a1=a3-2d=4,an=a1+(n-1)d=2n+2.故此样本数据的平均数为==13,中位数为==13.3.有甲、乙两个班级进行数学考试,按照大于等于85分的优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )参考公式:χ2=附表:P(χ2≥k)0.0500.0100.001k3.8416.63510.828A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”[答案] C[解析] 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到K2=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确.4.某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:14\n年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.[答案] 13 正[解析] 找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,年平均收入增多时,年平均支出也增多,因此两者正相关.5.考察黄烟经过药物处理跟发生青花病的关系,得到如下数据,在试验的470珠黄烟中,经过药物处理的黄烟有25珠发生青花病,60株没有发生青花病.未经过药物处理的有185株发生青花病,200株没有发生青花病,试推断药物处理跟发生青花病是否有关系.[解析] 由已知得到下表经药物处理未经药物处理合计患青花病25185210无青花病60200260合计85385470根据公式k2=≈9.788.由于9.788>7.879,所以我们有99.5%的把握认为经过药物处理跟发生青花病是有关系的.6.(2011·湖南六校联考)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x(℃)1011131286就诊人数y(人)222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;14\n(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程=bx+a;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b=,a=-b.)[解析] 将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为Ω={(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)}中共15个基本事件,设抽到相邻两个月的事件为A,则A={(1,2),(2,3),(3,4),(4,5),(5,6)}中共5个基本事件,∴P(A)==.(2)由表中数据求得=11,=24,由参考公式可得b=,再由a=-b求得a=-,所以y关于x的线性回归方程为=x-.(3)当x=10时,=,|-22|=<2;同样,当x=6时,=,|-12|=<2.所以,该小组所得线性回归方程是理想的.14
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)