第3讲成对数据的统计分析1.在用经验回归方程研究四组数据的拟合效果时,分别作出下列四个关于四组数据的残差图,则用线性回归模型拟合效果最佳的是( A )ABCD解析 用残差图判断模型的拟合效果时,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合效果越好.故选A.2.[全国卷Ⅰ]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到如图所示的散点图.由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( D )A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx解析 由散点图可以看出,随着温度x的增加,发芽率y增加到一定程度后,变化率越来越慢,符合对数型函数的图象特征.3.[2024江苏徐州模拟]如图,在一组样本数据A(2,2),B(4,3),C(6,4),D(8,7),E(10,6)的散点图中,若去掉D(8,7),则下列说法正确的为( D )A.样本相关系数r变小B.残差平方和变大C.决定系数R2变小
D.自变量x与因变量y的相关程度变强解析 由散点图分析可知,只有D点偏离直线较远,去掉D点后,x与y的线性相关程度变强,且为正相关,所以样本相关系数r变大,决定系数R2变大,残差平方和变小,故选D.4.[2024青岛市检测]已知某设备的使用年限x(年)与年维护费用y(千元)的对应数据如下表:x24568y34.56.57.59由所给数据分析可知:x与y之间具有线性相关关系,且y关于x的经验回归方程为y=1.05x+a,则a=( B )A.0.75B.0.85C.0.95D.1.05解析 由题意可知x=2+4+5+6+85=5,y=3+4.5+6.5+7.5+95=6.1,则6.1=1.05×5+a,所以a=6.1-1.05×5=0.85,故选B.5.[多选/2024九江模拟]根据最小二乘法,由一组样本点(xi,yi)(其中i=1,2,…,300)求得的经验回归方程是y=b^x+a,则下列说法正确的是( BD )A.至少有一个样本点落在经验回归直线y=b^x+a上B.若所有样本点都在经验回归直线y=b^x+a上,则变量间的相关系数为±1C.对所有的解释变量xi(i=1,2,…,300),b^xi+a的值一定与yi有误差D.若经验回归直线y=b^x+a的斜率b^>0,则变量x与y正相关解析 经验回归直线必过样本点的中心,但样本点可能都不在经验回归直线上,故A错误;若所有样本点都在经验回归直线y=b^x+a上,则变量间的相关系数为±1,故B正确;若所有的样本点都在经验回归直线y=b^x+a上,则b^xi+a的值与yi相等,故C错误;相关系数r与b^符号相同,若经验回归直线y=b^x+a的斜率b^>0,则r>0,样本点散布在从左下角到右上角的区域,则变量x与y正相关,故D正确.故选BD.6.[多选/2024贵州统考]某学校高三年级甲、乙两班共105人进行了一次数学测试.按照成绩大于或等于120分(满分150分)的同学评价为“优秀生”,其他分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,“优秀生”的概率为27,根据表(2)的数据,可断定下列说法正确的是( BC ) 表(1)单位:人班级成绩合计优秀生潜力生
甲班10b乙班c30合计105表(2)α0.050.010.001xα3.8416.63510.828A.列联表中c的值为30,b的值为35B.列联表中c的值为20,b的值为45C.根据列联表中的数据,有95%的把握认为成绩与班级有关D.根据列联表中的数据,没有95%的把握认为成绩与班级有关解析 因为在这105人中随机抽取1人,“优秀生”的概率为27,所以“优秀生”的人数为105×27=30,“潜力生”的人数为105-30=75,所以c=30-10=20,b=75-30=45,故A错B对;因为χ2=105×(10×30-20×45)230×75×50×55≈6.109>3.841,所以有95%的把握认为成绩与班级有关,故C对D错.故选BC.7.[多选/2024云南师大附中月考]已知变量x,y之间的经验回归方程为y=10.3-0.7x,且变量x,y的数据如表所示,则下列说法正确的是( BC )x681012y6m32A.变量x与y正相关B.实数m的值为5C.该经验回归直线必过点(9,4)D.相应于(10,3)的残差为0.3解析 由表格数据得,x=6+8+10+124=9,y=6+m+3+24=11+m4,将点(9,11+m4)代入经验回归方程y=10.3-0.7x得,11+m4=10.3-0.7×9,解得m=5,所以选项B正确;11+m4=4,即样本点的中心为(9,4),所以选项C正确;当变量x增加时,变量y相应值减少,两个变量负相关,所以选项A错误;由残差的定义知,观测值减去预测值为残差,由经验回归方程y=10.3-0.7x,令x=10,得预测值y=3.3,则相应于(10,3)的残差为3-3.3=-0.3,所以选项D错误.故选BC.8.[2024海南月考]某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:单位:人性别专业合计
非统计专业统计专业男131023女72027合计203050为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844,因为