第2讲用样本估计总体1.[命题点1/2023重庆名校联考]从2,3,4,5,6,7,8,9中随机取两个数,这两个数一个比m大,一个比m小的概率为514,已知m为上述数据的第x百分位数,则x的取值可能为( C )A.50B.60C.70D.80解析 因为514=1028=C21C51C82,所以m=4或m=7.当m=4时,数据的第x百分位数是第3个数据,则2<x%×8<3,解得25<x<37.5,所有选项都不符合;当m=7时,数据的第x百分位数是第6个数据,则5<x%×8<6,解得62.5<x<75,故C选项符合题意.2.[命题点2/多选/2023济南市统考]有一组样本数据x1,x2,…,xn,其平均数为x.现加入一个新数据xn+1,且xn+1<x,组成新的样本数据x1,x2,…,xn,xn+1,与原样本数据相比,新的样本数据可能( BD )A.平均数不变B.众数不变C.极差变小D.第20百分位数变大解析 x=1n(x1+x2+…+xn),新的样本数据的平均数x新=1n+1x1+x2+…+xn+xn+1=1n+1(nx+xn+1)<1n+1(nx+x)=x,故A错误.新增的数据xn+1可能等于原样本数据的众数,故B正确.当xn+1比原样本数据中最小的数据还小时,会改变极差,且极差变大;当xn+1不比最小的数据小时,就不会改变极差,故C错误.20%n≠20%(n+1),因此,第20百分位数可能会变大,故D正确.故选BD.3.[命题点2,4/2023潍坊市高三统考]若一组样本数据x1,x2,…,xn的平均数为10,另一组样本数据2x1+4,2x2+4,…,2xn+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为( A )A.17,54B.17,48C.15,54D.15,48解析 设样本数据x1,x2,…,xn的平均数为x,则x=10,所以样本数据2x1+4,2x2+4,…,2xn+4的平均数为2x1+4+2x2+4+…+2xn+4n=2(x1+x2+…+xn)+4nn=2×n×x+4nn=2x+4=24,所以将两组样本数据合并为一组样本数据后的平均数为10n+24n2n=17.又样本数据2x1+4,2x2+4,…,2xn+4的方差为1n{[2x1+4-(2x+4)]2+[2x2+4-(2x+4)]2+…+[2xn+4-(2x+4)]2}=4n[(x1-x)2+(x2-x)2+…+(xn-x)2]=8,所以1n[(x1-x)2+(x2-x)2+…+(xn-x)2]=2,即样本数据x1,x2,…,xn的方差为2,所以将两组样本数据合并为一组样本数据后的方差为12×2+17-102+12×8+17-242=54,故选A.
4.[命题点3/2021全国卷乙]某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和s22.(1)求x,y,s12,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s12+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解析 (1)由表格中的数据易得:x=-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.310+10.0=10.0,y=0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.510+10.0=10.3,s12=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得y-x=10.3-10.0=0.3,而2s12+s2210=25(s12+s22)=0.0304,显然有y-x>2s12+s2210成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.5.[命题点4/2023广州市调研]为调查某地区中学生每天的睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为( B )A.0.96B.0.94C.0.79D.0.75解析 由题知,样本数据中,初中生人数m=800,每天睡眠时间的平均数x=9,方差s12=1;高中生人数n=1200,每天睡眠时间的平均数y=8,方差s22=0.5.估计该地区中学生每天睡眠时间的平均数w=mx+nym+n=800×9+1200×8800+1200=8.4,方差s2=m[s12+(x-w)2]+n[s22+(y-w)2]m+n=800×[1+(9-8.4)2]+1200×[0.5+(8-8.4)2]800+1200=0.94,故选B.