首页

数学导航2022届高考数学大一轮复习第十章统计统计案例与算法初步同步练习文

资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。

1/59

2/59

剩余57页未读,查看更多内容需下载

【数学导航】2022届高考数学大一轮复习第十章统计、统计案例与算法初步同步练习文第一节 随机抽样1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.三种抽样方法类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等,均属于不放回抽样从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽样各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成两种抽样的步骤(1)系统抽样的步骤①先将总体的N个个体编号;②确定分段间隔k(k∈N*),对编号进行分段.当(n是样本容量)是整数时,取k=;③在第1段用简单随机抽样确定第1个个体编号l(l≤k);④按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加上k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.(2)分层抽样的步骤①分层:按某种特征将总体分成若干部分;②按比例确定每层抽取个体的个数;③各层分别按简单随机抽样或系统抽样的方法抽取个体;59\n④综合每层抽样,组成样本.1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)分层抽样就是按比例抽样.(  )(2)简单随机抽样是一种不放回抽样.(  )(3)简单随机抽样每个个体被抽到的机会不一样,与先后有关.(  )(4)系统抽样在起始部分抽样时采用简单随机抽样.(  )(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(  )答案: (1)√ (2)√ (3)× (4)√ (5)×2.(2022·江西卷)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为(  )7816657208026314070243699728019832049234493582003623486969387481                A.08 B.07C.02 D.01解析: 由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.答案: D3.(2022·广东卷)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为(  )A.50 B.40C.25 D.20解析: 由=25,可得分段的间隔为25.故选C.答案: C4.(2022·湖北卷)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.解析: 设乙设备生产的产品总数为x件,则甲设备生产的产品总数为(4800-x)件.由分层抽样特点,结合题意可得=,解得x=1800.答案: 180059\n5.为了解1200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为________.解析: 在系统抽样中,确定分段间隔k,对编号进行分段,k=(N为总体的容量,n为样本的容量),∴k===40.答案: 40简单随机抽样1.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为(  )A. B.C. D.解析: 由题意知=,∴n=28.∴P==.答案: B2.下列抽取样本的方式是简单随机抽样的有________个.①从无限多个个体中抽取50个个体作为样本;②箱子里有100支铅笔,今从中选取10支进行检验.在抽样操作时,从中任意拿出一支检测后再放回箱子里;③从50个个体中一次性抽取5个个体作为样本.解析: ①不满足样本的总体数较少的特点;②不满足不放回抽取的特点;③不满足逐个抽取的特点.答案: 0 解决简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.59\n系统抽样1.(2022·湖南卷)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样的三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则(  )A.p1=p2<p3 B.p2=p3<p1C.p1=p3<p2 D.p1=p2=p3解析: 根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样,每个个体被抽到的概率都是p=,故p1=p2=p3,故选D.答案: D2.(2022·陕西卷)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为(  )A.11 B.12C.13 D.14解析: 抽样间隔为=20.设在1,2,…,20中抽取号码x0(x0∈[1,20]),在[481,720]之间抽取的号码记为20k+x0,则481≤20k+x0≤720,k∈N*.∴24≤k+≤36.∵∈,∴k=24,25,26,…,35,∴k值共有35-24+1=12(个),即所求人数为12.答案: B 解决系统抽样应注意的问题(1)适合元素个数较多且均衡的总体;(2)各个个体被抽到的机会均等;(3)样本的第一个个体用简单随机抽样.分层抽样1.(2022·重庆卷)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为(  )A.100 B.150C.200 D.25059\n解析: 法一:由题意可得=,解得n=100,故选A.法二:由题意,抽样比为=,总体容量为3500+1500=5000,故n=5000×=100.答案: A2.某高中在校学生有2000人.为了响应“阳光体育运动”的号召,学校开展了跑步和登山比赛活动.每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:高一年级高二年级高三年级跑步abc登山xyz其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取(  )A.36人 B.60人C.24人 D.30人解析: 根据题意可知样本中参与跑步的人数为200×=120,所以从高二年级参与跑步的学生中应抽取的人数为120×=36.答案: A 分层抽样问题的解题策略(1)确定抽样比.可依据各层总数与样本数之比,确定抽样比.(2)求某一层的样本数或总体个数.可依题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数.(3)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.A级 基础训练1.(2022·大连市第一次模拟)某学校礼堂有30排座位,每排有20个座位,一次心理讲座时礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的30名学生.这里运用的抽样方法是(  )A.抽签法 B.随机数表法59\nC.系统抽样 D.分层抽样解析: 抽30名学生分了30组(每排为一组),每组抽一个,符合系统抽样的定义,故选C.答案: C2.某班级有男生20人,女生30人,从中抽取10人作为样本,恰好抽到了4个男生、6个女生,则下列命题正确的是(  )A.该抽样可能是简单随机抽样B.该抽样一定不是系统抽样C.该抽样中女生被抽到的概率大于男生被抽到的概率D.该抽样中女生被抽到的概率小于男生被抽到的概率解析: 本题看似是一道分层抽样的题,实际上每种抽样方法都可能出现这个结果,故B不正确.根据抽样的等概率性知C,D不正确.答案: A3.800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号,求得间隔数k==16,即每16人抽取一个人.在1~16中随机抽到一个数,如果抽到的是7,则从33~48这16个数中应取的数是(  )A.40 B.39C.38 D.37解析: 按系统抽样分组,33~48这16个数属第3组,则这一组应抽到的数是7+2×16=39.答案: B4.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为(  )A.101 B.808C.1212 D.2012解析: 由题意知抽样比为,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有=,解得N=808.答案: B59\n5.(2022·上海松江期末考试)某市共有400所学校,现要用系统抽样的方法抽取20所学校作为样本,调查学生课外阅读的情况.把这400所学校编上1~400的号码,再从1~20中随机抽取一个号码,如果此时抽得的号码是6,则在编号为21到40的学校中,应抽取的学校的编号为(  )A.25 B.26C.27 D.以上都不是解析: 系统抽样是把个体编号后,先抽取第一个,然后每次间隔相同的数依次抽取,本题中每次间隔20,第一个抽取的是6号,接下来应该抽取的是26号,故选B.答案: B6.(2022·天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析: 由分层抽样的特点可得应该从一年级本科生中抽取×300=60(名)学生.答案: 607.(2022·江苏南通二调)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为________.解析: 根据系统抽样的特点,共有80个产品,抽取5个样品,则可得组距为=16,又其中有1个为28,则与之相邻的为12和44,故所取5个依次为12,28,44,60,76,即最大的为76.答案: 768.某市有A、B、C三所学校,共有高三文科学生1500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为n的样本,进行成绩分析,若从B校学生中抽取40人,则n=________.解析: 设A、B、C三所学校学生人数分别为x、y、z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1500,所以y=500,用分层抽样方法抽取B校学生人数为×500=40,得n=120.答案: 1209.某初级中学共有学生2000名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373xy59\n男生377370z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?解析: (1)∵=0.19,∴x=380.(2)初三年级人数为y+z=2000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:×500=12名.10.一次数学模拟考试,共12道选择题,每题5分,共计60分,每道题有四个可供选择的答案,仅有一个是正确的.学生小张只能确定其中10道题的正确答案,其余2道题完全靠猜测回答.小张所在班级共有40人,此次考试选择题得分情况统计表如下:得分(分)4045505560百分率15%10%25%40%10%现采用分层抽样的方法从此班级抽取20人的试卷进行选择题质量分析.(1)应抽取多少张选择题得60分的试卷?(2)若小张选择题得60分,求他的试卷被抽到的概率.解析: (1)得60分的人数为40×10%=4.设抽取x张选择题得60分的试卷,则=,则x=2,故应抽取2张选择题得60分的试卷.(2)设小张的试卷为a1,另三名得60分的同学的试卷为a2,a3,a4,所有抽取60分试卷的方法为:(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4)共6种,其中小张的试卷被抽到的抽法共有3种,故小张的试卷被抽到的概率为P==.B级 能力提升1.在某大学数学专业的160名学生中开展一项社会调查,先将学生随机编号为01,02,03,…,160,采用系统抽样的方法抽取样本,已知抽取的学生中最小的两个编号为07,23,那么抽取的学生中最大编号应该是(  )A.150 B.151C.142 D.143解析: 由最小的两个编号为07,23可知,抽样间距为16,因此抽取人数的比例为59\n,即抽取10名学生,其编号构成首项为7,公差为16的等差数列,故抽取的学生中最大编号为7+9×16=151.答案: B2.一个总体中的80个个体编号为0,1,2,…,79,并依次将其分为8个组,组号为0,1,…,7,要用(错位)系统抽样的方法抽取一个容量为8的样本.即规定先在第0组随机抽取一个号码,记为i,依次错位地得到后面各组的号码,即第k组中抽取个位数字为i+k(当i+k<10)或i+k-10(当i+k≥10)的号码.在i=6时,所抽到的8个号码是________.解析: 由题意得,在第1组抽取的号码的个位数字是6+1=7,故应选17;在第2组抽取的号码的个位数字是6+2=8,故应选28,此次类推,应选39,40,51,62,73.答案: 6,17,28,39,40,51,62,733.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下35~50岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在35~50岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值.解析: (1)用分层抽样的方法在35~50岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m,∴=,解得m=3.抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2).∴从中任取2人,至少有1人学历为研究生的概率为.(2)由题意,得=,解得N=78.∴35~50岁中被抽取的人数为78-48-10=20,59\n∴==,解得x=40,y=5.即x,y的值分别为40,5.4.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.解析: 总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为×6=,技术员人数为×12=,技工人数为×18=,所以n应是6的倍数,36的约数,即n=6,12,18.由条件增加1人时知,只有n=6符合.第二节 用样本估计总体1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.统计图表的含义(1)频率分布表①含义:把反映总体频率分布的表格称为频率分布表.②频率分布表的画法步骤:第一步:求极差,决定组数和组距,组距=;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:能够反映样本的频率分布规律的直方图.(3)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边59\n的中点顺次连接起来,就得到频率分布折线图.(4)总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,即总体密度曲线.(5)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数.(3)平均数:把称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是s=s2=[(x1-)2+(x2-)2+…+(xn-)2]1.标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.2.众数、中位数和平均数的异同众数中位数平均数相同点都是描述一组数据集中趋势的量不同点与这组数据中的部分数据有关,出现在这些数据中不一定在这些数据中出现.奇数个时,在这组数值中出现;偶数时,为中间两数平均值不一定在这些数值中出现1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)在频率分布直方图中,小矩形的高表示频率.(  )(2)频率分布直方图中各个长方形的面积之和为1.(  )59\n(3)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(  )(4)茎叶图只适用数据为两位数字.(  )(5)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(  )答案: (1)× (2)√ (3)× (4)× (5)√2.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为(  )A.0.2 B.0.3C.0.4 D.0.5解析: 落在[114.5,124.5)内的样本数据为120,122,116,120,共4个,故所求频率为==0.4.答案: C3.(2022·广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为(  )A.200,20 B.100,20C.200,10 D.100,10解析: 该地区中小学生总人数为3500+2000+4500=10000,则样本容量为10000×2%=200,其中抽取的高中生近视人数为2000×2%×50%=20,故选A.答案: A4.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,________班的平均成绩较高.解析: 结合茎叶图中成绩的情况可知,乙班平均成绩较高.59\n答案: 乙5.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________;(2)命中环数的标准差为________.解析: (1)==7.(2)s2=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.答案: (1)7 (2)2样本的数字特征1.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有(  )A.a>b>c B.b>c>aC.c>a>b D.c>b>a解析: 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数b==15,众数c=17,则a<b<c.答案: D2.一个样本a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是(  )A.3 B.4C.5 D.6解析: 由x2-5x+4=0两根分别为1,4,∴有或.又a,3,5,7的平均数是b.即=b,=b,a+15=4b,∴符合题意,则方差s2=5,故选C.答案: C3.(2022·陕西卷)某公司10位员工的月工资(单位:元)为x1,x2,…,x1059\n,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为(  )A.,s2+1002 B.+100,s2+1002C.,s2 D.+100,s2解析: 法一:对平均数和方差的意义深入理解可巧解.因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D.法二:由题意知x1+x2+…xn=n,s2=[(x1-)2+(x2-)2+…+(xn-)2],则所求均值=[(x1+100)+(x2+100)+…+(xn+100)]=(n+n×100)=+100,而所求方差t2=[(x1+100-)2+(x2+100-)2+…+(xn+100-)2]=[(x1-)2+(x2-)2+…+(xn-)2]=s2,故选D.答案: D 众数、中位数、平均数及方差的意义及计算方法(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)平均数、方差的公式推广①若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.②数据x1,x2,…,xn的方差为s2.(ⅰ)数据x1+a,x2+a,…,xn+a的方差也为s2;(ⅱ)数据ax1,ax2,…,axn的方差为a2s2.(3)方差的简化计算公式s2=[(x+x+…+x)-n2],或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方.茎叶图(2022·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:59\n3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解析: (1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得=(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,=(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得>,因此可看出A药的疗效更好.(2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有的叶集中在茎“0.”,“1.”上,由此可看出A药的疗效更好.1.如图是根据《山东统计年鉴2022》中的资料做成的2022年至2022年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2022年至2022年我省城镇居民百户家庭人口的平均数为(  )A.304.6 B.303.6C.302.6 D.301.659\n解析: 由茎叶图可知,这一组数据的平均数==303.6.答案: B2.(2022·安徽省“江南十校”联考)一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为(  )A.8 B.5C.4 D.2解析: 甲、乙两班成绩按大小顺序排列,处在最中间的数分别为87、89,故它们之差的绝对值是2.答案: D 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据.频率分布直方图(2022·新课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)频数62638228(1)在下表作出这些数据的频率分布直方图:59\n(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析: (1)如图所示:(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为:s2=(-20)2×0.06+(-10)2×0.26+02×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.1.(2022·广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:(1)确定样本频率分布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率.解析: 59\n(1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n1=7,n2=2,所以f1===0.28,f2===0.08.(2)样本频率分布直方图如图.(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为0.2,设所取的4人中,日加工零件数落在区间(30,35]的人数为ξ,则ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.4096=0.5904,所以在该厂任取4人,至少有1人的日加工零件数落在区间(30,35]的概率为0.5904.2.(2022·重庆卷)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.解析: (1)据直方图知组距=10,由(2a+3a+6a+7a+2a)×10=1,解得a==0.005.(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2,成绩落在[60,70)中的学生人数为3×0.005×10×20=3.(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),其中2人的成绩都在[60,70)中的基本事件有3个:59\n(B1,B2),(B1,B3),(B2,B3),故所求概率为P=.3.(2022·黑龙江大庆一中第二次阶段考试)某班同学利用寒假在5个居民小区内选择两个小区逐户进行一次“低碳生活习惯”的调查,以计算每户的碳月排放量.若月排放量符合低碳标准的称为“低碳族”,否则称为“非低碳族”.若小区内有至少75%的住户属于“低碳族”,则称这个小区为“低碳小区”,否则称为“非低碳小区”.已知备选的5个居民小区中有三个非低碳小区,两个低碳小区.(1)求所选的两个小区恰有一个为“非低碳小区”的概率;(2)假定选择的“非低碳小区”为小区A,调查显示其“低碳族”的比例为,数据如图1所示,经过同学们的大力宣传,三个月后,又进行了一次调查,数据如图2所示,问这时小区A是否达到“低碳小区”的标准?解析: (1)设三个“非低碳小区”为B,C,D,两个“低碳小区”为m,n,则从5个小区中任选两个小区,所有可能的结果有10种,它们是(B,C),(B,D),(B,m),(B,n),(C,D),(C,m),(C,n),(D,m),(D,n),(m,n),恰有一个为“非低碳小区”的结果有(B,m),(B,n),(C,m),(C,n),(D,m),(D,n),共6种,故所求概率为P==.(2)由题图1可知月碳排放量不超过300千克的称为“低碳族”.由题图2可知,三个月后的“低碳族”的比例为0.07+0.23+0.46=0.76>0.75,所以三个月后小区A达到了“低碳小区”的标准. 解决频率分布直方图问题时要抓住:(1)直方图中各小长方形的面积之和为1.59\n(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.A级 基础训练1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是(  )A.0.05 B.0.25C.0.5 D.0.7解析: 由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为=0.7.答案: D2.(2022·山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )A.6 B.8C.12 D.18解析: 由题图可知,第一组和第二组的频率之和为(0.24+0.16)×1=0.40,故该试验共选取的志愿者有=50人.所以第三组共有50×0.36=18人,其中有疗效的人数为18-6=12.答案: C3.某地区为了解中学生的日平均睡眠时间(单位:h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图,如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n等于(  )59\nA.80 B.90C.100 D.110解析: 设第1个小长方形的面积为S,则4个小长方形的面积之和为,由题意知,4S+4××0.1=1,故S=0.1,又因为=0.1,所以n=100.答案: C4.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是(  )A.13,12 B.13,13C.12,13 D.13,14解析: 设等差数列{an}的公差为d(d≠0),a3=8,a1a7=(a3)2=64,(8-2d)(8+4d)=64,(4-d)(2+d)=8,2d-d2=0,又d≠0,故d=2,故样本数据为:4、6、8、10、12、14、16、18、20、22,平均数为==13,中位数为=13.答案: B5.甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,1、2分别表示甲、乙两名运动员这项测试成绩的平均数,s1、s2分别表示甲、乙两名运动员这项测试成绩的标准差,则有(  )A.1>2,s1<s2 B.1=2,s1=s2C.1=2,s1<s2 D.1=2,s1>s2解析: 1=15,2=15,s=,s=.答案: C59\n6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________、________.解析: 甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45.乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46.答案: 45 467.(2022·江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.解析: 由频率分布直方图可得树木底部周长小于100cm的频率是(0.025+0.015)×10=0.4,又样本容量是60,所以频数是0.4×60=24.答案: 248.(2022·湖北卷)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析: (1)根据频率和为1,得(0.0024+0.0036+0.0060+x+0.0024+0.0012)×50=1,解得x=0.0044;(2)(0.0036+0.0060+0.0044)×50×100=70.答案: (1)0.0044 (2)709.甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:59\n甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算两组数据的平均数;(2)分别计算两组数据的方差;(3)根据计算结果,估计一下两名战士的射击水平谁更好一些.解析: (1)甲=(8+6+7+8+6+5+9+10+4+7)=7,乙=(6+7+7+8+6+7+8+7+9+5)=7.(2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2]可求得s=3.0,s=1.2.(3)由甲=乙,说明甲、乙两战士的平均水平相当;又∵s>s,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.10.(2022·北京卷)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;59\n(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析: (1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是1-=0.9.从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)的有17人,频率为0.17,所以a===0.085.课外阅读时间落在组[8,10)的有25人,频率为0.25,所以b===0.125.(3)样本中的100名学生课外阅读时间的平均数在第4组.B级 能力提升1.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A、B两样本的下列数字特征对应相同的是(  )A.平均数 B.标准差C.众数 D.中位数解析: A样本数据的平均数=,B样本数据的平均数′=-5.A样本数据的方差s2=[(42-)2+(43-)2+…+(50-)2],B样本数据的方差s′2=[(42-)2+(43-)2+…+(50-)2],∴A、B两样本的标准差相同,故选B.答案: B2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为________.解析: 根据茎叶图,去掉1个最低分87,1个最高分99,则[87+94+90+91+90+(90+x)+91]=91,∴x=4.∴s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=.59\n答案: 3.(2022·通化模拟)某学科在市模考后从全年级抽出100名学生的学科成绩作为样本进行分析,得到样本频率分布直方图如图所示.(1)利用组中值估计该次考试该学科的平均成绩.(2)估计该学科成绩在[100,130)之间的概率.(3)为详细了解每题的答题情况,从样本中成绩在80~100之间的试卷中任选2份进行分析,求至少有1人成绩在80~90之间的概率.解析: (1)用每组的组中值作为该组的平均值,算得该次考试该学科的平均成绩为124.4分.(2)样本中学生成绩在[100,130)之间的频率为0.58,故由频率估计该学科成绩在[100,130)之间的概率P1=0.58.(3)样本中成绩在80~90之间有2人,设其编号为①②;样本中成绩在90~100之间有4人,设其编号为③④⑤⑥.从上述6人中任取2人的所有选取可能为:①②,①③,①④,①⑤,①⑥,②③,②④,②⑤,②⑥,③④,③⑤,③⑥,④⑤,④⑥,⑤⑥.故从样本中成绩在80~100之间任选2人所有可能结果数为15,至少有1人成绩在80~90之间可能结果数为9,因此,所求概率为P2=0.6.4.(2022·唐山调研)在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如茎叶图所示:(1)从甲、乙两人中选择一人参加数学趣味知识竞赛,你会选哪位?请运用统计学的知识说明理由;(2)从乙的6次成绩中随机选择2个成绩,试求选到123分的概率.解析: (1)甲==112,59\n乙==112,s=[(99-112)2+(107-112)2+(108-112)2+(115-112)2+(119-112)2+(124-112)2]=,s=[(102-112)2+(105-112)2+(112-112)2+(113-112)2+(117-112)2+(123-112)2]=,∴甲=乙,s>s,说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,则选择乙同学.(2)从6个成绩中随机选择2个,共有15个基本事件,分别是:{102,105},{102,112},{102,113},{102,117},{102,123},{105,112},{105,113},{105,117},{105,123},{112,113},{112,117},{112,123},{113,117},{113,123},{117,123},其中满足条件的基本事件有5个,故所求概率P==.第三节 变量间的相关关系、统计案例1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.4.了解回归分析的基本思想、方法及其简单应用.1.相关关系与回归方程(1)相关关系的分类:①正相关:从散点图上看,点散布在从左下角到右上角的区域内;②负相关:从散点图上看,点散布在从左上角到右下角的区域内.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.(3)回归方程:①59\n最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,则==,=-,其中,是回归方程的斜率,是在y轴上的截距.(4)样本相关系数:r=,用它来衡量两个变量间的线性相关关系.①当r>0时,表明两个变量正相关;②当r<0时,表明两个变量负相关.③r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于0.75时,认为两个变量有很强的线性相关性.2.独立性检验(1)2×2列联表假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)K2统计量:K2=.(其中n=a+b+c+d为样本容量)1.线性回归直线方程的求法求解回归方程关键是确定回归系数,,因求解的公式计算量太大,一般题目中给出相关的量,如,,,等,便可直接代入求解.充分利用回归直线过样本中心点(,),即有=+,可确定.59\n2.独立性检验思想的理解独立性检验的思想类似于反证法,即要确定“两个变量X与Y有关系”这一结论成立的可信度,首先假设结论不成立,即它们之间没有关系,也就是它们是相互独立的,利用概率的乘法公式可推知,(ad-bc)接近于零,也就是随机变量K2=应该很小,如果计算出来的K2的观测值k不是很小,通过查表P(K2≥k0)的概率很小.又根据小概率事件不可能发生,由此判断假设不成立,从而可以肯定地断言X与Y之间有关系.1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(  )(2)K2=.(  )(3)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.(  )(4)任何一组数据都对应着一个回归直线方程.(  )答案: (1)× (2)× (3)√ (4)×2.有关线性回归的说法,不正确的是(  )A.具有相关关系的两个变量是非确定关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.散点图中的点越集中,两个变量的相关性越强答案: D3.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”.(  )附:P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828                A.0.1% B.1%C.99% D.99.9%解析: 因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.答案: C59\n4.下面是一个2×2列联表y1y2总计x1a2173x222527总计b46则表中a、b处的值分别为________.解析: ∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案: 52、545.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析: 由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.答案: 0.254相关关系的判断1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  )A.-1 B.0C. D.1解析: 所有样本点均在直线上,则样本相关系数最大即为1,故选D.答案: D2.(2022·湖北卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;59\n④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是(  )A.①② B.②③C.③④ D.①④解析: 正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④,故选D.答案: D 1.函数关系中的两个变量间是一种确定性关系.例如,正方形面积S与边长x之间的关系S=x2就是函数关系.2.相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.例如,商品的销售额与广告费是相关关系.两个变量具有相关关系是回归分析的前提.线性回归方程(2022·新课标全国卷Ⅱ)某地区2022年至2022年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2022202220222022202220222022年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2022年至2022年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2022年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=-.解析: (1)由所给数据计算得=×(1+2+3+4+5+6+7)=4,=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(ti-)2=9+4+1+0+1+4+9=28,(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,59\n===0.5,=-=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3.(2)由(1)知,=0.5>0,故2022年至2022年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2022年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,故预测该地区2022年农村居民家庭人均纯收入为6.8千元.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程=x+,其中=-20,=-b;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解析: (1)由于=(8+8.2+8.4+8.6+8.8+9)=8.5,=(90+84+83+80+75+68)=80,又=-20,=-b=80+20×8.5=250,从而回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.59\n 求线性回归方程的基本步骤(1)先把数据制成表,从表中计算出、,x+x+…+x、x1y1+x2y2+…+xnyn的值;(2)计算回归系数,;(3)写出线性回归方程=x+.注:回归方程一定过点(,).独立性检验(2022·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(  )表1   成绩性别   不及格及格总计男61420女102232总计163652表2   视力性别   好差总计男41620女122032总计163652表3   智商性别   偏高正常总计男81220女82432总计16365259\n表4   阅读量性别   丰富不丰富总计男14620女23032总计163652A.成绩 B.视力B.智商 D.阅读量解析: 因为K==,K==,K==,K==,则K>K>K>K,所以阅读量与性别有关联的可能性最大.答案: D(2022·辽宁卷)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生10102059\n合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.解析: 将2×2列联表中的数据代入公式计算,得K2==≈4.762.由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. 独立性检验的一般步骤(1)根据样本数据制成2×2列联表;(2)根据公式K2=计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断.A级 基础训练1.已知变量x,y呈线性相关关系,线性回归方程为y=0.5+2x,则变量x,y是(  )A.线性正相关关系B.由回归方程无法判断其正负相关C.线性负相关关系D.不存在线性相关关系解析: 随着变量x增大,变量y有增大的趋势,则x,y称为正相关.答案: A2.(2022·重庆卷)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是(  )A.=0.4x+2.3 B.=2x-2.4C.=-2x+9.5 D.=-0.3x+4.4解析: 由正相关的理解可排除C,D,由回归直线方程恒过点(,),可知排除B.答案: A3.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:59\n气温(℃)181310-1山高(km)24343864由表中数据,得到线性回归方程=-2x+(∈R).由此估计山高为72(km)处气温的度数为(  )A.-10 B.-8C.-6 D.-4解析: ∵=10,=40,∴样本中心点为(10,40).∵回归直线过样本中心点,∴40=-20+,即=60,∴线性回归方程为=-2x+60,∴山高为72(km)处气温的度数为-6,故选C.答案: C4.(2022·山东东营模拟)已知变量x与y之间的回归直线方程为=-3+2x,若i=17,则i的值等于(  )A.3 B.4C.0.4 D.40解析: 依题意==1.7,而直线=-3+2x一定经过(,),所以=-3+2=-3+2×1.7=0.4,∴i=0.4×10=4.答案: B5.(2022·长春市第二次调研)以下四个命题:①在匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②若两个变量的线性相关性越强,则它们的相关系数的绝对值越接近于1;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④对分类变量X与Y的随机变量K2的观测值k来说,k越小,判断“X与Y有关系”的把握越大.其中真命题的序号是(  )59\nA.①④ B.②④C.①③ D.②③解析: ①应为系统(等距)抽样;②线性相关系数r的绝对值越接近于1,两变量间线性关系越强;③在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;④显然错误.故选D.答案: D6.(2022·忻州联考)已知x,y的取值如下表:x2345y2.23.85.56.5从散点图分析,y与x线性相关,且回归方程为=1.46x+,则实数的值为________.解析: ==3.5,==4.5,回归方程必过样本的中心点(,).把(3.5,4.5)代入回归方程,计算得=-0.61.答案: -0.617.(2022·厦门诊断)为考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据,则种子经过处理与是否生病________(填“有”或“无”)关.解析: 在假设无关的情况下,根据题意K2=≈0.16,可以得到无关的概率大于50%,所以种子经过处理跟是否生病有关的概率小于50%,所以可以认为种子经过处理与是否生病无关.答案: 无8.(2022·山东菏泽调研)某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查对临界值表知P(K2≥3.841)≈0.05.对此,四名同学做出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;59\ns:这种血清预防感冒的有效率为5%.则下列命题中,真命题的序号是________.(把你认为正确的命题序号都填上)①p∧¬q;②¬p∧q;③(¬p∧¬q)∧(r∨s);④(p∨¬r)∧(¬q∨s).解析: 由题意,得K2≈3.918,P(K2≥3.841)≈0.05,所以只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”.由真值表知①④为真命题.答案: ①④9.在综合素质评价的某个维度的测评中,依据评分细则,学生之间相互打分,最终将所有的数据合成一个分数.满分100分,按照大于等于80分为优秀,小于80分为合格.为了解学生在该维度的测评结果,从毕业班中随机抽出一个班的数据.该班共有60名学生,得到如下的列联表.优秀合格总计男生6女生18总计60已知在该班随机抽取1人测评结果为优秀的概率为.(1)请完成上面的列联表;(2)能否在犯错误的概率不超过0.10的前提下认为性别与测评结果有关系?解析: (1)优秀合格总计男生62228女生141822总计204060(2)提出统计假设:性别与测评结果没有关系,则K2=≈3.348>2.706.P(K2>2.706)<0.10.因此,在犯错误的概率不超过0.10的前提下认为“性别与测评结果有关系”.10.(2022·重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.59\n(1)求家庭的月储蓄y对月收入x的线性回归方程=x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程=x+中,=,=-,其中,为样本平均值.解析: (1)由题意知n=10,=i==8,=i==2,又lxx=-n2=720-10×82=80,lxy=iyi-n=184-10×8×2=24,由此得===0.3,=-=2-0.3×8=-0.4,故所求线性回归方程为=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).B级 能力提升1.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:P(K2≥k)0.100.050.025k2.7063.8415.024K2=59\n参照附表,得到的正确结论是(  )A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析: 由公式可计算K2的观测值k==≈3.03>2.706,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C.答案: C2.(2022·广东梅州一模)在2022年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.5m10.511销售量y11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程是:=-3.2x+40,且m+n=20,则其中的n=________.解析: ==8+,==6+,线性回归直线一定经过样本中心(,),即6+=-3.2+40,即3.2m+n=42,又∵m+n=20,即解得故n=10.答案: 103.(2022·安徽卷)某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.59\n附:K2=P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879解析: (1)300×=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2==≈4.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.4.为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下表格:日期4月1日4月7日4月15日4月21日4月30日温差x(℃)101113128发芽数y(颗)2325302616(1)从这5天中任选2天,记发芽的种子数分别为m,n,求事件“m,n均不小于25”的概率;(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y关于x的线性回归方程=x+;59\n(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:=,=-)解析: (1)所有的基本事件为(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共10个.设“m,n均不小于25”为事件A,则事件A包含的基本事件为(25,30),(25,26),(30,26),共3个.所以P(A)=.(2)由数据得,另3天的平均数=12,=27,3=972,32=432,iyi=977,=434,所以==,=27-×12=-3,所以y关于x的线性回归方程为=x-3.(3)依题意得,当x=10时,=22,|22-23|<2;当x=8时,=17,|17-16|<2,所以(2)中所得到的线性回归方程是可靠的.第四节 算法初步1.了解算法的含义,了解算法的思想.2.理解程序框图的三种基本逻辑结构:顺序结构、条件结构、循环结构.3.了解几种基本算法语句——输入语句、输出语句、赋值语句、条件语句、循环语句的含义.1.三种基本逻辑结构(1)顺序结构①59\n定义:由若干个依次执行的步骤组成的结构,这是任何一个算法都离不开的基本结构.②结构形式(2)条件结构①定义:算法的流程根据条件是否成立有不同的流向,条件结构就是处理这种过程的结构.②结构形式(3)循环结构①定义:从某处开始,按照一定的条件反复执行某些步骤的情况,这就是循环结构,反复执行的步骤称为循环体.②结构形式2.三种算法语句的格式与应用(1)输入语句、输出语句和赋值语句语句一般格式功能输入语句INPUT“提示内容”;变量输入信息输出语句PRINT“提示内容”;表达式输出常量、变量的值和系统信息赋值语句变量=表达式将表达式代表的值赋给变量(2)条件语句①功能:实现条件结构.②条件语句的格式及框图:59\na.IF-THEN格式b.IF-THEN-ELSE格式(3)循环语句①功能:实现程序框图中的循环结构.②循环语句的格式及框图:a.UNTIL语句      b.WHILE语句  程序框图的画法在画程序框图时首先要进行结构的选择.若所要解决的问题不需要分情况讨论,只用顺序结构就能解决;若所要解决的问题要分若干种情况讨论时,就必须引入条件结构;若所要解决的问题要进行许多重复的步骤,且这些步骤之间又有相同的规律时,就必须引入变量,应用循环结构.1.判断下面结论是否正确(请在括号中打“√”或“×”)(1)算法只能解决一个问题,不能重复使用.(  )(2)程序框图中的图形符号可以由个人来确定.(  )(3)输入框只能紧接开始框,输出框只能紧接结束框.(  )(4)条件结构的出口有两个,但在执行时,只有一个出口是有效的.(  )答案: (1)× (2)× (3)× (4)√2.阅读如图的程序框图,若输出的y=1,则输入的x的值可能是(  )59\nA.±和2 B.-和2C.± D.2解析: 由程序框图可知,当x>2时,log2x=1⇒x=2,舍去;当x≤2时,x2-1=1,x=±.答案: C3.(2022·全国卷Ⅰ)执行下面的程序框图,若输入的a,b,k分别为1,2,3,则输出的M=(  )A. B.C. D.解析: 当n=1时,M=1+=,a=2,b=;当n=2时,M=2+=,a=,b=;当n=3时,M=+=,a=,b=;59\nn=4时,终止循环,输出M=.答案: D4.如图是一个算法流程图,则输出的k的值是________.解析: 根据程序框图可知,k=1时,12-1×6+5≤0;k=2时,22-2×6+5≤0;k=3时,32-3×6+5≤0;k=4时,42-4×6+5≤0;k=5时,52-5×6+5≤0;k=6时,62-6×6+5>0.故输出的k的值是6.答案: 65.如图所示的框图,已知集合A={x|框图中输出的x值},集合B={y|框图中输出的y值},全集U=Z,Z为整数集,则当x=-1时,(綂UA)∩B=________.解析: 依题意得,当x=-1时,A={0,1,2,3,4,5,6},B={-3,-1,1,3,5,7,9},(綂UA)∩B={-3,-1,7,9}.答案: {-3,-1,7,9}顺序结构与条件结构1.阅读如图所示的程序框图,若输入的a,b,c分别是21,32,75,则输出的a,b,c分别是(  )59\nA.75,21,32 B.21,32,75C.32,21,75 D.75,32,21解析: 由程序框图中的各个赋值语句可得x=21,a=75,c=32,b=21,故a,b,c分别是75,21,32.答案: A2.(2022·四川卷)执行如图所示的程序框图,如果输入的x,y∈R,那么输出的S的最大值为(  )A.0 B.1C.2 D.3解析: 当时,由线性规划的图解法知,目标函数S=2x+y的最大值为2,否则,S的值为1,所以输出的S的最大值为2.答案: C 顺序结构和条件结构的应用(1)顺序结构顺序结构是最简单的算法结构,语句与语句之间、框与框之间是按从上到下的顺序进行的.(2)条件结构利用条件结构解决算法问题时,重点是判断框,判断框内的条件不同,对应的下一图框中的内容和操作要相应地进行变化,故要重点分析判断框内的条件是否满足.59\n循环结构(1)(2022·湖南卷)执行如图所示的程序框图,如果输入的t∈[-2,2],则输出的S属于(  )A.[-6,-2] B.[-5,-1]B.[-4,5] D.[-3,6](2)(2022·山东卷)执行如图所示的程序框图,若输入的x的值为1,则输出的n的值为________.解析: (1)由程序框图可知S是分段函数,且S=其值域为(-2,6]∪[-3,-1]=[-3,6],故选D.(2)12-4×1+3≤0,x=2,n=1;22-4×2+3≤0,x=3,n=2;32-4×3+3≤0,x=4,n=3;42-4×4+3>0,跳出循环,此时输出n=3.答案: (1)D (2)31.(2022·北京卷)执行如图所示的程序框图,则输出的S值为(  )59\nA.1 B.3C.7 D.15解析: 程序框图运行如下:k=0<3,S=0+20=1,k=1<3;S=1+21=3,k=2<3;S=3+22=7,k=3.输出S=7.答案: C2.(2022·北京西城一模)执行如图所示的程序框图,如果输入a=2,b=2,那么输出的a值为(  )A.4 B.16C.256 D.log316解析: log32>4不成立,执行第一次循环,a=22=4;log34>4不成立,执行第二次循环,a=42=16;log316>4=log334=log381不成立,执行第三次循环,a=162=256;log3256>4=log381成立,跳出循环体,输出a的值为256,故选C.答案: C3.已知某程序框图如图所示,当输入的x的值为5时,输出的y的值恰好是,则在空白的赋值框处应填入的关系式可以是(  )A.y=x3 B.y=xC.y=3x D.y=3-x59\n解析: 由程序框图可知,当输入的x的值为5时,第一次运行,x=5-2=3;第二次运行,x=3-2=1;第三次运行,x=1-2=-1,此时x≤0,退出循环,要使输出的y的值为,只有C中的函数y=3x符合要求.答案: C4.(2022·辽宁沈阳教学质量监测(五))如图所示的程序框图,则该程序框图表示的算法功能是(  )A.输出使1×2×4×…×i≥1000成立的最小整数iB.输出使1×2×4×…×i≥1000成立的最大整数iC.输出使1×2×4×…×i≥1000成立的最大整数i+2D.输出使1×2×4×…×i≥1000成立的最小整数i+2解析: 该程序框图表示的算法功能是输出使1×2×4×…×i≥1000成立的最小整数i+2,选D.答案: D5.已知实数a,b,c满足a+b+c=0,a2+b2+c2=1,则a的最大值为________.解析: 因为a+b+c=0,所以b+c=-a.因为a2+b2+c2=1,所以-a2+1=b2+c2=(b+c)2-2bc=a2-2bc,59\n所以2a2-1=2bc≤b2+c2=1-a2,所以3a2≤2,所以a2≤,所以-≤a≤.所以amax=.答案:  利用循环结构表示算法的步骤利用循环结构表示算法,第一要先确定是利用当型循环结构,还是利用直到型循环结构;第二要选择准确的表示累计的变量;第三要注意在哪一步开始循环,满足什么条件不再执行循环体.基本算法语句(2022·陕西卷)根据下列算法语句,当输入x为60时,输出y的值为(  )A.25 B.30C.31 D.61解析: 由算法语句读出其功能,进一步利用分段函数的解析式求函数值.由题意,得y=当x=60时,y=25+0.6×(60-50)=31.∴输出y的值为31.答案: C下列程序执行后输出的结果是________.解析: 程序反映出的算法过程为i=11⇒S=11×1,i=10;i=10⇒S=11×10,i=9;i=9⇒S=11×10×9,i=8;59\ni=8<9退出循环.执行“PRINTS”.故S=990.答案: 990 使用算法语句的注意点(1)输入、输出语句在输入、输出语句中加提示信息时,要加引号,变量之间用逗号隔开.(2)赋值语句左、右两边不能对换,赋值号左边只能是变量.(3)条件语句条件语句中包含条件语句时,要分清内外条件结构,保证结构完整性.(4)循环语句分清WHILE—WEND和DO—LOOPUNTIL的格式不能混用.A级 基础训练1.(2022·重庆卷)执行如图所示的程序框图,若输出k的值为6,则判断框内可填入的条件是(  )A.s> B.s>C.s> D.s>解析: 第一次执行循环:s=1×=,k=8,s=应满足条件;第二次执行循环:s=×=,k=7,s=59\n应满足条件,排除选项D;第三次执行循环:s=×=,k=6,正是输出的结果,故这时程序不再满足条件,结束循环,而选项A和B都满足条件,故排除A和B,故选C.答案: C2.(2022·河北唐山高三统一考试)执行如图所示的程序框图,则输出的n是(  )A.4 B.5C.6 D.7解析: 由程序框图可知x=1,a=1,b=1,不满足条件,n=2,x=0,a=1,b=0,不满足条件,n=3,x=-1,a=0,b=-1,不满足条件,n=4,x=-1,a=-1,b=-1,不满足条件,n=5,x=0,a=-1,b=0,不满足条件,n=6,x=1,a=0,b=1,符合条件,结束循环.故输出的n=6.答案: C3.(2022·河南三市第一次调研考试)如图给出的是计算++…+的值的一个程序框图,则图中判断框内和执行框中应填的语句分别是(  )A.i>100,n=n+1 B.i>100,n=n+2C.i>50,n=n+2 D.i≤50,n=n+2解析: 因为,,…,共50个数,所以程序框图应运行50次,所以变量i应满足i59\n>50,因为是求偶数的倒数和,所以应使变量n满足n=n+2,故选C.答案: C4.(2022·陕西卷)根据如图所示的框图,对大于2的整数N,输出的数列的通项公式是(  )A.an=2n B.an=2(n-1)C.an=2n D.an=2n-1解析: 由初始值的特征可知,输出的数列首项为2,又ai=2×S,S=ai,i=i+1,∴=2,则输出的数列是首项为2,公比为2的等比数列,则通项公式为an=2n.答案: C5.给出一个如图所示的程序框图,若要使输入的x值与输出的y值相等,则这样的x值的个数是(  )A.1 B.2C.3 D.4解析: 由程序框图得到如下分段函数:y=当x≤2时,y=x2=x,解得x1=0,x2=1;当2<x≤5时,y=2x-3=x,解得x=3;当x>5时,y==x,解得x=±1(舍去),59\n故x可为0,1,3.答案: C6.(2022·湖北七市联合考试)阅读如图所示的程序框图,则输出结果s的值为(  )A. B.C. D.解析: 程序在执行过程中,s,n的值依次为:s=1,n=1;s=1×cos,n=2;s=1×cos×cos,n=3;s=1×cos×cos×cos,n=4;s=1×cos×cos×cos×cos,n=5,输出s=1×cos×cos×cos×cos==.答案: D7.(2022·海淀区第二学期期中练习)李强用流程图把早上上班前需要做的事情做了如下几种方案,则所用时间最少的方案是________.方案一:方案二:方案三:59\n解析: 方案一所用时间为8+5+13+7+15+6=54.方案二所用时间为8+15+7=30.方案三所用时间为8+13+7=28.所以所用时间最少的是方案三.答案: 方案三8.(2022·浙江杭州一模)输入x=5,运行如图所示的程序之后得到的y等于________.解析: y=f(x)=∴f(5)=(5-1)2=16.答案: 169.关于函数f(x)=的流程图如图,现输入区间[a,b],则输出的区间是________.解析: 由程序框图的第一个判断条件为f(x)>0,当f(x)=cosx,x∈[-1,1]时满足.然后进入第二个判断框,需要解不等式f′(x)=-sinx≤0,即0≤x≤1.故输出区间为[0,1].答案: [0,1]59\n10.(2022·山东青岛3月质量检测)如图是某算法的程序框图,若任意输入[1,19]中的实数x,则输出的x大于49的概率为________.解析: 运行第一次得x=2x-1,n=2;运行第二次得x=2(2x-1)-1=4x-3,n=3;运行第三次得x=2(4x-3)-1=8x-7,n=4,结束循环,输出8x-7.由8x-7>49得x>7,所以当输入的x∈[1,19]时,输出的x大于49的概率为=.答案: B级 能力提升1.(2022·江西卷)阅读如下程序框图,运行相应的程序,则程序运行后输出的结果为(  )A.7 B.9C.10 D.11解析: i=1,S=0,第1次运行,S=0+lg=-lg3>-1;第2次运行,i=3,S=lg+lg=lg=-lg5>-1;第3次运行,i=5,S=lg+lg=lg=-lg7=-1;第4次运行,i=7,S=lg+lg=lg=-lg9>-1;第5次运行,i=9,S=lg+lg=lg=-lg11<-1,跳出循环,输出i=9.答案: B2.某程序框图如图所示,则该程序运行后输出的S的值为________.59\n解析: 依题意得,运行程序后输出的是数列{an}的第2013项,其中数列{an}满足:a1=1,an+1=.注意到a2=,a3=,a4=,a5=1,a6=,…,该数列中的项以4为周期重复性地出现,且2013=4×503+1,因此a2013=a1=1,运行程序后输出的S的值为1.答案: 13.(2022·成都模拟)已知某算法的程序框图如图所示,若将输出的(x,y)值依次记为(x1,y1),(x2,y2),…(xn,yn),…(1)若程序运行中输出的一个数组是(9,t),求t的值;(2)程序结束时,共输出(x,y)的组数为多少?解析: (1)由程序框图可知,当x=1时,y=0;当x=3时,y=-2;当x=9时,y=-4,所以t=-4.(2)当n=1时,输出一对,当n=3时,又输出一对,…,当n=2009时,输出最后一对,共输出(x,y)的组数为1005.59\n4.(2022·河南郑州市第二次预测)每年的三月十二日,是中国的植树节.林管部门在植树前,为保证树苗的质量,都会在植树前对树苗进行检测.现从甲、乙两种树苗中各抽测了10株树苗的高度,规定高于128厘米的树苗为“良种树苗”,测得高度如下(单位:厘米):甲:137,121,131,120,129,119,132,123,125,133;乙:110,130,147,127,146,114,126,110,144,146.(1)根据抽测结果,画出甲、乙两种树苗高度的茎叶图,并根据你填写的茎叶图,对甲、乙两种树苗的高度作比较,写出对两种树苗高度的统计结论;(2)设抽测的10株甲种树苗高度平均值为,将这10株树苗的高度依次输入按程序框图进行运算(如图),问输出的S大小为多少?并说明S的统计学意义.解析: (1)茎叶图如图所示:统计结论:①甲种树苗的平均高度小于乙种树苗的平均高度;②甲种树苗比乙种树苗长得更整齐;③甲种树苗高度的中位数为127,乙种树苗高度的中位数为128.5;④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近,乙种树苗的高度分布较为分散.(2)依题意,=127,S=35.S表示10株甲种树苗高度的方差,是描述树苗高度的离散程度的量.S值越小,表示树苗长得越整齐,S值越大,表示树苗长得越参差不齐.59\n59

版权提示

  • 温馨提示:
  • 1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
  • 2. 本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
  • 3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
  • 4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)

文档下载

发布时间:2022-08-25 16:20:06 页数:59
价格:¥3 大小:1.39 MB
文章作者:U-336598

推荐特供

MORE