广东省高考数学第二轮复习 专题七 概率与统计 文
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
专题七 概率与统计真题试做1.(2012·课标全国高考,文3)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( ).A.-1B.0C.D.12.(2012·广东高考,文13)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为__________.(从小到大排列)3.(2012·辽宁高考,文11)在长为12cm的线段AB上任取一点C.现作一矩形,邻边长分别等于线段AC,CB的长,则该矩形面积大于20cm2的概率为( ).A.B.C.D.4.(2012·广东高考,文17)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5考向分析从近三年的高考试题来看,概率统计一般是1+1的模式,一大一小.几何概型是高考一个新的热点,并且它是一个重要的知识交会点,通常会把几何概型与线性规划、解析几何以及其他数学知识综合起来进行考查,且重点考查“长度型”和“面积型”,主要以填空题、选择题的形式出现,试题难度为中、低档,所占分值为5分左右.古典概型是考查的热点,经常在解答题中与统计一起考查,属中、低档题,以考查基本概念为主,同时注重运算能力与逻辑推理能力的考查.而对于统计方面的考查,主要是考查分层抽样、系统抽样的有关计算或三种抽样方法的区别以及茎叶图,频率分布表,频率分步直方图的识图及运用.考查概率与统计知识点的高考试题,既有自身概念的思想体现,如:样本估计总体的思想、假设检验的思想;又有必然与或然思想、函数与方程思想和数形结合思想.热点例析热点一 随机抽样和用样本估计总体【例1】-10-\n(2012·四川高考,文3)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( ).A.101 B.808 C.1212 D.2012【例2】(2012·山东高考,文14)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为__________.规律方法(1)解答与抽样方法有关的问题的关键是深刻理解各种抽样方法的特点、适用范围和实施步骤,熟练掌握系统抽样中被抽个体号码的确定方法,掌握分层抽样中各层人数的计算方法.(2)与频率分布直方图、茎叶图有关的问题,应正确理解图表中各个量的意义,通过图表掌握信息是解决该类问题的关键.(3)在做茎叶图或读茎叶图时,首先要弄清楚“茎”和“叶”分别代表什么,正确求出数据的众数和中位数;方差越小,数据越稳定.特别提醒:频率分布直方图中的纵坐标为,而不是频率值.变式训练1(2012·湖南高考,文13)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数)热点二 变量的相关性和统计案例【例3】(2012·福建高考,文18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元88.28.48.68.89销量y/件908483807568(1)求回归直线方程=x+,其中=-20,=-;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)规律方法解决线性回归问题的关键是:(1)正确理解计算,的公式并准确的计算,若对数据作适当的预处理,可避免对大数字进行运算;(2)分析两个变量的相关关系时,可根据样本数据作散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.变式训练2某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程=x+;-10-\n(2)利用(1)中所求出的直线方程预测该地2013年的粮食需求量.热点三 古典概型与几何概型【例4】(2012·湖北高考,文10)如图,在圆心角为直角的扇形OAB中,分别以OA,OB为直径作两个半圆.在扇形OAB内随机取一点,则此点取自阴影部分的概率是( ).A.-B.C.1-D.规律方法(1)解决古典概型问题的关键是①正确求出基本事件总数和所求事件包含的基本事件数.②P(A)=既是古典概型的定义,又是求概率的计算公式,应熟练掌握.(2)解决几何概型的关键是寻找试验的全部结果构成的区域和事件发生时构成的区域,有时需要设出变量,在坐标系中表示所需要的区域.(3)若事件正面情况比较多、反面情况较少,则一般利用对立事件进行计算.对于“至少”、“至多”等事件的概率计算,往往用这种方法求解.变式训练3(1)有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为( ).A. B. C. D.(2)如图,矩形ABCD中,点E为边CD的中点,若在矩形ABCD内部随机取一个点Q,则点Q取自△ABE内部的概率等于( ).A.B.C.D.热点四 概率统计综合问题【例5】(2012·北京高考,文17)近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾”箱“可回收物”箱“其他垃圾”箱厨余垃圾400100100可回收物3024030其他垃圾202060(1)试估计厨余垃圾投放正确的概率;(2)试估计生活垃圾投放错误的概率;(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a,b,c,其中a>0,a+b+c=600.当数据a,b,c的方差s2最大时,写出a,b,c的值(结论不要求证明),并求此时s2的值.(注:s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为数据x1,x2,…,xn的平均数)规律方法1.抽样方法和概率问题的综合一般是从分层抽样开始,设置分层抽样中的一些计算问题,然后就分层抽样中各个层设置一个古典概型计算问题.虽然此类题目所考查的知识横跨两部分,但是分解开来后,并不难解决.-10-\n由于此类题目多与实际问题联系紧密,题干较长,信息量大,且会有图表,因此要认真审题并要掌握解答题目所需的知识.要做到:(1)分层抽样中的公式运用要准确.①抽样比==.②层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量.(2)在计算古典概型概率时,基本事件的总数要计算准确.2.频率分布与概率的综合主要有两种形式:(1)题目中给出了样本的频率分布表,它反映了样本在各个组内的频数和频率,要求根据频率分布表画出频率分布直方图,并根据样本在各组的频数,设置分层抽样和概率计算等.(2)利用频率与概率的关系,频率近似于概率,给出某类个体中的一个个体被抽中的概率,从而求出样本容量及其他类个体的数量.在解决此类问题时,可将题目中所给概率作为此类个体被抽中的频率,从而求解.变式训练4某河流上的一座水力发电站,每年六月份的发电量Y(单位:万千瓦时)与该河上游在六月份的降雨量X(单位:毫米)有关.据统计,当X=70时,Y=460;X每增加10,Y增加5.已知近20年X的值为:140,110,160,70,200,160,140,160,220,200,110,160,160,200,140,110,160,220,140,160.(1)完成如下的频率分布表近20年六月份降雨量频率分布表降雨量70110140160200220频率(2)假定今年六月份的降雨量与近20年六月份降雨量的分布规律相同,并将频率视为概率,求今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率.思想渗透数形结合思想——解决有关统计问题(1)通过频率分布直方图和频数条形图研究数据分布的总体趋势;(2)根据样本数据散点图确定两个变量是否存在相关关系.解答时注意的问题:(1)频率分布直方图中的纵坐标为,而不是频率值;(2)注意频率分布直方图与频数条形图的纵坐标的区别.为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如下:-10-\n(1)估计该校男生的人数;(2)估计该校学生身高在170~185cm之间的概率;(3)从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm之间的概率.解:(1)样本中男生人数为40,由分层抽样比例为10%估计全校男生人数为400.(2)由统计图知,样本中身高在170~185cm之间的学生有14+13+4+3+1=35人,样本容量为70,所以样本中学生身高在170~185cm之间的频率f==0.5,故由f估计该校学生身高在170~185cm之间的概率P1=0.5.(3)样本中身高在180~185cm之间的男生有4人,设其编号为①,②,③,④,样本中身高在185~190cm之间的男生有2人,设其编号为⑤,⑥,从上述6人中任取2人的树状图为:故从样本中身高在180~190cm之间的男生中任选2人的所有可能结果数为15,至少有1人身高在185~190cm之间的可能结果数为9,因此,所求概率P2==.1.(2012·湖南高考,文5)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( ).A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg2.要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( ).A.①简单随机抽样法,②系统抽样法B.①分层抽样法,②简单随机抽样法C.①系统抽样法,②分层抽样法D.①②都用分层抽样法3.(2012·湖北高考,文2)容量为20的样本数据,分组后的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数234542则样本数据落在区间[10,40)的频率为( ).A.0.35B.0.45C.0.55D.0.654.设不等式组表示的平面区域为D,在区域D内随机取一个点,则此点到坐标原点的距离大于2的概率是( ).A.B.C.D.5.(2012·浙江五校联考,文11)为了分析某同学在班级中的数学学习情况,统计了该同学在6次月考中的数学名次,用茎叶图表示如图所示:,则该组数据的中位数为__________.-10-\n6.(2012·广东广州一模,文17)某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图的频率分布直方图.(1)求图中实数a的值;(2)若该校高一年级共有学生640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[40,50)与[90,100)两个分数段内的学生中随机选取两名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率.7.(2012·广东深圳二模,文17)设函数f(x)=x2+bx+c,其中b,c是某范围内的随机数,分别在下列条件下,求事件A“f(1)≤5且f(0)≤3”发生的概率.(1)若随机数b,c∈{1,2,3,4};(2)已知随机函数Rand()产生的随机数的范围为{x|0≤x≤1},b,c是算法语句b=4Rand()和c=4Rand()的执行结果.(注:符号“”表示“乘号”)参考答案命题调研·明晰考向真题试做1.D 解析:样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1.2.1,1,3,3 解析:设该组数据依次为x1≤x2≤x3≤x4,则=2,=2,∴x1+x4=4,x2+x3=4.∵x1,x2,x3,x4∈N+,∴或或又∵标准差为1,∴x1=1,x2=1,x3=3,x4=3.3.C 解析:此概型为几何概型,由于在长为12cm的线段AB上任取一点C,因此总的几何度量为12,满足矩形面积大于20cm2的点在C1与C2之间的部分,如图所示.因此所求概率为,即,故选C.4.解:(1)依题意得,10(2a+0.02+0.03+0.04)=1,解得a=0.005.(2)这100名学生语文成绩的平均分约为:55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.(3)数学成绩在[50,60)的人数为:100×0.05=5,数学成绩在[60,70)的人数为:100×0.4×=20,数学成绩在[70,80)的人数为:100×0.3×=40,数学成绩在[80,90)的人数为:100×0.2×-10-\n=25,所以数学成绩在[50,90)之外的人数为:100-5-20-40-25=10.精要例析·聚焦热点热点例析【例1】B 解析:四个社区抽取的总人数为12+21+25+43=101,由分层抽样可知,=,解得N=808.故选B.【例2】9 解析:由于组距为1,则样本中平均气温低于22.5℃的城市频率为0.10+0.12=0.22.平均气温低于22.5℃的城市个数为11,所以样本容量为=50.而平均气温高于25.5℃的城市频率为0.18,所以,样本中平均气温不低于25.5℃的城市个数为50×0.18=9.【变式训练1】6.8 解析:∵==11,∴s2==6.8.【例3】解:(1)由于=(x1+x2+x3+x4+x5+x6)=8.5,=(y1+y2+y3+y4+y5+y6)=80,所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-202+361.25,当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.【变式训练2】解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,为此对数据预处理如下:年份-2006-4-2024需求量-257-21-1101929对预处理后的数据,容易算得=0,=3.2,===6.5,=-=3.2.由上述计算结果,知所求回归直线方程为-257=(x-2006)+=6.5(x-2006)+3.2,即=6.5(x-2006)+260.2.①(2)利用直线方程①,可预测2013年的粮食需求量为:6.5×(2013-2006)+260.2=6.5×7+260.2=305.7(万吨)≈306(万吨).【例4】C 解析:设OA=OB=2R,连接AB-10-\n,如图所示,由对称性可得,阴影的面积就等于直角扇形拱形的面积,S阴影=π(2R)2-×(2R)2=(π-2)R2,S扇=πR2,故所求的概率是=1-.【变式训练3】(1)A 解析:记三个兴趣小组分别为1,2,3,甲参加1组记为“甲1”,则基本事件为“甲1,乙1;甲1,乙2;甲1,乙3;甲2,乙1;甲2,乙2;甲2,乙3;甲3,乙1;甲3,乙2;甲3,乙3”,共9个.记事件A为“甲、乙两位同学参加同一个兴趣小组”,则事件A包含“甲1,乙1;甲2,乙2;甲3,乙3”,共3个.因此P(A)==.(2)C 解析:由题意知,可设事件A为“点Q落在△ABE内”,构成试验的全部结果为矩形ABCD内所有点,事件A为△ABE内的所有点,又因为E是CD的中点,所以S△ABE=AD×AB,S矩形ABCD=AD×AB,所以P(A)=.【例5】解:(1)厨余垃圾投放正确的概率约为==.(2)设生活垃圾投放错误为事件A,则事件表示生活垃圾投放正确.事件的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P()约为=0.7,所以P(A)约为1-0.7=0.3.(3)当a=600,b=c=0时,s2取得最大值.因为=(a+b+c)=200,所以s2=×[(600-200)2+(0-200)2+(0-200)2]=80000.【变式训练4】解:(1)在所给数据中,降雨量为110毫米的有3个,为160毫米的有7个,为200毫米的有3个,故近20年六月份降雨量频率分布表为降雨量70110140160200220频率(2)P(“发电量低于490万千瓦时或超过530万千瓦时”)=P(Y<490或Y>530)=P(X<130或X>210)=P(X=70)+P(X=110)+P(X=220)=++=.故今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率为.创新模拟·预测演练1.D 解析:D选项中,若该大学某女生身高为170cm,则可断定其体重约为:0.85×170-85.71=58.79kg.故D不正确.-10-\n2.B 解析:①中总体由差异明显的几部分构成,宜采用分层抽样法,②中总体中的个体数较少,宜采用简单随机抽样法,故选B.3.B 解析:样本数据落在区间[10,40)的频数为2+3+4=9,故所求的频率为=0.45.4.D 解析:题目中表示的区域为如图所示的正方形,而动点D可以存在的位置为正方形面积减去四分之一圆的面积部分,因此P=,故选D.5.18.5 解析:由茎叶图知中间两位数为18和19,所以中位数为=18.5.6.解:(1)由于图中所有小矩形的面积之和等于1,所以10×(0.005+0.01+0.02+a+0.025+0.01)=1,解得a=0.03.(2)根据频率分布直方图,成绩不低于60分的频率为1-10×(0.005+0.01)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学成绩不低于60分的人数约为640×0.85=544.(3)成绩在[40,50)分数段内的人数为40×0.05=2,分别记为A,B.成绩在[90,100]分数段内的人数为40×0.1=4,分别记为C,D,E,F.若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取两名学生,则所有的基本事件有:(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F)共15种.如果两名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这两名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100]分数段内,那么这两名学生的数学成绩之差的绝对值一定大于10.记“这两名学生的数学成绩之差的绝对值不大于10”为事件M,则事件M包含的基本事件有:(A,B),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F)共7种.所以所求概率为P(M)=.7.解:由f(x)=x2+bx+c知,事件A“f(1)≤5且f(0)≤3”,即(1)因为随机数b,c∈{1,2,3,4},所以共等可能地产生16个数对(b,c),列举如下:(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4).事件A:包含了其中6个数对(b,c),即(1,1),(1,2),(1,3),(2,1),(2,2),(3,1).所以P(A)==,即事件A发生的概率为.(2)由题意,b,c均是区间[0,4]中的随机数,产生的点(b,c)均匀地分布在边长为4的正方形区域Ω中(如图),其面积S(Ω)=16.-10-\n事件A:所对应的区域为如图所示的梯形(阴影部分),其面积为:S(A)=×(1+4)×3=.所以P(A)===,即事件A的发生概率为.-10-
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)