大纲版数学高考名师一轮复习教案平面向量1010统计microsoftword文档doc高中数学
资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。
10.10抽样方法总体分布的估计一、明确复习目标 1.会用随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本2.会用样本频率分布去估计总体分布3.了解正态分布的意义及主要性质4.了解线性回归的方法和简单应用二.建构知识网络1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.⑴简单随机抽样的特点:逐个抽取,不放回抽样,各个个体被抽到的概率相等.简单随机抽样方法是其他更复杂抽样方法的根底.(2)简单随机抽样的两种方法:①抽签法:编号写签,搅拌均匀,逐个抽取.先后抽取概率均等.抽签法简便易行,适用于个体数不太多总体. ②随机数表法:“三步曲”:第一步,将总体中的个体编号;第二步,选定开场的数字;第三步,获取样本号码18/18\n2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个局部,然后按预先定出的规那么,从每一局部抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:(总体中的个体的个数为N,样本容量为n)①采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等②确定分段(局部)的间隔k当是整数时,k=;当不是整数时,先从总体中用简单随机抽样剔除一些个体,使剩下的总体中个体数能被n整除,取k=.③在第一段用简单随机抽样确定起始的个体编号.④按照事先确定的规那么抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,……)与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.可以证明:当n不能整除N时,先刎除的个体与其它个体一样,被抽的概率也是1/N.3.分层抽样:18/18\n当已知总体由差异明显的几局部组成时,为了使样本更充分地反映总体的情况,常将总体分成几局部,然后按照各局部所占的比例进展抽样,这种抽样叫做分层抽样,所分成的局部叫做层.简单随机抽样,系统抽样,分层抽样都是等概率抽样,简单随机抽样是根底,系统抽样的第一局部和分层抽样的每一层都采用简单随机抽样.随机抽样、系统抽样、分层抽样都是不放回抽样4.频率分布:用样本估计总体,是研究统计问题的根本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.5.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进展了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.总体分布是不易知道的,通常用“样本频率分布估计总体分布”,这是统计的根本思想方法,样本容量越大,估计越准确.总体密度曲线baxOy6.总体密度曲线:如果ξ是连续型随机变量,就把ξ的取值区间分组,当样本容量无限增大,分组的组距无限缩小,各组的频率就越接近于总体在相应各组取值的概率,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.18/18\n它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。 总体分布密度密度曲线函数y=f(x)的两条根本性质: ①f(x)≥0(x∈R);②由曲线y=f(x)与x轴围成面积为1。7.正态分布:象测量的误差、产品的尺寸等总体分布密度曲线可用,(σ>0,-∞<x<∞)近似表示,这样的分布中正态分布,记为,f(x)叫正态分布密度函数.其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.(1)正态分布由参数μ、σ唯一确定,如果随机变量~N(μ,σ2),根据定义有:μ=E,σ=D。(2)正态曲线具有以下性质:①在x轴的上方,与x轴不相交。②关于直线x=μ对称。③在x=μ时位于最高点。18/18\n④当x<μ时,曲线上升;当x>μ时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。⑤当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。8.标准正态曲线:当μ=0、σ=l时,叫标准正态总体,分布密度函数:,(-∞<x<+∞),相应的曲线叫标准正态曲线.标准正态总体N(0,1)中,总体取值小于的概率,P(x<x0)=Φ(x0),当x0>0时,可由标准正态分布表查得.当时,;Φ(0)=0.5..任何正态分布的概率问题均可通过转化成标准正态总体.9.假设检验的思想:小概率事件不能发生——假设某种指标服从正态分布N(μ,σ2);(2)确定一次试验中的取值a;(2)作出统计推断:假设a∈(μ-3σ,μ+3σ),那么承受假设,假设a(μ-3σ,μ+3σ),那么拒绝假设.10.线性回归:18/18\n变量与变量之间的关系大致可分为为两类:确定的函数关系,和不确定的相关关系,不确定的两变量之间也有规律可循,回归分析就是研究这种相关关系的一种数理统计方法.如果n组数据(x1,y1),(x2,y2),……(xn,yn)对应的点大致分布在一条直线附近,这条直线就叫回归直线,方程为,其中a、b是待定系数.,, ,三、双基题目练练手1.一个容量为n的样本,分成假设干组,已知某数的频数和频率分别为40、0.125,那么n的值为()A.640B.320C.240D.1602.(2022江苏)某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,那么|x-y|的值为()(A)1 (B)2 (C)3 (D)43.(2022重庆)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为岁-18岁的男生体重(㎏),得到频率分布直方图如下:根据上图可得这100名学生中体重在的学生人数是()18/18\n(A)20(B)30(C)40(D)504.某厂生产的零件外直径ξ~N(8.0,1.52)(mm),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9mm和7.5mm,那么可认为A.上、下午生产情况均为正常B.上、下午生产情况均为异常C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常5.随机变量ξ~N(0,1),如果P(ξ<1)=0.8413,那么P(-1<ξ<0)=_______.6.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:(表中单位是千元)广告费1.04.06.010.014.018/18\n销售额19.044.040.052.053.0现要使销售额到达6万元,那么需广告费用为______.(保存两位有效数字)◆答案:1-4.BDCC;4.根据3σ原那么,在8+3×1.5=8.45,与8-3×1.5=7.55,之外时为异常.答案:C;5.P(-1<ξ<0)=P(0<ξ<1)=Φ(1)-Φ(0)=0.8413-0.5=0.3413.6.先求出回归方程=bx+a,令=6,得x=1.5万元.答案:1.5万元四、经典例题做一做【例1】某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为=.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1≤k≤8),那么在其余组中分别抽取第k+8n(n=1,2,3,…,19)号,此时每个个体被抽到的概率为.18/18\n(3)分层抽样法:按比例=,分别在一级品、二级品、三级品、等外品中抽取48×=6个,64×=8个,32×=4个,16×=2个,每个个体被抽到的概率分别为,,,,即都是.综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是.点评:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取表达了公平性和客观性.yaox3x21【例2】设随机变量ξ的概率密度函数为,求(1)常数a的值;(2)P(ξ<2)及F(x)=P(ξ<x)解(1)f(1)=a,f(3)=0,如图,密度曲线与x轴围成三角形面积.(2)f(2)=,f(ξ<2)=.F(x)=P(ξ<x)=【例3】将温度调节器放置在贮存着某种液体的容器内,调节器设定在d℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N(d,0.52).18/18\n(1)假设d=90°,求ξ<89的概率;(2)假设要保持液体的温度至少为80℃的概率不低于0.99,问d至少是多少?(其中假设η~N(0,1),那么Φ(2)=P(η<2)=0.9772,Φ(-2.327)=P(η<-2.327)=0.01).分析:需转化为标准正态分布的数值.解:(1)P(ξ<89)=F(89)=Φ()=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d满足0.99≤P(ξ≥80),即1-P(ξ<80)≥1-0.01,∴P(ξ<80)≤0.01.∴Φ()≤0.01=Φ(-2.327).∴≤-2.327.∴d≤81.1635.故d至少为81.1635.◆提炼方法:(1)假设ξ~N(μ,σ),那么η=~N(0,1).(2)标准正态分布的密度函数f(x)是偶函数,x<0时,f(x)为增函数,x>0时,f(x)为减函数.【例4】(2022湖北)在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布N(70,100)。已知成绩在90分以上(含90分)的学生有12名。(Ⅰ)试问此次参赛的学生总数约为多少人?18/18\n(Ⅱ)假设该校方案奖励竞赛成绩排在前50名的学生,试问设奖的分数约为多少分?可供查阅的(局部)标准正态分布表x001234567891.20.88490.88690.88880.89070.89250.89440.89620.89800.89970.90151.30.90320.90490.90660.90820.90990.91150.91310.91470.91620.91771.40.91920.92070.92220.92360.92510.92650.92780.92920.93060.93191.90.97130.97190.97260.97320.97380.97440.97500.97560.97620.97672.00.97720.97780.97830.97880.97930.97980.98030.98080.98120.98172.10.98210.98260.98300.98340.98380.98420.98460.98500.98540.9857解:(1)设参赛学生的分布数为ξ,因为ξ~N(70,100),由条件知:这说明成绩在90分以上(含90分)的学生人数约占全体参赛人数的2.28%因此,参赛总人数约为(2)假定设奖的分数线为分,那么即,查表得,解得故设奖的分数线约为83分.【研讨.欣赏】设有一样本x1,x2,…,xn,其标准差为sx,另有一样本y1,y2,…,yn,其中yi=3xi+2(i=1,2,…,n),其标准差为sy,求证:sy=3sx.18/18\n证明:∵=,∴====3+2.∴sy2=[(y12+y22+…+yn2)-n2]=[(3x1+2)2+(3x2+2)2+…+(3xn+2)2-n(3+2)2]=[9(x12+x22+…+xn2)+12(x1+x2+…+xn)+4n-n(92+12+4)]=[(x12+x22+…+xn2)-n2]=9sx2.∵sx≥0,sy≥0,∴sy=3sx.五.提炼总结以为师1、理解三种抽样方法的特点;2、用样本的频率去估计总体分布;3、正态分布的意义、主要性质及应用;4、了解线性回归的方法,会求线性回归方程。同步练习10.10抽样方法总体分布的估计【选择题】1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,那么某特定个体入样的概率是18/18\nA.B.C.D.2.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后效劳情况,记这项调查为②.那么完成①、②这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法分析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.3.(2022年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为()A.0.6hB.0.9hC.1.0hD.1.5h4..如果随机变量ξ~N(μ,σ2),且Eξ=3,Dξ=1,18/18\n那么P(-1<ξ≤1)等于()A.2Φ(1)-1B.Φ(4)-Φ(2)C.Φ(2)-Φ(4)D.Φ(-4)-Φ(-2)【填空题】5.(2022全国)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进展检验,这三种型号的轿车依次应抽取______辆、______辆、______辆.6.(2022全国Ⅱ)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如以以下图)。为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,那么在(元)月收入段应抽出_____人。◆练习简答:1-4.CBBB;3.一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即=0.9h.,答案:B18/18\n4.对正态分布,μ=Eξ=3,σ2=Dξ=1,故P(-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2).答案:B5.分层抽样,抽样比例为=,分别有6辆、30辆、10辆;6.25人.【解答题】7.某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为=.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1≤k≤8),那么在其余组中分别抽取第k+8n(n=1,2,3,…,19)号,此时每个个体被抽到的概率为.(3)分层抽样法:按比例=,分别在一级品、二级品、三级品、等外品中抽取48×=6个,64×=8个,32×=4个,16×=2个,每个个体被抽到的概率分别为,,,,即都是.18/18\n综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是.评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取表达了公平性和客观性.8.已知连续型随机变量ε的概率密度函数,且f(x)≥0,求常数k的值,并计算概率P(1.5≤ε<2.5)。 分析:但凡计算连续型随机变量ε的密度函数f(x)中的参数、概率P(a≤ε≤b)都需要通过求面积来转化而求得。假设f(x)≥0且在[a,b]上为线性,那么P(a≤ε≤b)的值等于以b-a为高,f(a)与f(b)为上、下底的直角梯形的面积,即。解:∵∴; 9.一投资者在两个投资方案中选择一个,这两个投资方案的利润x18/18\n(万元)分别服从正态分布N(8,32)和N(6,22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?解:对第一个方案,有x~N(8,32),于是P(x>5)=1-P(x≤5)=1-F(5)=1-Φ()=1-Φ(-1)=1-[1-Φ(1)]=Φ(1)=0.8413.对第二个方案,有x~N(6,22),于是P(x>5)=1-P(x≤5)=1-F(5)=1-Φ()=1-Φ(-0.5)=Φ(0.5)=0.6915.相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案.10.公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ξ~N(173,72)(cm),问车门应设计多高?解:设公共汽车门的设计高度为xcm,由题意,需使P(ξ≥x)<1%.∵ξ~N(173,72),∴P(ξ≤x)=Φ()>0.99.查表得>2.33,∴x>189.31,即公共汽车门的高度应设计为190cm,可确保99%以上的成年男子头部不跟车门顶部碰撞.【探索题】已知测量误差ξ~N(2,100)(cm),必须进展多少次测量,才能使至少有一次测量误差的绝对值不超过8cm的频率大于0.9?解:设η表示n次测量中绝对误差不超过8cm的次数,那么η~B(n,p).其中P=P(|ξ|<8)=Φ()-Φ()=Φ(0.6)-1+Φ(1)=0.7258-1+0.8413=0.5671.18/18\n由题意,∵P(η≥1)>0.9,n应满足P(η≥1)=1-P(η=0)=1-(1-p)n>0.9,∴n>==2.75.因此,至少要进展3次测量,才能使至少有一次误差的绝对值不超过8cm的概率大于0.9.18/18
版权提示
- 温馨提示:
- 1.
部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
- 2.
本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
- 3.
下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
- 4.
下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)