首页

2024届高考数学一轮复习(新教材人教A版强基版)第九章统计与成对数据的统计分析9.4列联表与独立性检验课件

资源预览文档简介为自动调取,内容显示的完整度及准确度或有误差,请您下载后查看完整的文档内容。

1/85

2/85

3/85

4/85

剩余81页未读,查看更多内容需下载

§9.4列联表与独立性检验第九章统计与成对数据的统计分析 1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用.考试要求 内容索引第一部分第二部分第三部分落实主干知识探究核心题型课时精练 落实主干知识第一部分 1.分类变量为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示. 2.列联表与独立性检验(1)关于分类变量X和Y的抽样数据的2×2列联表:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d (2)计算随机变量χ2=,利用χ2的取值推断分类变量X和Y的方法称为χ2独立性检验.如表为5个常用的小概率值和相应的临界值.是否独立α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828 判断下列结论是否正确(请在括号中打“√”或“×”)(1)2×2列联表中的数据是两个分类变量的频数.()(2)事件A和B的独立性检验无关,即两个事件互不影响.()(3)χ2的大小是判断事件A和B是否相关的统计量.()(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.()×√×√ 由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是A.均值B.方差C.独立性检验D.回归分析√ A.27,38B.28,38C.27,37D.28,372.如表是2×2列联表,则表中a,b的值分别为√y1y2合计x1a835x2113445合计b4280a=35-8=27,b=a+11=27+11=38. 3.已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=________的χ2独立性检验,分析喜欢该项体育运动与性别有关.0.01因为6.635<7.235<10.828,所以根据小概率值α=0.01的χ2独立性检验,分析喜欢该项体育运动与性别有关. 探究核心题型第二部分 例1(1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:则a-b-c等于A.7B.8C.9D.10√题型一列联表与χ2的计算男女合计喜欢ab73不喜欢c25合计74 男女合计喜欢522173不喜欢222547合计7446120根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,补充完整2×2列联表为:∴a-b-c=52-21-22=9. 在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到χ2的值为A.1.255B.38.214C.0.0037D.2.058(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如表:√体育课不及格体育课及格合计文化课及格57221278文化课不及格164359合计73264337 2×2列联表是4行4列,计算时要准确无误,关键是对涉及的变量分清类别.思维升华 会外语不会外语合计男ab20女6d合计1850跟踪训练1某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中,a+b+d=________.44由题意得a+b+d+6=50,所以a+b+d=50-6=44. 每周使用次数1次2次3次4次5次6次及以上男866141660女1210881240合计2016142228100例2(2023·吉林模拟)共享单车是指企业与政府合作,在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供单车共享服务,是共享经济的一种新形态.为了研究广大市民共享单车的使用情况,某公司在某市随机抽取了200名用户进行调查,得到如下数据:单位:人题型二列联表与独立性检验 (1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成2×2列联表;单位:人不喜欢骑行共享单车喜欢骑行共享单车合计男女合计 由题中表格可得2×2列联表如下:单位:人不喜欢骑行共享单车喜欢骑行共享单车合计男2090110女306090合计50150200 (2)根据小概率值α=0.05的独立性检验,分析“喜欢骑行共享单车”是否与性别有关.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828 零假设为H0:“喜欢骑行共享单车”与性别无关.将2×2列联表中的数据代入公式计算得,所以根据小概率值α=0.05的独立性检验,推断H0不成立,即认为“喜欢骑行共享单车”与性别有关. 独立性检验的一般步骤(1)根据样本数据制成2×2列联表.思维升华(3)比较χ2与临界值的大小关系,作统计推断. 跟踪训练2为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:单位:人年龄段认知情况合计知晓不知晓A组(90后与00后)7525100B组(70后与80后)4555100合计12080200 (1)若从样本内知晓“绿色消费”意义的120人中用比例分配的分层随机抽样方法随机抽取16人,问应在A组、B组中各抽取多少人?α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828 (2)能否依据小概率值α=0.001的独立性检验,分析对“绿色消费”意义的认知情况与年龄有关? 零假设为H0:对“绿色消费”意义的认知情况与年龄无关.故依据小概率值α=0.001的独立性检验,推断H0不成立,即认为对“绿色消费”意义的认知情况与年龄有关. 例3体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(2020-2030)》(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1000名学生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,题型三独立性检验的综合应用 得到如表数据:数学成绩(分)[30,50)[50,70)[70,90)[90,110)[110,130)[130,150]人数(人)2512535030015050运动达标的人数(人)104514520010743约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前50%以内(含50%)的为“数学成绩达标”.(1)求该中学高三年级本次月考数学成绩的65%分位数; 每组的频率依次为0.025,0.125,0.350,0.300,0.150,0.050,∵0.025+0.125+0.350=0.500<0.65,0.025+0.125+0.350+0.300=0.800>0.65,高三年级本次月考数学成绩的65%分位数位于[90,110)内,且为[90,110)的中点100,该中学高三年级本次月考数学成绩的65%分位数为100. (2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值作代表);该中学高三年级本次月考数学成绩的平均分估计该中学高三年级本次月考数学成绩的平均分为91.50分. (3)请根据已知数据完成下列列联表,并根据小概率值α=0.001的独立性检验,分析“数学成绩达标”是否与“运动达标”相关.α0.0100.0050.001xα6.6357.87910.828数学成绩达标人数数学成绩不达标人数合计运动达标人数运动不达标人数合计 列联表如表所示:零假设为H0:“数学成绩达标”与“运动达标”无关,数学成绩达标人数数学成绩不达标人数合计运动达标人数350200550运动不达标人数150300450合计5005001000 ∴根据小概率值α=0.001的独立性检验,推断H0不成立,即认为“数学成绩达标”与“运动达标”有关. 独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往用小题的形式,而且χ2的公式一般会在原题中给出.思维升华 跟踪训练3某网红奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.(1)该公司经过初步判断,可用经验回归模型拟合y与x的关系,求y关于x的经验回归方程;x(个)23456y(十万元)2.5344.56 (2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.依据小概率值α=0.1的独立性检验,分析两个店的顾客下单率有无差异.x0.1=2.706. 零假设为H0:两个店的顾客下单率无差异,则由题意可知2×2列联表如表所示:不下单下单合计分店一25530分店二602080合计8525110 ∴根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,即两个店的顾客下单率没有差异. 课时精练第三部分 观察等高堆积条形图易知D选项两个分类变量之间关系最强.1.观察下列各图,其中两个分类变量x,y之间关系最强的是1234567891011121314√基础保分练 2.下列关于独立性检验的说法正确的是A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以100%确定两个变量之间是否具有某种关系C.利用χ2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为吸烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病D.对于独立性检验,随机变量χ2的值越小,判定“两变量有关系”犯错误的概率越大√1234567891011121314 对于A,独立性检验是通过卡方计算来判断两个变量存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;对于B,独立性检验并不能100%确定两个变量相关,故错误;对于C,99%是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟人中患肺病的发病率,故错误;对于D,根据卡方计算的定义可知该选项正确.1234567891011121314 下表是χ2独立性检验中几个常用的小概率值和相应的临界值:3.为了考察某种中成药预防流感的效果,抽样调查40人,得到如下数据:1234567891011121314药物流感患流感未患流感服用218未服用812α0.10.050.010.005xα2.7063.8416.6357.879 根据表中数据,计算χ2=,若由此认为“该药物预防流感有效果”,则该结论出错的概率不超过A.0.05B.0.1C.0.01D.0.005√α0.10.050.010.005xα2.7063.8416.6357.879药物流感患流感未患流感服用218未服用8121234567891011121314 由临界值表可知,认为“该药物预防流感有效果”,则该结论出错的概率不超过0.05.1234567891011121314 α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8284.(多选)(2022·郑州模拟)为考察一种新型药物预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的2×2列联表中,由列联表中的数据计算得χ2≈9.616.参照附表,下列结论正确的是附表:1234567891011121314 α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828A.根据小概率值α=0.001的独立性检验,分析认为“药物有效”B.根据小概率值α=0.001的独立性检验,分析认为“药物无效”C.根据小概率值α=0.005的独立性检验,分析认为“药物有效”D.根据小概率值α=0.005的独立性检验,分析认为“药物无效”√√1234567891011121314 1234567891011121314因为χ2≈9.616,所以7.879<χ2<10.828,所以根据小概率值α=0.001的独立性检验,分析认为“药物无效”.根据小概率值α=0.005的独立性检验,分析认为“药物有效”. 5.(多选)(2023·南通模拟)根据分类变量x与y的观察数据,计算得到χ2=2.974,依据表中给出的χ2独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是A.根据小概率值α=0.05的独立性检验,分析变量x与y相互独立B.根据小概率值α=0.05的独立性检验,分析变量x与y不相互独立C.变量x与y相互独立,这个结论犯错误的概率不超过0.1D.变量x与y不相互独立,这个结论犯错误的概率不超过0.11234567891011121314√√α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828 因为χ2=2.974>2.706,所以变量x与y不相互独立,这个结论犯错误的概率不超过0.1.1234567891011121314 营养品身高合计有明显增长无明显增长食用a1050未食用b3050合计60401006.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是1234567891011121314 参考数据:A.a=b=30B.χ2≈12.667C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是D.根据小概率值α=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响√1234567891011121314α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828 所以根据小概率值α=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响,所以B错误,D正确;从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是所以C错误.1234567891011121314由题可知a=50-10=40,b=50-30=20,所以A错误; 喜欢运动不喜欢运动合计男402868女51217合计4540857.如表是对于“喜欢运动”与性别是否有关的2×2列联表,依据表中的数据,得到χ2≈________(结果保留到小数点后3位).12345678910111213144.722 8.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:则χ2=________(精确到小数点后三位),依据概率值α=0.05的独立性检验,该实验________该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持).注意力稳定注意力不稳定男生297女生3350.538支持1234567891011121314 所以没有充分证据认为学生在注意力的稳定性上与性别有关,即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.由表中数据可知a=29,b=7,c=33,d=5,n=a+b+c+d=74,1234567891011121314 9.(2021·全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?1234567891011121314 一级品二级品合计甲机床15050200乙机床12080200合计2701304001234567891011121314 (2)依据小概率值α=0.01的独立性检验能否认为甲机床的产品质量与乙机床的产品质量有差异?1234567891011121314α0.050.010.001xα3.8416.63510.828 1234567891011121314零假设为H0:甲机床的产品质量与乙机床的产品质量无差异,根据题表中的数据可得所以依据小概率值α=0.01的独立性检验,推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异. 10.某花圃为提高某品种花苗质量,开展技术创新活动,A,B在实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a的值,并求综合评分的中位数;1234567891011121314 由直方图的性质可知,0.005×10+0.010×10+0.025×10+10a+0.020×10=1,解得a=0.040,因为(0.02+0.04)×10=0.6>0.5,所以中位数位于[80,90)内,设中位数为x,则有0.020×10+0.040×(90-x)=0.5,解得x=82.5.故综合评分的中位数为82.5.1234567891011121314 (2)填写下面的2×2列联表,并根据小概率值α=0.01的独立性检验,分析优质花苗与培育方法是否有关,请说明理由.1234567891011121314优质花苗非优质花苗合计甲培育法20乙培育法10合计 1234567891011121314α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828 1234567891011121314由(1)得优质花苗的频率为0.6,所以样本中优质花苗的数量为60,得如下列联表:优质花苗非优质花苗合计甲培育法203050乙培育法401050合计6040100 1234567891011121314零假设为H0:优质花苗与培育方法无关,所以根据小概率值α=0.01的独立性检验,推断H0不成立,即认为优质花苗与培育方法有关. 被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计3010011.在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):1234567891011121314综合提升练 A.0.001B.0.05C.0.01D.0.005计算可知,根据小概率值α=________的独立性检验,分析“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8281234567891011121314√ 1234567891011121314完善2×2列联表如下:零假设为H0:“给基因编辑小鼠注射该种疫苗不能起到预防该病毒感染的效果”.被某病毒感染未被某病毒感染合计注射疫苗104050未注射疫苗203050合计3070100 1234567891011121314所以根据小概率值α=0.05的独立性检验,推断H0不成立,即认为“给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果”. 其中a,15-a均为大于5的整数,若依据α=0.05的独立性检验可以认为X与Y有关,则a的可能取值为A.6B.7C.8D.912.(多选)有两个分类变量X,Y,其列联表如表所示.XY合计Y1Y2X1a20-a20X215-a30+a45合计1550651234567891011121314√√ 1234567891011121314根据a>5且15-a>5,a∈Z,知a可取6,7,8,9.由表中数据及题意,得结合选项,知a的可能取值为8,9. 性别晕机合计晕机者未晕机者男a15c女6bd合计e284613.(多选)在一次恶劣天气的飞行航程中,调查男、女乘客在飞机上晕机的情况,得到如下列联表:(单位:人),则1234567891011121314拓展冲刺练 B.χ2<2.706C.依据小概率值α=0.1的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别有关D.依据小概率值α=0.1的独立性检验,可以认为在恶劣天气的飞行航程中,是否晕机与性别无关√1234567891011121314√ 1234567891011121314 所以得到如下列联表:性别晕机合计晕机者未晕机者男121527女61319合计1828461234567891011121314 零假设为H0:在恶劣天气的飞行航程中,是否晕机与性别无关,1234567891011121314依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即在恶劣天气的飞行航程中,是否晕机与性别无关,所以B,D正确,C错误. 14.为了考察某种药物预防疾病的效果,进行动物试验,得到如下列联表:若在本次考察中得出“在犯错误的概率不超过0.01的前提下认为药物有效”的结论,则a的最小值为________.(其中a≥40且a∈N*)(参考数据:药物疾病合计未患病患病服用a50-a50未服用80-aa-3050合计8020100123456789101112131446 1234567891011121314α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828 解得a≥45.16或a≤34.84,又因为a≥40且a∈N*,所以a≥46,所以a的最小值为46.整理得(100a-4000)2≥502×42×6.635,1234567891011121314

版权提示

  • 温馨提示:
  • 1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
  • 2. 本文档由用户上传,版权归属用户,莲山负责整理代发布。如果您对本文档版权有争议请及时联系客服。
  • 3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
  • 4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服vx:lianshan857处理。客服热线:13123380146(工作日9:00-18:00)

文档下载

发布时间:2023-09-13 05:45:02 页数:85
价格:¥2 大小:1.52 MB
文章作者:随遇而安

推荐特供

MORE