- 3.36 MB
- 2021-06-19 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第十章 算法初步、统计、统计案例
第一节算法初步
基础盘查 算法及程序框图
(一)循纲忆知
1.了解算法的含义,了解算法的思想.
2.理解程序框图的三种基本逻辑结构:顺序、条件分支、循环.
(二)小题查验
1.判断正误
(1)任何算法必有条件结构( )
(2)算法可以无限操作下去( )
(3)▱是赋值框,有计算功能( )
答案:(1)× (2)× (3)×
2.(人教A版教材例题改编)已知程序框图如图所示,则输出的结果是________.
答案:5 050
3.某程序框图如图所示,该程序运行后输出的k的值是____________.
解析:运行框图:第一步:S=1,k=1;
第二步:S=3,k=2;
第三步:S=11,k=3;
第四步:S=11+211>100,k=4.故输出的k=4.
答案:4
4.(2015·广州模拟)执行如图的程序框图,如果输入的N的值是6,那么输出的p的值是________.
解析:由程序框图可得p=1×3×5×7=105.
答案:105
|(基础送分型考点——自主练透)
[必备知识]
程序框图的三种基本结构
(1)顺序结构
顺序结构是最简单的算法结构,语句与语句之间、框与框之间是按从上到下顺序进行的.程序框图中一定包含顺序结构.
(2)条件结构
当需要对研究对象进行逻辑判断时,要使用条件结构,它是根据指定条件选择执行不同指令的控制结构.
(3)循环结构
两种循环结构的特点
直到型循环结构:在执行了一次循环体后,对条件进行判断,如果条件不满足,就继续执行循环体,直到条件满足时终止循环.
当型循环结构:在每次执行循环体前,对条件进行判断,当条件满足时,执行循环体,否则终止循环.
[题组练透]
1.(2015·威海一模)根据给出的程序框图,计算f(-1)+f(2)=( )
A.0 B.1
C.2 D.4
解析:选A 输入-1,满足x≤0,所以f(-1)=4×(-1)=-4;
输入2,不满足x≤0,所以f(2)=22=4,
即f(-1)+f(2)=0.故选A.
2.(2014·新课标全国卷Ⅱ)执行如图的程序框图,如果输入的x,t均为2,则输出的S=( )
A.4 B.5
C.6 D.7
解析:选D 在循环体部分的运算为:第一步,M=2,S=5,k=2;第二步,M=2,S=7,k=3.故输出结果为7.
3.(2014·重庆高考)执行如图所示的程序框图,若输出k的值为6,则判断框内可填入的条件是( )
A.s> B.s>
C.s> D.s>
解析:选C 当输出k的值为6时,s=1×××=,结合题中的程序框图知,选C.
[类题通法]
1.解决程序框图问题要注意几个常用变量:
(1)计数变量:用来记录某个事件发生的次数,如i=i+1.
(2)累加变量:用来计算数据之和,如S=S+i.
(3)累乘变量:用来计算数据之积,如p=p×i.
2.处理循环结构的框图问题,关键是理解并认清终止循环结构的条件及循环次数.
|(常考常新型考点——多角探明)
[多角探明]
算法是高考热点内容之一,算法的交汇性问题是新课标高考的一大亮点,归纳起来常见的命题角度有:
(1)与统计的交汇问题;
(2)与函数的交汇问题;
(3)与线性规划的交汇问题;
(4)与数列求和的交汇问题.
角度一:与统计的交汇问题
1.某班有24名男生和26名女生,数据a1,a2,…,a50是该班50名学生在一次数学学业水平模拟考试中的成绩(成绩不为0),如图所示的程序用来同时统计全班成绩的平均分:A,男生平均分:M,女生平均分:W.为了便于区别性别,输入时,男生的成绩用正数,女生的成绩用其成绩的相反数,那么在图中空白的判断框和处理框中,应分别填入( )
A.T>0?,A= B.T<0?,A=
C.T<0?,A= D.T>0?,A=
解析:选D 依题意得,全班成绩的平均数应等于班级中所有的学生的成绩总和除以总人数,注意到当T>0时,输入的是某男生的成绩;当T<0时,输入的是某女生的成绩的相反数.结合题意得,选D.
角度二:与函数的交汇问题
2.(2014·湖南高考)执行如图所示的程序框图,如果输入的t∈[-2,2],则输出的S属于( )
A.[-6,-2] B.[-5,-1]
C.[-4,5] D.[-3,6]
解析:选D 由程序框图可知S是分段函数,且S=其值域为(-2,6]∪[-3,-1]=[-3,6],故选D.
角度三:与线性规划的交汇问题
3.(2014·四川高考)执行如图所示的程序框图,如果输入的x,y∈R,那么输出的S的最大值为( )
A.0 B.1
C.2 D.3
解析:选C 当时,由线性规划的图解法知,目标函数S=2x+y的最大值为2,否则,S的值为1.所以输出的S的最大值为2.
角度四:与数列求和的交汇问题
4.(2015·湘潭模拟)执行如图所示的程序框图,则输出的结果是________.
解析:共循环2 014次,由裂项求和得S=++…++=++…++=1-=.
答案:
[类题通法]
解决算法的交汇性问题的方法
(1)读懂程序框图,明确交汇知识;
(2)根据给出问题与程序框图处理问题;
(3)注意框图中结构的判断.
|(重点保分型考点——师生共研)
[必备知识]
1.条件语句的格式及框图
(1)IF-THEN格式:
(2)IF-THEN-ELSE格式:
2.循环语句的格式及框图
(1)UNTIL语句:
(2)WHILE语句:
[典题例析]
1.(2015·湖北八市联考)按照如图程序运行,则输出K的值是________.
X=3
K=0
DO
X=2*X+1
K=K+1
LOOP UNTIL X>16
PRINT K
END
解析:第一次循环,X=7,K=1;
第二次循环,X=15,K=2;
第三次循环,X=31,K=3;
终止循环,输出K的值是3.
答案:3
2.(2015·西安模拟)如图所示的程序中,输出的S的值为________.
a=3
b=5
c=6
a=b
b=c
S=a+b+c
PRINT S
END
解析:根据多次赋值的意义,有a=5,b=6=c,∴S=5+6+6=17.
答案:17
[类题通法]
1.输入语句、输出语句和赋值语句基本对应于算法的顺序结构.
2.在循环语句中也可以嵌套条件语句,甚至是循环语句,此时需要注意嵌套格式,这些语句需要保证算法的完整性,否则就会造成程序无法执行.
[演练冲关]
(2015·南京三模)执行下边的程序,输出的结果是________.
解析:根据循环结构可得:第一次:S=1×3=3,i=3+2=5,由3≤200,则循环;
第二次:S=3×5=15,i=5+2=7,由15≤200,则循环;
第三次:S=15×7=105,i=7+2=9,由105≤200,则循环;
第四次:S=105×9=945,i=9+2=11,由945>200,则循环结束,故此时i=11.
答案:11
一、选择题
1.阅读右图所示的程序框图,运行相应的程序,输出S的值为( )
A.15 B.105
C.245 D.945
解析:选B 逐次计算的结果是T=3,S=3,i=2;T=5,S=15,i=3;T=7,S=105,i=4,此时输出的结果为S=105.选B.
2.执行如图所示的程序框图,如果输入的t∈[-1,3],则输出的s属于( )
A.[-3,4] B.[-5,2]
C.[-4,3] D.[-2,5]
解析:选A 当-1≤t<1时,s=3t,则s∈[-3,3).当1≤t≤3时,s=4t-t2.函数在[1,2]上单调递增,在[2,3]上单调递减.∴s∈[3,4].
综上知s∈[-3,4].故选A.
3.(2014·陕西高考)根据如图所示的框图,对大于2的整数N,输出的数列的通项公式是( )
A.an=2n B.an=2(n-1)
C.an=2n D.an=2n-1
解析:选C 由程序框图可知:a1=2×1=2,a2=2×2=4,a3=2×4=8,a4=2×8=16,归纳可得:an=2n,故选C.
4.(2014·江西高考)阅读如下程序框图,运行相应的程序,则程序运行后输出的结果为( )
A.7 B.9
C.10 D.11
解析:选B i=1,S=0,第一次循环:S=0+lg=-lg 3>-1;第二次循环:i=3,S=lg+lg=lg=-lg 5>-1;第三次循环:i=5,S=lg+lg=lg=-lg 7>-1;第四次循环:i=7,S
=lg+lg=lg=-lg 9>-1;第五次循环:i=9,S=lg+lg=lg=-lg 11<-1.故输出i=9.
5.(2015·北京西城一模)执行如图所示的程序框图,如果输入a=2,b=2,那么输出的a值为( )
A.4 B.16
C.256 D.log316
解析:选C log32>4不成立, 执行第一次循环,a=22=4;
log34>4不成立,执行第二次循环,a=42=16;
log316>4=log334=log381不成立,
执行第三次循环,a=162=256;
log3256>4=log381成立,跳出循环体,输出a的值为256,故选C.
6.(2014·安徽高考)如图所示,程序框图(算法流程图)的输出结果是( )
A.34 B.55
C.78 D.89
解析:选B 由题中程序框图(算法流程图)知:x=1,y=1,z=2;x=1,y=2,z=3;x=2,y=3,z=5;x=3,y=5,z=8;x=5,y=8,z=13;x=8,y=13,z=21;x=13,y=21,z=34;x=21,y=34,z=55>50,跳出循环.故输出结果是55.
7.(2015·辽宁五校联考)某程序框图如图所示,若该程序运行后输出k的值是6,则满足条件的整数S0的个数有( )
A.31 B.32
C.63 D.64
解析:选B 输出k的值为6说明最后一次参与运算的k=5,所以S=S0-20-21-22-23-24-25=S0-63,上一个循环S=S0-20-21-22-23-24=S0-31,所以31<S0≤63,总共32个满足条件的S0.
8.(2015·石家庄模拟)某程序框图如图所示,若输出的S=120,则判断框内为( )
A.k>4? B.k>5?
C.k>6? D.k>7?
解析:选B 依题意,进行第一次循环时,k=1+1=2,S=2×1+2=4;进行第二次循环时,k=2+1=3,S=2×4+3=11;进行第三次循环时,k=3+1=4,S=2×11+4=26;进行第四次循环时,k=4+1=5,S=2×26+5=57;进行第五次循环时,k=5+1=6,S=2×57+6=120,此时结束循环,因此判断框内应为“k>5?”,选B.
二、填空题
9.(2015·南京模拟)根据如图所示的伪代码,最后输出的S的值为________.
解析:解析:这是一个1+2+3+…+10的求和,所以输出的S的值为55.
答案:55
10.关于函数f(x)=的程序框图如图所示,现输入区间[a,b],则输出的区间是________.
解析:由程序框图的第一个判断条件为f(x)>0,当f(x)=cos x,x∈[-1,1]时满足.然后进入第二个判断框,需要解不等式f′(x)=-sin x≤0,即0≤x≤1.故输出区间为[0,1].
答案:[0,1]
11.(2014·江苏高考改编)如图是一个程序框图,则输出的n的值是________.
解析:该程序框图共运行5次,各次2n的值分别是2,4,8,16,32,所以输出的n的值是5.
答案:5
12.(2014·湖北高考)设a是一个各位数字都不是0且没有重复数字的三位数,将组成a的3个数字按从小到大排成的三位数记为I(a),按从大到小排成的三位数记为D(a)(例如a=815,则I(a)=158,D(a)=851).阅读如图所示的程序框图,运行相应的程序,任意输入一个a,输出的结果b=________.
解析:当a=123时,b=321-123=198≠123;
当a=198时,b=981-189=792≠198;
当a=792时,b=972-279=693≠792;
当a=693时,b=963-369=594≠693;
当a=594时,b=954-459=495≠594;
当a=495时,b=954-459=495=a,终止循环,输出b=495.
答案:495
第二节随机抽样
基础盘查一 简单随机抽样
(一)循纲忆知
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本(抽签法、随机数表法).
(二)小题查验
1.判断正误
(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最大( )
(2)从100件玩具中随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样( )
答案:(1)× (2)×
2.(2015·广东七校联考)假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________.(下面摘取了随机数表第7行至第9行)
解析:由随机数表,可以看出前4个样本的个体的编号是331,572,455,068.于是,第4个样本个体的编号是068.
答案:068
基础盘查二 系统抽样
(一)循纲忆知
了解系统抽样方法(编号、分组抽取).
(二)小题查验
1.判断正误
(1)系统抽样适用于元素个数较多且分布均衡的总体( )
(2)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平( )
答案:(1)√ (2)×
2.(人教B版教材习题改编)某工厂平均每天生产某种机器零件大约10 000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第一组中的号码为0010,则第三组抽取的号码为________.
答案:0410
3.用系统抽样法(按等距离的规则)要从160名学生中抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是________.
答案:5
基础盘查三 分层抽样
(一)循纲忆知
了解分层抽样的方法(计算抽样比、分层抽取样本).
(二)小题查验
1.判断正误
(1)分层抽样中,每个个体被抽到的可能性与层数及分层有关( )
(2)分层抽样时,为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同( )
答案:(1)× (2)√
2.(人教B版教材例题改编)某校高中生有900名,其中高一有400名,高二有300名,高三有200名,打算抽取容量为45的一个样本,则高三学生应抽取________人.
答案:10
3.某单位有职工480人,其中青年职工210人,中年职工150人,老年职工120人.为了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为________.
解析:设样本容量为n,则=,解得n=16.
答案:16
|(基础送分型考点——自主练透)
[必备知识]
(1)抽取方式:逐个不放回抽取;
(2)每个个体被抽到的概率相等;
(3)常用方法:抽签法和随机数法.
[提醒] 简单随机抽样中易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等.
[题组练透]
1.下列抽取样本的方式是简单随机抽样的有( )
①从无限多个个体中抽取50个个体作为样本;
②箱子里有100支铅笔,今从中选取10支进行检验.在抽样操作时,从中任意拿出一支检测后再放回箱子里;
③从50个个体中一次性抽取5个个体作为样本.
A.0个 B.1个
C.2个 D.3个
解析:选A ①不满足样本的总体数较少的特点;②不满足不放回抽取的特点;③不满足逐个抽取的特点.
2.某公司在甲、乙、丙、丁四个地区分别有150,120,180,150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有20个大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
解析:选B 一般甲、乙、丙、丁四个地区会存在差异,采用分层抽样法较好.在丙地区中抽取的样本个数较少,易采用简单随机抽样法.
3.(2013·江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
解析:选D 从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的数字为08,02,14,07,01,…,故选出的第5个个体的编号为01.
[类题通法]
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
|(重点保分型考点——师生共研)
[必备知识]
系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号;
(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.
[提醒] 系统抽样中,易忽视抽取的样本数也就是分段的段数,当不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.
[典题例析]
(2014·广东高考)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )
A.50 B.40
C.25 D.20
解析:由=25,可得分段的间隔为25.故选C.
答案:C
[类题通法]
解决系统抽样问题的两个关键步骤
(1)分组的方法应依据抽取比例而定,即根据定义每组抽取一个样本.
(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.
[演练冲关]
已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.
5
6
7
8
9
2
0 3
1
(1)若第1组抽出的号码为2,则所有被抽出职工的号码为_________________________;
(2)分别统计这5名职工的体重(单位:千克),获得体重数据的茎叶图如图所示,则该样本的方差为________.
解析:(1)由题意知被抽出职工的号码为2,10,18,26,34.
(2)由茎叶图知5名职工体重的平均数
==69,
则该样本的方差s2=×[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.
答案:(1)2,10,18,26,34
(2)62
|(常考常新型考点——多角探明)
[必备知识]
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
[提醒] 分层抽样中,易忽视每层抽取的个体的比例是相同的,即.
[多角探明]
分层抽样是历年高考的重要考点之一,高考中常把分层抽样、频率分布、概率综合起来进行考查,反映了当前高考的命题方向.这类试题难度不大,但考查的知识面较为宽广,在解题中要注意准确使用所学知识,不然在一个点上的错误就会导致整体失误.
常见的命题角度有:
(1)与频率分布相结合问题;
(2)与概率相结合问题.
角度一:与频率分布相结合问题
1.(2014·广东高考)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.100,10 B.200,10
C.100,20 D.200,20
解析:选D 易知(3 500+4 500+2 000)×2%=200,即样本容量;抽取的高中生人数为2 000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.
角度二:与概率相结合问题
2.(2015·广东六校联考)某市A,B,C,D四所中学报名参加某高校2014年自主招生的学生人数如下表所示:
中学
A
B
C
D
人数
30
40
20
10
为了解参加考试的学生的学习状况,该高校采用分层抽样的方法从报名参加考试的四所中学的学生中随机抽取50名参加问卷调查.
(1)从A,B,C,D四所中学中各抽取多少名学生?
(2)从参加问卷调查的50名学生中随机抽取2名学生,求这2名学生来自同一所中学的概率;
(3)在参加问卷调查的50名学生中,从来自A,C两所中学的学生中随机抽取2名学生,用X表示抽得A中学的学生人数,求X的分布列.
解:(1)由题意知,四所中学报名参加该高校2014年自主招生的学生总人数为100,则抽样比为=.
∵30×=15,40×=20,20×=10,10×=5,
∴应从A,B,C,D四所中学中抽取的学生人数分别为15,20,10,5.
(2)设“从参加问卷调查的50名学生中随机抽取2名学生,这2名学生来自同一所中学”为事件M,
∵从50名学生中随机抽取2名学生的取法共有C=1 225种,来自同一所中学的取法共有C+C+C+C=350(种),
∴P(M)==.
即从参加问卷调查的50名学生中随机抽取2名学生,这2名学生来自同一所中学的概率为.
(3)由(1)知,来自A,C两所中学的学生人数分别为15,10.
依题意得,X的所有可能取值为0,1,2,
∵P(X=0)==,P(X=1)==,
P(X=2)==,∴X的分布列为
X
0
1
2
P
[类题通法]
进行分层抽样的相关计算时,常利用以下关系式巧解:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
一、选择题
1.(2014·湖南高考)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1、p2、p3,则( )
A.p1=p22,s1>s2 B.1>2,s1s2 D.1<2,s10,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入(1)中的回归方程,
得=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
[类题通法]
1.正确理解计算,的公式和准确的计算是求线性回归方程的关键.
2.回归直线方程=x+必过样本点中心(,).
3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.
[演练冲关]
(2015·石家庄模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)由题意,作散点图如图.
(2)由对照数据,计算得iyi=66.5,
=32+42+52+62=86,
=4.5,=3.5,
===0.7,
=-=3.5-0.7×4.5=0.35,
所以回归方程为=0.7x+0.35.
(3)当x=100时,y=100×0.7+0.35=70.35(吨标准煤),预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).
|(重点保分型考点——师生共研)
[必备知识]
1.2×2列联表
设X,Y为两个变量,它们的取值分别为和,其样本频数列联表(2×2列联表)如下:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
2.独立性检验
利用随机变量K2=(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
[典题例析]
(2014·江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1 表2
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3 表4
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力
C.智商 D.阅读量
解析:选D
因为K==,
K==,
K==,
K==,
则有K>K>K>K,所以阅读量与性别关联的可能性最大.
[类题通法]
1.在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.
2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.
[演练冲关]
(2015·辽宁沈阳月考)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作
不太主动参加班级工作
合计
学习积极性高
18
7
25
学习积极性一般
6
19
25
合计
24
26
50
(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.
解:(1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型概率的计算公式可得抽到积极参加班级工作的学生的概率是P1==,又因为不太主动参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P2=.
(2)由K2统计量的计算公式得
K2=≈11.538,
由于11.538>10.828,所以有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系.
一、选择题
1.(2014·湖北高考)根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=bx+a,则( )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析:选B 由表中数据画出散点图,如图,
由散点图可知b<0,a>0,选B.
2.2014年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
则下面的正确结论是( )
A.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
解析:选A 由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.
3.(2015·石家庄一模)登山族为了了解某山高y(km)与气温x(°C)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温x(°C)
18
13
10
-1
山高y(km)
24
34
38
64
由表中数据,得到线性回归方程=-2x+(∈R),由此请估计出山高为72(km)处气温的度数为( )
A.-10 B.-8
C.-4 D.-6
解析:选D 由题意可得=10,=40,
所以=+2=40+2×10=60.
所以=-2x+60,当=72时,有-2x+60=72,解得x=-6,故选D.
4.(2015·兰州、张掖联考)对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是( )
A. B.
C. D.
解析:选B 依题意可知样本中心点为,
则=×+,解得=.
5.(2015·东营二模)某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=-10x+200,则下列结论正确的是( )
A.y与x具有正的线性相关关系
B.若r表示变量y与x之间的线性相关系数,则r=-10
C.当销售价格为10元时,销售量为100件
D.当销售价格为10元时,销售量为100件左右
解析:选D 当销售价格为10元时,=-10×10+200=100,即销售量为100件左右.
6.(2015·大连双基考试)对于下列表格所示五个散点,已知求得的线性回归方程为=0.8x-155,则实数m的值为( )
x
196
197
200
203
204
y
1
3
6
7
m
A.8 B.8.2
C.8.4 D.8.5
解析:选A ==200,
==.
样本中心点为,将样本中心点代入=0.8x-155,可得m=8.故A正确.
二、填空题
7.(2015·厦门诊断)为考察棉花种子经过处理跟生病之间的关系得到下表数据:
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
根据以上数据,则种子经过处理与是否生病________(填“有”或“无”)关.
解析:在假设无关的情况下,根据题意K2=≈0.16,可以得到无关的概率大于50%,所以种子经过处理跟是否生病有关的概率小于50%,所以可以认为种子经过处理与是否生病无关.
答案:无
8.为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单元:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程为=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,则年教育支出平均增加________万元.
解析:因为回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.
答案:0.15
9.(2015·忻州联考)已知x,y的取值如下表:
x
2
3
4
5
y
2.2
3.8
5.5
6.5
从散点图分析,y与x线性相关,且回归方程为=1.46x+,则实数的值为________.
解析:==3.5,==4.5,回归方程必过样本的中心点(,).把(3.5,4.5)代入回归方程,计算得=-0.61.
答案:-0.61
10.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
总计
男生
20
5
25
女生
10
15
25
总计
30
20
50
则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关(请用百分数表示).
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
解析:K2=
=≈8.333>7.879.
答案:0.5%
三、解答题
11.(2015·大连高三质检)假设关于某设备的使用年限x(年)和所支出的维修费用y(万元),有如下表的统计资料:
使用年限x(年)
2
3
4
5
6
维修费用y(万元)
2.2
3.8
5.5
6.5
7.0
若由资料可知y对x呈线性相关关系,试求:
(1)线性回归直线方程;
(2)根据回归直线方程,估计使用年限为12年时,维修费用是多少?
解:(1)列表
i
1
2
3
4
5
合计
xi
2
3
4
5
6
20
yi
2.2
3.8
5.5
6.5
7.0
25
xiyi
4.4
11.4
22.0
32.5
42.0
112.3
x
4
9
16
25
36
90
=4,=5;
=90; iyi=112.3
===1.23,
于是=-=5-1.23×4=0.08.
所以线性回归直线方程为=1.23x+0.08.
(2)当x=12时,=1.23×12+0.08=14.84(万元),即估计使用12年时,维修费用是14.84万元.
12.(2015·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:
喜欢“应用统计”课程
不喜欢“应用统计”课程
总计
男生
20
5
25
女生
10
20
30
总计
30
25
55
(1)判断是否有99.5%的把握认为喜欢“应用统计”课程与性别有关?
(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.
下面的临界值表供参考:
P(K2≥k)
0.15
0.10
0.05
0.25
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:K2=,其中n=a+b+c+d)
解:(1)由公式K2=≈11.978>7.879,
所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.
(2)设所抽样本中有m个男生,则=,得m=4,所以样本中有4个男生,2个女生,分别记作B1,B2,B3,B4,G1,G2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15个,
其中恰有1个男生和1个女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8个.
所以恰有1个男生和1个女生的概率为.
命题点一 算法 命题指数:☆☆☆☆
难度:中 题型:选择题、填空题
1.(2014·新课标全国卷Ⅰ)执行下面的程序框图,若输入的a,b,k分别为1,2,3,则输出的M=( )
A. B.
C. D.
解析:选D 第一次循环:M=,a=2,b=,n=2;第二次循环:M=,a=,b=,n=3;第三次循环:M=,a=,b=,n=4,则输出M=,选D.
2.(2013·山东高考)执行两次如图所示的程序框图,若第一次输入的a的值为-1.2,第二次输入的a的值为1.2,则第一次、第二次输出的a的值分别为( )
A.0.2,0.2
B.0.2,0.8
C.0.8,0.2
D.0.8,0.8
解析:选C 两次运行结果如下:
第一次:-1.2→-1.2+1→-0.2+1→0.8;
第二次:1.2→1.2-1→0.2.
3.(2013·新课标全国卷Ⅱ)执行下面的程序框图,如果输入的N=4,那么输出的S=( )
A.1+++
B.1+++
C.1++++
D.1++++
解析:选B 按程序框图逐步计算可知:
S=1+++.
4.(2014·天津高考)阅读如图所示的框图,运行相应的程序,输出 S的值为________.
解析:S=0,n=3,第1次运行,S=0+(-2)3=-8,n=2,不满足条件;第2次运行,S=-8+(-2)2=-8+4=-4,n=1,满足条件,跳出循环,输出S的值为-4.
答案:-4
命题点二 抽样方法 命题指数:☆☆☆
难度:低 题型:选择题、填空题
1.(2014·重庆高考)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
解析:选A 样本抽取比例为=,该校总人数为1 500+3 500=5 000,则=,故n=100,选A.
2.(2013·陕西高考)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14
解析:选B 因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.
命题点三 用样本估计总体 命题指数:☆☆☆☆☆
难度:中 题型:选择题、填空题、解答题
1.(2014·四川高考)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )
A.总体 B.个体
C.样本的容量 D.从总体中抽取的一个样本
解析:选A 5 000名居民的阅读时间的全体是总体,每名居民的阅读时间是个体,200是样本容量,故选A.
2.(2014·山东高考)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8
C.12 D.18
解析:选C 第一组和第二组的频率之和为0.4,故样本容量为=50,第三组的频率为0.36,故第三组的人数为50×0.36=18,故第三组中有疗效的人数为18-6=12.
3.(2014·陕西高考)某公司10位员工的月工资(单位:元)为x1,x2,…,x10 ,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )
A. ,s2+1002 B. +100, s2+1002
C. ,s2 D. +100, s2
解析:选D 法一:对平均数和方差的意义深入理解可巧解.因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D.
法二:由题意知x1+x2+…+xn=n,
s2=[(x1-)2+(x2-)2+…+(xn-)2],
则所求均值=[(x1+100)+(x2+100)+…+(xn+100)]=(n+n×100)=+100,
而所求方差t2=[(x1+100-)2+(x2+100-)2+…+(xn+100-)2]=[(x1-)2+(x2-)2+…+(xn-)2]=s2,故选D.
4.(2012·广东高考)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中x的值;
(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.
解:(1)由题意得:
10x=1-(0.006×3+0.01+0.054)×10=0.18,
所以x=0.018.
(2)∵成绩不低于80分的学生共有(0.018+0.006)×10×50=12人,其中90分以上(含90分)的共有0.006×10×50=3人,
ξ的可能值为0,1,2,
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
∴ξ的分布列为
ξ
0
1
2
P
∴E(ξ)=0×+1×+2×=.
命题点四 回归分析与独立性检验 命题指数:☆☆☆
难度:中 题型:选择题、填空题、解答题
1.(2014·重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.
2.(2013·福建高考)已知x与y之间的几组数据如下表:
x
1
2
3
4
5
6
y
0
2
1
3
3
4
假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,a′ D.a′.
3.(2012·湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:选D 由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项A中的结论正确;回归直线过样本点的中心,选项B中的结论正确;根据回归直线斜率的意义易知选项C中的结论正确;由于回归分析得出的是估计值,故选项D中的结论不正确.
4.(2013·福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
P(χ2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
附:χ2=
解:(1)由已知得,样本中有25周岁(含25周岁)以上组工人60名,25周岁以下组工人40名.
所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组(含25周岁)”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
生产能手
非生产能手
合计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
合计
30
70
100
所以得K2=
==≈1.79.
因为1.79<2.706,
所以没有90%的把握认为“生产能手与工人所在的年龄组有”.