- 1.88 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第1课时 随机抽样
1.简单随机抽样
(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法.
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号;
(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
(2)分层抽样的应用范围:
当总体由差异明显的几个部分组成时,往往选用分层抽样.
4.判断下列结论的正误(正确的打“√”错误的打“×”)
(1)简单随机抽样是一种不放回抽样.(√)
(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.(×)
(3)系统抽样在起始部分抽样时采用简单随机抽样.(√)
(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.(×)
(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(×)
(6)从100件玩具中随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样.(×)
(7)系统抽样适用于元素个数很多且均衡的总体.(√)
(8)某校即将召开学生代表大会,现从高一、高二、高三共抽取60名代表,则可用分层抽样方法抽取.(√)
(9)随机抽样有一定的随意性,可根据自己的喜好而抽取,故每个个体被抽到的概率不等.(×)
(10)系统抽样是一种平均抽样,每个被抽取出来的个体的编号必须符合一个固定的公式.(×)
考点一 简单随机抽样
命题点
1.简单随机抽样的概念与判定
2.抽签法与随机数表法
[例1] (1)下列抽取样本的方式是否属于简单随机抽样?
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
解:①不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.
②不是简单随机抽样.因为它是放回抽样.
③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
④不是简单随机抽样.因为不是等可能抽样.
(2)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
A.08 B.07
C.02 D.01
解析:从第1行第5列、第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.
答案:D
[方法引航] (1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.
(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况).
1.下面的抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见
D.用抽签法从10件产品中选取3件进行质量检验
解析:选D.选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.
2.假设要考察某公司生产的500克
袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________.(下面摘取了随机数表第7行至第9行)
87 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
答案:068
考点二 系统抽样
命题点
1.求分段间隔
2.求抽取的样本个体
3.求抽取的样本数
[例2] (1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )
A.50 B.40
C.25 D.20
解析:由=25,可得分段间隔为25.
答案:C
(2)为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到50的塑料瓶装饮料中抽取5瓶进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5瓶饮料的编号可能是( )
A.5,10,15,20,25 B.2,4,8,16,32
C.1,2,3,4,5 D.7,17,27,37,47
解析:从中抽取5瓶,应将50瓶分成5组.抽样间隔为=10.
答案:D
(3)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14
解析:由系统抽样定义可知,所分组距为=20,每组抽取一个,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.
答案:B
[方法引航] (1)系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.
(2)系统抽样时,如果总体中的个体数不能被样本容量整除,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.
1.若本例(3)中条件不变,第三组抽得的号码为44,则在第八组中抽得的号码是________.
解析:在第八组中抽得的号码为(8-3)×20+44=144.
答案:144
2.若本例(3)中条件不变,在编号为[481,720]中抽取8人,则样本容量为________.
解析:因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人,所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为=28.
答案:28
考点三 分层抽样
命题点
1.求每层中的样本容量
2.求总体容量
[例3] (1)(2017·云南昆明检测)某公司员工对户外运动分别持“喜欢”、“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6位对户外运动持“喜欢”态度,有1位对户外运动持“不喜欢”态度,有3位对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的有( )
A.36人 B.30人
C.24人 D.18人
解析:设对户外运动持“喜欢”“不喜欢”“一般”态度的人数分别为6x、x、3x,由题意可得3x-x=12,x=6,∴对户外运动持“喜欢”态度的有6×6=36(人).
答案:A
(2)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
解析:法一:由题意可得=,解得n=100.
法二:由题意,抽样比为=,总体容量为3 500+1 500=5 000,故n=5 000×=100.
答案:A
(3)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=( )
A.54 B.90
C.45 D.126
解析:依题意得×n=18,解得n=90,即样本容量为90.
答案:B
[方法引航] 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N.
1.某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组用简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( )
A.15 B.16
C.17 D.18
解析:选C.由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故共抽取高二学生人数为33-16=17.
2.某学校的三个学生社团的人数分布如下表(每名学生只能参加一个社团):
围棋社
舞蹈社
拳击社
男生
5
10
28
女生
15
30
m
学校要对这三个社团的活动效果进行抽样调查,按分层抽样的方法从三个社团成员中抽取18人,结果拳击社被抽出了6人.
(1)求拳击社女生有多少人;
(2)从围棋社指定的3名男生和2名女生中随机选出2人参加围棋比赛,求这2名同学是一名男生和一名女生的概率.
解:(1)由于按分层抽样的方法从三个社团成员中抽取18人,拳击社被抽出了6人,
∴=,∴m=2.
(2)指定3男生记为A1,A2,A3,2女生记为B1,B2,选取2人有A1A2,A1A3,A2A3,B1B2,A1B1,A1B2,A2B1,A2B2,A3B1,A3B2
共10种选法,其中一男一女有6种选法,故设A为“这2名同学是一名男生和一名女生”,则P(A)==.
[易错警示]
抽样后每个个体被抽到的概率
[典例] 在120个零件中,一级品24个,二级品36个,三级品60个.用系统抽样法从中抽取容量为20的样本,则二级品中每个个体被抽取到的概率是________.
[正解] 二级品中每个个体被抽到的概率等于所有零件中每个个体被抽取到的概率,所以所求的概率为=.
[易误] 对系统的抽取理解不到位,易产生以下计算错误:二级品中需抽取到的产品个数为×36=6,故所求概率为=.(与正确结论一致是一种巧合)
[答案]
[警示] 从总体为N的容量中抽取容量为n的样本,每个个体被抽到的概率相等,都是.
[高考真题体验]
1.(2013·高考课标全国卷Ⅰ)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样
C.按学段分层抽样 D.系统抽样
解析:选C.因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.
2.(2015·高考北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
类别
人数
老年教师
900
中年教师
1 800
青年教师
1 600
合计
4 300
A.90 B.100
C.180 D.300
解析:选C.设该样本中的老年教师人数为x,由题意得=,故x=180.
3.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )
A.3 B.4
C.5 D.6
解析:选B.因为35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.
4.(2015·高考福建卷)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.
解析:男生人数为900-400=500(人),设男生应抽取x人,则有=,解得x=25.
答案:25
课时规范训练
A组 基础演练
1.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270.
关于上述样本的下列结论中,正确的是( )
A.②、③都不能为系统抽样
B.②、④都不能为分层抽样
C.①、④都可能为系统抽样
D.①、③都可能为分层抽样
解析:选D.因为③为系统抽样,所以选项A不对;因为②为分层抽样,所以选项B不对;因为④不为系统抽样,所以选项C不对,故选D.
2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
A.6 B.8
C.10 D.12
解析:选B.设样本容量为N,则N×=6,
∴N=14,∴高二年级所抽取的人数为14×=8.
3.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )
A.7 B.15
C.25 D.35
解析:选B.由题意知青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.
4.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,己知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为( )
A.13 B.19
C.20 D.51
解析:选C.抽样间隔为46-33=13,故另一位同学的编号为7+13=20,选C.
5.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101 B.808
C.1 212 D.2 012
解析:选B.由题意知抽样比为,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,故有=,解得N=808.
6.某学校高三一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,…,60.选取的这6名学生的编号可能是( )
A.1,2,3,4,5,6 B.6,16,26,36,46,56
C.1,2,4,8,16,32 D.3,9,13,27,36,54
解析:选B.由系统抽样知识知,所选取学生编号之间的间距相等且为10,所以应选B.
7.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为( )
A.8 B.11
C.16 D.10
解析:选A.设高一学生有x人,则高三学生有2x人,高二学生有(x+300)人,学校共有4x+300=3 500(人),解得x=800(人),由此可得按的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为×800=8(人),故应选A.
8.某校初一、初二、初三年级各有300人,400人,302人,采用系统抽样从中抽取一个容量为100的样本检查学生的视力情况,则初三年级每人被抽到的概率为( )
A. B.
C. D.
解析:选B.利用系统抽样,虽然剔除2人,但每人能抽到的概率为=.
9.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )
A.9 B.10
C.12 D.13
解析:选D.依题意得=,故n=13.
10.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中取的数是39,则在第1小组1~16中随机抽到的数是( )
A.5 B.7
C.11 D.13
解析:选B.间隔数k==16,即每16人抽取一个人.由于39=2×16+7,所以第1小组中抽取的数为7.
B组 能力突破
1.某校共有学生2 000名,各年级男、女生人数如下表所示:
一年级
二年级
三年级
女生
373
380
y
男生
377
370
z
现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )
A.24 B.18
C.16 D.12
解析:选C.一年级的学生人数为373+377=750,二年级的学生人数为380+370=750,于是三年级的学生人数为2 000-750-750=500,所以应在三年级抽取的人数为500×=16.
2.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为( )
A.26,16,8 B.25,17,8
C.25,16,9 D.24,17,9
解析:选B.由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+12(k-1).
令3+12(k-1)≤300得k≤,因此第Ⅰ营区被抽中的人数是25;
令300<3+12(k-1)≤495得<k≤42,因此第Ⅱ营区被抽中的人数是42-25=17.结合各选项知,选B.
3.将某班的60名学生编号为01,02,…
,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.
答案:16,28,40,52
4.某课题组进行城市空气质量调查,按地域把24个城市分成某甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________.
解析:由已知得抽样比为=,
∴丙组中应抽取的城市数为8×=2.
答案:2
5.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.
解析:由题意知:m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.
答案:76
6.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是________.
解析:由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x+(n-1)×8,所以第16组应抽出的号码为x+(16-1)×8=123,解得x=3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.
答案:11
第2课时 用样本估计总体
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离.
(2)标准差:
s= .
(3)方差:s2= [(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).
5.判断下列结论的正误(正确的“√”错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.(×)
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(√)
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(×)
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(×)
(7)在频率分布直方图中,小矩形的高表示频率.(×)
(8)频率分布直方图中各个长方形的面积之和为1.(√)
(9)一组数据的方差越大,说明这组数据的波动越大.(√)
(10)中位数与众数都是唯一的.(×)
考点一 频率分布直方图的绘制及应用
命题点
1.绘制频率分布直方图
2.应用频率分布直方图
[例1] (1)(2016·高考山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60
C.120 D.140
解析:由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D.
答案:D
(2)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
B地区用户满意度评分的频数分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
①作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
②根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大,说明理由.
解:(1)
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.
[方法引航] 频率分布直方图的特征
(1)各矩形的面积和为1.
(2)纵轴的含义为,矩形的面积=组距×=频率.
(3)样本数据的平均数的估计值等于每个小矩形的面积乘矩形底边中点横坐标之和.
(4)众数为最高矩形的底边中点的横坐标.
考点二 茎叶图的绘制及应用
命题点
1.绘制茎叶图
2.应用茎叶图求特征数字
[例2] (1)(2017·安徽合肥质检)一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x-y的值为( )
A.2 B.-2
C.3 D.-3
解析:由题意得=81⇒x=0,易知y=3,∴x-y=-3,故选D.
答案:D
(2)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
①根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
②根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
解:(1)两地区用户满意度评分的茎叶图如下:
通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.
(2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”;
CA2表示事件:“A地区用户的满意度等级为非常满意”;
CB1表示事件:“B地区用户的满意度等级为不满意”;
CB2表示事件:“B地区用户的满意度等级为满意”,
则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1∪CB2CA2.
P(C)=P(CB1CA1∪CB2CA2)=P(CB1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2).
由所给数据得CA1,CA2,CB1,CB2发生的频率分别为,,,,故P(CA1)=,P(CA2)=,P(CB1)=,
P(CB2)=,P(C)=×+×=0.48.
[方法引航] 由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.
考点三 用样本的数字特征估计总体的数字特征
命题点
1.求样本的平均数、方差
2.求样本的中位数,众数
3.利用样本的数字特征进行决策
[例3] (1)(2017·山东济南模拟)某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数甲、乙和中位数y甲、y乙进行比较,下面结论正确的是( )
A.甲>乙,y甲>y乙 B.甲<乙,y甲y乙 D.甲>乙,y甲3.841,因此有95%的把握认为“成绩与班级有关系”.
(3)设“抽到6号或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y).所有的基本事件有(1,1),(1,2),…,(6,6),共36个.事件A包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,故P(A)==.
[回顾反思] 独立性检验的基本思想
它类似于反证法,要确定“两个变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个变量没有关系”
成立,在该假设下构造的随机变量K2=应该很小,如果结果很大,则在一定程度上说明假设不合理,即认为两个变量在一定程度上有关.这种检验方法可靠吗?实际上这种方法仍然是用样本去估计总体,推断可能正确,也可能错误.但我们只要科学合理地去抽样,那么犯错的可能性就很小了,如果K2检验中K2>6.635,则说明我们犯错的概率仅为1%,这正是统计方法的魅力所在.所以利用K2进行独立性检验,可以对推断正确性的概率作出估计,样本量n越大,这个估计越准确.
[高考真题体验]
1.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
解析:选D.根据柱形图易得选项A,B,C正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D错误.故选D.
2.(2015·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=- .据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:选B.∵=10.0,=8.0,=0.76,∴=8-0.76×10=0.4,∴回归方程为=0.76x+0.4,把x=15代入上式得,=0.76×15+0.4=11.8(万元),故选B.
3.(2014·高考江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查352名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力
C.智商 D.阅读量
解析:选D.因为A中,K=
==,
B中,K===,
C中,K===,
D中,K===,
则K4>K2>K3>K1,所以阅读量与性别有关联的可能性最大.
4.(2014·高考课标全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
=,=-.
解:(1)由所给数据计算得
=(1+2+3+4+5+6+7)=4,
=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
(ti-)2=9+4+1+0+1+4+9=28,
(ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
===0.5,
=-=4.3-0.5×4=2.3,
所求回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.课时规范训练
A组 基础演练
1.某地区调查了2~9岁的儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为=8.25x+60.13,下列叙述正确的是( )
A.该地区一个10岁儿童的身高为142.63 cm
B.该地区2~9岁的儿童每年身高约增加8.25 cm
C.该地区9岁儿童的平均身高是134.38 cm
D.利用这个模型可以准确地预算该地区每个2~9岁儿童的身高
答案:B
2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
解析:选D.样本点都在直线上时,其数据的估计值与真实值是相等的,即yi=i,代入相关系数公式r=
3.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )
A.直线l过点(,)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
解析:选A.因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误.D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误.根据线性回归直线一定经过样本点中心可知A正确.
4.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
解析:选D.由于线性回归方程中x的系数为0.85,
因此y与x具有正的线性相关关系,故A正确.
又线性回归方程必过样本点中心(,),因此B正确.
由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.
当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得线性回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析:选B.∵==,==42,
又=x+必过(,),
∴42=×9.4+,∴=9.1.
∴线性回归方程为=9.4x+9.1.
∴当x=6时,=9.4×6+9.1=65.5(万元).
6.已知回归方程=4.4x+838.19,则可估计x与y的增长速度之比约为________.
解析:x每增长1个单位,y增长4.4个单位,故增长的速度之比约为1∶4.4=5∶22.
事实上所求的比值为回归直线方程斜率的倒数.
答案:5∶22
7.以下四个命题,其中正确的序号是________.
①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②两个随机变量相关性越强,则相关系数的绝对值越接近于1;
③在线性回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;
④对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.
解析:①是系统抽样;对于④,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小.
答案:②③
8.某班主任对全班30名男生进行了作业量多少的调查,数据如下表:
认为作业多
认为作业不多
总计
喜欢玩电脑游戏
12
8
20
不喜欢玩电脑游戏
2
8
10
总计
14
16
30
该班主任据此推断男生喜欢玩电脑游戏与认为作业量的多少有关,这种推断犯错误的概率不超过________.
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
解析:根据题中给出的数据可以得到
K2=≈4.285 7>3.841,所以犯错误的概率不超过0.050.
答案:0.050
9.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
甲厂:
分组
[29.86,29.90)
[29.90,29.94)
[29.94,29.98)
[29.98,30.02)
[30.02,30.06)
[30.06,30.10)
[30.10,30.14]
频数
12
63
86
182
92
61
4
乙厂:
分组
[29.86,29.90)
[29.90,29.94)
[29.94,29.98)
[29.98,30.02)
[30.02,30.06)
[30.06,30.10)
[30.10,30.14]
频数
29
71
85
159
76
62
18
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填下面2×2列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
甲厂
乙厂
总计
优质品
非优质品
总计
解:(1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为=72%;
乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为=64%.
(2)完成的2×2列联表如下:
甲厂
乙厂
总计
优质品
360
320
680
非优质品
140
180
320
总计
500
500
1 000
由表中数据计算得K2的观测值
k=≈7.35>6.635,
所以有99%的把握认为“两个分厂生产的零件的质量有差异.”
10.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄对月收入x的线性回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
解:(1)由题意知n=10,=i==8,
=i==2,
又lxx=-n2=720-10×82=80,
lxy=iyi-n =184-10×8×2=24,
由此得===0.3,
=-=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
B组 能力突破
1.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是=x+a,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数a的值是( )
A. B.
C. D.
解析:选B.依题意可知样本点的中心为,则=×+a,解得a=.
2.变量U与V相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到U与V的线性回归分析,R2表示解释变量对于预报变量变化的贡献率,则R2=( )
A. B.
C.1 D.3
解析:选C.依题意,注意到点(1,1.4),(2,2.2),(3,3),(4,3.8)均位于直线y-1.4=(x-1),即y=0.8x+0.6上,因此解释变量对于预报变量变化的贡献率R2=1.
3.根据如下样本数据:
x
3
4
5
6
7
y
4.0
a-5.4
-0.5
0.5
b-0.6
得到的回归方程为=bx+a.若样本点的中心为(5,0.9),则当x每增加1个单位,y就( )
A.增加1.4个单位 B.减少1.4个单位
C.增加7.9个单位 D.减少7.9个单位
解析:选B.依题意得,=0.9,故a+b=6.5①;又样本点的中心为(5,0.9),故0.9=5b+a②,联立①②,解得b=-1.4,a=7.9,则=-1.4x+7.9,可知当x每增加1个单位时,y就减少1.4个单位,故选B.
4.为考察棉花种子经过处理跟生病之间的关系得到下表数据:
种子处理
种子未处理
总计
得病
32
101
133
不得病
61
213
274
总计
93
314
407
根据以上数据,则种子经过处理与是否生病________(填“有”或“无”)关.
解析:在假设无关的情况下,根据题意
K2=≈0.16,可以得到无关的概率大于50%,所以种子经过处理跟是否生病有关的概率小于50%,所以可以认为种子经过处理与是否生病无关.
答案:无
5.为了增强环保意识,我校从男生中随机抽取了60人,从女生中随机抽取了50人参加环保知识测试,统计数据如下表所示:
优秀
非优秀
总计
男生
40
20
60
女生
20
30
50
总计
60
50
110
(1)试判断是否有99%的把握认为环保知识是否优秀与性别有关;
(2)为参加市里举办的环保知识竞赛,学校举办预选赛,已知在环保测试中优秀的同学通过预选赛的概率为,现在环保测试优秀的同学中选3人参加预选赛,若随机变量X表示这3人中通过预选赛的人数,求X的分布列与数学期望.
附:K2=
P(K2≥k)
0.500
0.400
0.100
0.010
0.001
k
0.455
0.708
2.706
6.635
10.828
解:(1)由题意得
K2=≈7.822>6.635,
∴有99%的把握认为环保知识是否优秀与性别有关.
(2)由题意X的可能取值为0,1,2,3,
P(X=0)=3=,P(X=1)=C2=,P(X=2)=C2=,P(X=3)=3=,
∴X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=2.
高考规范答题 统计、概率类考题
[典例] (本题满分12分)甲、乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛,假设每局甲获胜的概率为,乙获胜的概率为,各局比赛结果相互独立.
(1)求甲在4局以内(含4局)赢得比赛的概率;
(2)记X为比赛决出胜负时的总局数,求X的分布列和均值(数学期望).
标准答案·满分模板
[解] 用A表示“甲在4局以内(含4局)赢得比赛”,Ak表示“第k局甲获胜”,Bk表示“第k局乙获胜”,则P(Ak)=,P(Bk)=,k=1,2,3,4,5.……1分
(1)P(A)=P(A1A2)+P(B1A2A3)+P(A1B2A3A4)
=P(A1)P(A2)+P(B1)P(A2)P(A3)+P(A1)P(B2)P(A3)P(A4)……1分
=2+×2+××2=.……2分
(2)X的可能取值为2,3,4,5,……1分
P(X=2)=P(A1A2)+P(B1B2)
=P(A1)P(A2)+P(B1)P(B2)
=2+2=,……1分
P(X=3)=P(B1A2A3)+P(A1B2B3)
=P(B1)P(A2)P(A3)+P(A1)P(B2)P(B3)
=×2+×2=,……1分
P(X=4)=P(A1B2A3A4)+P(B1A2B3B4)
=P(A1)P(B2)P(A3)P(A4)+P(B1)P(A2)P(B3)P(B4)
=××2+××2=,……1分
P(X=5)=P(A1B2A3B4A5)+P(B1A2B3A4A5)+P(A1B2A3B4B5)+P(B1A2B3A4B5)
=P(A1)P(B2)P(A3)P(B4)P(A5)+P(B1)P(A2)P(B3)P(A4)P(A5)+P(A1)P(B2)P(A3)P(B4)P(B5)+P(B1)P(A2)P(B3)P(A4)P(B5)
=23+23+32+32=.……2分
故X的分布列为
X
2
3
4
5
P
……1分
E(X)=2×+3×+4×+5×=.……1分
[规范答题] (1)踩点说明
①有引进字母表示事件,得2分.
②把事件拆分成A=A1A2+B1A2A3+A1B2A3A4,就得2分,计算概率值正确,得1分.
③前面有过程,再给出事件A的概率值得5分,若无过程,只给事件A的概率值,仅得2分,扣3分.
④写出X的可能取值为2,3,4,5,得1分,若错误,本小题得0分,以下不看,即使有对的地方,也不再得分.
⑤求出X的四个值的概率,每对一个得1分,错一个扣1分,后面的分布列就不得分,若概率的求解只有结果,没有过程扣3分.
⑥期望值结果正确得1分,没有表达式不扣分.
求事件“X=5”的概率用减法P(X=5)=1-P(X=2)-P(X=3)-P(X=4)计算,结果正确,得1分.
⑦给出分布列表格,没有每个概率值的计算过程,仅得4分,扣3分.
(2)答题要求
①用字母表示事件,省去文字叙述.
②分清独立事件,互斥事件,正确选用概率公式.
③分别计算随机变量所对应的概率,正确列表.
如第(1)问分布列.
④书写期望计算公式,正确计算.
专题测试八 概率与统计、算法
(时间90分钟,满分100分)
一、选择题(本大题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.)
1.从某班学生中任意找出一人,如果该同学的身高不到160 cm的概率为0.2,该同学的身高在[160,175]cm内的概率为0.5,那么该同学的身高超过175 cm的概率为( )
A.0.2 B.0.3
C.0.7 D.0.8
解析:选B.由对立事件的概率计算公式可得,该同学的身高超过175 cm的概率为1-0.2-0.5=0.3.
2.一部3卷文集随机地排在书架上,卷号自左向右或自右向左恰为1,2,3的概率是( )
A. B.
C. D.
解析:选B.本题考查古典概型.3卷文集随机排列,共有6种结果,卷号自左向右或自右向左恰为1,2,3的只有2种结果,所以卷号自左向右或自右向左恰为1,2,3的概率是=.
3.点P在边长为1的正方形ABCD内运动,则动点P到顶点A的距离|PA|<1的概率为( )
A. B.
C. D.
解析:选A.由题意知,所求概率为==.
4.有两张卡片,一张的正反面分别写着数字0与1,另一张的正反面分别写着数字2与3,将两张卡片排在一起组成一个两位数,则组成的两位数为奇数的概率是( )
A. B.
C. D.
解析:选C.本题考查古典概型.所组成的两位数有12,13,20,21,30,31,共6个,其中,所组成的两位数为奇数的有13,21,31,共3个,故所组成的两位数为奇数的概率是=.
5.某单位男职工进行健康体验时的体重情况的频率分布直方图如图所示.已知图中从左到右的前3个小组的频率之比为1∶2∶3,其中第2小组的频数为24,则该单位男职工的总人数为( )
A.150 B.120
C.48 D.96
解析:选D.设该单位男职工的总人数为n,第1小组的频率为p,则由题意可知,第2小组的频率为2p,第3小组的频率为3p,则p+2p+3p+(0.037+0.013)×5=1,解得p=0.125,故第2小组的频率为0.25,由=0.25,解得n=96,故该单位男职工的总人数为96.
6.在演讲比赛的决赛中,七位评委给甲、乙两位选手打分的茎叶图如图所示,其中在☆处的数据丢失了.按照规则,甲、乙需各去掉一个最高分和一个最低分,用x和y分别表示甲、乙两位选手获得的平均分,则( )
A.x>y
B.x<y
C.x=y
D.x和y之间的大小关系无法确定
解析:选B.本题考查茎叶图及平均数的计算.设题图中甲、乙丢失的数据分别为a,b,则x=80+,y=80+,因为0≤a≤9,所以x=80+≤80+<y,即x<y.
7.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“x0=,y0=”的( )
A.充分不必要条件
B.必要不充分条件
C.充要条件
D.既不充分也不必要条件
解析:选B.因为回归直线=x+必过样本中心点,但除了样本中心点,回归直线上还可能有其他点,故B正确.
8.若随机事件A,B互斥,A,B发生的概率均不等于0,且P(A)=2-a.P(B)=4a-5,则实数a的取值范围是( )
A. B.
C. D.
解析:选D.由题意知⇒
⇒⇒