.word格式,模拟试题一一.单选题(一共20题,每2分)1.一家小食品加工厂,为了了解一种新产品是否受欢迎,以问卷形式做了市场调查,该家厂将收集来的数据,整理成表格形式,如下:表1.1性别女性男性对新产品的喜欢程度喜欢10215不喜欢2385总计125100请问这种将数据以表格形式表示出来属于统计学中的那类:A.收集数据B.分析数据C.计算数据D.由数据作出决策2.抛掷一个硬币,有时会正面向上,有时会反面向上,这说明了抛掷硬币这个事件具有某种:A.随机性B.不可预见性C.确定性D.规律性3.某大学为了了解教师作科研的情况,以问卷形式作调查,其中一项问题为:“论文的发表数量为多少?”为了不发生岐义,请为论文数量这个变量选个合理的定义:A.论文发表总数B.近五年发表的论文总数C.近五年在国内外核心期刊上发表的论文总数D.近五年在国内外核心期刊上发表的论文总数,其中重复发表的不计在抽样调查中,下列那个误差是必然存在的:A.未响应误差B.响应误差C.计算误差D.抽样误差5.在实验中控制实验对象而收集得到的数据称为:A.观测数据B.实验数据C.分组数据D.频数6.下列那种图形不是用来表示数值变量的:A.点线图B.盒形图C.直方图D.饼图7.沈阳市政府想调查一下沈阳市城区人民的年收入情况,因此随机调查了沈阳市内五区共1225人的年收入情况,现在想分区将这些数据表示出来,大致比较一下每个区的人均年收入与年收入的分散情况,下列那个图形较为合适:A.点线图B.直方图C.茎叶图D.盒形图8.直方图中代表观测数目的是矩形的:A.高度B.宽度C.面积D.无法确定9.把一个变量的一组观察数据从小到大排序,排在中间位置的那个数的数值称为这个变量的:A.众数B.中位数C.均值D.频数10.为了解我市初三女生的体能状况,从某校初三的甲、乙两班中各抽取27名女生进行一分钟跳绳次数测试,测试数据统计结果如表4.1,如果每分钟跳绳次数³105次的成绩即为优秀,那么甲、乙两班的优秀率的关系是:表4.1A.甲<乙B.甲>乙C.甲=乙D.无法比较11.我市少年军校准备从甲、乙、丙三位同学中选拔一人参加全市射击比赛,他们在选拔赛中,射靶十次的平均环数是,方差是,,,那么根据以上提供的信息,你认为应该推荐那位同学参加全市射击比赛?A.甲B.乙C.丙D.无法确定12.已知一个样本:1,3,5,x,2,它的平均数为3,则这个样本的方差是:,专业.专注.\n.word格式,A.3B.2.5C.2D.1.5813.甲、乙两人各自投篮的命中率分别为0.8和0.7,假设两人互不影响,则甲、乙两人都投中的概率是:A.0.56B.0.8C.0.7D.0.114.一个袋中装有两个红球三个白球,第一次摸出一个红球又放回,再任意摸出一个,则第二次摸到白球的概率为:A.3/4B.3/5C.1/2D.2/515.具有概率分布的是下列那个分布:A.正态分布B.超几何分布C.二项分布D.泊松分布16.设某课堂考卷上有20道选择题,每题答案是4选1,某学生只会做10题,另外10题完全不会,于是就瞎猜,求他能猜对5题的概率。A.B.C.D.17.X服从正态分布N(4,25),下面哪个随机变量服从标准正态分布N(0,1)?A.(X-2)/25B.(X-2)/5C.(X-4)/25D.(X-4)/518.在评价估计量的标准中,如果随着样本容量的增大,点估计量的值越来越接近总体参数,这是指估计量的: A、准确性 B、无偏性 C、有效性 D、一致性19.某厂生产的化纤纤度服从正态分布N(μ,σ2)。现测得25根纤维的纤度的均值为1.39,如果要检验这些纤维的纤度与原设计的标准值1.40有无显著差异,则合理的零假设与备择假设应为: A、H0:μ>1.40 H1:μ<1.40 B、H0:μ<1.40 H1:μ>1.40 C、H0:μ≥1.40 H1:μ<1.40 D、H0:μ=1.40 H1:μ≠1.4020.在变量x和变量y的直线相关分析中,|r|值越大,则:A.各散点越靠近直线B.各散点越离开直线C.直线越靠近x轴D.直线越远离x轴多选题(一共10题,每3分)1.下列生活、社会活动中,能用到统计的有那些:A.民意调查B.科学研究C.质量控制D.体育比赛E.新药的使用2.抽样调查是:A、是一种非全面调查B、按照随机原则选取调查对象C、永远存在抽样误差D、目的在于对样本进行全面调查E、是一种全面调查3.实验数据与观测数据有那些区别:A.观测数据是观测现实世界时收集得到的数据B.观测数据是为了从收集得到的样本中得出有关总体的一些结论C.观察数据用来对提出的问题研究各种导致它的可能性D.实验数据是在实验中通过控制一个或多个变量而得到的测量结果E.实验数据用来发现造成结果的原因,即鉴别因果关系4.关于点线图下列说法正确的是:A.适合样本量不大时B.适合样本量较大的情况C.能直观看出样本中那些地方观测值比较密集,那些地方观测值稀少D.简化了数据,但同时也丢失了一些信息5.作盒形图时用到的有关样本统计量是:A、最大值B、中位数C、四分位数D、最小值E、众数6.甲、乙两班举行电脑汉字输入比赛,参赛学生每分钟输入汉字的个数统计结果如表4.2所示,(其中每分钟输入汉字≥150个成绩即为优秀),专业.专注.\n.word格式,表4.2班级参赛人数中位数方差平均字数甲55149191135乙55151110135某同学分析上表后得出如下结论,其中正确的是A.甲、乙两班学生成绩的平均水平相同B.乙班优秀的人数多于甲班优秀的人数C.甲班成绩的波动比乙班大D.如果甲班的A同学与乙班的B同学的输入字数都为160,则A同学的标准得分比B同学的小7.对于事件A、B,它们至少有一个发生的概率是P(A)+P(B),则A、B应满足:A.A发生时B肯定不发生B.B发生时A肯定不发生C.A、B相互不影响D.A、B不同时发生8.每年袭击某地的台风次数近似服从参数为4的泊松分布。则一年中该地区受台风袭击次数为3~5的概率为:A.B.C.D.9.关于标准正态分布曲线下列说法正确的是:A.关于直线x=0对称B.关于直线x=1对称C.是一个钟型曲线D.曲线下面的面积等于110.在相关分析与回归分析中:A、据同一资料,相关系数只能计算一个B、据同一资料,相关系数可以计算两个C、据同一资料,回归方程只能配合一个D、据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个E、回归方程和相关系数均与自变量和因变量的确定无关判断题(一共15题,每2分)1.统计可以看做是一项研究随机性中的规律性的科学。2.某大学为了了解学生的英语掌握情况,就调查了外语学院大二年纪两个班的学生,这些学生英语四级通过率为75%,因此得出结论:该校学生英语能力为良好,这个结论是合理的。3.对照组是指实验对象中的一个被随机选择的子集,其中的个体与其他实验对象的所受实验待遇不一样。4.盒形图中,盒子中间有一条线,这条线代表的是样本的均值。5.一组样本只能作一个直方图。6.标准差指的是数据到中位数的一种平均距离。7.标准差的计算方法是,先计算观测值与均值的差,然后将这些数字平方后求和,最后再取平均值。8.概率是-1~1之间的一个数,它告诉了我们一件事发生的经常度。9.甲、乙二人做如下的游戏:从编号为1到20的卡片中任意抽出一张,若抽到的数字是奇数,则甲获胜,否则乙获胜,这个游戏对甲、乙双方是公平的。10.抛一个质量均匀的硬币10次,则出现7次正面的概率大于2次正面的概率。假设检验所依据的原则是:小概率事件在一次试验中不应该发生。,专业.专注.\n.word格式,方差分析中感兴趣是在分类变量的每一类均值是否相等上,但在判断均值之间是否有差异时要借助于方差。如果样本相关系数很高,则总体相关系数也必定很高。 在对数据集(xi、yi)与数据集(ti、ki)作相关与回归分析时,若它们的回归直线是相同的,则它们的相关系数也一定相同。 15.比赛的名次属于分类变量。模拟试题一参考答案一.单项选择题题号1234567891011121314151617181920答案BADDBDDCBAABABBADDDA二.多选题题号12345678910答案ABCDEABCABCDEACABCDABCDABDBCDACDAD三.判断题1对2错3错4错5错6错7错8错9对10对11对12对13错14错15错模拟试题二一.单选题(一共20题,每2分)1.下列学科那个是是研究如何收集、分析与处理数据,并且由此作出决策的一门学科?A.逻辑学B.数学C.统计学D.社会学2.当抛掷一个硬币100次时,差不多会得到50次正面向上,50次反面向上,这说明抛掷硬币这个事件具有某种:A.随机性B.不可预见性C.确定性D.规律性3.要了解20家工业企业职工的工资情况,则总体是:A、20家工业企业B、20家工业企业职工的工资总额C、20家工业企业每个职工的工资D、每一个工业企业的职工4.未响应误差是指:由于样本的随机性而产生的误差在调查中违反随机性原则出现的系统误差C、由于样本中有部分人未回答而造成的误差D、由于样本中部分人没有按他们的真实想法回答而造成的误差5.某生物科技研究所,想了解磷肥的实施是否影响玉米的产量,下面做法可行的是:A.收集某个种植区实施磷肥的量与玉米的产量进行研究B.收集某几个种植区实施磷肥的量与玉米的产量进行研究C.选取若干块土地种植玉米,并都实施磷肥,然后收集实施磷肥的量与玉米产量进行分析D.选取若干块土地种植玉米,随机的选取其中部分土地实施磷肥,并保证其他的种植条件都一样,然后收集实施磷肥的量与玉米产量进行分析,专业.专注.\n.word格式,6.能将数据简化,并不会丢失任何信息的图是:A.点线图B.盒形图C.直方图D.饼图7.盒形图是由一组数据的几个统计量绘制而成的?A、5 B、4 C、3 D、28.在直方图的每一个分类内,观测值被认为是服从:A、对称分布 B、正态分布 C、均匀分布 D、指数分布9.当一组数据中有一个特别大的数值时,适宜用哪一种平均来代表这组数据的集中趋势:A.众数B.中位数C.均值D.频数10.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用条形图表示,如图4.2所示。根据条形图可得这50名学生在该天平均每人的课外阅读时间为:0.5人数(人)时间(小时)2010501.01.52.015A.0.6小时B.0.9小时C.1.0小时D.1.5小时图4.211.在方差计算公式中,数字9和20分别表示:A.数据的个数减一和方差B.平均数和数据的个数C.数据的个数减一和平均数D.数据组的方差和平均数12.若一组数据a1,a2,…,an的方差是5,则一组新数据2a1,2a2,…,2an的方差是:A.5B.10C.20D.5013.某一居民区有500户人家装有电话。某天晚上恰有100户家中无人,而在其余400户中,又有120户人家拒绝电话调查。如果随机地给这些家庭中的某一家打电话,试求电话打到有人的家庭,但这家人却拒绝调查的概率:A.6/25B.4/5C.24/125D.3/1014.连掷两次骰子,它们的点数和是4的概率是:A.1/36B.1/6C.1/18D.1/1215.如果一个事件每次发生的概率是p,那么在n次观察中能够看到这个事件出现k次的概率是:A.B.C.D.16.具有概率分布的是下列那个分布:A.超几何分布B.正态分布C.二项分布D.泊松分布17.由某机器生产的螺栓的长度(cm)服从参数m=10.05,s=0.06的正态分布。现取一螺栓其长度为10.17,将这个长度转换为标准z得分是:A.2B.-2C.1/2D.-1/218.如果大量样本的样本统计量的均值等于总体参数的真值,则这种样本统计量是该参数的: A、准确估计 B、无偏估计 C、有效估计 D、一致估计19.若X~N(μ,σ2)(其中μ,σ2均未知),记样本均值为,样本标准差为s,对于假设检验问题:H0:μ=μ0,H1:μ≠μ0,应该选取的检验统计量为: A.B.C.D. 20.当相关系数r=0时,说明变量x与变量y:A.不存在任何关系B.存在相关关系的可能性很小,专业.专注.\n.word格式,C.关系不能确定D.不存在直线关系,但不排除存在某种曲线关多选题(一共10题,每3分)1.对“概率”这一词的理解主要有那两种:A.某一系统的一个内在特性B.频数的极限C.对某一陈述相信程度的度量D.0~1间的一个数E.不确定性2.抽样调查法可应用在:A、税务局对所有纳税企业有无偷税漏税情况的检查B、对电视机使用寿命的检查C、对产品的质量进行控制D、对有破坏性产品的质量检验3.在进行实验分析时,需要选取对照组,对于对照组下列说法正确的是:A.没有对照组也可以一样的进行实验B.没有对照组,对于实验结果就没有办法确定是由实验中感兴趣的变量或者其他变量还是它们的联合变量引起的C.选取对照组的原则是随机分配D.在对照组中,通过控制实验中不感兴趣的变量,使之与实验组中一样,因此可以消除不感兴趣的变量对实验结果的影响4.数值(连续)变量通常用的图形表示法有:A.直方图B.茎叶图C.点线图D.盒形图E.条形图5.关于盒形图下列说法正确的是:A.从图中能够看出一共有多少个数据B.样本容量较大时可以用盒形图表示C.从图中可以看出样本中的最大最小值D.简化了数据,但同时也丢失了一些信息6.数据离散程度的度量值有:A、极差B、标准差C、方差D、众数7.下列事件中指的是主观概率的有:A.Jerry投掷一枚质量不均匀的硬币1000次得到200次正面向上,因此他认为在一次投掷中,这枚硬币正面向上的概率为1/5B.Tom同学觉得这次统计课期末考试他及格的概率为1/2C.某游客认为这次旅行平安到达的概率为9999/10000D.某球迷认为这次世界杯中法国队胜出的概率为4/58.有放回抽样的特点是:A.各次抽选互不影响B.各次抽选相互影响C.每次抽选时,总体的大小逐渐减少D.每次抽选时,总体的大小始终不变E.每个个体被抽中的机会在各次抽选中相等9.下列关于t分布说法正确的是:A.t分布有一族B.t分布的曲线关于y轴对称C.服从t分布的变量的标准差等于1D.t分布适用于小样本的情况10.下列说法中正确的有:A.具有明显因果关系的两变量不一定是线性相关关系B.相关关系的符号可说明两变量相互关系的方向,专业.专注.\n.word格式,C.样本相关系数和总体相关系数之间存在着抽样误差D.具有线性相关关系的变量一定存在因果关系E、相关系数越大,则回归系数也越大判断题(一共15题,每2分)1.抛一个质量均匀的硬币,其正面向上的概率为1/2,因此在抛这个硬币100次时,不可能出现没有正面向上的情况。2.在问卷调查中,给出问题的备选答案有助于对该问题的答案进行分析。3.在研究某种新药的效果时,常会遇到这种道德困境,如果新药的疗效很好,那么对照组的人就没有得到及时有效的治疗;如果新药有意想不到的负作用,那么实验组的人将遇到未知的危险。4.在作直方图时,将自变量的区间划分的越多越细越好。5.盒形图与直方图能将数据简化,但也丢失了样本信息。6.对于大多数单峰对称分布,标准差大约等于极差的四分之一。7.观测值的标准差比均值的标准误差小。利用一个随机事件的频率(比例)能够求出概率的一个精确值。甲、乙二人做如下的游戏:从编号为1到20的卡片中任意抽出一张,若抽到的数字是3的倍数,则甲获胜;若抽到的数字是5的倍数,则乙获胜,此时这个游戏对甲、乙双方是公平的。抛一个质量均匀的硬币n次,正面出现n/2次的概率最大。p-值就是衡量零假设是否正确的概率。12.方差分析时,自变量每一分类的数据都比较多时,如果用散点图来表示这些数据,因为点太多很难看清这两个变量的关系,因此可以用盒形图来表示,盒形图能够简化数据。13.在一元线性回归方程中,回归系数表示自变量每变动一个单位时,因变量的变动值。 14.在由样本信息对总体进行推断时,检验零假设为“自变量与因变量无关”,它等价于检验“回归系数b=0”。 15.可以将分类变量转化为顺序变量,但反之不行。模拟试题二参考答案一.单项选择题题号1234567891011121314151617181920答案CDCCDAACBBCCADADABCD二.多选题题号12345678910答案ACBCDBCDABCDBCDABCBCDADEABDABC三.判断题1错2错3对4错5对6对7错8错9错10错11错12对13错14对15错模拟测试三一、单选题(一共20题,每2分),专业.专注.\n.word格式,1.一家小食品加工厂,为了了解一种新产品是否受欢迎,以问卷形式做了市场调查,该家厂由调查来的数据进行推断:这种新产品更受女性消费者的欢迎。请问这种推断属于统计学中的那类:A.收集数据B.分析数据C.计算数据D.由数据作出决策2.从概率的角度来看,你认为下列生活中的哪一种现象具有合理的成分?A.某同学认为某门课程太难,考试不可能及格,因此放弃了努力学习;B.某人总是用一个固定的号码去买彩票,她坚信总有一天这个号码会中奖;C.某人总是抢先第一个抽签,认为这样抽到好签的可能性最大;D.某足球教练认为比赛时他的衣服颜色与比赛的结果有关,所以总穿着同一件“幸运服”去指挥比赛简单随机样本的含义是什么A.总体中的每个个体以相等的概率进入样本中B.总体中的每个个体以确定的概率进入样本中C.总体中的每个个体以随机的概率进入样本中D.容易调查的个体形成的样本抽样调查中,抽样误差是:A.可以避免但不可控制的B.可以避免且可控的C.不可避免且不可控制的D.不可避免但可以控制的5.在实验中,实验组与对照组选取的原则是:A.随机分配B.使得实验尽量简单C.根据自愿D.指定分配6.盒形图中,盒子中包含了多少观测值?A.整个样本B.样本的1/2C.样本的1/4D.样本的3/47.当样本量不大,并想快速收集整理信息时,此时适合用的图形是:A.饼图B.直方图C.茎叶图D.盒形图8.下列说法不正确的是:A.作直方图时,如何划分自变量的区间不是唯一确定的B.直方图没有丢失样本信息C.作直方图时自变量区间分得较少,有可能会掩盖了数据是双峰的信息D.作直方图时矩形的高低形状不同,能够造成视觉上的差异如图4.1是对37位妇女的结婚年龄的调查而得到的直方图,由图可以得出这些妇女结婚年龄的众数为:A.27.5B.25C.30D.20图4.110.数据0,1,1,3,4,5,5,5,6的中位数是: A、3 B、3.5 C、4 D、511.标准差反映了数据到()一种平均距离A.众数B.中位数C.均值D.频数,专业.专注.\n.word格式,12.以下四个数据集中,那个数据集的标准差最大?A.6,6,6,6,6,6,6B.5,5,6,6,6,7,7C.3,3,4,6,8,9,9D.3,3,3,6,9,9,913.某人因听说飞机失事的报道而不敢乘坐飞机外出办事,其同事帮找来近三年的飞行记录,其中安全飞行记录共有15万次左右,而失事纪录只有2次,此人了解后便不再害怕乘坐飞机,因为他算出一次飞行中飞机失事的概率:A、约为1/75000B、精确等于1/75000C、0D、无法确定14.独立地抛掷一枚质量均匀硬币,已知连续出现了10次反面,问下一次抛掷时出现的是正面的概率是:A.1/11B.1/10C.1/2D.1/915.事件A发生的概率p=1/3,则在15次实验中,下列事件那个概率最大?A.A发生15次B.A发生5次C.A发生10次D.A发生7次16.某商场每月销售某商品的数量服从参数为3的泊松分布,则下月该商场买出5件该产品的概率为:A.B.C.D.17.已知标准z变量取值在-1.96~1.96之间的概率为0.95。在一次公务员资格考试中,甲同学考了80分,可以认为此次考试成绩服从正态分布,平均成绩是60分,标准差是10分,则可以认为:A.有等于5%的同学能比他考得更好B.有等于2.5%的同学能比他考得更好C.有少于2.5%的同学能比他考得更好D.有2.5%~5%的同学能比他考得更好18.如果我们做了大量次数的重复抽样,采用某方法得到的估计值的标准差很小,则称这种估计是:A、准确的 B、无偏的 C、有效的 D、一致的19.若X~N(μ,σ2)(其中μ,σ2均未知),记样本均值为,样本标准差为s,对于假设检验问题:H0:μ=μ0,H1:μ≠μ0取检验统计量为t0=,此检验的显著水平为a的拒绝域为:A.|t0|>taB.|t0|>t1-aC.|t0|>ta/2D.|t0|>t1-a/220.有学生十人(甲、乙、……、癸),他们期终考的数学成绩与该学期数学课的缺课数,如下表10.1所示。 表10.1学生甲乙丙丁戊己庚辛壬癸缺课数1233435630成绩1009090807070606080100设两者的相关系数为r,则有:A.-1≤r≤-0.6B.0.6<r<1C.-0.1≤r≤0.2 D.0.2<r<0.6多选题(一共10题,每3分)1.某灯泡厂生产了100箱灯泡,在进行产品检验时,下列那些事件是随机事件:A.某一个特定的箱中是否含有废品B.随机取10箱,其中有两箱含有废品C.这100箱中,含有2件废品的箱数D.任取一箱,其中含有废品2.某大学为了了解现在学生的心里健康状况,决定从在校的2万多名学生中随机选取1200人进行调查,你认为下列那些方案是可行的:,专业.专注.\n.word格式,A.随机选取大二年级的1200名学生B.将所有学生的学号写在纸条上,在放入一个箱子里搅匀,然后随机抽取1200名C.下课时,随机调查从教学大楼里走出的1200名学生D.将所有学生按1、2、3、…顺序编号,然后通过随机数表产生1200个随机数并取对应的学生做为调查对象E.周六到学生寝室随机调查1200名学生3.以人为对象的实验中,经常会遇到如下问题:A.人们未必服从研究者的安排B.人们都有自己的计划和兴趣,未必会服从研究者的研究兴趣C.人们可能对安排在他们身上的研究非常敏感,因此使得他们注意自我,从而对他们的行为产生了很多约束D.某些实验可能因为道德问题而无法进行4.关于直方图,以下说法正确的是:A、直方图的矩形高度表示频数或百分比B、直方图的矩形面积表示频数或百分比C、直方图的矩形宽度是固定的D、直方图的矩形通常是连续排列5.用来表示两个数值变量的图有:A.散点图B.点线图C.时间序列图D.盒形图6.调查了37对新婚夫妇,有一对新人的年龄是:新郎21岁、新娘19岁。还知道这37对新人中,新郎们的平均年龄是30岁,标准差11岁;新娘们的平均年龄25岁,标准差10岁。那么关于该对新人下面说法正确的是:A.该新娘与女性的均值的距离比该新郎与男性的均值更远B.该新郎与男性的均值的距离比该新娘与女性的均值更远C.该新娘的结婚年龄比他的新郎更反常规D.该新郎的结婚年龄比他的新娘更反常规7.甲、乙两人独立地解同一问题,甲解决这个问题的概率是p1,乙解决这个问题的概率是p2,那么恰好有1人解决这个问题的概率是:A.p1p2B.p1(1-p2)+p2(1-p1)C.1-p1p2D.1-(1-p1)(1-p2)-p1p28.某书第一节课后有习题10道,为判断题,某学生都不会做,于是就瞎猜,则他至少能猜对5题的概率为:A.B.C.D.9.下列关于正态分布的曲线与t分布的曲线说法正确的是:A.正态分布的曲线与t分布的曲线基本形状相同B.正态分布曲线的中部较高C.它们都关于直线x=0对称D.t分布曲线在其均值周围的聚集程度比正态分布要差一些10.对于回归系b,下列说法正确的有:A、b是回归直线的斜率B、b的绝对值介于0~1之间C、b接近于零表明自变量对因变量影响不大D、b与相关系数r能够相互推导,专业.专注.\n.word格式,判断题(一共15题,每2分)1.在无放回抽样下,从容量为N的总体中抽取容量为n的样本,则所有可能的样本个数为Nn个。2.一般的,在一次抽样中,由样本得到的估计值与总体真值之间是有差别的。3.在研究照明度对生产灯泡的工人生产率的影响时,无论增加减少照明度,产量都会增加,后来称这种现象为Hawthorne效应。4.直方图的矩形高度和条形图的条形高度均表示各组的频数。5.时间序列图能够反映出一个变量随着时间而变化的趋势。6.根据一个样本的数据可以估计标准误差。7.样本越多,一个样本均值与另一个样本均值的变差就越小,这使得标准误差也较小。主观概率指的是对于不能做重复试验的随机事件,人们各自给出的对这个事件发生的相信程度。小概率事件在一次实验中能够认为不会发生,飞机失事就是小概率事件,虽然乘坐飞机有危险,但是人们还是会乘坐飞机旅行。抛一个质量均匀的硬币n次,当n为偶数时,正面出现n/2次的概率最大。一般来说零假设总是“受到保护的假设”没有充分的证据是不能拒绝零假设的。方差分析的实质就是检验若干总体的方差是否相等。如果两变量的相关系数等于0,说明它们之间不存在任何关系。在作回归系数的区间估计时,如果置信区间包含了0点,那么我们就可以认为在总体中,自变量与因变量有关系。15.数值变量、顺序变量都可以转化为分类变量。模拟试题三参考答案一.单项选择题题号1234567891011121314151617181920答案DBABABCBACCDACBACCCA二.多选题题号12345678910答案BDBDABCDBDACBDBDCDABCDACD三.判断题1错2对3对4错5对6对7对8对9对10对11对12错13错14错15对模拟测试四一.选择题1.矩估计是(A)点估计(B)极大似然估计(C)区间估计(D)无偏估计2.设是来自总体的样本则()(A)同分布(B)与同分布,专业.专注.\n.word格式,(C)独立同分布(D)与同分布且相互独立3.总体未知参数的估计量是()(A)随机变量(B)总体(C)(D)均值4.设X~N(μ,σ2),是取自总体X的一组样本,则 5.设X~N(μ,σ2)(其中μ,σ2均未知),是取自总体X的一组样本,记则检验假设H0:μ=μ0,H1:μ≠μ0,应该选统计量( )。 A B C D 6.设X代表每个高中生平均每天学习数学的时间(以小时计),则代表每个高中生平均每周不学习数学的时间.又设Y代表每个高中生数学学科能力测验的成绩,设X,Y之间的相关系数为RXY,W,Y之间的相关系数为RWY,则RXY与RWY两数之间的关系应该满足()(A)(B)(C)(D)7.下列5组资料(每组各有10笔)(1)l,l,l,l,l,10,10,10,10,10(2)1,1,1,1,1,5,5,5,5,5(3)4,4,4,5,5,5,5,6,6,6(4)l,l,2,2,3,3,4,4,5,5(5)1,2,3,4,5,6,7,8,9,10试问哪一组资料的标准差最大?(A)(A)(1)(B)(2)(C)(4)与(5)(D)(3)与(4)8.有5笔(x,y)资料如图所示.则去掉哪一笔资料后,剩下的4笔资料的相关系数最大?()(A)B(B)C(C)D(D)E,专业.专注.\n.word格式,9.在假设检验中,显著性水平的意义是【 】。(A)原假设成立,经检验拒绝的概率.(B)原假设成立,经检验接受的概率.(C)原假设不成立,经检验拒绝的概率.(D)原假设不成立,经检验不能拒绝的概率.10、设为来自总体的一个样本,均为未知参数,则下面不是统计量的是【 】。(A);(B);(C);(D)二、判断题(判断正误。正确的在题目后面的括号内填入“√”;否则填入“×”。)1、绘制茎叶图时,以某组数据的高位数值作为树茎。()2、某公司的所有员工中,如果大多数人的月销售额都比平均数高,意味着众数最大,平均数最小,这样的分布是偏斜分布。()3、如果总体服从正态分布,则样本均值也服从正态分布;如果总体不服从正态分布,则样本均值也不服从正态分布。()4、区间估计中,总体均值不在某一区间的概率用α表示,称为置信水平;而总体均值在这一区间的概率1-α称为显著性水平。5、在假设检验中,当备择假设H1为真时作出接受原假设H0的判断,则犯了弃真错误。()6、一元线性回归方程中,回归系数表示自变量每变动一个单位时,因变量的平均变动值。()7、方差分析中,组间方差的自由度为n-1,组内方差的自由度为k-1。()8、两变量的相关系数等于0,说明它们之间不存在相关关系。()三、简答题1.某艺术学校今年招收新生300名,而报名并参加考试的学生有1500人,已知面试满分为100分,抽样统计考试成绩服从正态分布N(75,64),请试估计该校今年的录取分数线.(参考数据Φ(0.84)=0.7995,Φ(0.85)0.8023)2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。假定顾客用餐平均花费的金额服从正态分布,且标准差为15元。(1)求样本均值的抽样标准误差;(2)在95%的置信水平下,求边际误差;(3)如果样本均值为120元,求95%置信水平下总体均值的置信区间。3.某种生产线生产的感冒冲剂规定每包重量为12克,超重或份量不足都是严重问题。从过去的资料知δ是0.6克,质检员每2小时抽取25包冲剂称重检验,并作出是否停工的决策。假定产品重量服从正态分布。(14分),专业.专注.\n.word格式,(1)建立适当的原假设和备择假设。(2)在α=0.05时,该检验的决策准则是什么?(3)如果克,应该采取什么行动?(4)如果克,应该采取什么行动?4、某公司经理给出了评价雇员的业绩指标,按此将公司雇员的业绩分为优、良、中等三类。为增加评价的客观性,该经理又设计了若干项测验。现从优、良、中等三类雇员中各随机抽选5人。下表是他们各项测验的总分:优良中等123451048786838668697165664137444733平均89.267.840.4要求:⑴在下表中带有下划线的空格内填写数据,以完善该方差分析表。差异源平方和自由度均方F值P-值组间5983.6________________3.898.94E-08组内________________________总计6412.4________ ⑵根据方差分析的结果,你认为优、良、中等三类雇员的测验成绩有显著差异吗?模拟试题四参考答案一.选择题1.A2.D3.A4.B5.D6.D7.A8.C9.A10.D二、判断题1、√2、√3、×4、×5、×6、√7、×8、×2、设随机变量~,~,且和相互独立,则~。三.简答题1.解:设录取分数线为x分,则由题意知:P(ξ³x)==0.20,∵ξiN(75,64),∴iN(0,1),,专业.专注.\n.word格式,1–P(<)=0.2即Φ()=0.08,≈0.85,x≈82.2.(1)这里采取的抽样方法是不重复抽样,但由于到该快餐店就餐的顾客总体可以看作是一个无限总体,因而样本均值的抽样标准误差仍可在重复抽样的标准差来计算。即:(2)显著性水平为95%时,,边际误差为:(3)95%的置信水平下总体均值的置信区间为:即总体均值的置信区间为115.8≤μ≤124.2。2、(14分)(1)(2)在α=0.05时,临界值,如果统计量的值,则拒绝原假设。(3)当克时,检验的统计量为:由于,所以拒绝。即应该对生产线停产检查。(4)当克时,检验的统计量为:由于,所以不能拒绝。即不应该对生产线停产检查。4.)解:⑴方差分析表差异源SSdfMSFP-valueFcrit组间22991.883.73组内428.801235.73,专业.专注.\n.word格式,总计14 ⑵提出假设:三类雇员的测试成绩相同、、不全相等,三类雇员的测试成绩不全相同。由于检验统计量F=83.73>,应拒绝原假设H0,即不成立,可认为三类雇员的测试成绩有显著差异。模拟测试五一.选择题统计量是根据()计算出来的。A、总体数据B、样本数据C、分类数据D、顺序数据箱线图是由一组数据的()个特征值绘制而成的。A、5B、4C、3D、2下四分位数是处于数据()位置的值。A、50%B、40%C、80%D、25%当一组数据的分布为左偏时,最好用()作为该组数据的概括性度量。A、众数B、均值C、最小值D、最大值5、在其他条件不变的情况下,()。A、置信概率越大,所需的样本容量也就越小B、样本容量与总体方差成反比C、样本容量与边际方差的平方成正比D、样本容量与边际方差的平方成反比6、P值可显示检验统计量值在一定范围内出现的概率,将P值与给定的显著性水平α相比()。A、当P值≥α时,拒绝原假设B、当P值≥α时,接受原假设C、当P值<α,拒绝原假设D、当P值<1-α时,接受原假设7、在方差分析中,随机误差()。A、只存在于组内方差中B、只存在于组间方差中C、既存在于组内方差,又存在于组间方差中D、是由系统性因素造成的8、回归直线拟合的好坏取决于SSR及SSE的大小,()。A、SSR/SST越大,直线拟合得越好B、SSR/SST越小,直线拟合得越好C、SSR越大,直线拟合得越好D、SST越大,直线拟合得越好9、变量之间的相关程度越低,则相关系数的数值( )。(A)越小 (B)越接近于0 (C)越接近于-1 (D)越接近于110.设总体是X的样本,则【 】。,专业.专注.\n.word格式,(A)t(n)(B)(C)F(1,n)(D)N(0,1)二、判断题设随机变量,,且随机变量X与Y相互独立,则F(m,n)。()两个总体不相关的变量,其样本相关系数也可能较高。()备择假设为真时,作出接受原假设的判断,这类错误称为第二类(弃真)错误。()在区间估计中,总体均值不在某一区间的概率用α表示,称为置信水平;而总体均值在这一区间的概率1-α称为显著性水平。()在对单个总体的参数值做检验时,小样本量用z检验。()6、H0:μ≥2000,H1:μ<2000是一个单边备择假设。()7、相关系数的取值范围在0和+1之间。()8、某商场有160名员工,如果大多数人的月销售额都比平均数高,意味着众数最大,平均数最小,这样的分布是偏斜分布。()三.简答题1、为了估计员工每月的通讯费平均支出,某公司采用简单随机抽样方法从1000名员工中抽取了64名员工。假定员工通讯费的平均支出服从正态分布,且标准差为15元。(1)求样本均值的抽样标准误差;(2)在95%的置信水平下,求边际误差;(3)如果样本均值为150元,求总体均值95%的置信区间。2、某公司纯净水灌装线生产的瓶装纯净水规定每瓶净含量为600ml。过多或过少都是质量问题。从过去的资料知δ是10ml,质检员每1小时抽取25瓶称重检验,并作出是否停工检修的决策。假定产品净含量服从正态分布。(本题14分)(1)建立适当的原假设和备择假设。(2)在α=0.05时,该检验的决策准则是什么?(3)如果,应该作出怎样的决策?(4)如果,应该作出怎样的决策?3、有两种水稻品种,分别在五块田上试种,其产量如下:甲品种乙品种,专业.专注.\n.word格式,田块面积(亩)产量(公斤)田块面积(亩)产量(公斤)1.21.11.00.90.86004954455404201.51.41.21.00.9840770540520450要求:(1)分别计算两品种单位面积产量。(2)假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广。4、为研究产品销售额和销售利润之间的关系,某公司对所属10家企业进行调查,设产品销售为X(万元),销售利润为Y(万元).对调查资料进行整理和计算,其结果如下:∑x=795∑x2=72925∑y=1065∑y2=121475∑xy=93200要求:(1)计算销售额和销售利润之间的相关系数;(2)配合销售利润对销售额的直线回归方程.模拟试题五参考答案一.选择题1、B2、A3、D4、A5、D6、B7、C8、B9、B10.B二.判断题1、×2、√3、√4、×5、×6、√7、×8、√三.简答题解:(1)这里采取的抽样方法是不重复抽样。已知N=1000,n=64,(2)显著性水平为95%时,,边际误差为:(3)总体均值95%的置信区间为:即:在95%的置信水平下,该公司员工每月的通讯费支出在146.44元和153.56元之间。2、解:(1)提出假设:(2分)(2)由于正态总体,总体方差已知,n=25,使用Z统计量。在α=0.05时,临界值。这是双侧检验,如果统计量的值,则拒绝原假设。(2分),专业.专注.\n.word格式,(3)当ml时,检验的统计量为:(3分)由于,所以拒绝,即应该对生产线停工检修。(2分)(4)当ml时,检验的统计量为:(3分)由于,所以不能拒绝,即不应该对生产线停工检修。(2分)3.解:x=产量\面积=x·f\f甲品种==2500/5=500(公斤)乙品种:3120/6=520(公斤)甲品种σ===55.3(公斤)乙品种σ==40.6(公斤)甲品种v甲=σ/×100%=55.3/500×100%=11.06%乙品种v乙=40.6/520×100%=7.8%因为v乙
中位数>均值C、中位数>均值>众数D、均值>中位数>众数多选题1.下列属于集中趋势的度量值的是:A、众数B、中位数C、均值D、标准差2.下面关于众数说法正确的是:A.众数只能表明这个值比其它的值出现的次数多,但不能说明它较别的数值多的程度B.众数可以代替均值使用C.众数可以从图表中容易获得D.众数一般不单独使用,因为它只能传递数据集的很小一部分信息3.下面关于中位数说法正确的是:A.在直方图中,中位数不需要计算就可以获得B.中位数主要用于描述非对称分布,即偏斜分布的数据C.中位数的优点是对于极端值不敏感D.在茎叶图中,中位数容易获得4.下面关于均值说法正确的是:A.均值不能从图表中直接获得,需要计算B.均值对于极端值比较敏感C.均值的优点是对于变量的每一个观测值都加以利用,保留原数据的信息较众数、中位数多D.均值只能用于表示数值变量数据集的中心判断题得到一组样本以后,经常要计算表示样本数据平均趋势和离散趋势的统计量,这些统计量的主要缺点是:丢失了样本的某些信息。众数只能用来描述分类变量,不能描述其他变量。对于数值变量,选择不同的直方图的区间长度,可以获得不同的众数,因此,众数依赖于直方图的画法。对于二众数分布,均值能比两个众数提供更多的信息。不管样本容量是奇数还是偶数,中位数的求法是一样的。中位数就是第五十个百分位数。决定一个数据集是用中位数还是均值,最好两种都算出来,如果它们的值很接近就使用均值。决定一个数据集是用中位数还是均值,最好两种都算出来,如果中位数与均值有很大不同,就使用中位数。根据数据的直方图可以算出均值的精确值。第二节数据的变差(29)单选题1.下列函数中,离散程度最大的是:,专业.专注.\n.word格式,A.B.C.D.2.样本数据中最大值与最小值的差称为:A.方差B.标准差C.误差D.极差3.标准差反映了数据到()一种平均距离A.众数B.中位数C.均值D.频数4.以下四个数据集中,那个数据集的标准差最大?A.6,6,6,6,6,6,6B.5,5,6,6,6,7,7C.3,3,4,6,8,9,9D.3,3,3,6,9,9,95.方差是标准差的:A.平方B.平方根C.算术平方根D.以上皆不是6.对于大多数单峰对称分布,几乎所有的观测值会落在A.均值加减一个标准差内B.均值加减两个标准差内C.均值加减一个方差内D.均值加减两个方差内7.下列反映变异的指标中,最易受极端值影响的是:A.标准差B.方差C.极差D.四分位数极差8.为了判断甲、乙两个小组学生英语口语测验成绩哪一组比较整齐,通常需要知道两组成绩的:A.平均数B.方差C.众数D.中位数9.在统计中,样本的方差可以近似地反映出总体的:A.平均状态B.最大值和最小值C.分布规律D.波动大小10.我市少年军校准备从甲、乙、丙三位同学中选拔一人参加全市射击比赛,他们在选拔赛中,射靶十次的平均环数是,方差是,,,那么根据以上提供的信息,你认为应该推荐那位同学参加全市射击比赛?A.甲B.乙C.丙D.无法确定11.已知一个样本:1,3,5,x,2,它的平均数为3,则这个样本的方差是:A.3B.2.5C.2D.1.5812.在方差计算公式中,数字9和20分别表示:A.数据的个数减一和方差B.平均数和数据的个数C.数据的个数减一和平均数D.数据组的方差和平均数13.若一组数据a1,a2,…,an的方差是5,则一组新数据2a1,2a2,…,2an的方差是:A.5B.10C.20D.5014.很多不同样本的均值的标准差称为:A.标准差B.标准误差C.标准方差D.误差15.一组观测值的标准得分是指:A.(观测值-均值)/方差B.(均值-观测值)/方差C.(均值-观测值)/标准误差D.(观测值-均值)/标准差16.使用下面那个统计量,能够使得一个变量的任何值都可以和任何其它变量的值相比较?A.标准得分B.标准误差C.均值D.方差多选题,专业.专注.\n.word格式,1.数据离散程度的度量值有:A、极差B、标准差C、方差D、众数2.盒形图中可以表示出观测值的:A、方差B、标准差C、极差D、四分位极差3.四分位极差是指:A.数据排序后中间一半数据的极差B.最小的25%与最大的25%的数据去掉后,剩下数据的极差C.下四分位数-上四分为数D.上四分位数-下四分为数4.调查了37对新婚夫妇,有一对新人的年龄是:新郎21岁、新娘19岁。还知道这37对新人中,新郎们的平均年龄是30岁,标准差11岁;新娘们的平均年龄25岁,标准差10岁。那么关于该对新人下面说法正确的是:A.该新娘与女性的均值的距离比该新郎与男性的均值更远B.该新郎与男性的均值的距离比该新娘与女性的均值更远C.该新娘的结婚年龄比他的新郎更反常规D.该新郎的结婚年龄比他的新娘更反常规5.甲、乙两班举行电脑汉字输入比赛,参赛学生每分钟输入汉字的个数统计结果如表4.2所示,(其中每分钟输入汉字≥150个成绩即为优秀)表4.2班级参赛人数中位数方差平均字数甲55149191135乙55151110135某同学分析上表后得出如下结论,其中正确的是A.甲、乙两班学生成绩的平均水平相同B.乙班优秀的人数多于甲班优秀的人数C.甲班成绩的波动比乙班大D.如果甲班的A同学与乙班的B同学的输入字数都为160,则A同学的标准得分比B同学的小判断题1.标准差指的是数据到中位数的一种平均距离。2.标准差的计算方法是,先计算观测值与均值的差,然后将这些数字平方后求和,最后再取平均值。3.对于大多数单峰对称分布,标准差大约等于极差的四分之一。4.观测值的标准差比均值的标准误差小。5.根据一个样本的数据可以估计标准误差。6.样本越多,一个样本均值与另一个样本均值的变差就越小,这使得标准误差也较小。7.如果两个变量的均值相同,但标准差不同时,其中一个变量的值是可以和另一个变量的值相互比较的。8.一个数据的标准得分越偏离零点,则说明这个数据越异常,大多数正常数据的标准得分都落在区间-2.00~2.00之间,绝大多数在-3.00~3.00之间。参考答案第一节数据的平均(31)单选题1.B2.C3.D4.A5.A6.B7.C8.B9.C10.D11.C12A.13.D14.A15.D16.B17.B18D多选题1.A、B、C、2.ACD3.BCD4.ABC,专业.专注.\n.word格式,判断题对错对错错对对对错第二节数据的变差(29)单选题1.A2.D3.C4.D5.A6.B7.C8.B9.D10.A11.B12.C13.C14.B15.D16.A多选题1.ABC2.CD3.ABD4.BD5.ABCD判断题1.错2.错3.对4.错5.对6.对7.错8.对第五章习题第一节概率的计算(33)单选题某人忘记了电话号码的最后一位数字,因而他随意拨号,第一次接通电话的概率是:A、1/9B、1/10C、3/10D、2/9某福利中心为了筹集急救资金,发行了一次有奖彩票,共10万张,其中有奖的2万张,特别的,一等奖有2张奖金1万元,假设有奖与无奖彩票是均匀混合随机发放的,那么小张买一张彩票中一等奖的概率是多少?A、1/100000B、2/10C、1/50000D、1/10000某人因听说飞机失事的报道而不敢乘坐飞机外出办事,其同事帮找来近三年的飞行记录,其中安全飞行记录共有15万次左右,而失事纪录只有2次,此人了解后便不再害怕乘坐飞机,因为他算出一次飞行中飞机失事的概率:A、约为1/75000B、精确等于1/75000C、0D、无法确定一次事件(不可重复)的概率叫做:A.客观概率B.条件概率C.相对频数D.主观概率火星上有生命的概率为0.0001,其中这里的“概率”指的是:A.某系统的内部特性B.条件概率C.主观概率D.相对频数某一居民区有500户人家装有电话。某天晚上恰有100户家中无人,而在其余400户中,又有120户人家拒绝电话调查。如果随机地给这些家庭中的某一家打电话,试求电话打到有人的家庭,但这家人却拒绝调查的概率:A.6/25B.4/5C.24/125D.3/10设某地有甲、乙两种杂志,该地成年人中有20%读甲杂志,16%读乙杂志,8%兼读甲和乙两种杂志。问成年人中百分之几至少读一种杂志?,专业.专注.\n.word格式,A.20%B.36%C.24%D.28%袋中有5个白球,n个红球,从中任取一个恰为红球的概率为2/3,则n为:A、16B、10C、20D、18连掷两次骰子,它们的点数和是4的概率是:A.1/36B.1/6C.1/18D.1/12连掷两次骰子,它们的点数都是4的概率是:A.1/36B.1/6C.4/9D.1/3独立地抛掷一枚质量均匀硬币,已知连续出现了10次反面,问下一次抛掷时出现的是正面的概率是:A.1/11B.1/10C.1/2D.1/9甲、乙两人各自投篮的命中率分别为0.8和0.7,假设两人互不影响,则甲、乙两人都投中的概率是:A.0.56B.0.8C.0.7D.0.1一个袋中装有两个红球三个白球,第一次摸出一个红球又放回,再任意摸出一个,则第二次摸到白球的概率为:A.3/4B.3/5C.1/2D.2/5“有志者,事竟成”可以用概率论中的一个结论来近似解释,这个结论是:A.概率是某系统内部的特性B.大量重复实验中频率接近与概率C.一次实验中小概率事件不可能发生D.小概率事件必然发生在风险和利益之间寻求平衡的过程叫做:A.概率分析B.决策分析C.统计推断D.统计分析某突发事件,在不采取任何预防措施的情况下发生的概率为0.3,一旦发生,将造成400万元的损失.现有甲、乙两种相互独立的预防措施可供采用。单独采用甲、乙预防措施所需的费用分别为45万元和30万元,采用相应预防措施后此突发事件不发生的概率为0.9和0.85.若预防方案允许甲、乙两种预防措施单独采用、联合采用或不采用,请确定预防方案使总费用最少。(总费用=采取预防措施的费用+发生突发事件损失的期望值.)A.不采取预防措施B.单独采取措施甲C.单独采取预防措施乙D.联合采取甲、乙两种预防措施多选题概率可通过下列那些办法计算得到:A.利用等可能性B.相对频数C.主观概率D.几何概率中的面积比下列事件中指的是主观概率的有:A.Jerry投掷一枚质量不均匀的硬币1000次得到200次正面向上,因此他认为在一次投掷中,这枚硬币正面向上的概率为1/5B.Tom同学觉得这次统计课期末考试他及格的概率为1/2C.某游客认为这次旅行平安到达的概率为9999/10000D.某球迷认为这次世界杯中法国队胜出的概率为4/5对于事件A、B,它们至少有一个发生的概率是P(A)+P(B),则A、B应满足:A.A发生时B肯定不发生B.B发生时A肯定不发生C.A、B相互不影响D.A、B不同时发生甲、乙两人独立地解同一问题,甲解决这个问题的概率是p1,乙解决这个问题的概率是p2,那么恰好有1人解决这个问题的概率是:A.p1p2B.p1(1-p2)+p2(1-p1)C.1-p1p2D.1-(1-p1)(1-p2)-p1p2,专业.专注.\n.word格式,为防止某突发事件发生,有甲、乙、丙、丁四种相互独立的预防措施可供采用,单独采用甲、乙、丙、丁预防措施后此突发事件不发生的概率(记为P)和所需费用如下表5.1:表5.1预防措施甲乙丙丁P0.90.80.70.6费用(万元)90603010预防方案可单独采用一种预防措施或联合采用几种预防措施,在总费用不超过120万元,且使得此突发事件不发生的概率大于等于0.9的前提下,下列那些预防方案是可行的:A.方案1:单独采用甲措施B.方案2:联合采用甲、乙两种预防措施C.方案3:联合采用甲、丁两种预防措施D.方案4:联合采用三种预防措施判断题概率是-1~1之间的一个数,它告诉了我们一件事发生的经常度。在重复实验中,一个特殊结果出现的可能性为多少,可以用概率来回答。任何情况都可以利用等可能性来计算概率。利用等可能性计算概率需满足的条件是,实验的所有可能结果数是已知的,且每种实验结果出现的可能性一样。利用一个随机事件的频率(比例)能够求出概率的一个精确值。甲、乙二人做如下的游戏:从编号为1到20的卡片中任意抽出一张,若抽到的数字是奇数,则甲获胜,否则乙获胜,这个游戏对甲、乙双方是公平的。甲、乙二人做如下的游戏:从编号为1到20的卡片中任意抽出一张,若抽到的数字是3的倍数,则甲获胜;若抽到的数字是5的倍数,则乙获胜,此时这个游戏对甲、乙双方是公平的。主观概率指的是对于不能做重复试验的随机事件,人们各自给出的对这个事件发生的相信程度。小概率事件指的就是不可能发生的事件。小概率事件在一次实验中能够认为不会发生,飞机失事就是小概率事件,虽然乘坐飞机有危险,但是人们还是会乘坐飞机旅行。小概率事件必然发生,指的是在无穷次实验中,小概率事件肯定会发生。对设某件事件发生的概率为p,乘积p(1-p)能衡量此事件发生的不确定性,特别得,当p=0.5时,不确定性最大。第二节离散变量的概率分布(28)单选题每张奖券中末等奖的概率为1/10,某人购买了20张号码杂乱的奖券,设中末等奖的张数为X,则X服从:A.二项分布B.泊松分布C.正态分布D.超几何分布一年内飞机失事的次数可以看成服从:A.二项分布B.泊松分布C.正态分布D.超几何分布假如盒子里有a个黑球与b个白球,任意有放回和不放回取出m个;那么这m个小球中含有黑球的数目分别服从:A.超几何分布、二项分布B.超几何分布、泊松分布C.二项分布、超几何分布D.二项分布、正态分布如果一个事件每次发生的概率是p,那么在n次观察中能够看到这个事件出现k次的概率是:A.B.C.D.具有概率分布的是下列那个分布:A.超几何分布B.正态分布C.二项分布D.泊松分布,专业.专注.\n.word格式,具有概率分布的是下列那个分布:A.正态分布B.超几何分布C.二项分布D.泊松分布设某课堂考卷上有20道选择题,每题答案是4选1,某学生只会做10题,另外10题完全不会,于是就瞎猜,求他能猜对5题的概率。A.B.C.D.设某课堂考卷上有20道选择题,每题答案是4选1,某学生只会做10题,另外10题完全不会,于是就瞎猜,求他至少能猜对5题的概率。A.B.C.D.在有5张记有1、2、3、4、5的卡片中,现无放回的抽取两次,一次一张,则第二次取到奇数卡的概率为:A.4/25B.3/5C.9/25D.1/3在有5张记有1、2、3、4、5的卡片中,现无放回的抽取两次,一次一张,则两次都取到奇数卡的概率分别为:A.1/2B.3/5C.2/5D.3/10从1,2,……,9这九个数中,随机抽取2个不同的数,则这2个数的和为奇数的概率是:A.1/2B.15/36C.5/9D.5/18每次试验的成功率为p(01.40 H1:μ<1.40 B、H0:μ<1.40 H1:μ>1.40 C、H0:μ≥1.40 H1:μ<1.40 D、H0:μ=1.40 H1:μ≠1.407.p-值给出了零假设正确时,得到所观测数据或更极端数据的概率,将p-值与给定的显著性水平a相比: A、当p-值<1-α时,接受零假设 B、当p-值≥α时,拒绝零假设 C、当p-值<α时,接受零假设 D、当p-值≥α时,接受零假设8.若X~N(μ,σ2)(其中μ,σ2均未知),记样本均值为,样本标准差为s,对于假设检验问题:H0:μ=μ0,H1:μ≠μ0,应该选取的检验统计量为: A.B.C.D. 9.若X~N(μ,σ2)(其中μ,σ2均未知),记样本均值为,样本标准差为s,对于假设检验问题:H0:μ=μ0,H1:μ≠μ0取检验统计量为t0=,此检验的显著水平为a的拒绝域为:A.|t0|>taB.|t0|>t1-aC.|t0|>ta/2D.|t0|>t1-a/210.在关于一个或者两个比例的检验问题中要使用:A.卡方变量B.t变量C.F变量D.z变量11.关于一个或者两个均值(总体方差不已知)的检验问题里应该使用:A.卡方变量B.t变量C.F变量D.z变量12.在关于比例的检验问题中,如果收集到的样本容量不太大时(不超过30),应该使用()计算有关的p-值:A.二项分布B.t变量C.F变量D.z变量13.甲、乙两种味道的酒各4杯,颜色相同。从中挑4杯便能将甲种酒全部挑出,算是试验成功。某人通过品尝区分两种酒,他连续试验10次,结果成功7次,问此人在显著水平a=0.05下,是否确有品尝区分的能力?A.计算,这个值远小于0.05,因此认为此人有区分能力B.计算,这个值远小于0.05,因此认为此人没有区分能力C.计算,这个值远小于0.05,因此认为此人有区分能力D.计算,这个值远小于0.05,因此认为此人没有区分能力,专业.专注.\n.word格式,多选题1.下面关于估计与假设检验说法正确的是:A.都是由样本推断总体参数的信息B.估计关心的是总体参数的值为多少C.假设检验关心的是总体参数的值是否等于某个特殊值D.假设检验优于估计2.下面关于p-值说法正确的是A.零假设正确性的概率B.p-值是有关数据的概率,p-值给出了某总体的许多样本中,某一类数据出现的经常程度C.p-值是指零假设不确时,得到所观测数据或更极端数据的概率D.p-值是指零假设正确时,得到所观测数据或更极端数据的概率3.关于显著水平a下面说法正确的是A.显著水平a是由抽样所得数据拒绝了零假设的概率B.显著水平a通常取作0.05C.显著水平a只能等于0.05D.能拒绝零假设的最小显著水平就是该数据的p-值4.下面关于零假设说法正确的是:A.在总统竞选时,抽样调查某位竞选人的支持率,此时的零假设一般设为:H0:μ=50%B.在总统竞选时,抽样调查某位竞选人的支持率,此时的零假设一般设为:H0:μ>50%C.检验两个不同总体的比例是否相等时零假设设为:H0:μ1-μ2≠0D.检验两个不同总体的比例是否相等时零假设设为:H0:μ1-μ2=05.某纤维的强力服从N(μ,1.192)。原设计的平均强力为6克。现改进工艺后,测得100个强力数据的均值为6.35,假定标准差不变。如果要检验均值的提高是否为工艺改进的结果,则合理的零假设与备择假设应为: A、H0:μ>6 H1:μ<6 B、H0:μ=6 H1:μ>6 C、H0:μ=6 H1:μ≠6 D、H0:μ≤6 H1:μ>66.某厂宣传其产品的平均使用寿命不低于1000小时,进行检验时应: A、作一个双边检验 B、作一个单边检验 C、原假设为H0:μ≥1000 D、备择假设为H1:μ<1000 E、备择假设为H1:μ>10007.下面关于置信区间与假设检验说法正确的是:A.它们都是利用样本数据对于总体中未知的参数去作出结论的统计方法B.假设检验关心的是总体参数是否等于某一个特殊值C.置信区间给出的是参数介于哪个范围之间D.一般来说置信区间能够比假设检验提供更多的关于参数的信息判断题假设检验所依据的原则是:小概率事件在一次试验中不应该发生。假设检验所依据的原则是:一直做下去小概率事件肯定会发生。零假设所提出的问题是要以样本数据为基础回答的。假设检验中,在假设零假设正确的情况下,算一下得到这组样本值或者比它更极端值的可能性,如果很小说明样本数据不支持零假设。假设检验中,p-值越大拒绝零假设的理由就越充分。p-值就是衡量零假设是否正确的概率。一个特别零假设没有是对或是错的概率,只能不是对就是错。如果零假设被拒绝,就可以说样本结果是统计显著的。零假设为真时,作出拒绝零假设的判断,这类错误称为第二类错误。,专业.专注.\n.word格式,在假设检验中,当备择假设H1为真时作出接受原假设H0的判断,则犯了第一类错误。一般来说零假设总是“受到保护的假设”没有充分的证据是不能拒绝零假设的。假设检验的任务就是根据抽取出的样本来决定是接受零假设还是拒绝它。如果观测值落在拒绝域,我们就拒绝零假设。p-值小于显著水平a,我们就接受零假设。能拒绝零假设的最小显著水平就是该数据的p-值。显著水平取值越小,接受域则越大。“因为p-值=0.0008而拒绝零假设”这种说法比“以0.05的显著水平拒绝零假设”能提供更多的信息。假设检验:H0:μ=300,H1:μ<300是一个双检验。在对单个总体的均值做检验时,应使用F统计量。参考答案第一节假设检验(39)单选题1.C2.A3.B4.B5.A6.D7.D8.C 9.C10.D11.B12.A13.A多选题1.ABC2.BD3.ABD4.AD5.BD6.BE7.ABCD判断题1.对2.错3.对4.对5.错6.错7.对8.对9.错10.错,专业.专注.\n.word格式,11.对12.对13.对14.错15.对16.对17.对18.错19.错第八章习题第一节变量关系的四个问题(11)单选题1.在研究两个变量之间的关系时,可以用一个统计量来刻划这两个变量之间的相关程度,这个统计量是:A.样本均值B.样本方差C.相关系数D.秩2.研究两个或者更多变量之间的关系问题时,如果它们之间没有关系,这时相关系数r=:A.0B.1C.-1D.无法确定3.研究两个或者更多变量之间的关系问题时,最难回答的问题是:A.从数据来看变量间有关系吗B.如果变量间有关系,这个关系有多强C.是否不仅在样本中,而且在总体中也有这种关系D.这个关系是不是因果关系多选题1.研究两个或者更多变量之间的关系问题时,首先要观察数据中是否显示出某种关系,一般观察数据中是否显现某种关系时所用的方法是:A.利用统计图B.计算样本均值C.利用统计表D.计算样本方差2.研究两个变量之间的关系问题,在由样本对总体关系进行推测时,零假设一般取为:A.这两个变量无关B.这两个变量的相关系数r=0C.这两个变量相关D.这俩个变量的相关系数r=13.研究两个变量之间的关系问题时,如果两个变量关系最强,这时相关系数r可能等于:A.0B.1C.-1D.无法确定判断题1.相关系数越接近于0就表明变量之间的关系越强。2.在由样本数据推算总体关系时,只要计算出相应的p-值或者临界值,就可以判断这种关系究竟是由于样本数据的随机性所引起的,还是由于变量之间的确存在某种关系而在样本数据中体现出来。3.如果变量没有关系的零假设被拒绝,我们就认为变量间有关系。4.变量之间存在着统计关系并不意味着它们之间一定具有某种因果关系。5.用一个变量的值预测另一个变量的值时,它们之间必须存在因果关系。第二节变量的类型(15),专业.专注.\n.word格式,单选题1.下列选项属于分类变量的是:A、年龄B、体重C、性别D、学历2.下列选项不是数值变量的是:A.温度B.年级C.体重D.时间3.当自变量和因变量都是分类变量时,适用那种统计方法进行分析:A.卡方分析B.回归与相关C.秩方法D.方差分析4.用于讨论两个顺序变量之间关系的统计分析方法是:A.卡方分析B.方差分析C.秩方法D.回归分析5.用于讨论两个数值变量之间关系的统计分析方法是:A.卡方分析B.方差分析C.秩方法D.相关与回归分析6.当自变量分类变量,因变量是数值变量时,适用那种统计方法进行分析:A.卡方分析B.方差分析C.秩方法D.相关与回归分析多选题1.下列选项属于顺序变量的是:A.国籍B.比赛名次C.贫困程度D.学历E.年级2.下列选项属于数值(连续)变量的是:A.身高B.分数C.选课数D.结婚年数3.卡方分析可以用来分析A.自变量因变量都为分类变量B.自变量是数值变量,因变量是分类变量C.自变量是顺序变量,因变量是分类变量D.自变量是分类变量,因变量是顺序变量4.秩方法可以用来分析A.自变量因变量都为顺序变量B.自变量是数值变量,因变量是顺序变量C.自变量是顺序变量,因变量是数值变量D.自变量是分类变量,因变量是顺序变量判断题1.宗教信仰属于顺序变量。2.比赛的名次属于分类变量。3.可以将分类变量转化为顺序变量,但反之不行。4.数值变量、顺序变量都可以转化为分类变量。5.可以将数值变量转化为顺序变量,但反之不行。参考答案第一节变量关系的四个问题(11)单选题1.C2.A3.D多选题,专业.专注.\n.word格式,1.AC2.AB3.BC判断题1.错2.对3.对4.对5.错第二节变量的类型(15)单选题1.C2.B3.A4.C5.D6.B多选题1.BCDE2.AB3.ACD4.ABC判断题1.错2.错3.错4.对5.对第九章习题第一节四格表的卡方分析(15)单选题1.卡方分析主要用来分析:A.两个分类变量之间的关系B.两个顺序变量之间的关系C.两个数值变量之间的关系D.无法确定2.用于表述两个分类变量分布频率的统计表是:A.方差分析表B.三线表C.列联表D.以上皆不是3.美国某大学通过询问72个大学生在购买食物时是否看营养说明得到了一个随机样本,调查者还记录了每个学生的性别,如表9.1所示,并将数据用条形图表示了出来,如图9.1,请问从此表和图中能够看出什么趋势:表9.1性别女性男性阅读商标是1628否208总计3636,专业.专注.\n.word格式,图9.1A.一般的,购物时女同学比男同学更容易看营养说明B.一般的,购物时男同学比女同学更容易看营养说明C.购物时男女同学在阅读营养说明时没有什么差别D.购物时所有男同学都比女同学更愿意看营养说明4.美国某大学通过询问72个大学生在购买食物时是否看营养说明得到了一个随机样本,调查者还记录了每个学生的性别,如表9.1所示,请计算这两个分类变量的相关系数f=:A.-0.66B.0.66C.-0.34D.0.345.美国某大学通过询问72个大学生在购买食物时是否看营养说明得到了一个随机样本,调查者还记录了每个学生的性别,如表9.1所示,若零假设是:在学生总体中性别与阅读习惯这两个变量间没有关系,由相关系数f计算出自由度为1的c2变量的值为8.42,p-值为0.00372小于显著性水平a=0.05,因此可以:A.拒绝零假设B.接受零假设C.认为零假设正确D.认为零假设错误6.美国某大学通过询问72个大学生在购买食物时是否看营养说明得到了一个随机样本,调查者还记录了每个学生的性别,如表9.2所示,则此时这两个分类变量的相关系数f=:表9.2性别女性男性阅读商标是360否036总计3636A.-1B.1C.1/2D.07.美国某大学通过询问72个大学生在购买食物时是否看营养说明得到了一个随机样本,调查者还记录了每个学生的性别,如表9.3所示,则此时这两个分类变量的相关系数f=:表9.3性别女性男性阅读商标是1616否2020总计3636,专业.专注.\n.word格式,A.1/2B.-1C.1D.08.下列那种情形使得2×2列联表中的相关系数f=0?表9.4变量XA1A2变量YB1acB2bd总计a+bc+dA.a=cB.b=dC.a/(a+b)=c/(c+d)D.a/(a+b)=d/(c+d)9.2×2列联表中的相关系数f与c2变量有何关系:A.c2=nf2B.c2=n2f2C.c2=n2fD.c2=nf10.2×2列联表中的相关系数f的取值范围是:A.-1~1B.0~1C.-1~0D.无法确定判断题1.2×2列联表中的相关系数f的取值范围是-1~1。2.2×2列联表中当所有的观测值都落在对角线上时,相关系数f=0。3.2×2列联表中因为分类变量的次序可以交换,因此计算出相关系数f<0时,只要交换表中的两列(或两行)就可以改变f的符号。4.2×2列联表中c2变量的自由度为1,可以理解为在表中我们只需要知道一个格子的频数就可以求出其他三个格子的频数。5.2×2列联表中,应满足所有期望频数都大于5时,才能用c2统计量进行检验。第二节更多状态的卡方分析(10)单选题1.欧洲共产主义政权失败以前的最后一次奥运会是在1988年举行的。关于这些共产主义国家是如何强调其体育运动及其妇女在体育中的角色,表9.5给出的是那年获得金牌最多的三个国家中不同性别的人获得的金牌数目。请问这个表给了我们当时这些国家中体育和性别的什么信息:表9.5国家苏联东德美国总计性别男41152379女14221349总计553736128A.从比例上说,美国的女性获得奖牌的百分比少于苏联的女性获得奖牌的百分比。B.从比例上说,东德的女性获得最多的奖牌而苏联的女性获得最少的奖牌。C.从比例上说,美国的女性获得奖牌的百分比多于东德的女性获得奖牌的百分比。D.从比例上说,美国的女性获得最多的奖牌而苏联的女性获得最少的奖牌2.表9.5给出的是1988年奥运会获得金牌最多的三个国家中不同性别的人获得的金牌数目。若零假设是:国家与性别这两个变量间没有关系,由数据计算出自由度为2的c2变量的值为11.69,p-值为0.003小于显著性水平a,专业.专注.\n.word格式,=0.05,因此可以:A.拒绝零假设B.接受零假设C.认为零假设正确D.认为零假设错误3.表9.5给出的是1988年奥运会获得金牌最多的三个国家中不同性别的人获得的金牌数目。由相关系数V与c2变量的计算公式,可计算出国家与性别这两个变量的相关系数V=:A.0.73B.0.21C.-0.30D.0.304.相关系数V的计算公式为:,其中L=:A.行数B.列数C.min(行数,列数)D.行数+列数5.如果分类变量有两个或多个,而且至少其中一个分类变量的取值多于两类时,这些分类变量的相关系数V的取值范围是:A.-1~0B.-1~1C.0~1D.无法确定6.对于含有两个分类变量的列联表,计算c2变量时其自由度为:A.行数×列数B.(行数-1)×(列数-1)C.行数+列数D.(行数-1)×列数判断题1.两个分类变量,当一个或两个分类变量的取值多于两类时,这两个变量的相关系数V的取值范围是-1~1。2.卡方统计量K2是对每一个观察值,计算(观察值-理论值)2/理论值,再全部求和。3.相关系数计算公式中,参数L指的是变量的个数。4.如果分类变量有两个或多个,而且至少其中一个分类变量的取值多于两类时,通常用统计量来度量变量的相关程度,V是2×2列联表中相关系数f的推广。参考答案第一节四格表的卡方分析(15)单选题1.A2.C3.B4.D5.A6.B7.D8.C9.A10.B判断题1.错2.错,专业.专注.\n.word格式,3.对4.对5.对第二节更多状态的卡方分析(10)单选题1.B2.A3.D4.C5.C6.B判断题1.错2.对3.错4.对第十章习题第一节 回归与相关分析 (64)单选题研究一个(或多个)数值自变量的变化如何影响数值因变量的分析为:A.回归分析B.相关分析C.秩分析D.独立性分析研究两个数值变量的相关程度的分析为:A.回归分析B.相关分析C.秩分析D.独立性分析相关分析是:A、研究变量之间的变动关系B、研究变量之间的数量关系C、研究变量之间相互关系的密切程度D、研究变量之间的因果关系回归这个术语是由英国著名统计学家F.Galton在19世纪末期研究孩子及他们父母的身高时提出来的,F.Galton给出的回归效应的含义是:A.孩子的身高值与父母的身高值在一条直线附近B.孩子的身高值与父母的身高值相关C.孩子们的身高值向中间值靠近D.以上皆不对收集了n组数据(xi,yi),i=1,2,……,n,为了解变量x与y间是否有相关关系,可以从下列那种图形加以考察?A.直方图 B. 散点图 C.正态钟形曲线D.点线图收集了n组数据(xi,yi),i=1,2,……,n,画出散点图,若n个点基本在一条直线附近时,称这两变量间具有:A.独立的关系 B.不相容的关系C.函数关系 D.线性相关关系有5组(xi,yi)资料如图10.1所示。则去掉哪一点后,剩下的4组数据的相关系数最大?A.B点B.C点C.D点D.E点,专业.专注.\n.word格式,图10.1 在作散点图时,图中的点从左下角到右上角有明显的直线趋势,这时可以认为这两个变量A.负相关B.正相关C.不相关D.无法确定相关系数的取值范围是: A、-1≤r≤0 B、0≤r≤1 C、-1≤r≤1 D、-1<r<1在变量x和变量y的直线相关分析中,|r|值越大,则:A.各散点越靠近直线B.各散点越离开直线C.直线越靠近x轴D.直线越远离x轴当相关系数r=0时,说明变量x与变量y:A.不存在任何关系B.存在相关关系的可能性很小C.关系不能确定D.不存在直线关系,但不排除存在某种曲线关系如果两个变量之间的相在系数为–1,这说明两个变量之间是A、完全相关B、低度相关C、中度相关D、不相关若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为:A.不相关B.负相关C.正相关D.曲线相关当一个现象的数量由小变大,而另一个现象的数量相反地由大变小时,这种相关关系称为A、线性相关B、非线性相关C、正相关D、负相关有学生十人(甲、乙、……、癸),他们期终考的数学成绩与该学期数学课的缺课数,如下表10.1所示。 表10.1学生甲乙丙丁戊己庚辛壬癸缺课数1233435630成绩1009090807070606080100设两者的相关系数为r,则有:A.-1≤r≤-0.6B.0.6<r<1C.-0.1≤r≤0.2 D.0.2<r<0.6如果散点图没有表示出变量x与y具有线性关系,而是具有某种曲线关系,此时:A.可以作回归分析B.肯定不能作回归分析C.不能够直接做回归分析,一般首先要做数学转换D.无法确定相关分析与回归分析,在是否需要确定自变量和因变量的问题上:A、前者勿需确定,后者需要确定B、前者需要确定,后者勿需确定C、两者均需确定D、两者都勿需确定如果两个变量x、y具有线性关系y=-8x,则对这两个变量的相关系数r=:A.-1/8B.1/8C.1D.-1两个变量的直线回归方程中,若回归系数为负,则:A、表明两个变量正相关B、表明两个变量负相关C、表明相关程度很弱D、不能说明相关的方向和程度简单回归分析是指:A.计算简单的回归分析,专业.专注.\n.word格式,B.自变量是虚拟变量的回归分析C.因变量是虚拟变量的回归分析D.两个变量的回归分析在计算回归直线时,科学常用的方法是:A.画图法B.最小二乘法C.试验法 D. 以上皆不是在回归直线方程=a+bx中,b表示:A.当x增加一个单位时,y的精确增加量B.当y增加一个单位时,x的精确增加量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时,x的平均增加量对于回归直线=9x+100,若x每增加一个单位,则y平均增加A、100个单位B、109个单位C、9个单位 D、91个单位已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程是:A、B、C、D、某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为:=180-5x,其中该学校考试成绩满分为100分,学习时间的单位为小时,这个方程明显有误,错误在于:A.a值的计算有误,b值是对的B.b值的计算有误,a值是对的C.a值和b值的计算都有误D.自变量和因变量的关系搞错了设变量x与变量y的总体相关系数为ρ,在一次随机抽样中,计算得到样本的相关系数r,下面有关ρ和r叙述不正确的是:A.若ρ=0.6,有可能r<0B.r是ρ的点估计C.若r>0表示样本中y和x正相关,r<0表示负相关D.若ρ=0,则必有r=0在双变量(x,y)的相关与回归分析中有:A.r值与b值的符号相同B.r值与b值毫无关系C.|r|值越大|b|值越大D.|r|值越大|b|值越小在简单回归分析中,在由样本对总体进行推断时,要计算t统计量的值,那么t统计量的自由度为: A、n B、n-2 C、n-1 D、n-2-1多选题讨论两个数值变量之间关系常用的统计分析方法是:A.c2分析B.秩方法C.回归分析D.方差分析E.相关分析相关系数r=0说明所分析的两个变量之间:A.肯定不线性相关B.肯定不曲线相关C.可能完全不相关D.可能是曲线相关E.可能不线性相关下列属于正相关的现象是:,专业.专注.\n.word格式,A.家庭收入越多,其消费支出也越多B.某产品产量随工人劳动生产率的提高而增加C.流通费用率随商品销售额的增加而减少D.生产单位产品所耗工时随劳动生产率的提高而减少E.产品产量随生产用固定资产价值的减少而减少下列哪些关系是相关关系:A.家庭收入多少与消费支出增长的关系B.农作物收获和施肥量的关系C.商品销售额和利润率的关系D.产品产量与单位成品成本的关系下列属于负相关的现象是:第十一章习题第一节方差分析(30)单选题方差分析主要用于分析:A.自变量和因变量都是分类变量B.自变量和因变量都是顺序变量C.自变量和因变量都是数值变量D.自变量是分类变量,因变量是数值变量下列关于方差分析中所作的散点图与回归分析中所作的散点图说法正确的是:A.没有什么区别B.都可以用一条回归直线来代表这些点C.方差分析中,水平轴上的自变量是能够交换顺序的,而回归分析中不能D.方差分析中,竖直轴上的因变量是能够交换顺序的,而回归分析中不能方差分析时,比较自变量每个分类之间的差异时,比较的是每个分类的:A.均值B.中位数C.众数D.方差方差分析的思想就是,假设所有的数据都没有变异,那么它们的取值应该一样,都等于:A.组均值 B.总均值C.总中位数D. 总方差方差分析中如果只有自变量对总体的变异有影响,那么自变量每一类中的数据都应该等于:A.组均值 B.总均值C.总中位数D. 总方差方差分析中,残差变量使得样本数据偏离了:A.总方差 B.总均值C.组方差 D.组均值在方差分析中,随机误差: A、只存在于自变量平方和中 B、只存在于残差平方和中 C、既存在于自变量平方和中,又存在于残差平方和中 D、是可以避免的方差分析中,自变量平方和比上总变量平方和称为R2,它的含义是什么?A.自变量与因变量之间的关系强度 B.由于自变量产生的变异占总变异的比例C.由于残差变量产生的变异占总变异的比例D.残差变量与因变量之间的关系强度方差分析中在由样本推断总体性质时,零假设是:A.各分类间方差相等 B.各分类间均值相等,专业.专注.\n.word格式,C.各分类间均值不相等D.各分类间至少有两组均值相等方差分析中在由样本推断总体性质时,备择假设是:A.各分类间均值不全相等 B.各分类间均值相等C.各分类间均值都不相等D.各分类间至少有两组均值相等方差分析中,假设样本总数为n,自变量的分类数为k,自变量每一类的观测数分别为n1,n2,……nk,那么总平方和的自由度为:A.n B.k C.k-1 D.n-1方差分析中,假设样本总数为n,自变量的分类数为k,自变量每一类的观测数分别为n1,n2,……nk,那么自变量平方和的自由度为:A.n B.k C.k-1 D.n-1方差分析中,假设样本总数为n,自变量的分类数为k,自变量每一类的观测数分别为n1,n2,……nk,那么平均自变量平方和等于:A.自变量平方和/n B.自变量平方和/k-1 C.自变量平方和/k D.自变量平方和/n-1方差分析中,假设样本总数为n,自变量的分类数为k,自变量每一类的观测数分别为n1,n2,……nk,那么平均残差变量平方和等于:A.残差变量平方和/n-k B.残差变量平方和/k-1 C.残差变量平方和/k D.残差变量平方和/n现有三台机器生产同规定的铝合金薄板,其厚度分别服从同方差的正态分布,从三台机器上各取五块斑测量其厚度,对其进行方差分析,求得F=32.92,查F分布表知在a=0.05时临界值为3.89,则结论是:A.三台机器生产的薄板厚度在显著性水平0.95上有显著差异B.三台机器生产的薄板厚度在显著性水平0.95上无显著差异C.三台机器生产的薄板厚度在显著性水平0.05上有显著差异D.三台机器生产的薄板厚度在显著性水平0.05上无显著差异多选题1.方差分析中,一般可以用下列那些图形来观测两个变量之间是否存在关系?A.饼图B.散点图C.盒形图D.直方图2.方差分析时,可以用盒形图来表示数据,下列关于盒形图的说法正确的是:A.盒形图相对于散点图增强了数据的可比性B.盒形图简化了数据C.通过比较每个盒形图的中线,就可以观测出自变量各类之间的均值差异D.通过比较每个盒形图的高度,就可以观测出自变量各类之间取值的离散程度3.方差分析中下列关于自变量与因变量相关系数R说法正确的是:A.取值范围是-1~1B.取值范围是0~1C.数值上等于自变量平方和除以总变量平方和D.数值上等于自变量平方和除以总变量平方和再开平方4.方差分析中,F统计量是由下面那两个统计量相比得到的:A.自变量平方和B.残差平方和C.平均自变量平方和,专业.专注.\n.word格式,D.平均残差变量平方和5.方差分析中,假设样本总数为n,自变量的分类数为k,自变量每一类的观测数分别为n1,n2,……nk,那么残差平方和的自由度为:A.n-k B.(n1-1)+(n2-1)+……(nk-1) C.k-1 D.n-16.在方差分析中,如果在显著性水平0.05上拒绝了零假设,即认为不同水平之间存在显著性差异,则: A、总体中不同水平之间一定存在差异 B、总体中不同水平之间可能不存在差异C、由自变量产生的差异仅是随机性引起的 D、在显著性水平0.05上认为总体中存在显著性差异判断题1.方差分析的实质就是检验若干总体的方差是否相等。方差分析时,自变量每一分类的数据都比较多时,如果用散点图来表示这些数据,因为点太多很难看清这两个变量的关系,因此可以用盒形图来表示,盒形图能够简化数据。在方差分析表中,只要自变量平方和不是0,则总体中自变量不同水平之间肯定存在差异。 方差分析的前提是因变量的变异完全是由于自变量和对自变量每一类都有影响的因素决定的。 方差分析中残差变量是指除自变量之外所有能够对因变量产生影响的变量。 在方差分析中,如果认为不同水平之间存在显著性差异,那么由于自变量产生的差异仅由随机性引起的。 方差分析可以用检验两组数据均值是否相等的t检验代替。 方差分析中感兴趣是在分类变量的每一类均值是否相等上,但在判断均值之间是否有差异时要借助于方差。在方差分析中,假定残差变量对与自变量的所有水平均有影响。 第二节 配对数据的分析 (11)单选题1.如果在同一个实验单元上进行重复测量,就会得到在每个单元中有两个观测值的数据,而处理这种数据时所用的方法就叫做:A.方差分析B.秩分析 C.配对分析D.符号分析2.根据配对数据的差构造一组新的样本采用t变量做假设检验,零假设是:A.这些新样本的总体均值为0B.这些新样本的总体均值不为0C.这些新样本的均值为0D.这些新样本的均值不为03.在检验不服从正态分布的配对数据的总体均值是否相等时,应用检验方法是:A.t检验 B.F检验 C.c2检验 D.符号检验多选题1.配对数据t检验的前提是:A、总体服从正态分布 B、总体服从F分布 C、各总体的均值相等 D、每一个实验单元进行两次重复观察E、观察值独立2.根据配对数据的差构造一组新的样本采用t变量做假设检验,备择假设是:这些新样本的总体均值不为0,它等价于:A.原配对数据的总体没有变化B.原配对数据的总体有变化,专业.专注.\n.word格式,C.原配对数据的总体均值相等D.原配对数据的总体均值不相等3.在检验服从正态分布的配对数据的总体均值是否相等时,可用检验方法有:A.t检验 B.F检验 C.符号检验 D. c2检验4.关于符号检验下列说法正确的是:A.使用起来较为简单,B.只考虑配对数据差的正负号C.如果在重复观察时总体没有变化,则n个配对数据之差的新样本中应该是正、负号基本上各占一半。D.当数据服从正态分布时,没有t检验精确判断题1.配对数据t检验适用于检验总体来自于t分布,对于每一个实验单元进行重复观察得到两个数据时,总体有没有变化。2.配对分析中,如果总体没有变化,则重复观察的每对数据也应该变化不大(只有随机误差的影响),因此每对数据的差应该在零点附近波动。3.符号检验简单处理配对数据使用简单,只考虑配对数据差的正负号,如果在重复观察时总体没有变化,则n个配对数据之差的新样本中正、负号的个数肯定都等于n/2。4.配对分析中如果配对数据的差不符合正态分布,用符号检验比较好。 参考答案第一节方差分析(30)单选题1.D2.C3.A4.B5.A6.D7.C8.B9.B10.A11.D12.C13.B14.A15.C多选题1.BC2.ABCD3.BD4.CD5.AB6.BD判断题,专业.专注.\n.word格式,错对错对对错错对对第二节 配对数据的分析 (11)单选题1.C2.A3.D多选题1.ADE2.BD3.AC4.ABCD判断题1.错2.对3.错4.对第十二章习题第一节“词”为观察值的顺序变量(10)单选题1.秩方法主要用来分析:A.两个分类变量之间的关系B.两个顺序变量之间的关系C.两个数值变量之间的关系D.无法确定2.美国一次全国性的调查中,其中一个问题是询问被调查者关于流产的态度以及他们认为流产问题的重要性,其数据在表12.1中:表12.1对于堕胎的立场反对中立同意总计重要性最重要的之一8516789341重要806383571075不太/一点也不重要565833661005总计22113888122421将数据改成百分比,下列那个表是正确的:表12.2对于堕胎的立场反对中立同意总计重要性最重要的之一38.5%12%11%61.5%重要36%46%44%126%,专业.专注.\n.word格式,不太/一点也不重要25.5%42%45%112.5%总计100%100%100%2421表12.3对于堕胎的立场反对中立同意总计重要性最重要的之一38.5%12%11%341重要36%46%44%1075不太/一点也不重要25.5%42%45%1005总计100%100%100%2421表12.4对于堕胎的立场反对中立同意总计重要性最重要的之一25%49%26%100%重要7.5%59.5%33%100%不太/一点也不重要6%58%36%100%总计22113888122421表12.5对于堕胎的立场反对中立同意总计重要性最重要的之一25%49%26%100%重要7.5%59.5%33%100%不太/一点也不重要6%58%36%100%总计38.5%166.5%95%2421A.表12.2B.表12.3C.表12.4D.表12.53.美国一次全国性的调查中,其中一个问题是询问被调查者关于流产的态度以及他们认为流产问题的重要性,其数据在表12.1中,则这两个变量的相关系数r为:A.-0.81B.0.81C.0.19D.-0.194.美国一次全国性的调查中,其中一个问题是询问被调查者关于流产的态度以及他们认为流产问题的重要性,其数据在表12.1中,若零假设是:在美国成年人的总体中这两个变量间没有关系,由相关系数r计算出标准正态变量z的值为-7.01,这个p-值远小于显著性水平a=0.05,因此可以:A.拒绝零假设B.接受零假设C.认为零假设正确D.认为零假设错误5.如果两个顺序变量X、Y的取值全部落在如图12.1从左下角到右上角的椭圆内,则此时这两个变量的相关系数r=:图12.1A.-1B.0C.1D.无法确定判断题顺序变量与分类变量的最大区别是:分类变量的分类之间可以比较大小,而顺序变量不能。对于以“词”作为观察值的两个顺序变量,计算相关系数并通过z检验来判断它们是否有关。对于以“词”,专业.专注.\n.word格式,作为观察值的两个顺序变量,计算相关系数时不同次序数是指所有那些两个变量的排序都同时高(或同时低)的配对数目。对于以“词”作为观察值的两个顺序变量,计算相关系数时不同次序数是指所有那些两个变量的排序一个高另一个就低的配对数目。知道了两个顺序变量的相关系数r,当我们要预测一个观察值在因变量中的排序时,如果知道了它在自变量中的排序,就能够比不知道这一点提高r×100%的准确性。第二节秩顺序相关系数(11)单选题1.度量两个有数量值的顺序变量的相关程度的统计量称为:A.相关系数B.顺序秩相关系数C.回归系数D.样本系数2.评估教育成就国际联合会在1991年公布了一项关于不同国家大二年级的学生在学科方面的表现。在生物和化学方面这些国家的排名情况如表12.6所示:表12.6国家排名生物化学新加坡13英国22匈牙利35波兰47香港51挪威68芬兰713瑞典89奥地利96日本104加拿大1112意大利1210美国1311通过这个表,可以看出什么趋势:A.一般的,在某个学科上好的国家在其他学科上反而不好B.一般的,在某个学科上好的国家在其他的学科上也好C.在某个学科上好的国家一定在其他学科上也好D.没有什么趋势3.评估教育成就国际联合会在1991年公布了一项关于不同国家大二年级的学生在学科方面的表现。在生物和化学方面这些国家的排名情况如表12.6所示,这两列顺序变量的顺序秩相关系数rs=A.-0.35B.0.35C.0.65D.-0.654.评估教育成就国际联合会在1991年公布了一项关于不同国家大二年级的学生在学科方面的表现。在生物和化学方面这些国家的排名情况如表12.6所示,若零假设为:这两个变量之间没有关系。通过把顺序秩相关系数rs转化为自由度为11得t统计量,计算得到的t值为2.82,p-值为0.008,在显著性水平a=0.05下,可以:A.拒绝零假设B.接受零假设C.认为零假设正确D.认为零假设错误5.在计算两个顺序变量的顺序秩相关系数时,由于两个变量的取值都是从1到n的整数,记di为每一行观测值的两个秩的差异,此时把顺序秩相关系数的计算公式简化成:A.B.,专业.专注.\n.word格式,C.D.6.某校6支足球队,5年期间在校运动会上比赛的排名恰好颠倒,如图12.2所示,则关于两次排名的顺序变量间的顺序秩相关系数rs=:图12.2A.-1/2B.1/2C.1D.-17.再将“1,2,……n”作为观察值的两个顺序变量的顺序秩相关系数rs转化为t变量时,t变量的自由度为:A.nB.n-1C.n-2D.n-3判断题1.对于“数字排序”作为观察值的两个顺序变量,通过把数值次序当成数量变量,因此可以计算回归系数来度量这两个变量的关系。2.对于“数字排序”作为观察值的两个顺序变量,计算相关系数并通过t检验来判断这两个变量是否有关。3.顺序秩相关系数rs与相关系数r没有区别。4.顺序秩相关系数rs与相关系数r计算公式一样。参考答案第一节“词”为观察值的顺序变量(10)单选题1.B2.B3.D4.A5.C判断题错对,专业.专注.\n.word格式,错对10.对第二节秩顺序相关系数(11)单选题1.B2.B3.C4.A5.A6.D7.C判断题1.错2.对3.错4.对,专业.专注.