- 757.00 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
模拟试题一 一.单项选择题(每小题2分,共20分)9名大学生每月的手机话费支出(单位:元)分别是:64.3,60.4,77.6,51.2,53.1,57.5,53.9,47.8,53.5。手机话费支出的平均数是()A.53.9B.57.7C.55.2D.56.5一项调查表明,在所抽取的2000个消费者中,他们每月在网上购物的平均花费是200元,这项调查的总体是()A.2000个消费者B.2000个消费者的平均花费金额C.所有在网上购物的消费者D.所有在网上购物的消费者的总花费额在参数估计中,要求用来估计总体参数的统计量与总体参数的离差越小越好。这种评价标准称为()A.无偏性B.有效性C.一致性D.充分性下面关于回归模型的假定中不正确的是()A.误差项是一个期望值为0的随机变量B.对于所有的x值,的方差都相同C.误差项是一个服从正态分布的随机变量,且独立D.自变量x是随机的某药品生产企业采用一种新的配方生产某种药品,并声称新配方药的疗效远好于旧的配方。为检验企业的朔方是否属实,医药管理部门抽取一个样本进行检验,提出的假设为\n。该检验所犯的第Ⅱ类错误是指()A.新药的疗效有显著提高,得出新药疗效没有显著提高的结论B.新药的疗效有显著提高,得出新药的疗效有显著提高的结论C.新药的疗效没有显著提高的结论,得出新药疗效没有显著提高的结论D.新药的疗效没有显著提高,得出新药疗效有显著提高的结论一家研究机构从事水稻品种的研发。最近研究出3个新的水稻品。为检验不同品种的平均产量是否相同,对每个品种分别在5个地块上进行试验,共获得15个产量数据。在该项研究中,反映全部15个产量数据之间称为()A.总误差B.组内误差C.组间误差D.处理误差趋势变动的特点是()A.呈现出固定长度的周期性变动B.呈现出波浪形或振荡式变动C.在一年内重复出现的周期性波动D.呈现出某种持续向上或持续下降的变动一般而言,选择主成分的标准通常是要求所选主成分的累积方差总和占全部方差的()A.60%以上B.70%以上C.80%以上D.90%以上如果要检验样本数据是否来自某一正态分布的总体,可采用的非参数检验方法是()A.符号检验B.Wilcoxon符号秩检验C.二项分布检验D.K-S检验在聚类分析中,根据样本对多个变量进行分类称为()\nA.型聚类B.型聚类C.层次聚类D.K-均值聚类二.简要回答下列问题(每小题10分,共20分)直方图和条形图各自的应用场合是什么?二者有何区别?从一批食品抽取20袋作为样本。(1)估计时该批食品的平均重量的置信区间时采用的分布是什么?请说明理由。(2)估计该批食品重量的方差时采用的分布是什么?(3)上述两种估计的假定条件是什么?三.计算与分析下列各题(每小题15分,共60分)某公司招收推销员,要测定男女推销员的推销能力是否有差别,名随机抽选了8人,经过一段时间销售,取得销售额数据(单位:万元)如下: (1)计算男推销员销售额的四分位数。(2)计算男推销员销售额的平均数和标准差。(3)已知女推销员销售额的平均数是33.75万元,标准差是14.44万元。比较男女推销员销售额数据的差异程度。\n某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下: 假定食品包重服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间。(2)如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置信区间。(3)采用假设检验方法检验该批食品的重量是否符合标准要求?(,写出检验的具体步骤)。一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行使时间(小时)行驶的里程(公里)之间的关系,为此随机调查了20个出租车司机,根据每天的收入()、行使时间()和行驶的里程()的有关数据进行回归,得到下面的有关结果(): (1)写出每天的收入()与行使时间()和行驶的里程()的线性回归方程。(2)\n解释各回归系数的实际意义。(3)计算多重判定系数,并说明它的实际意义。(4)计算估计标准误差,并说明它的实际意义。(5)若显著性水平a=0.05,回归方程的线性关系是否显著?(注:)某房地产开发公司为制定合理的开发计划,需要了解商品房销售情况。为此,公司收集了最近三年各季度的房屋销售量数据(单位:万平方米),结果如下: (1)根据上表数据绘制房屋销售量的时间序列图,根据图形分析,房屋销售量含有什么成分?该成分的变化特点是什么?(2)要预测房屋销售量,应该选择哪些方法?(3)根据上面的数据计算的各季节指数如下: 指出房屋销售的旺季和淡季。(4)如果2008年4季度的销售量不受季节影响的话,销售量应该是多少?模拟试题一解答 一、单项选择题(每小题2分,共20分)1.B;2.C;3.B;4.B;5.D;6.A;7.D;8.C;9.D;10.A。二、简要回答下列问题(每小题10分,共20分)1.\n直方图主要用于展示数据型数据的分布;条形图则主要用于展示不同类别中数据的多少,尤其适合于展示分类数据。二者的主要区别是:条形图中的每一矩形表示一个类别,矩形的高度(或长度)表示数据的多少,其宽度没有意义,是任意确定的;而直方图各矩形的高度表示各组的频数混频率,宽度表示各组的组距,其高度和宽度都有实际意义。其次,由于数值型数据的分组具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。2.(1)估计时该批食品的平均重量的置信区间,应采用采用正分布进行估计。因为属于小样本,由于总体方差未知,样本均值经标准化会服从自由度为的分布。(2)估计该批食品重量的方差时采用的分布,因为样本方差的抽样分布服从自由度为的分布。(3)上述两种估计都假定该批食品的重量服从正态分布。三、(每小题15分,共60分)1.(1);将销售额排序后得:;(2)(3)男推销员的离散系数为:。女推销员的离散系数为:\n。男推销员的离散系数大于女推销员,说明男推销员销售额的离散程度大于女推销员。2.(1)已知:,。样本均值为:克,样本标准差为:克。由于是大样本,所以食品平均重量95%的置信区间为:即(100.867,101.773)。(2)提出假设:,计算检验的统计量:由于,所以拒绝原假设,该批食品的重量不符合标准要求。3.(1)回归方程为:。(2)表示:在行驶里程不变的情况下,行驶时间每增加1小时,每天的收入平均增加9.16元;表示:在行驶时间不变的情况下,行驶里程每增加1公里,每天的收入平均增加0.46元。(3)\n。表明在每天收入的总变差中,被估计的多元线性回归方程所解释的比例为85.17%,说明回归方程的拟合程度较高。(4)。表明用行驶时间和行驶里程来预测每天的收入时,平均的预测误差为17.50元。(5)提出假设::,:至少有一个不等于0。计算检验的统计量F:于,拒绝原假设。这意味着每天收入与行驶时间和行驶里程之间的线性关系是显著的。4.(1)时间序列图如下: 从图形看,含有季节成分。其特点是观测值在一年内重复出现周期性波动。(2)可供选择的预测方法有:季节多元回归模型、季节自回归模型、分解预测。(3)销售旺季是3季度,淡季是4季度。(4)提出季节影响的结果是:68÷0.7679=88.55万平方米。模拟试题二一. 单项选择题(每小题2分,共20分)\n一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示: 故障次数()0123概率()0.050.250.400.30正好发生1次故障的概率为()A.0.05B.0.25C.0.40D.0.30要观察200名消费者每月手机话费支出的分布状况,最适合的图形是(A.饼图B.条形图C.箱线图D.直方图从某种瓶装饮料中随机抽取10瓶,测得每瓶的平均净含量为355毫升。已知该种饮料的净含量服从正态分布,且标准差为5毫升。则该种饮料平均净含量的90%的置信区间为()A.B.C.D.根据最小二乘法拟合线性回归方程是使()A.B.C.D.一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。随机抽取由200名学生组成的一个随机样本,检验假设,,得到样本比例为。检验统计量的值为()\nA.B.C.D.在实验设计中,将种“处理”随机地指派给试验单元的设计称为()A.试验单元B.完全随机化设计C.随机化区组设计D.因子设计某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是()A.直线模型B.二次曲线模型C.指数曲线模型D.修正指数曲线模型在因子分析中,变量的共同度量反映的是()A.第个公因子被变量的解释的程度B.第个公因子的相对重要程度C.第个变量对公因子的相对重要程度D.变量的信息能够被第个公因子所解释的程度如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是()A.Mann-Whitney检验B.Wilcoxon符号秩检验C.Kruskal-Wallis检验D.Spearman秩相关及其检验在二元线性回归方程中,偏回归系数的含义是()A.变动一个单位时,的平均变动值为B.变动一个单位时,因变量的平均变动值为C.在不变的条件下,变动一个单位时,的平均变动值为D.在不变的条件下,变动一个单位时,的平均变动值为二. 简要回答下列问题(每小题10分,共20分)\n画出时间序列预测方法选择的框图。简述因子分析的基本步骤。三. 计算与分析下列各题(每小题15分,共60分)假定其他条件不变,某种商品的需求量()与该商品的价格()有关,现取得以下样本数据:价格(元)7658754需求量(公斤)75807060658590根据上表数据计算得:,,,。(1)绘制散点图,说明需求量与价格之间的关系。(2)拟合需求量对价格的直线回归方程,说明回归系数的实际意义。(3)计算当价格为10元时需求量的点估计值。一家物业公司需要购买一批灯泡,你接受了采购灯泡的任务。假如市场上有两种比较知名品牌的灯泡,你希望从中选择一种。为此,你从两个供应商处各随机抽取了60个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下:灯泡寿命(小时)供应商甲供应商乙700~900124900~110014341100~130024191300~1500103合计6060\n(1)请用直方图直观地比较这两个样本,你能得到什么结论?(2)你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平?请简要说明理由(3)哪个供应商的灯泡具有更长的寿命?(4)哪个供应商的灯泡寿命更稳定?为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,得样本均值为6.5小时,样本标准差为2.5小时。(1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间。(注:,)对于来自五个总体的样本数据进行方差分析,得到下面的方差分析表()<差异源SSdfMSFP-valueFcrit组间69.74BD0.0023.055组内A15C 总计105.219 (1)计算出表中A、B、C、D四个单元格的数值。(2)B、C两个单元格中的数值被称为什么?它们所反映的信息是什么?(3)在0.05的显著性水平下,检验的结论是什么?模拟试题二解答\n一、单项选择题(每小题2分,共20分)1.B;2.D;3.C;4.B;5.A;6.B;7.C;8.D;9.A;10.C。二、简要回答下列问题(每小题10分,共20分)1.框图如下:2.(1)对数据进行检验,以判断手头的数据是否适合作因子分析。用于因子分析的变量必须是相关的。一般来说,相关矩阵中的大部分相关系数小于0.3,就不适合作因子分析了。(2)因子提取。根据原始变量提取出少数几个因子,使得少数几个因子能够反映原始变量的绝大部分信息,从而达到变量降维的目的。(3)因子命名。一个因子往往包含了多个原始变量的信息,它究竟反映了原始变量的哪些共同信息?因子分析得到的因子的含义是模糊的,需要重新命名,以便对研究的问题做出合理解释。(4)根据因子得分函数计算因子在每个样本上的具体取值,以便对各样本进行综合评价和排序。三、计算与分析各题(每小题15分,共60分)1.(1)散点图如下:\n从散点图可以看出,需求量与价格之间存在负线性关系,即随着价格的提高,需求量则随之下降。(2)由最小二乘法可得:,。总需求量与价格的一元线性回归方程为:。回归系数表示:价格每增加1元,总需求量平均减少6.25公斤。(3)公斤。2.两个供应商灯泡使用寿命的直方图如下: \n 从集中程度来看,供应商甲的灯泡的使用寿命多数集中在1100小时~1300小时之间,供应商乙的灯泡的使用寿命多数集中在900小时~1100小时之间。从离散程度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。 (2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供应商灯泡使用寿命的分布基本上是对称分布的。 (3)计算两个供应商灯泡使用寿命的平均数如下:小时。小时。 甲供应商灯泡使用寿命更长。 (4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:小时。小时。\n由于,说明供应商乙的灯泡寿命更稳定。3.(1)已知:,,,。网络用户每天平均上网时间的95%的置信区间为:即(6.17,6.83)。(2)样本比例。龄在20岁以下的网络用户比例的95%的置信区间为:即(33.6%,46.4%)。4.(1)A=105.2-69.7=35.5;B=69.7÷4=17.425;C=35.5÷15=2.367;D=14.425÷2.367=7.361。(2)B=17.425被称为组间方差,反映组间平均误差的大小;C=2.367被称为组内方差,反映组内平均误差的大小。(3)由于,拒绝原假设,表明五个总体的均值之间不全相等。第1章 统计和统计数据1.指出下面的数据哪一个属于分类数据DA.某种产品的销售价格(元):21,26,19,22,28B.某汽车生产企业各季度的产量(万辆):25,27,30,26C.产品的质量等级:一等品,二等品,三等品D.上网的方式:有线宽带,无线宽带2.指出下面的变量哪一个属于顺序变量BA.每月的生活费支出B.产品质量的等级\nC.企业所属的行业D.产品的销售收入3.质检部门从某业生产一天生产的手机中随机抽取20部进行检查,推断该批手机的合格率。这项研究的总体是BA.20部手机B.一天生产的全部手机C.20部手机中合格的手机D.一天生产的手机中合格的手机4.一所大学从全校学生中随机抽取300人作为样本进行调查,其中80%的人回答他们的月生活费支出在500元以上。这里的300人是BA.总体B.样本C.变量D.统计量5.一项调查表明,在所抽取的2000个消费者中,他们每月在网上购物的平均花费是200元,这项调查的样本是AA.2000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的网上购物的平均花费金额D.2000个消费者的网上购物的平均花费金额6.最近发表的一项调查表明,“汽车消费税率调整后,消费者购买大排量汽车的比例显著下降”。这一结论属于DA.对样本的描述B.对样本的推断C.对总体的描述D.对总体的推断7.下列数据分析方法中,属于推断统计方法的是DA.画出一个班考试分数的茎叶图B.学生的生活费支出分成400元以下、400元~500元、500元~600元、600元以上,列出每一组的人数C.随机抽取2000个家庭计算出它们的平均收入D.随机抽取2000个家庭,根据2000个家庭的平均收入估计该地区家庭的平均收入8.分层机抽样的特点是BA.使得总体中的每一个元素都有相同的机会被抽中B.在抽样之前先将总体的元素划分为若干类,使得每一类都有相同的机会被抽中C.先将总体划分成若干群,使得每一群都有相同的机会被抽中D.先将总体各元素按某种顺序排列,使得总体中的每一个元素都有相同的机会被抽中9.为了解大学生的上网时间,从全校所有学生宿舍中随机抽取50个宿舍,然后对抽中宿舍中的每个学生进行调查,这种抽样调查方法是D\nA.分层抽样B.简单随机抽样C.系统抽样D.整群抽样10.在抽取样本时,一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取个元素为止,这样的抽样方法称为BA.重复抽样B.不重复抽样C.分层抽样D.系统抽样第2章用图表展示数据1.在2008年8月北京举办的第29届奥运会上,中国体育代表团共获得51枚金牌,占中国队获得奖牌总数的51%。这里的“51%”是CA.平均数B.频数C.比例D.比率2.某地区2008年新生婴儿中,男性婴儿为25万,女性婴儿为20万。男性婴儿与女性婴儿的人数之比为1.25:1,这个数值属于BA.比例B.比率C.频数D.平均数3.在2008年8月北京举办的第29届奥运会上,中国体育代表团共获得51枚金牌、银牌21枚、铜牌28枚,要描述中国队获得奖牌的构成状况,适宜的图形是BA.条形图B.饼图C.茎叶图D.雷达图4.某集团公司下属5个子公司。集团公司想比较5个子公司在总生产成本、销售收入、销售人员数、公司所在地的居民收入水平这4项指标的差异和相似程度,适宜采用的图形是DA.帕累托图B.环形图C.散点图D.雷达图5.某大学的教学管理人员想分析经济管理类专业的学生统计学的考试分数与数学考试分数之间是否存在某种关系,应该选择的描述图形是AA.散点图B.条形图C.饼图D.箱线图6.随机抽取500个消费者的应该随机样本,得到他们每月的消费支出数据。研究者想观察这500个消费者生活费支出的分布状况,应该选择的描述图形是CA.条形图B.帕累托图C.直方图D.\n雷达图7.在对数值型数据进行分组后,统计各组频数时,通常要求一个组的变量值x满足DA.B.C.D.8.一所大学的法学院设有三个专业,其中刑法专业20名学生,民法专业50名学生,经济法专业30名学生。要描述三个专业学生人数的多少,适宜采用的图形是CA.雷达图B.茎叶图C.条形图D.箱线图9.条形图与直方图的主要区别之一是DA.条形图不能用于展示数值型数据B.条形图可以横置,直方图不能横置C.条形图中矩形的高度没有实际意义,而直方图中矩形的高度则有实际意义D.条形图的矩形通常分开排列,而直方图的矩形通常连续排列10.在对数值型数据进行分组时,所分的组数CA.通常是越多越好B.通常是越少越好C.应以能够适当观察数据的分布特征为准D.应使数据分布的图形达到对称第3章用统计量描述数据1.9名大学生每月的生活费支出(单位:元)分别是:583,618,750,495,510,550,512,456,510。生活费支出的中位数是AA.510B.750C.450D.6182.在第29届北京奥运会男子100米决赛中,进入决赛的8名百米运动员的成绩(单位:秒)分别是:9.69,9.89,9.91,9.93,9.95,9.97,10.01,10.03,这8名运动员百米成绩的标准差是BA.0.011B.0.105C.0.340D.0.0373.已知某班级学生的英语平均考试成绩为85分,标准差是5分。如果一个学生考试成绩的标准分数是-2,则该学生的考试分数为CA.95B.80C.75D.65\n4.某大学共有5000名本科学生,每月平均生活费支出是500元,标准差是50元。假定该校学生的生活费支出为对称分布,月生活费支出在400元至600元之间的学生人数大约为AA.4750B.4950C.4550D.34005.某地区的个人收入不是对称分布的,平均数5000元,标准差是1000元。收入在2000元至8000元范围内的人口至少占BA.75%B.89%C.94%D.99%6.市场营销人员的平均月收入为8000元,标准差为2400元,大学教师的平均月收入为5000元,标准差为2000元。由此可知BA.市场营销人员收入的离散程度较大B.大学教师收入的离散程度较大C.大学教师收入的离散程度较小D.二者收入的离散程度相等7.在证券投资行业中随机抽取10个从业者,得到他们的月收入分别为:6800,7300,6600,7600,8600,7400,6300,9000,6500,8900,他们月收入的平均数是BA.7000B.7500C.6800D.66008.大学生中每周的上网时间的偏态系数为0.3,这表明学生每周上网时间的分布是CA.对称的B.左偏的C.右偏的D.严重左偏的9.某品牌的汽车在10家4S店销售,7月份各店的销售量(单位:辆)分别为:252,209,261,208,221,257,262,272,224,223,销售量25%和75%位置上的分位数分别是DA.235和267B.261和272C.209和224D.215和25910.某地区家庭年收入的平均数8000元,中位数是6000元,众数是5000元。由此可知,该地区家庭的收入是BA.左偏分布B.右偏分布C.对称分布D.尖峰分布第4章 概率分布1.一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数x及相应的概率如下表所示。故障次数多于一次的概率为D故障次数()0123\n概率()0.050.250.400.30A.0.25B.0.40C.0.60D.0.702.某大学的管理人员希望估计该大学本科生平均每月的生活费支出,为此,调查了300名学生,发现他们每月平均生活费支出是550元。管理人员感兴趣的统计量是CA.该大学的所有学生人数B.该大学所有本科生的平均月生活费支出C.所调查的300名学生的平均月生活费支出D.所调查的200名学生3.某研究部门准备在全市100万个家庭中抽取5000个家庭作为样本,推断该城市所有家庭的年人均收入。这项研究的参数是AA.100万个家庭的人均收入B.5000个家庭的人均收入C.100万个家庭D.5000个家庭4.从全校学生中随机抽取100人作为样本,调查他们每月的生活费支出。则统计量的抽样分布是指CA.这100名学生生活费支出的频数分布B.全校学生生活费支出的频数分布C.抽取所有可能的样本量为100的样本,所有样本平均生活费支出的概率分布D.全校学生平均生活费支出的概率分布5.某地区每个人的年收入是右偏的,均值为5000元,标准差为1200元。随机抽取900人并记录他们的年收入,则样本均值的分布为AA.近似正态分布,均值为5000元,标准差为40元B.近似正态分布,均值为5000元,标准差为1200元C.右偏分布,均值为5000,标准差为40D.左偏分布,均值为5000元,标准差为1200元6.一家慈善机构的调查表明,在捐赠者中,有40%是通过银行账户实施捐赠。从该慈善机构中抽取样本量为200的捐赠者组成一个样本,则样本比例的期望值为CA.80%B.8%C.40%D.4%7.某电讯部门抽取20个手机用户,计算出他们通话时间的方差。要用样本方差推断总体方差,假定前提是所有用户的通话时间应服从B\nA.分布B.正态分布C.t分布D.F分布8.下面关于标准误差的陈述中正确的是CA.标准误差和标准差是同一个概念的两种表述B.标准误差反映的是一组原始数据的离散程度C.标准误差反映的是样本统计量的离散程度D.标准误差的大小与总体标准差无关9.正态分布有两个参数和,其中BA.越大,正态曲线越陡峭B.越小,正态曲线越陡峭C.不同的,决定了正态曲线在横轴上的位置D.不同的,决定了正态曲线下的面积大小10.下面关于n重Bernoulli试验条件的陈述不正确的是DA.一次试验只有两个可能结果,即“成功”和“失败”B.每次试验“成功”的概率为都为p,“失败”的概率都为1-pC.试验是相互独立的,且可以重复进行n次D.在n次试验中,“成功”的次数对应一个连续型随机变量x第5章 参数估计1.总体均值的区间估计是在点估计的基础上给出总体均值的一个估计区间,该区间等于样本均值加减CA.样本标准差B.样本均值的标准误差C.估计误差D.总体标准差2.下面关于置信区间的表述正确的是DA.任何总体参数的置信区间都等于点估计值加减估计误差B.一个具体样本构建的总体参数的95%的置信区间,将以95%的概率包含总体参数C.在样本量相同的情况下,总体均值的90%的置信区间要比95%的置信区间窄D.在相同的置信水平下,一个较大的样本构建的总体均值的置信区间要比一个较小的样本构建的置信区间准确3.\n根据样本均值的抽样分布可知,样本均值的期望值等于总体均值。因此,用样本均值作为总体均值的估计量时,称其为总体均值的AA.无偏估计量B.有效估计量C.可靠估计量D.一致估计量4.质检部门的一项抽样调查表明,某种袋装食品平均重量的99%的置信区间为490克~505克之间,这里的99%是指DA.食品重量的合格率为99%B.在100袋食品中,有99袋的重量在490克~505克之间C.可以用99%的概率保证该食品每袋的平均重量在490克~505克之间D.如果用相同的方法进行多次估计,每袋食品重量的平均值在490克~505克之间的频率约为99%5.某个地区的家庭年收入额通常是右偏的,从该地区随机抽取2000个家庭作为样本,估计该地区家庭的年平均收入额,所使用的分布是AA.正态分布B.t分布C.分布D.F分布6.已知某种灯泡的使用寿命服从正态分布,方差为。从该种灯泡中随机抽取15只,测得平均使用寿命为2800小时。则该种灯泡平均使用寿命的95%的置信区间为BA.B.C.D.7.在某个电视节目的收视率调查中,随机抽取由165个家庭构成的样本,其中观看该节目的家庭有33个。用90%的置信水平(注:)估计观看该节目的家庭比例的置信区间为CA.20%±3%B.20%±4%C.20%±5%D.20%±6%8.随机抽取10个消费者,让他们分别品尝两个品牌的饮料,然后进行打分,得到两种饮料得分差值的均值为,标准差为,两种饮料得分差值的95%(注:)的置信区间为AA.3.5±1.88B.3.5±0.59C.3.5±2.18D.3.5±0.289.某城市准备提出一项出租汽车运营的改革措施,为估计出租车司机中赞成该项改革的人数的比例,要求估计误差不超过0.03,置信水平为90%(注:),应抽取的样本量为C\nA.552B.652C.752D.85210.随机抽取20罐啤酒,得到装填的标准差为0.5升。用95%的置信水平(注:,)得到总体装填量标准差的置信区间为CA.(0.028,0.105)B.(0.28,1.05)C.(0.14,0.53)D.(2.8,10.5)第6章 假设检验1.一家食品生产企业声称,它们生产的某种食品的合格率在95%以上。为检验这一说法是否属实,某食品安全检测部门打算抽取部分食品进行检验,该检验的原假设和备择假设为CA.,B.,C.,D.,2.在假设检验中,原假设所表达的含义总是指CA.参数是错误的B.参数发生了变C.参数没有发生变化D.变量之间存在某种关系3.某电池生产商声称,它们生产的5号电池的平均使用时间为85小时。质检部门抽取20节电池的随机样本,在a=0.05的显著性水平下,检验结果是未能拒绝原假设,这意味着DA.该企业生产的5号电池的平均使用时间是85小时B.该企业生产的5号电池的平均使用时间不是85小时C.没有证据证明该企业生产的5号电池的平均使用时间是85小时D.没有证据证明该企业生产的5号电池的平均使用时间不是85小时4.要检验某地区的人均消费水平是否等于1500元,提出的原假设和备择假设分别为。在该假设检验中,第Ⅰ类错误是指AA.该地区人均消费水平的实际值是1500元,检验结果却拒绝了原假设B.该地区人均消费水平的实际值是1500元,检验结果却未拒绝原假C.该地区人均消费水平的实际值不是1500元,检验结果却拒绝了原假设D.该地区人均消费水平的实际值不是1500元,检验结果却未拒绝原假设\n5.指出下列假设检验中哪一个属于右侧检验CA.B.C.D.6.在某大学生中随机抽取一个49名学生组成一个,计算得到某月网上购物的平均花费金额为,标准差为,要检验假设,检验的统计量为AA.-1.75B.1.75C.-12.25D.12.257.下面关于假设检验的陈述中正确的是BA.备择假设通常是指研究者想收集证据予以推翻的假设B.假设检验中的P值是根据样本数据计算出来的犯第Ⅰ类错误的概率C.不拒绝原假设意味着原假设就是正确的D.小的样本通常会导致检验结果在“统计上是显著的”8.企业管理人员认为,两台机床加工的零件尺寸的方差是相同的。根据两个随机样本,计算得到,,要检验假设,则检验统计量的值F为DA.1.72B.1.62C.1.52D.1.429.为比较物流企业的信息化发展状况,在2000年和2005年分别抽取了371家和459家物流企业进行调查,发现物流企业利用计算机处理信息的比率从2000年的25%()增加到33%(),在a=0.05的显著性水平下,检验假设,得到的结论是AA.拒绝B.不拒绝C.可以拒绝也可以不拒绝D.可能拒绝也可能不拒绝10.从正态总体中随机抽取一个n=12的随机样本,计算得到,,假定,要检验假设,则检验统计量的值为CA.B.C.D.\n第7章 方差分析与实验设计1.要检验来自东部地区、中部地区、西部地区的大学生平均每月的生活费支出是否相同,这里的“地区”被称为DA.因子B.方差C.处理D.观测值2.在统计上,将我国的31个省市自治区分为东部地区、中部地区、西部地区、东北地区。要检验不同地区的居民收入水平是否相同,在每类地区各随机抽取一个样本。某一地区中样本数据之间的误差属于BA.处理误差B.组间方差C.随机误差D.非随机误差3.一家研究机构从事水稻品种的研发。最近研究出3个新的水稻品种。为检验不同品种的平均产量是否相同,对每个品种分别在5个地块上进行试验,共获得15个产量数据。在该项研究中,不同品种在不同地块上的产量是不同的,这种误差称为BA.总误差B.组内误差C.组间误差D.随机误差4.方差分析中有3个基本的假定,即正态性、方差齐性和独立性,在这3个假定中,对分析结果影响较大的是BA.正态性B.方差齐性C.正态性和方差齐性D.独立性5.某家电制造公司的管理者想比较A、B、C三种不同的培训方式对产品组装时间的多少是否有显著影响,将20名新员工随机分配给每种培训方式。在培训结束后,对参加培训的员工组装一件产品所花的时间进行分析,得到下面的方差分析表。表中“A”单元格内的结果是A差异源SSdfMSF组间5.352A8.28组内7.43230.323 总计12.7825 A.10.700B.2.675C.0.233D.5.3506.为研究食品的包装和销售地区对其销售量是否有影响,在3个不同地区中用三种不同包装方法进行销售,根据获得的销售量数据计算得到下面的方差分析表。表中“A”单元格和“B”单元格内的结果是DSSdfMSF\n差异源行22.222A0.073列955.562B3.127误差611.114152.78 总计1588.898 A.44.44和1922.12B.5.56和477.78C.11.11和477.78D.5.56和238.897.从三个总体中各选取了4个观察值,得到组间方差为15.09,组内方差为0.97,要检验三个总体的均值是否相等,检验的统计量为DA.14.64B.15.56C.0.06D.15.098.在检验四个总体的均值是否相等时,得到的结论是不拒绝原假设,这意味着BA.相等B.没有证据表明不相等C.的两两组合都相等D.的两两组合中至少有一对相等9.来自A、B、C三种处理的完全随机化设计的数据,得到下面的方差分析表。在a=0.05的显著性水平下,用Fisher最小显著性差异方法检验所有可能的配对比较,得到的结论是D差异源SSdfMSF组间148827445.50组内203015135.3 总计351817 A.A与B之间有差异B.A与C之间有差异C.B与C之间有差异D.A与B之间、A与C之间有差异10.随机抽取20罐啤酒,得到装填的标准差为0.5升。用95%的置信水平(注:,)得到总体装填量标准差的置信区间为\nBA.(0.028,0.105)B.(0.28,1.05)C.(0.14,0.53)D.(2.8,10.5)第8章 一元线性回归1.下面关于相关分析的陈述中,不正确的是AA.相关系数的数值越大,说明两个变量之间的线性关系越强B.相关系数是一个随机变量C.相关系数的绝对值不会大于1D.相关系数只度量两个变量之间的线性关系2.在一元回归模型中,反映的是DA.由于x的变化引起的y的线性变化部分B.由于y的变化引起的x的线性变化部分C.由于x和y的线性关系对y的影响D.除x和y的线性关系之外的随机因素对y的影响3.在一元线性回归模型中,对有三个基本假定,即正态性、方差齐性和独立性。其中的独立性是指AA.对于一个特定的x值,它所对应的与其他x值所对应的不相关B.对于一个特定的y值,它所对应的与其他y值所对应的不相关C.对于所有的x值,的方差都相同D.对于所有的y值,的方差都相同4.在回归分析中,残差平方和是指BA.各实际观测值与其均值的离差平方和B.各实际观测值与回归值的离差平方和C.回归预测值与因变量均值的离差平方和D.因变量与自变量的平方和5.在一元线性回归中,如果估计标准误差,则意味着D\nA.回归系数B.回归系数C.相关系数D.相关系数6.在一元线性回归分析中,利用所求得的一元线性回归方程,对于自变量x的一个给定值,求出因变量的平均值的区间,这一区间称为AA.因变量平均值的置信区间B.因变量个别值的预测区间C.自变量平均值的置信区间D.自变量个别值的预测区间7.根据两个变量之间的一元线性回归,得到的回归平方和,残差平方和。则判定系数等于BA.20.83%B.79.17%C.26.32%D.33.25%8.随机抽取10家企业,根据产品产量(x)与生产费用(y)的数据进行回归,得到下面的方差分析表。方差分析表中“A”和“B”单元格的数据分别为BdfSSMSF回归11711.31711.3B残差8281.1A 总计91992.4 A.281.1和48.8B.35.1和48.8C.35.1和0.02D.28.1和6.19.残差除以相应的标准差,其结果称为CA.残差平方和B.残差C.标准化残差D.估计标准误差10.对于下面的数据,根据x预测y时的最小二乘回归直线方程为Ax57318129y8911271712A.B.C.D.第9章 多元线性回归\n1.在多元线性回归分析中,t检验是用来检验BA.回归模型的总体线性关系是否显著B.回归模型的各回归系数是否显著C.样本数据的线性关系是否显著D.回归方程的预测结果是否显著2.下面关于多元线性回归模型的陈述中不正确的是CA.对于给定的的值,假定因变量y是一个服从正态分布的随机变量B.即使对回归系数检验不显著,也不能断定与y之间就不存在线性关系C.如果检验表明回归模型的线性关系显著,意味着每一个x与y的线性关系都显著D.模型中的自变量可以是数值型变量,也可以数定性变量3.根据因变量y与自变量、和的样本数据进行回归得到下面的有关结果。以下的结论中不正确的是C Coefficients标准误差tStatP-valueIntercept20.9625.7223.6630.022XVariable1-0.0910.133-0.6850.531XVariable2-0.0750.032-2.3210.081XVariable30.1780.0573.1390.035A.在a=0.05的显著性水平下,和的回归系数不显著B.已知用于线性关系检验的P=0.014,在a=0.05的显著性水平下,回归模型的线性关系显著C.回归模型中可能存在多重共线性\nD.如果采用逐步回归方法,和都将会从模型中剔除4.根据因变量y与自变量、和的样本数据进行回归得到下面的方差分析表。据此计算的估计标准误差等于B dfSSMSF回归分析387.6—13.9残差4—2.1 总计796 A.2.10B.1.45C.29.2D.0.915.在某行业中随机抽取20名员工,得到它们的月收入(单位:元)和性别的数据。其中用1表示男性,0表示女性,用月收入作因变量,性别作自变量进行回归,得到的回归方程为。这里的回归系数表示AA.女性员工的月平均收入位2850元B.男性员工的月平均收入2850元C.女性员工的月平均收入比男性员工的月平均收入多2850元D.男性员工的月平均收入比女性员工的月平均收入多2850元6.根据两个自变量得到的多元回归方程为,回归系数的含义是DA.每变动一个单位,y平均减少0.08个单位B.在不变的条件下,每变动一个单位,y平均增加0.08个单位C.在不变的条件下,每变动一个单位,y平均减少0.08个单位D.在不变的条件下,每变动一个单位,y平均减少0.08个单位7.在多元线性回归分析中,用F统计量检验回归模型的线性关系时,备择假设是DA.:B.:C.:D.:至少有一个不等于0\n8.根据两个自变量得到进行的二元线性回归得到的有关结果如下。检验回归系数的统计量为A Coefficients标准误差Intercept11.466.27XVariable10.240.07XVariable2-0.130.18A.-0.72B.0.72C.-3.43D.3.439.下面是根据3个自变量建立多元线性回归方程,得到的方差分析表如下。据此计算的多重判定系数为AdfSSMSF回归3321946.8107315.68.96残差11131723.211974.84 总计14453670 A.70.97%B.29.04%C.33.33%D.9.09%10.在建立多元线性回归模型时,需要对自变量进行筛选,最后确定适合的回归模型。下面的陈述中正确的是DA.向前选择法是从模型中没有自变量开始,然后将所有自变量依次增加到模型中B.向后剔除法是先对所有自变量拟合线性回归模型,然后依次将所有自变量剔除模型C.逐步回归法是将向前选择法和向后剔除法结合起来,但不能保证得到的回归模型一定就显著D.逐步回归法选择变量时,在前面步骤中增加的自变量在后面的步骤中有可能被剔除,而在前面步骤中剔除的自变量在后面的步骤中也可能重新进入到模型中\n第10章 时间序列预测1.下面的图形是我国1985年~2006年全国研究生招生人数的时间序列图。从该图可以看出,各年的研究生招生人数呈现BA.线性趋势B.指数趋势C.季节变动D.循环波动2.指出下面对时间序列的描述哪个符合季节变动的特点AA.在一年内重复出现周期性波动B.呈现出固定长度的周期性变动C.呈现出非固定长度的周期性变动D.在长时期内呈现出持续向上或持续向下的变动3.下面的图形是我国1990年~2006年的社会消费品零售总额(单位:亿元)的时间序列图。下列的那种方法比较适合于该序列的预测CA.移动平均法B.指数平滑法C.指数模型法D.分解法4.如果时间序列的变化明显具有两个拐点,适合选择的预测模型是DA.线性趋势模型B.指数平滑模型C.二阶曲线模型D.三阶曲线模型5.根据某企业历年的生产成本(单位:万元)数据拟合的线性趋势方程为\n,方程中的65表示CA.本年度的生产成本为65万元B.下一年度的生产成本将增加65万元C.时间每增加1年,生产成本平均增加65万元D.时间每增加1年,生产成本平均减少65万元6.如果时间序列变化的特点是:初期增长迅速,随后增长率逐渐降低,最终则以某个常数为增长极限,描述该现象适合的趋势线为DA.回归直线B.指数曲线C.Gompertz曲线D.指修正指数曲线7.使用Durbin-Watson统计量的的d临界值表检验自相关时,如果统计量d的值小于临界值下限,则表明该序列AA.存在自相关B.不存在自相关C.是否存在自相关无法据此无法做出判断D.存在负的自相关8.如果时间序列存在自相关,使用最小二乘法拟合的回归模型进行预测时,则违背了最小二乘回归中关于CA.误差项正态性的假定B.误差项方差齐性的假定C.误差项独立性的假定D.误差项随机性的假定9.根据我国2002年至2006年各月份的社会消费品零售总额数据,计算的7月份的季节指数为92.14%。这表明7月份属于AA.零售的淡季,零售额比年平均零售额低7.86%B.零售的淡季,零售额比年平均零售额低92.14%C.零售的旺季,零售额比年平均零售额低7.86%D.零售的旺季,零售额比年平均零售额低92.14%10.某月份的水产品销售额为150万元,该月的季节指数为0.96,消除季节因素影响后,该月的销售额应为BA.142.50万元B.156.25万元C.54万元D.246万元第12章 聚类分析1.下面关于聚类分析的描述不正确的是BA.聚类分析所分的类别不是事先给定的B.聚类分析是将对象分到已知的类中\nC.聚类分析是根据对象之间的相似性将对象进行分类D.聚类分析可以根据变量对样本分类,也可以根据样本对变量进行分类2.选择30个不同品牌的啤酒,根据其所含的热量、纳含量、酒精含量及价格等指标对啤酒进行分类。这种分类属于AA.Q型聚类B.R型聚类C.层次聚类D.K-均值聚类3.调查500名消费者,根据收入水平、受教育水平、消费支出、年龄等变量,对消费者的特征进行分类。这种分类属于DA.层次聚类B.K-均值聚类C.Q型聚类D.R型聚类4.在聚类分析中,平方欧氏距离主要是用于度量CA.类间距离B.变量间的相关程度C.样本的点间距离D.类别的数量5.使用层次聚类法进行分类时,离差平方和法(Ward’smethod)主要是用于度量CA.变量之间的相关系数的大小B.对象之间的差异程度C.类间距离的远近D.对象之间的相似程度6.在对样本分类后,为考察所分的类别是否合理,用于检验各不同类别的变量之间是否有显著差异时所使用的统计方法是BA.两个总体均值之间的配对检验B.方差分析C.距离分析D.相似性分析7.层次聚类和K-均值聚类是两种不同的分类方法,二者的主要区别是DA.层次聚类比K-均值聚类的更接近实际B.层次聚类的计算量要小于K-均值聚类C.层次聚类的结果不如K-均值聚类结果可靠D.层次聚类事先不确定要分多少类,而K-均值聚类需要事先指定要分的类别数8.下面是对20个样本的5个变量采用K-均值聚类得到的最终聚类中心。该表中的数据1.22168表示,被分到第一类的样本中第1个变量的DCluster123Zscore(1)1.22168.68535-1.01643Zscore(2)1.83630.13636-.73331Zscore(3)-.96013-.29683.58389Zscore(4)1.55317.44327-.91174\nZscore(5)1.63394.39487-.89564A.X1、和X4B.X5、X3和X2C.X1、X2、X3、X4和X5D.X1、X4和X69.一般来说,在所分的类别中,各类所包含的对象的数量应该大致相当。下面是对20个样本的5个变量采用K-均值聚类,得到分成2类、分成3类、分成4类时各类别的样本数。认为分成几类时各类别的样本数大致相当AA.2类B.3类C.4类D.2类和4类10.下面的陈述中正确的是BA.参与分类的各变量之间应该有较强的相关关系B.参与分类的各变量的取值在数量级上的不应该有较大的差异C.在所分的各类中包含的对象的数量应该有较大差异D.将对象最终分成几类完全取决于研究者的判断第13章 非参数检验1.与参数检验相比,非参数检验的适用场合主要是BA.总体的参数已知B.总体的参数未知C.总体的分布形式已知D.总体的分布形式未知,或者无法对总体的分布做出假定2.Wilcoxon符号秩检验的基本假定是AA.总体服从正态分布B.总体服从二项分布C.总体服从连续对称分布D.总体参数等于某一假定值3.下面是从两个总体中抽取的两个独立样本的数据,采用Mann-Whitney检验(a=0.05),原假设和备择假设为:,:。得到的结论是D样本11517261118211329样本22314241322231821A.拒绝原假设,两个总体的中位数相等B.拒绝原假设,两个总体的中位数不相等C.不拒绝原假设,两个总体中的中位数相等D.不拒绝原假设,没有证据表明两个总体中的中位数不相等4.\n为比较两种汉字输入方法的效率,让10名打字员先后用两种方法进行录入,记录下他们在5分钟内录入的字数。要检验两种输入法的录入效率是否存在显著差异,应采用的非参数检验方法是CA.Wilcoxon符号秩检验B.Mann-WhitneyU检验C.Kruskal-Wallis检验D.Spearman秩相关检验5.为比较两种汉字输入方法的效率,让10名打字员先后用两种方法进行录入,在5分钟内录入的字数如下表。要检验两种输入法的录入效率是否存在显著差异(a=0.05),原假设和备择假设为::=0(两个总体相同),:0(两个总体不相同)。采用非参数检验得到的结论是CA输入法426387410506411398427449407438B输入法437446421510465409414459502439A.拒绝原假设,两种输入法的录入效率存在显著差异B.拒绝原假设,两种输入法的录入效率不存在显著差异C.不拒绝原假设,两种输入法的录入效率有显著差异D.不拒绝原假设,没有证据表明两种输入法的录入效率存在显著差异6.从3所高校中各随机抽取5名学生的随机样本,得到每月的生活费支出数据。要检验3所高校的学生生活费支出是否有显著差异a=0.05),采用的非参数检验方法是BA.Wilcoxon符号秩检验B.Mann-WhitneyU检验C.Kruskal-Wallis检验D.Kendall秩相关检验7.从三所高校中各随机抽取5名学生的随机样本,得到每月的生活费支出数据如下表。要检验三所高校的学生生活费支出是否有显著差异a=0.05),采用非参数检验方法得到的结论是D学校A1200450800575375学校B9503501050750680学校C6755001100660310A.拒绝原假设,三所高校的学生生活费支出有显著差异B.拒绝原假设,三所高校的学生生活费支出没有显著差异C.不拒绝原假设,三所高校的学生生活费支出有显著差异D.\n不拒绝原假设,没有证据表明三所高校的学生生活费支出有显著差异8.下面关于Spearman秩相关系数和Kendall秩相关系数的陈述中正确的是A.Spearman秩相关系数不如Kendall秩相关系数准确DB.对于同一组数据,Spearman秩相关系数通常大于Kendall秩相关系数C.对于同一组数据,Spearman秩相关系数通常小于Kendall秩相关系数D.Kendall秩相关系数不会出现负值9.两个独立样本的Mann-Whitney检验所对应的参数检验方法是AA.两个配对总体均值之差的检验B.两个独立总体均值之差的检验C.单因子方差分析D.双因子方差分析10.Spearman秩相关系数的取值范围BA.B.C.D.