- 467.00 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第一、二章习题一、单项选择题1、指出下面的数据哪一个属于分类数据?(D)A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据?(D)A、年龄B、工资C、汽车产量D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是(C)。A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、了解居民的消费支出情况,则(B)。A、居民的消费支出情况是总体B、所有居民是总体C、居民的消费支出情况是总体单位D、所有居民是总体单位5、统计学研究的基本特点是(B)。A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是(C)。A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是(A)。A、我国每一家工业企业B、我国所有工业企业C、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是(C)。A、1000个消费者B、所有在网上购物的消费者C、所有在网上购物的消费者的平均消费额D、1000个消费者的平均消费额9、一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于(C)。A、分类数据B、顺序数据C、截面数据D、时间序列数据10、一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于(D)。A、访问调查B、邮寄调查C、个别深度访问D、观察调查11、工业企业的设备台数、产品销售额是(D)A、连续型变量B、离散型变量C、前者是连续型变量,后者是离散型变量D、前者是离散型变量,后者是连续型变量12、抽样误差是指(C)。A、调查中所产生的登记性误差B、调查中所产生的系统性误差\nC、随机抽样产生的代表性误差D、由于违反了随机原则而产生的误差13、保定市工商银行要了解2000年第一季度全市储蓄金额的基本情况,抽取了储蓄金额最高的几个储蓄所,这种抽样属于(A)。A、重点抽样B、典型抽样C、随机抽样D、整群抽样14、连续生产的电子管厂,产品质量检验是这样安排的,在一天中,每隔一小进抽取5分钟的产品进行检验,这是(D)。A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样15、当总体内部差异比较大时,比较适合的抽样组织方式是(C)。A、纯随机抽样B、整群抽样C、分层抽样D、简单随机抽样16、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样组织形式,被称为(B)。A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样17、在抽样推断中,抽样误差是(D)。A、可以避免的B、可避免且可控制C、不可避免且无法控制D、不可避免但可控制18、随机抽样所特有的误差是(A)。A、由于样本的随机性而产生的误差B、登记误差C、系统性误差D、ABC都错19、事先将总体各单位按某一标志排列,然后依排列顺序并按相同的间隔来抽样样本单位的形式称为(C)。A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样20、概率抽样所必须遵循的基本原则是(B)。A、准确性原则B、随机性原则C、可靠性原则D、灵活性原则二、多项选择题1、欲了解某地高等学校科研情况(BD)。A、该地所有高等学校所有的科研项目是总体B、该地所有的高等学校是总体C、该地所有高等学校的每一科研项目是总体单位D、该地每一所高等学校是总体单位E、该地所有高等学校的所有科研人员是总体2、下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据:公司名称销售额(百万美元)利润额(百万美元)行业代码BancOne102721427.08CPCIntl.9844580.019TysonFoods645487.019….….….….…..…….…..Woolworth8092168.748在这个例子中(BC)。A、总体是500强公司,总体单位是表中所列的公司B、总体是500强公司,总体单位是其中每一家公司C、总体是500强公司,样本是表中所列的公司D、总体是500强公司,样本是表中所列公司的销售额和利润额E、总体是表中所有的公司,总体单位是表中每一家公司3、一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过标准,就把整批货退回。这个问题中(BDE)\nA、样本是从所有木材批次中随机抽取的部分批次木材B、样本是从每批木材中随机抽取的5块木材C、总体单位是从所有木材批次中随机抽取的部分批次木材D、总体单位是购买的每一块木材E、总体是购买的全部木材4、下面研究问题中所确定的总体单位有(ABCDE)。A、研究某地区国有企业的规模时,总体单位是每个国有企业B、研究某地区粮食收获率时,总体单位是每一亩播种面积C、研究某种农产品价格,总体单位可以是每一吨农产品D、研究货币购买力(一定单位的货币购买商品的能力),总体单位应是每元货币E、确定某商店的销售额,总体单位是每一次销售行为5、下列变量中属于离散变量的有(ABE)。A、机床台数B、学生人数C、耕地面积D、粮食产量E、汽车产量6、随机抽样的抽样误差(ACE)。A、是不可避免要产生的B、是可以通过改进调查方法来消除的C、是可以事先计算出来的D、只有在调查结束之后才能计算E、其大小是可以控制的三、判断题1、统计运用大量观察法必须对所有的总体单位进行观察。(×)2、人们可以有意识地控制抽样误差的大小,因为可以调整总体方差。(×)3、抽样调查是利用总体中的一部分进行调查与推断,则不可避免地会出现误差。(√)4、抽样误差是由于抽样的偶然因素而产生的误差,这种误差既可以避免,也可以控制。(×)5、在概率抽样方式中,每个单位被抽中的概率都是已知的,或是可以计算出来的。(√)6、重点调查中的重点单位是标志值较大的单位。(√)7、样本量越大、总体的变异性越小,则抽样误差越小。(√)四、填空题1、调查的实践中经常采用的概率抽样方式有简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样。2、抽样误差是由于抽样的随机性而产生的误差,这种误差不可避免,但可以计算、控制。3、非概率抽样的方式有许多种,可以归为以下五种类型:方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。4、通过抽取几个主要的产棉区来调查棉花的生长情况,这种抽样方法属于重点抽样。第三、四章习题一、单项选择题1、一组数据排序后处于25%和75%位置上的值称为(C)。A、众数B、中位数C、四分位数D、均值2、某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是(B)。A、众数>中位数>均值B、均值>中位数>众数C、中位数>众数>均值D、中位数>均值>众数3、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为(D)。\nA、环形图B、茎叶图C、直方图D、箱线图4、当变量值较小的一组其权数较大时,则均值(B)。A、接近变量值较大的一组B、接近变量值较小的一组C、不受权数影响D、仅受变量值影响5、离散系数(C)。A、只能消除一组数据的水平对标准差的影响B、只能消除一组数据的计量单位对标准差的影响C、可以同时消除数据的水平和计量单位对标准差的影响D、可以准确反映一组数据的离散程度6、峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值(A)。A、等于0B、大于0C、小于0D、等于17、如果峰态系数K>0,表明该组数据是(A)。A、尖峰分布B、扁平分布C、左偏分布D、右偏分布8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是(B)。A、1200B、经济管理学院C、200D、理学院9、在组距数列中,向下累计到某组的次数是100,这表示总体单位中(A)。A、大于该组下限的累计次数是100B、小于该组下限的累计次数是100C、大于该组上限的累计次数是100D、小于该组上限的累计次数是10010、某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。第一组和第四组的组中值分别为(D)。A、750和2500B、800和2250C、800和2500D、750和225011、对于分类数据,测度其离散程度使用的统计量主要是(B)。A、众数B、异众比率C、标准差D、均值12、甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量(B)。A、上升B、下降C、不变D、可能上升,也可能下降13、数据筛选的主要目的是(C)。A、发现数据的错误B、对数据进行排序C、找出所需要的某类数据D、纠正数据中的错误14、当各个变量值的频数相等时,该变量的(A)。A、众数不存在B、众数等于均值C、众数等于中位数D、众数等于最大的数据值15、有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为(B)。A、24B、23C、22D、2116、变量数列中各组频率的总和应该(B)。A、小于1B、等于1C、大于1D、不等于117、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?(D)A、算术平均数B、几何平均数C、中位数D、众数18、计算平均速度最好用(C)。A、均值B、调和平均数C、几何平均数D、众数19、下面的哪一个图形最适合描述结构性问题(B)。\nA、条形图B、饼图C、雷达图D、直方图20、下面的哪一个图形适合比较研究两个或多个总体或结构性问题(A)。A、环形图B、饼图C、直方图D、茎叶图二、多项选择题1、变量数列中,各组变量值与频数的关系是(AC)。A、各组变量值作用的大小由各组频数的多少反映B、各组变量值作用的大小由各组变量值的大小反映C、频数越大的变量值对总体一般水平的影响也越大D、频数越大的变量值对总体一般水平的影响越小E、频数越大,变量值也越大2、下列说法那些是正确的?(ABCD)。A、应该用均值来分析和描述地区间工资水平B、宜用众数来描述流行的服装颜色C、考试成绩中位数的含义是有一半考生的成绩超过此数D、在数据组高度偏态时,宜用中位数而不是用众数来作为平均数E、一般常用算术平均法来计算年平均增长率3、下列应该用几何平均法计算的有(BCE)。A、生产同种产品的三个车间的平均合格率B、平均发展速度C、前后工序的三个车间的平均合格率D、平均劳动生产率E、以复利支付利息的年平均利率4、在组距式变量数列中,组中值(ABDE)。A、是上限和下限之间的中点数B、是用来代表各组的标志值C、在开口组中无法确定D、在开口组中,可参照相邻的组距来确定E、就是组平均数5、在某一个次数分配数列中(BCD)。A、各组的频数之和等于100B、各组频率大于0C、频数越小,则该组的标志值所起的作用越小D、频率表明各组标志值对总体的相对作用程度E、总次数一定,频数和频率成反比三、填空题1、某班的经济学成绩如下表所示:435556565960676973757777787980818283838384868788888990909597该班经济学成绩的平均数为77,众数为83,中位数为80.5,下四分位数为68.5,上四分位数为87.25,四分位差为18.75,离散系数为0.173。从成绩分布上看,它属于 左偏,你觉得用中位数描述它的集中趋势比较好,理由是数据分布明显左偏又是顺序数据。2、在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200~300元的家庭占24%,人均月收入在300~400元的家庭占26%,在400~500元的家庭占29%,在500~600元的家庭占10%,在600~700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断:(1)该城市收入数据分布形状属右偏(左偏还是右偏)。\n(2)你觉得用均值、中位数、众数中的中位数,来描述该城市人均收入状况较好。理由是数据分布明显右偏。(3)从收入分布的形状上判断,我们可以得出中位数和均值中均值数值较大。下四分位数所在区间为300~400,上四分位数所在区间为400~500。3、组距式分组根据其分组的组距是否相等可以分为等距分组和异距分组。4、在组距数列中,表示各组界限的变量值称为组限,各组的上限与下限之间的中点值称为组中值。5、有一批灯泡,经检查其使用寿命小于1000小时的占半数,出现最多的是1050小时。根据资料可以估计算术平均数约为975小时。6、某工业局全员劳动生产率的标准差为512元,标准差系数为8.4%,则该工业局全员劳动生产率水平为6095.24元。四、判断分析题1、并非任意一个变量数列都可以计算其算术平均数、中位数和众数。(√)2、某企业某年各季度销售额和利润资料如下:季度1234销售额(百万元)利润率(%)15030180322003521036则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。(×)3、对任何两组性质相同的数据,比较其集中趋势测度值的代表性,都可以采用标准差指标。(×)4、若数据组的均值是450,则所有的观察值都在450周围。(√)5、由于离散型变量不能用小数表示,因此只能以单项数列来表现资料。(×)6、连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。(×)7、组距是指每个组变量值中的最大值与最小值之差,也就是组的上限与下限之差。(√)8、众数和中位数都属于平均数,因此它们数值的大小受到总体内各单位数值大小的影响。(×)9、离中趋势测度值越大,说明总体中各数据的变异程度就越大,则集中趋势测度值的代表性就越小。(√)五、计算题1、40名学生的考试成绩如下,试进行适当的统计分组,并编制频数分布表、绘制茎叶图,简要分析学生考试成绩的分布特征。61517662606364655850766768695969749070727991909581829788877380848686857172727483解:绝大多数同学成绩集中在60—80之间,其中70-80分占27.5%成绩人数频率%60以下41060-70102570-801127.580-90102590以上512.5合计40100.05 0189\n6 12034578997 664029312248 12870466539 010572、对50只电子元件的耐用时间进行测试,所得数据(单位:小时)如下:8879259909489508641060927948860102992697881810009191040854110090086590595489010069269009998861080895900800938864920865982917860950930896976921987830940802850要求:(1)试根据上述资料编制变量数列。(2)编制向上累计和向下累计频数、频率数列。(3)根据所编制的变量数列绘制条形图和曲线图。(4)根据变量数列,指出电子元件耐用时数在1000小时以上的有多少?占多大比重?电子元件耐用时数在900小时以下的有多少?占多大比重?(5)根据次数分布的曲线图说明电子元件耐用时数的分布属于哪种类型的变量分布。(6)若该电子元件耐用时数在900小时以下为不合格品,试计算其合格率。解:(1)50只电子元件耐用时间测试分布表按耐用时间分组频数(个)频率(%)向上累计向下累计频数(个)频率(%)频数(个)频率(%)800~850484850100850~900132617344692900~950173434683366950~1000918438616321000~10504847947141050~1100365010036个数耐用时数080085090095010001050110018161412108642合计50100----(2)(3)耐用时数1000小时以上的7个,占14%;900小时以下的17个,占34%。(4)属于正态分布(或钟型分布)。(5)900小时以上为合格,共33个,产品合格率为66%第五、六章概率与抽样习题一、单项选择题\n1、设A,B,C表示三个事件,则表示(D)。A、A,B,C中有一个发生B、A,B,C中不多于一个发生C、A,B,C中恰有两个发生D、A,B,C都不发生2、设随机变量ξ可取无穷多个值:0,1,2,…,其概率分布为P(k;3)=(即ξ~P(3))则下式成立的是(A)。A、Eξ=Dξ=3B、Eξ=Dξ=C、Eξ=3,Dξ=D、Eξ=,Dξ=33、设随机变量ξ的分布列为P{ξ=k}=,k=1,2,3,4,5,则常数A=(C)。A、5B、10C、15D、204、设ζ的分布列为ξ-202P0.40.30.3则Eζ2=(D)A、-0.2B、0.2C、2.76D、2.85、设随机变量ξ的密度函数p(x)=,则常数C=(D)。A、B、C、4D、56、独立随机变量ξ,η,若ξ~N(1,4),η~N(3,16),下式中不成立的是(C)。A、E(ξ+η)=4B、E(ξη)=3C、D(ξ-η)=12D、D(η+2)=167、设随机变量X在[a,b]上服从均匀分布,则其标准差为(C)。A、B、C、D、8、设X~N(μ,σ2),则E(X2)=(A)。A、μ2+σ2B、μ+σ2C、μ2+σD、μ+σ9、若D(X)=2,则D(4X-1)=(A)。A、32B、8C、2D、3110、若E(X)=1,E(Y)=2,则E(2X-Y)=(A)。A、0B、-1C、1D、211、样本方差的抽样分布服从(B)。A、正态分布B、卡方分布C、F分布D、未知12、根据中心极限定理,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为(A)。A、μB、C、D、σ213、假设总体比例为0.55,从此总体中抽取容量为100的样本,则样本比例的期望与\n标准差为(B)。A、0.25,0.01B、0.55,0.05C、0.055,0.06D、0.55,0.2514、从一个均值等于10,标准差等于0.6的总体中随机选取容量n=36的样本。假定该总体并不是很偏的,则样本均值小于9.9的近似概率为(A)。A、0.1587B、0.1268C、0.2735D、0.632415、总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布(B)。A、服从正态分布B、近似正态分布C、服从均匀分布D、服从χ2分布16、从服从正态分布的无限总体中分别抽取容量为4、16、36的样本,当样本容量增大时,样本均值的标准差(C)。A、保持不变B、增加C、减小D、无法确定17、总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为(B)。A、50,8B、50,1C、50,4D、8,818、某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是(B)。A、正态分布,均值为250元,标准差为400元B、正态分布,均值为2500元,标准差为40元C、右偏,均值为2500元,标准差为400元D、正态分布,均值为2500元,标准差为400元19、大样本的样本比例的抽样分布服从(A)。A、正态分布B、t分布C、F分布D、卡方分布20、在一个饭店门口等出租车的时间是左偏的,均值为12分钟,标准差为3分钟,如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则样本均值的分部服从(A)。A、正态分布,均值为12分钟,标准差为0.3分钟B、正态分布,均值为12分钟,标准差为3分钟C、左偏分布,均值为12分钟,标准差为3分钟D、左偏分布,均值为12分钟,标准差为0.3分钟21、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的数学期望与标准差是(B)。A、150,50B、200,5C、100,10D、250,15二、计算题1、对以往数据分析结果表明,当机器调整得良好时,产品的合格率为98%,而当机器发生某种故障时,其合格率为55%。每天早上机器开动时,机器调整良好的概率为95%。试求已知某日早上第一件产品是合格时,机器调整得良好的概率是多少?解:设A为事件“产品合格”,B为事件“机器调整良好”。所求的概率为=0.972\n、某商店收进甲厂生产的产品30箱,乙厂生产的同种产品20箱,甲厂每箱装100个,废品率为0.06,乙厂每箱装120个,废品率为0.05,求:(1)任取一箱,从中任取一个为废品的概率;(2)若将所有产品开箱混放,求任取一个为废品的概率。解:记事件A、B分别为甲、乙两厂的产品,C为废品,则(1)由全概率公式,得=0.056(2)由全概率公式,得3、一本书排版后一校时出现错误处数X服从正态分布N(200,400),求:(1)出现错误处数不超过230的概率;(2)出现错误处数在190~210之间的概率。解:(1)(2)4、一工厂生产的电子管寿命X(以小时计算)服从期望值μ=160的正态分布,若要求P(120μ0,则接受域为Z40000,=42000,s=3000,n=15,=2.582,tα=1.7613,t>tα结论:拒绝H0,经检验该制造商的声称是可信的。5、有一个组织在其成员中提倡通过自修提高水平,目前正考虑帮助成员中未曾高中毕业者通过自修达到高中毕业的水平。该组织的会长认为成员中未读完高中的人少于25%,并且想通过适当的假设检验来支持这一看法。他从该组织成员中抽选200人组成一个随机样本,发现其中有42人没有高中毕业。试问这些数据是否支持这个会长的看法?(α=0.05)解:,H0:p≥0.25,H1:p<0.25,=-1.306,Zα=1.645,Z>-Zα,结论:接受H0,这些数据还不能证实该会长的看法。第十章方差分析习题一、单项选择题1、方差分析所研究的是(D)。A、分类型自变量对分类型因变量的影响B、分类型自变量对数值型自变量的影响C、分类型因变量对数值型自变量的影响D、分类型自变量对数值型因变量的影响2、与假设检验相比,方差分析方法可以使犯第I类错误的概率(B)。A、提高B、降低C、等于0D、等于13、在方差分析中,所要检验的对象称为(A)。A、因素B、水平C、处理D、观测值4、下面不属于单因素方差分析中所需的平方和是(D)。A、SSTB、SSAC、SSED、SSR5、在方差分析中,( D )反映的是样本数据与其组平均值的差异。A、总离差 B、组间误差C、抽样误差 D、组内误差6、是(A)。A、组内平方和B、组间平方和C、总离差平方和D、因素B的离差平方和
二、多项选择题1、应用方差分析的前提条件是( ACE )。A、各个总体报从正态分布 B、各个总体均值相等 C、各个总体具有相同的方差D、各个总体均值不等 E、各个总体相互独立2、为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是( AD )。A、单因素方差分析 B、双因素方差分析 C、三因素方差分析D、单因素三水平方差分析 E、双因素三水平方差分析三、判断题\n1、进行方差分析的前提条件是:各组观察数据是从具有相同方差的相互独立的总体中抽取的。( √ )2、方差分析中,P值越大,越拒绝原假设。( × )3、组间方差反映了随机因素的影响,组内方差既反映了随机因素,也反映了系统因素的影响。( × )4、对同一批数据而言,进行单因素方差分析和进行双因素方差分析,其总离差平方和是一样的。( √ )四、填空题1、从形式上看,方差分析是比较多个总体均值是否相等,但本质上是研究变量之间的关系。2、在双因素方差分析中,如果两个因素的影响是相互独立的,称为 无交互作用 的双因素方差分析。第十一章一元线性相关与回归分析习题一、单项选择题1、下面的函数关系是(B)。A、销售人员测验成绩与销售额大小的关系B、圆周的长度决定于它的半径C、家庭的收入和消费的关系D、数学成绩与统计学成绩的关系2、相关系数r的取值范围(B)。A、-∞