• 1.23 MB
  • 2022-09-01 发布

《统计学》习题与答案解析

  • 35页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第一章一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是()A.分类变量B.顺序变量C.数值型变量D.离散变量7.要反映我国工业企业的整体业绩水平,总体单位是()A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A.分类数据B.顺序数据C.截面数据D.时间序列数据10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于()A.访问调查B.邮寄调查C.个别深度访问D.观察调查二、多项选择题1.欲了解某地高等学校科研情况()A.该地所有高等学校所有的科研项目是总体B.该地所有的高等学校是总体C.该地所有高等学校的每一科研项目是总体单位D.该地每一所高等学校是总体单位E.该地所有高等学校的所有科研人员是总体2.下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据:公司名称销售额(百万美元)利润额(百万美元)行业代码BancOne102721427.08CPCIntl.9844580.019TysonFoods645487.019….….….….…..…….…..Woolworth8092168.748在这个例子中()A.总体是500强公司,总体单位是表中所列的公司B.总体是500强公司,总体单位是其中每一家公司C.总体是500强公司,样本是表中所列的公司D.总体是500强公司,样本是表中所列公司的销售额和利润额E.总体是表中所有的公司,总体单位是表中每一家公司3.一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过标准,就把整批货退回。这个问题中()A.样本是从所有木材批次中随机抽取的部分批次木材B.样本是从每批木材中随机抽取的5块木材C.总体单位是从所有木材批次中随机抽取的部分批次木材\nD.总体单位是购买的每一块木材E.总体是购买的全部木材三、判断分析题(判断正误,并简要说明理由)统计运用大量观察法必须对所有的总体单位进行观察。()四、简答题1.报纸上报道一项民意调查的结果说:“43%的美国人对总统的整体表现感到满意。”报道最后写到:“这份调查是根据电话访问1210位成人所得,访问对象遍布美国各地。”这个调查的总体是什么?总体单位是什么?样本是什么?2.一个公司正致力于测试一种新的电视广告的效果。作为测试的一部分,广告在某市的当地新闻节目中下午6:30播出。两天以后,一市场调查公司进行了电话采访以获取记忆率信息(观众记得看过广告的百分比)和对广告的印象。这一研究的总体是什么?总体单位是什么?样本是什么?这种情况下为什么使用样本?简要解释原因。3.简述标志与指标的区别连续。第2章数据的搜集一、单项选择题1.从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样2.为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样3.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是()A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样4.在一项调查中,调查单位和填报单位()A.无区别,是一致的B.有区别,是不一致的C.无区别,是人为确定的D.有区别,但有时是一致的5.对家用电器的平均寿命进行调查,应该采用()A.普查B.重点调查C.典型调查D.抽样调查二、多项选择题1.下列属于原始数据的是()A.统计部门掌握的数据B.说明总体单位特征的数据C.说明总体特征的数据D.还没有经过分组汇总的数据E.直接向调查单位登记得到的数据2.统计调查方案的内容包括有()A.确定调查目的B.确定调查对象、调查单位和报告单位C.确定调查项目和调查表D.确定调查方法和调查时间E.确定调查人员、经费等3.重点调查的“重点”单位指()A.在国民经济中作用重要的单位B.标志值在总体标志总量中所占比重比较大的单位C.全部单位中的一小部分单位D.在国民经济中地位显赫的单位E.能反映总体基本情况的单位三、简答题1.抽样调查与重点调查、典型调查有哪些主要区别?2.进行产品质量调查和市场占有率调查,你认为采用什么调查方法最合适?简要说明理由。3.简述普查和抽样调查的特点。第3章数据的整理与显示一、单项选择题1.在累计次数分布中,某组的向下累计次数表明()A.大于该组上限的次数是多少B.大于该组下限的次数是多少C.小于该组上限的次数是多少D.小于该组下限的次数是多少2.数据筛选的主要目的是()A.发现数据的错误B.对数据进行排序C.找出所需要的某类数据D.纠正数据中的错误3.样本或总体中各不同类别数值之间的比值称为()A.频率B.频数C.比例D.比率\n4.将比例乘以100得到的数值称为()A.频率B.频数C.比例D.比率5.下面的哪一个图形最适合描述结构性问题()A.条形图B.饼图C.雷达图D.直方图6.下面的哪一个图形适合比较研究两个或多个总体或结构性问题()A.环形图B.饼图C.直方图D.茎叶图7.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为()A.单变量值分组B.组距分组C.等距分组D.连续分组8.下面的哪一个图形最适合描述大批量数据分布的图形()A.条形图B.茎叶图C.直方图D.饼图9.由一组数据的最大值、最小值.中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为()A.环形图B.茎叶图C.直方图D.箱线图10.10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据()A.茎叶图B.散点图C.条形图D.饼图二、多项选择题1.下列属于定性变量的有()A.职业B.居住区域C.体重D.身高E.汽车产量2.下面的数列属于()身高(厘米)人数比重(%)150-1554020155-16010050160-1656030合计200100A.变量数列B.品质数列C.等距数列D.异距数列E.闭口数列三、简答题1.数值型数据的分组方法有哪些?2.直方图与条形图有何区别?3.茎叶图与直方图相比有什么优点?4.简述数据的类型及各类型的功能特点?四、应用题1.下面是一个班50个学生的经济学考试成绩:88569179699088718279988534744810075956092836465699964457663696874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。(2)用茎叶图将原始数据表现出来。2.下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课程的成绩。考生编号123456789101112英语664439585234747151416451政治696658566840736562485864专业课154252036214824228353919专业课2906285816454737868668075专业课3815645627063768665217473对英语和政治两门课程做直方图。第4章数据的概括性度量一、单项选择题1.一组数据排序后处于25%和75%位置上的值称为()A.众数B.中位数C.四分位数D.均值2.如果一个数据的标准分数是–2,表明该数据()A.比平均数高出2个标准差B.比平均数低2个标准差\nC.等于2倍的平均数D.等于2倍的标准差3.经验法则表明,当一组数据对称分布时,在均值加减1个标准差的范围内大约有()A.68%的数据B.95%的数据C.99%的数据D.100%的数据4.离散系数的主要用途是()A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平5.离散系数()A.只能消除一组数据的水平对标准差的影响B.只能消除一组数据的计量单位对标准差的影响C.可以同时消除数据的水平和计量单位对标准差的影响D.可以准确反映一组数据的离散程度6.峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值()A.等于0B.大于0C.小于0D.等于17.如果峰态系数K>0,表明该组数据是()A.尖峰分布B.扁平分布C.左偏分布D.右偏分布8.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是()A.1200B.经济管理学院C.200D.理学院9.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用()A.众数B.中位数C.四分位数D.均值10.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用()A.众数B.中位数C.四分位数D.均值11.对于分类数据,测度其离散程度使用的统计量主要是()A.众数B.异众比率C.标准差D.均值12.甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量()A.上升B.下降C.不变D.可能上升,也可能下降13.权数对平均数的影响作用取决于()A.各组标志值的大小B.各组的次数多少C.各组次数在总体单位总量中的比重D.总体单位总量14.当各个变量值的频数相等时,该变量的()A.众数不存在B.众数等于均值C.众数等于中位数D.众数等于最大的数据值15.有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为()A.24B.23C.22D.2116.下列数列平均数都是50,在平均数附近散布程度最小的数列是()A.02040506080100B.04849505152100C.012509899100D.0474950515310017.下列各项中,应采用加权算术平均法计算的有()A.已知计划完成百分比和实际产值,求平均计划完成百分比B.已知计划完成百分比和计划产值,求平均计划完成百分比C.已知各企业劳动生产率和各企业产值,求平均劳动生产率D.已知生产同一产品的各企业产品单位成本和总成本,求平均单位成本18.如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?()A.算术平均数B.几何平均数C.中位数D.众数19.假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用()A.算术平均数B.几何平均数C.众数D.调和平均数20.某组数据分布的偏度系数为正时,该数据的众数.中位数.均值的大小关系是()A.众数>中位数>均值B.均值>中位数>众数C.中位数>众数>均值D.中位数>均值>众数二、多项选择题\n1.变量数列中,各组变量值与频数的关系是()A.各组变量值作用的大小由各组频数的多少反映B.各组变量值作用的大小由各组变量值的大小反映C.频数越大的变量值对总体一般水平的影响也越大D.频数越大的变量值对总体一般水平的影响越小E.频数越大,变量值也越大2.应该用加权算术平均法计算平均数的有()A.已知各组职工工资水平和各组职工人数,求平均工资B.已知各组职工工资水平和各组工资总额,求平均工资C.已知各组计划完成百分数和各组计划产值,求平均计划完成百分数D.已知各组计划完成百分数和各组实际产值,求平均计划完成百分数E.已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率3.下列应该用几何平均法计算的有()A.生产同种产品的三个车间的平均合格率B.平均发展速度C.前后工序的三个车间的平均合格率D.平均劳动生产率E.以复利支付利息的年平均利率4.下列说法哪些是正确的?()A.应该用均值来分析和描述地区间工资水平B.宜用众数来描述流行的服装颜色C.考试成绩中位数的含义是有一半考生的成绩超过此数D.在数据组高度偏态时,宜用中位数而不是用众数来作为平均数E.一般常用算术平均法来计算年平均增长率三、填空题1.某班的经济学成绩如下表所示:435556565960676973757777787980818283838384868788888990909597该班经济学成绩的平均数为(1),众数为(2),中位数为(3),上四分位数为(4),下四分位数为(5),四分位差为(6),离散系数为(7)。从成绩分布上看,它属于(8) ,你觉得用(9) 描述它的集中趋势比较好,理由(10) 。2.在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200-300元的家庭占24%,人均月收入在300-400元的家庭占26%,在400-500元的家庭占29%,在500-600元的家庭占10%,在600-700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断:(1)该城市收入数据分布形状属(左偏还是右偏)。(2)你觉得用均值、中位数、众数中的,来描述该城市人均收入状况较好。理由是。(3)从收入分布的形状上判断,我们可以得出中位数和均值中数值较大。上四分位数所在区间为,下四分位数所在区间为。四、判断分析题(判断正误,并简要说明理由)1.并非任意一个变量数列都可以计算其算术平均数、中位数和众数。()2.某企业某年各季度销售额和利润资料如下:季度1234销售额(百万元)利润率(%)15030180322003521036则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。()3.某企业计划劳动生产率比上年提高10%,实际只提高了5%,表明劳动生产率计划只完成了一半。()4.若数据组的均值是450,则所有的观察值都在450周围。()五、简答题1.简述众数、中位数和均值特点及应用场合。2.某公司下属两个企业生产同一种产品,其产量和成本资料如下:基期报告期单位成本(元)产量(吨)单位成本(元)产量(吨)甲企业乙企业6007001200180060070024001600合计6603006404000\n试问:报告期与基期相比,该公司下属各企业单位成本都没有变化,但该公司总平均成本却下降了20元,这是为什么?3.一项民意测验询问了2050个成年人,“你对今天的生活状况满意程度如何?”回答分类为满意.不满意和说不清。(1)这一调查的样本规模有多大?(2)回答的答案是属于品质型还是数量型?(3)使用平均数或百分比作为对这一问题的数据的汇总,哪一个更有意义?(4)回答中,8%的人说他们对今天的生活状况不满意,作出这种回答的人是多少?六、计算题1.下表中的数据反映的是1992年到2001年我国职工工资和居民消费价格增长指数:年份1992199319941995199619971998199920002001职工工资增长指数(%)118.5124.8135.4121.7112.1103.6100.2106.2107.9111.0居民消费价格指数(%)106.4114.7124.1117.1108.3102.899.298.6100.4100.7试根据上表数据比较我国1992年到2001年间职工工资平均增长指数与平均居民消费价格指数的大小。2.下面是甲地区空气质量指数(0~50表示良好,50~100表示适中)的一组数据:28,42,58,48,45,55,60,49,50。(1)计算全距、方差和标准差;(2)已知同期观察到的乙地区空气质量指数的平均数为48.5,标准差为11.66,试对两地区的空气质量作出比较。3.某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下:净利润(元/头)原品种牛改良品种牛频数频率(%)频率(%)–20036610122220018531574003676140合计600100100(1)牧场主应该选择哪一种品种?为什么?(2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润有什么变化时,牧场主会改变他在(1)中所做的选择?第5章概率与概率分布一、单项选择题1.根据概率的统计定义,可用以近似代替某一事件的概率的是()。A.大量重复试验中该随机事件出现的次数占试验总次数的比重B.该随机事件包含的基本事件数占样本空间中基本事件总数的比重C.大量重复随机试验中该随机事件出现的次数D.专家估计该随机事件出现的可能性大小2.下列事件中不属于严格意义上的随机事件的是()。A.从一大批合格率为90%的产品中任意抽出的一件产品是不合格品B.从一大批合格率为90%的产品中任意抽出的20件产品都是不合格品C.从一大批优质品率为15%的产品中任意抽出的20件产品都是优质品D.从一大批合格率为100%的产品中任意抽出的一件产品是合格品3.假设A、B为两个互斥事件,则下列关系中,不一定正确的是()。A.P(A+B)=P(A)+P(B)B.P(A)=1-P(B)C.P(AB)=0D.P(A|B)=04.同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为()。A.0.125B.0.25C.0.375D.0.55.下列由中心极限定理得到的有关结论中,正确的是()。A.只有当总体服从正态分布时,样本均值才会趋于正态分布B.只要样本容量n充分大,随机事件出现的频率就等于其概率C.无论样本容量n如何,二项分布概率都可以用正态分布近似计算D.不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布二、多项选择题1.下列关于随机变量的数学期望的表述中正确的是()。A.它又称为随机变量的均值B.它表示该随机变量所有可能取值的平均水平\nC.它度量的是随机变量的离中趋势D.任一随机变量都存在一个有限的数学期望E.它与加权算术平均数的不同之一是它以概率或分布密度为权数2.下列关于几种概率分布之间的关系的陈述中,正确的有():A.二点分布(0-1分布)是二项分布的特例B.当n很大而p又很小时,二项分布可用参数λ=np的泊松分布近似C.当N很大而M/N很小是,超几何分布趋于二项分布D.当n>30时,不管p大小,二项分布的概率都可用正态分布来近似计算E.当n无限增大时,二项分布趋近于正态分布三、判断分析题(判断正误,并简要说明理由)1.频率的极限是概率。2.若某种彩票中奖的概率为5‰,那么随机购买1000注彩票将有5注中奖。四、简答题全概率公式与逆概率公式分别用于什么场合?五、计算题1.某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求:(1)使用寿命在500小时以下的灯管占多大比例?(2)使用寿命在850-1450小时的灯管占多大比例?(3)以均值为中心,95%的灯管的使用寿命在什么范围内?第6章统计量及其抽样分布一、单项选择1.重复抽样的抽样误差()A.大于不重复抽样的抽样误差B.小于不重复抽样的抽样误差C.等于不重复抽样的抽样误差D.不一定2.在简单重复抽样下,若总体方差不变,要使抽样平均误差变为原来的一半,则样本单位数必须()A.扩大为原来的2倍B.减少为原来的一半C.扩大为原来的4倍D.减少为原来的四分之一3.在抽样之前对每一个单位先进行编号,然后使用随机数表抽取样本单位,这种方式是()A.等距抽样B.分层抽样C.简单随机抽样D.整群抽样4.一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做检验,这是()A.简单随机抽样B.整群抽样C.系统抽样(即机械抽样)D.分层抽样5.有限总体修正系数可以省略的前提是()A.n/N<0.05B.n/N>0.5C.n/N>0.05D.n/N<0.5二、判断题1.抽样推断是利用全体中的一部分进行推断,就不可能避免会出现误差()2.抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的,唯一的.()3.中心极限定理告诉我们:无论总体服从什么分布,抽样分布均服从正态分布()4.抽样误差是由于抽样的偶然性因素而产生的误差,这种误差即可以避免,也可以控制其大小。()三、计算题1.某县欲统计今年小麦产量,调查了全县100个村子的小麦产量,测得全县每个村子小麦产量的平均值为1700(百斤),标准差为200(百斤)。若从全县的100个村子中按重复抽样的方法随机抽取10个村子,则由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?若采用的是不重复抽样的方法,那么由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?2.某地有200家外贸企业,年平均出口额为90万美元,标准差为27万美元,随机抽取36家企业调查,问其年平均出口额在100万美元以上的概率是多大?3.工厂在正常情况下产品次品率为8%,若产品批量较大,随机抽取100个产品进行检验,求次品率在7%-9%之间的概率。第7章参数估计一、单项选择题1.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是()A.样本容量为10B.抽样误差为2C.样本平均每袋重量是估计量D.498是估计值\n2.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于()A.N(100,25)B.N(100,5/)C.N(100/n,25)D.N(100,25/n)3.在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加()A.一半B.一倍C.三倍D.四倍4.在其他条件不变时,置信度(1–α)越大,则区间估计的()A.误差范围越大B.精确度越高C.置信区间越小D.可靠程度越低5.其他条件相同时,要使抽样误差减少1/4,样本量必须增加()A.1/4B.4倍C.7/9D.3倍6.在整群抽样中,影响抽样平均误差的一个重要因素是()A.总方差B.群内方差C.群间方差D.各群方差平均数7.在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使()尽可能小A.总体层数B.层内方差C.层间方差D.总体方差8.一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是()A.简单随机抽样B.分层抽样C.等距抽样D.整群抽样9.为了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用()A.分层抽样B.简单随机抽样C.等距抽样D.整群抽样10.某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,优质频率应选()A.85%B.87.7%C.88%D.90%二、多项选择题1.影响抽样误差大小的因素有()A.总体各单位标志值的差异程度B.调查人员的素质C.样本各单位标志值的差异程度D.抽样组织方式E.样本容量2.某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。根据抽样结果进行推断,下列说法正确的有()A.样本容量为200B.样本容量为30C.总体合格率是一个估计量D.样本合格率是一个统计量E.合格率的抽样平均误差为2.52%3.用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布()A.np≤5B.np≥5C.n(1–p)≥5D.p≥1%E.n≥30三、填空题对某大学学生进行消费支出调查,采用抽样的方法获取资料。请列出五种常见的抽样方法:(1)、(2)、(3)、(4)、(5),当对全校学生的名单不好获得时,你认为(6)方法比较合适,理由是(7)。四、简答题1.分层抽样与整群抽样有何异同?它们分别适合于什么场合?2.解释抽样推断的含义。五、计算题1.某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知。(已知:,,,)2.某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,试问样本量应该为多大?(已知:,)3.为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。(1)试对家庭每天平均看电视时间进行区间估计。(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05)\n(已知:,)第8章假设检验一、单项选择题1.按设计标准,某自动食品包装及所包装食品的平均每袋重量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用()。A.左侧检验B.右侧检验C.双侧检验D.左侧检验或右侧检验2.假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定原假设的,则可认为()。A.抽样是不科学的B.检验结论是正确的C.犯了第一类错误D.犯了第二类错误3.当样本统计量的观察值未落入原假设的拒绝域时,表示()。A.可以放心地接受原假设B.没有充足的理由否定与原假设C.没有充足的理由否定备择假设D.备择假设是错误的4.进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会()。A.都减少B.都增大C.都不变D.一个增大一个减小5.关于检验统计量,下列说法中错误的是()。A.检验统计量是样本的函数B.检验统计量包含未知总体参数C.在原假设成立的前提下,检验统计量的分布是明确可知的D.检验同一总体参数可以用多个不同的检验统计量二、多项选择题1.关于原假设的建立,下列叙述中正确的有()。A.若不希望否定某一命题,就将此命题作为原假设B.尽量使后果严重的错误成为第二类错误C.质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D.若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E.可以随时根据检验结果改换原假设,以期达到决策者希望的结论2.在假设检验中,α与β的关系是()。A.α和β绝对不可能同时减少B.只能控制α,不能控制βC.在其它条件不变的情况下,增大α,必然会减少βD.在其它条件不变的情况下,增大α,必然会增大βE.增大样本容量可以同时减少α和β三、判断分析题(判断正误,并简要说明理由)1.对某一总体均值进行假设检验,H0:=100,H1:≠100。检验结论是:在1%的显著性水平下,应拒绝H0。据此可认为:总体均值的真实值与100有很大差异。2.有个研究者猜测,某贫困地区失学儿童中男孩数不足女孩数的1/3。为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。那么原假设可以为:H0:P≤1/3。四、简答题采用某种新生产方法需要追加一定的投资。但若根据实验数据,通过假设检验判定该新生产方法能够降低产品成本,则这种新方法将正式投入使用。(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。(2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?五、计算题1.某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。假设产品重量服从正态分布。(1)建立适当的原假设和备择假设。(2)在α=0.05时,该检验的决策准则是什么?(3)如果=12.25克,你将采取什么行动?(4)如果=11.95克,你将采取什么行动?第9章分类数据分析一、单选题1.四格表的周边合计不变时,如果实际频数有变化,则理论频数()。\nA.增大B.减小C.不变D.不确定2.下列哪项检验不适用检验()A.两样本均数的比较B.两样本率的比较C.多个样本构成比的比较D.拟合优度检验3.值的取值范围为()A.<2.16,故接受,即四种配方的饲料对小鸡的增重没有显著的差异。3.解:各总值均值间有显著差异。4.解:差异不显著。第11章一元线性回归一、单选:1.D2.A3.B4.A5.C6.A7.B8.C9.B10.C\n11.A12.A13.B14.A15.C16.A二、多选:1.ABD2.AE。三、判断:1.×。这种正相关是因为二者同时受到疾病的严重程度的影响所致。2.√。因为用最小平方法在现有资料范围内配合的最佳方程,推到资料范围外,就不一定是最佳方程。四、简答:1.答:变量之间存在的不确定的数量关系为相关关系,可能还会有其他很多较小因素影响;特点是一个变量的取值不能由另一个变量唯一确定。2.答:变量性质不同,相关分析不必区分自变量和因变量,而回归分析必须区分;作用不同,相关分析用于测度现象之间有无相关关系、关系方向、形态及密切程度,而回归分析是要揭示变量之间的数量变化规律。五、计算:1.解:(1)(2)建立线性回归方程,根据最小二乘法得:由此可得=0.732,=-2.01,则回归方程是=-2.01+0.732x(3)当受教育年数为15年时,其年薪的点估计值为:=-2.01+0.732×15=8.97(万元)估计标准误差:Sy=====0.733置信区间为:=8.97±2.228×0.733×=8.97±1.290预测区间为:=8.97±2.228×0.733×=8.97±2.0812.解:(1)建立线性回归方程,根据最小二乘法得:\n由此可得=0.0093,=0.316,则回归方程是=0.0093+0.316x(3)当GDP达到16时,其货币供应量的点估计值为:=0.0093+0.316×16=5.065亿元估计标准误差:Sy=====0.305置信区间为:=5.065±2.228×0.305×=5.065±0.318亿元预测区间为:=5.065±2.228×0.305×=5.065±0.750亿元第12章多元线性回归一、单选:1.D2.B3.C4.B5.C6.C7.D8.C9.C10.D11.C12.A13.D二、多选:1.ABC2.ABCD3.BCD4.ACDE5.BCD6.BC7.AD三、简答:1.答:(1)随机误差项的期望为零,即。(2)不同的随机误差项之间相互独立,即。(3)随机误差项的方差与t无关,为一个常数,即。即同方差假设。(4)随机误差项与解释变量不相关,即。通常假定为非随机变量,这个假设自动成立。(5)随机误差项为服从正态分布的随机变量,即。(6)解释变量之间不存在多重共线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。2.答:因为人们发现随着模型中解释变量的增多,多重决定系数的值往往会变大,从而增加了模型的解释功能。这样就使得人们认为要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等。为此用修正的决定系数来估计模型对样本观测值的拟合优度。3.答:,其作用有:(1)用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响;(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。4.答:常见的非线性回归模型主要有:(1)对数模型(2)半对数模型或\n(1)倒数模型(2)多项式模型(3)成长曲线模型包括逻辑成长曲线模型和Gompertz成长曲线模型5.答:①系数呈线性,变量非线性;②系数呈线性,变量非呈线性;③系数和变量均为非线性;④系数和变量均为非线性。6.答:①系数呈线性,变量非呈线性;②系数非线性,变量呈线性③系数和变量均为非线性;④系数和变量均为非线性。四、计算:1.解答:(1)这是一个对数化以后表现为线性关系的模型,lnL的系数为1.451意味着资本投入K保持不变时劳动—产出弹性为1.451;lnK的系数为0.384意味着劳动投入L保持不变时资本—产出弹性为0.384.(2)系数符号符合预期,作为弹性,都是正值。2.解答:该消费模型的判定系数,F统计量的值,均很高,表明模型的整体拟合程度很高。计算各回归系数估计量的t统计量值得:,,。除外,其余T值均很小。工资收入W的系数t检验值虽然显著,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为1.059意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。另外,尽管从理论上讲,非工资—非农业收入与农业收入也是消费行为的重要解释变量,但二者各自的t检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。3.解答:(1)(2)(3)4.解答:当时,模型变为,可作为一元回归模型来对待当时,模型变为,同样可作为一元回归模型来对待5.解答:(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。(2)出现不同符号的原因很可能是由于与高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。6.解答:(1)是盒饭价格,是气温,是学校当日的学生数量,是附近餐厅的盒饭价格。(2)在四个解释变量中,附近餐厅的盒饭价格同校园内食堂每天卖出的盒饭数量应该是负相关关系,其符号应该为负,应为;学校当日的学生数量每变化一个单位,盒饭相应的变化数量不会是28.4或者12.7,应该是小于1的,应为;至于其余两个变量,从一般经验来看,被解释变量对价格的反应会比对气温的反应更灵敏一些,所以是盒饭价格,是气温。第13章时间序列分析和预测一、单选:1.D2.C3.C4.C5.D  6.D7.D8.B9.C  10.C11.B12.B  13.C14.A 15.D  16.D17.C18.B 19.C 20.A 21.C 22.C   二、多选:1.CDE2.CDE3.ACE4.ACDE5.BC6.CD7.AD三、判断:1.×2.×3.√4.×5.×6.√7.×8.×9.×10.×11.√12.×13.×14.×四、计算:1.解:商品流通费用率(c)=商品流通费用总额(a)/商品纯销售额(b) 1月2月3月4月5月6月c商品流通费用率(%)a商品流通费用额(百元)b商品纯销售额(百元)3.509.86281.712.998.78293.652.958.50288.142.989.91332.554.5811.05241.273.8112.00314.96\n 7月8月9月10月11月12月c商品流通费用率(%)a商品流通费用额(百元)b商品纯销售额(百元)3.0211.84392.054.0010.96274.003.7511.58308.83.277.86240.373.958.05203.804.5810.00218.34∑a=120.39∑b=3389.64,=3.55%2.解: 02年底03年底04年底05年底06年底07年底c定期储蓄存款占全国储蓄存款总额的%78.2580.1680.1578.2878.2575.40a定期储蓄存款(亿元)16838.723778.230873.436226.741791.644955.1b全国储蓄存款总额(亿元)21519.129663.438519.546278.453407.859622.1===78.47%3.解:-1=1.0877-1=8.77%4.解:一季二季三季四季平均2003年2004年2005年2006年2007年747.5737.5762.5725.0755.0平均704792830656745.5季节比率(%)94.43106.24111.3387.99100.00 年份平均季度工作量指数平滑预测值(初始值747.5,α=0.1)2003年2004年2005年2006年2007年2008年747.5737.5762.5725.0755.0——————0.1*747.5+0.9*747.5=747.50.1*737.5+0.9*747.5=746.50.1*762.5+0.9*746.5=748.10.1*725.0+0.9*748.1=745.80.1*755.0+0.9*745.8=746.72008年1季度746.7*94.43%=705.1(百元)2008年2季度746.7*106.24%=793.3(百元)2008年3季度746.7*111.33%=831.3(百元)2008年4季度746.7*87.99%=657.0(百元)第14章指数一、单选1.C2.C3.B4.A5.A6.B7.D8.A9.C10.D11.A12.C13.C14.D15.A16.B17.B18.D19.D20.B21.B22.D二、多选1.CDE2.ACD3.AD4.AC5.ABD6.CDE7.CD三、填空1.119.79%;2.105.26%;3.拉氏;4.报告;5.四、判断1.√2.√3.×4.√5.×6.√7.×8.√9.×\n五、简答1.平均指数的基本含义和计算形式是什么?答案:平均指数是从个体指数出发来编制总指数的,即先计算出各种产品或商品的数量指标或质量指标的个体指数,然后进行加权平均计算,来测定现象的总变动程度。平均指数的计算形式为算术平均数指数和调和平均数指数。2.平均指数和综合指数计算结论相同的条件是什么?答案:当数量指标的算术平均数指数,在采用基期总值为权数的特定情况下,与一般综合指数的计算结论相同;当质量指标的调和平均数指数,在采用报告期总值为权数的特定情况下,与一般综合指数的计算结论相同。六、计算1.总产值指数=产量指数=出厂价格指数=2.单位成本总指数=总成本指数÷产量总指数=130%÷112.11%=115.96%3.4.销售量总指数=销售额总指数÷销售价格总指数销售量总指数=5.由于产量变动而增加的总成本绝对数:\n6.收购价格总指数=收购额总指数÷收购量总指数7.可变组成指数=1490.76—1400.52=486.24元固定组成指数=1490.76—1007.38=483.38元结构影响指数=1007.38—1004.52=2.86元

相关文档