- 799.83 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第1—3章复习题1.1. 简答题(1)什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集,整理和分析统计数据的方法论科学,其目的是探索数据内在的规律性,已达到对客观事物的科学认识。统计学和统计数据之间有着密不可分的关系。统计学是由一套收集和处理统计数据的方法所组成,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。统计数据不用统计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。(2)简述统计调查方案的基本内容答:调查方案是调查工作的计划性文件,是对整个调查工作的事先安排。调查内容不同,调查方案有一定的差异,但一般都包括以下几个方面的内容:即调查目的、调查对象和调查单位、调查内容(调查项目)、调查方式与方法、调查工作的组织与实施计划等。(3)最常用的统计调查方式是什么?他有什么特点?答:统计调查方式是指搜集数据时所采用的组织形式。在实际中应用最广泛的调查方式是抽样调查。抽样调查是从调查对象中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方法。与其它调查方式相比,抽样调查具有经济性、时效性强、适应面广、准确性高等特点。(4)最常用的搜集统计资料的方法是什么?答:搜集统计资料的方法是指搜集数据所采用的具体办法,其主要有访问法、观察法和实验法,其中访问法最为常用。(5)简述组距式分组的步骤。答:第一步,确定全距,以了解数据的变动范围,为确定组距提供依据;第二步,确定组数,确定组数的基本原则是确保组内的同质性、组间的差异性,同时能反映数据的分布特征,具体可参考经验公式确定;第三步,确定组距,等组距时,组距=全局/组数;第四步,确定组限,注意组限的表示方式;第五步,分组并编制次数分布表,会制次数分布图。2.2. 填空题(1)一个完整的统计工作过程,包括统计设计、统计调查、统计整理、统计分析和统计资料的管理与提供。(2)统计一词有三种含义,即统计工作、统计资料、统计学。(3)从统计方法的构成来看,统计学可分为描述统计、推断统计;从统计方法的研究和应用来看,可分为理论统计、应用统计。(4)在统计中,把说明现象某种特征的概念称为变量,变量的具体表现称为变量值。(5)从统计数据本身的来源看,统计数据最初都来源于直接的调查或试验。(6)就一般的统计数据而言,可将其质量评价标准概括为六个方面:精度、准确度、关联性、及时性、一致性、最低成本。 (7)在数据整理过程中,对品质数据主要是做分类整理,对数值型数据主要是做分组整理。3、3. 选择题单选题:(1)文化程度这一品质变量,所采用的计量尺度为:(②)①定类尺度②定序尺度③定距尺度④定比尺度(2)统计数据就是(①)①统计变量值②统计指标③统计变量④统计标志(3)某地区对占该地区工业总产值三分之二的6个企业进行调查,这一调查方式是(②)①抽样调查②重点调查③普查④典型调查(4)一个等距数列,末组为开口组,已知其下限为400,该组组中值为425,则该数列中各组的组距为(②)①25②50③100④12.5(5)按连续性变量分组,其末组为开口组,下限为200,相邻组的组中值为1750,则末组中值为(②)①2500②2250③2100④2200(27\n6)有20个工人看管机器台数资料为2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,对以上资料分组应采用(①)① 单变量值分组②等距式分组③不等组距式分组④以上分组均可(7)企业按业务收入计划完成程度分组,第一组为100%以下,第二组为100%—110% ,第三组为110%—120% ,第四组为120% 以上,则其计划完成程度为( ③ ) ①100%在第一组 ②110%在第二组③110%在第三组④120%在第三组(8)下列不适合定序数据的图形是(④)①条形图②圆形图③环形图④直方图(9)某地区人口的男女性别比为105∶100,这一对比关系是(②)①比例②比率③百分比④频数分布多选题:(1)下列属于品质变量的有(①③④)① 产品等级②人口受教育年限③经济类型④用户满意度(2)从变量的性质看,下列属于连续变量的有(①②④)① 商品销售额②邮电业务量③企业人数④人均GDP(3)普查属于(②③)①全面调查和经常性调查②专门组织的调查③一次性调查和全面性调查④非全面调查和一次性调查(4)统计分组的主要作用有(①②③)①划分现象的类型②反映总体的内部结构及数量关系③研究现象之间的依存关系④反映总体的基本情况(5)对离散型变量分组(②③④)①首位两组一定采用闭口组限②可采用单变量值分组③可进行组距式分组④组限可以断开也可以重叠⑤组限必须重叠(6)对连续型变量编制次数分布数列(①②③)①只能用组距式分组②相邻组的组限必须重叠③组距可相等也可不等④首尾两组一定得采用开口组⑤首尾两组一定得采用闭口组 (7)组距式数列中,影响各组次数分布的要素有(③④⑤)①总体单位数的多少②变量值的大小③组数④组距⑤组限4、方法应用题4.1某家用电器生产厂家想通过市场调查了解以下问题:a企业产品的知名度;b产品的市场占有率c用户对产品质量的评价及满意度。要求:(1)请设计出一份调查方案;(2)设计出一份调查问卷。答:(1)调查方案的基本内容:调查目的:了解某家用电器厂企业产品的知名度;产品的市场占有率;用户对该厂产品质量的评价及满意度。调查对象:一定区域内所有居民家庭调查单位:调查区域内的每一居民家庭调查内容:见问卷,根据调查目的确定调查方式与方法:抽样调查、访问法调查工作的起止时间:调查工作的组织与实施计划:主要包括调查人员的培训、经费的预算和管理、调查工作的组织机构及人员构成等。(2)问卷×××家用电器市场调查问卷尊敬的先生、女士:您好!我们是×××市场调研公司,为了了解广大用户对×××家用电器的使用及满意程度,可以占用您几分钟时间问几个问题吗?希望得到您的合作,谢谢!A:被调查者基本情况资料A1:您家中有()口人。A2:您家的年人均收入(A)400元以下(B)400―800元(C)800―1200元(D)1200―200027\n元(E)2000―3000元(F)3000元以上A5:您知道×××家用电器吗?(若“知道”,继续选答以下问题,若“不知道”,停止选答)(A)知道(B)不知道B1:您对×××家用电器了解多少?(A)非常了解(B)一般(C)了解一点(D)不了解B2:您知道×××家用电器厂生产的那些家电产品(A)电视机(B)电冰箱(C)洗衣机(D)微波炉(E)空调B3:您听过有人谈及xxx家用电器吗?(A)经常听到(B)偶尔听到(C)没听过B4:您家中是否购买xxx家用电器?(若回答“是”,继续回答以下问题,若回答“否”,停止答)(A)是(B)否C1:您加重购买了xxx家用电器厂生产的哪些家用电器?(A)电视机(B)电冰箱(C)洗衣机(D)微波炉(E)空调(F)其它C2:您觉得×××家用电器产品质量如何?(A)非常好(B)比较好(C)一般(D)不太好(E)非常不好C3:您认为×××家用电器产品质量不好有:(A)电视机(B)电冰箱(C)洗衣机(D)微波炉(E)空调(F)其它C4:您对×××家用电器厂的服务质量是否满意?(A)很满意(B)比较满意(C)一般(D)不太满意(E)很不满意C5:您对XXX家用电器厂以下那些服务不满意?(A)咨询服务(B)销售服务(C)维修服务(D)投诉服务(G)其它谢谢合作!2012年4月10日4.2根据下述某地区30个企业的职工人数和总产值资料,用分组法说明企业规模与劳动生产率之间的依存关系,并将分组结果用统计表表示。某地区30个企业的职工人数和总产值资料企业编号职工人数(人)总产值(万元)企业编号职工人数(人)总产值(万元)1345251612001482485411711401153515371813001574622501923013552544202501564173021262167750632224512865555232801888156424122515910925852514401631187868261521185127957127150019013840742816242101444532299559215932863056243 答:某地区30个企业企业规模与劳动生产率依存关系按职工人数分组总人数(人)总产值(万元)劳动生产率(元/人)200-5002959202682.66500-8004424363820.52800-11005345469877.461100-140048655791190.131400-170060857481229.254.3某行业管理局所属40个企业2001年的产品销售收入数据如下(单位:万元)27\n1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126如果按企业成绩规定:销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组,并根据分组结果绘制条形图和圆饼图。答:(1)某行业管理局所属40个企业1999年产品销售收入频数分布表组距分组界限频数频率向上累计向下累计累计频数累计频率累计频数累计频率85-959438%38%40100%95-105104615%923%3793%105-115114923%1845%3178%115-1251241128%2973%2255%125-135134410%3383%1128%135-145144513%3895%718%145-155515425%40100%25%合计-40100%----(2)按销售收入分组频数频率先进1127.5良好1127.5一般922.5落后922.5合计4010027\n第四章数据分布特征的描述习题一、填空题1、数据分布集中趋势的测度值(指标)主要有众数、中位数和均值。其中众数和中位数用于测度品质数据集中趋势的分布特征,均值用于测度数值型数据集中趋势的分布特征。2、标准差是反映数据离散程度的最主要指标(测度值)。3、几何平均数是计算平均比率和平均速度的比较适用的一种方法。4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算标准系数。5、在测定数据分布特征时,如果,则认为数据呈对称分布。6、当一组工人的月平均工资悬殊较大时,用他们工资的众数(中位数比其算术平均数更能代表全部工人工资的总体水平。二、选择题单选题:1、按反映的时间状况不同,总量指标可分为(②)①总量指标和时点总量指标②时点总量指标和时期总量指标③时期总量指标和时间指标④实物量指标和价值量指标2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成(②)①5.5%②5%③115.5%④15.5%3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数(⑵)(1)接近标志值小的一方(2)接近标志值大的一方(3)接近次数少的一方(4)接近哪一方无法判断4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现(⑴)(1)可变的(2)总是各组单位数(2)总是各组标志总量(4)总是各组标志值5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年(⑶)(1)提高(2)不变(3)降低(4)不能做结论6、在变异指标(离散程度测度值)中,其数值越小,则(⑵)(1)说明变量值越分散,平均数代表性越低(2)说明变量值越集中,平均数代表性越高27\n(3)说明变量值越分散,平均数代表性越高(4)说明变量值越集中,平均数代表性越低7、有甲、乙两数列,已知甲数列:;乙数列:根据以上资料可直接判断(⑷)(1)甲数列的平均数代表性大(2)乙数列的平均数代表性大(3)两数列的平均数代表性相同(4)不能直接判别多选题:1、某企业计划2000年成本降低率为8%,实际降低了10%。则以下说法正确的是(③⑤)①该企业的计划完成程度为10%/8%=125%②该企业的计划完成程度为110%/108%=101.85%③该企业的计划完成程度为90%/92%=97.83%④该企业未完成计划任务⑤该企业超额完成了计划任务2、下列那些指标属于结构相对指标(①②④)①废品率②平常函件差错率③电话机普及率④生产工人占全部职工的比重了⑤产值利税率3、应采用算术平均数计算的有(①③)(1)已知工资总额及工人数求平均工资(2)已知计划完成百分比和实际产值,求平均计划完成百分比(3)已知计划完成百分比和计划产值,求平均计划完成百分比(4)已知某厂1990到1995年的产值,求平均发展速度4、标志变异指标(离散程度测度值)的主要作用(①③)(1)衡量平均数代表性的大小(2)可以反映总体单位的均匀性和稳定性(3)可以反映社会经济活动过程的节奏性和均衡性(4)科学地确定必要抽样单位的因素(5)分析社会经济现象某总体的变动趋势5、加权平均数的大小受下列那些因素的影响(⑴⑵⑶)(1)受各组频数或频率的影响(2)受各组值大小的影响(3)受各组变量值和频数的共同影响(4)只受各组变量值的影响一、简答题1、在考察数据分布特征时,如何正确的选择集中趋势的测度值。答:首先要根据数类型选择集中趋势的测度值,定类数据选择众数,定序数据选择中位数数或分位数,数值型数据则一般选用均值;此外,对于数值型数据,还需要进一步根据数据的分布特征进一步选择不同的集中趋势测度值。当数据成对称分布或接近对称分布时,应选择均值作为集中趋势的测度值;当数据为偏态分布,特别是偏斜的程度较大时,应选择众数或中位数作为集中趋势的代表值。2、述平均指标(集中趋势测度值)与变异指标(离散程度测度值)之间的关系。27\n答:平均指标和变异指标都是说明数据分布特征的测度值,其中平均指标说明数据分布的集中趋势,而变异指标则说明数据分布特征的离中趋势,两者从不同的方面反映数据的分布特征。两者既有区别也有联系,联系主要表现为变异指标可以衡量平均指标的代表性大小,根据一组数据计算的变异指标大,其平均数的代表性就差;变异指标小,其平均数的代表性就大。3、什么是标准差系数?为什么要计算标准差系数?答:标准差系数又称为离散系数,它是一组数据的标准差与其相应的均值之比,是测度离散程度的相对指标。计算离散系数主要是为了消除变量值高低和计量单位不同对离散程度测度值的影响。离散系数主要用于变量值高低和计量单位不同的数据之间离散程度的对比。四、计算题1、某地电信局每月固定收取每部电话16元,用户每拨一次电话安使用时间每分钟0.1元收费。以下是6个用户的时间,计算6个用户本月使用电话的平均时间,使用电话的时间标准差。本月平均每户电话费的标准差。用户123456使用时间90508010040120解:(1)平均时间=(2)时间标准差==27.69(分钟)(3)平均电话费=(4)电话费标准差==2.77(元)2、企业60名工人包装某产品的数量资料如下:工人按日包装数量分组(件)工人数4月份五月份400以下400—500500—600600—700700—800800以上513181572351220155合计6060试计算4、5月份的劳动生产率,并指出4、5月劳动生产率高低不等的原因。解:(件/人)(件/人)3、某管理局所属企业按职工劳动生率高低分组如下:按劳动生率分组(元/人)企业数各组总产值500—600600—700700—80085382500650005250027\n800—900900—1000212550015200计算:工人平均劳动生产率。解:4、甲、乙两局二月份打往美国(单价:15元/分)方向的去话业务收入资料如下:时段优惠业务收入甲局乙局7—21点21—24点0—7点-20%40%150002400016200225001800018000试问哪个局的平均单价高?并说明原因。解:原因:乙局7-21点之间的业务量相对较多。5、有甲、乙两单位,甲单位的平均工资为950元,标准差为140元。乙单位工资资料如下:职工按工资分组职工人数(人)700—800100800—900200900—10004001000—11002001100以上100合计1000用尽可能简便的方法比较甲、乙两单位工人平均工资的代表性大小。解:(元)(元)因甲乙两单位的平均工资相等,且甲单位的标准差较大。因此乙单位平均工资的代表性较大。6、百货公司6月份各天的销售额数据如下(单位:万元)25727629725223831024023626527827129226128130127426728029125827\n272284268303273263322249269295(1)计算该百货公司日销售额的均值、众数、中位数;274.1、、272.5(2)计算该百货公司日销售额的极差、标准差;86、21.174725(3)计算日销售额分布的偏态系数和峰度系数。(注:上机用Excel完成)0.159087、-0.2119187、根据以下资料分别计算男女学生的年龄、身高、体重的平均值和标准差编号姓名性别年龄身高体重1陈红女1214543.12王玉女1214955.83刘丽丽女1213533.64张倩女1216265.85刘英丽女1212729.16李飞男1214738.17李强男1214958.18刘洪男1312535.99李花女1314750.810刘乐女1314948.611张晓英女1313730.412张鹏男1315944.513刘伟男1315447.714吴军男1314243.115刘小伟男1414535.916李丽君女1414936.817贾玲玲女1415241.318刘锦琦女1415964.519张虹源女1415438.120李丽霞女1415238.621吴龙飞男1415442.222刘涛男1415744.923张金星男141595424宋毅男1415741.825王洪飞男1416750.826刘建功男1415744.927张均男1516951.328张莹莹女1515241.829马晓云女1515750.830张海军男1516458.131王建男1515950.432刘云龙男1616247.733李帆男1715247.234樊晓霞男1616248.135刘莎女1615950.836吴丽英女1614752.237周虎男1616758.127\n38刘胜利女1715252.739张仲男1716760.840李哲男1717278.1(运用Excel的分类汇总功能完成)8、根据第7题的资料计算:(1)年龄15岁以上的人数;(2)身高160以上学生的平均身高。9、1997年我国城乡居民家庭平均每人生活消费支出数据如下表:1997年城乡居民家庭平均每人生活消费支出项目城镇居民农村居民食品家庭设备用品及服务医疗保健交通运输娱乐教育文化服务居住杂项商品与服务1942.59520.91316.89179.68232.90448.38358.64185.65890.28109.4185.4162.4553.92148.18233.2334.27合计4185.641617.15是根据以上资料绘制雷达图,并分析我国城乡居民消费结构的差异。(注:上机用Excel完成)消费差异:根据雷达图显示可知,城镇居民和农村居民的食品消费都占据了自己总支出的很大比重,在满足了食品消费后,城镇居民将支出更多的放在了居住上,而农村居民将支出更多的放在了杂项商品与服务上,另外,可以看出,农村居民的交通运输和娱乐教育文化服务还有医疗保健方面极其薄弱,并且在衣着支出上更是明显远低于城镇居民,相较之下城镇居民在各个方面都是较为全面,钱的支出方向较多,也是源于城镇的消费多样化。27\n第5章抽样与抽样估计复习题一、填空题1、在实际工作中,人们通常把n≥30的样本称为大样本,而把n<30的样本称为小样本。2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。二、选择题单选题:1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须(⑵)(1)增加到原来的3倍(2)增加到原来的9倍(3)增加到原来的6倍(4)也是原来的1/32、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用(⑶)(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样27\n3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1小时的全部产进行检验,这种方式是(⑷)(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会(⑵)(1)提高(2)降低(3)不变(4)不一定降低5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为0.8分钟,则概率为0.9545时,通话平均持续时间的抽样极限误差为(⑵)(1)0.8(2)0.16(3)0.84(4)3.166.在抽样调查中,样本量是指()。A.样本的个数B.样本所包含的单位数C.抽样框的大小D.样本的可能数目7.在抽样框中每隔一定距离抽选样本单位的调查方式是()。A.整理抽样B.系统抽样C.分层抽样D.简单随机抽样8、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差(⑶)(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小9.假设检验中第二类错误是指()。A.接受正确原假设B.拒绝正确原假设C.接受错误原假设D.假设设立不正确10.当总体为正态总体,方差已知,样本量为40,此时进行均值检验,应采用()统计量进行检验。A.卡方B.tC.FD.Z多选题:1、降低抽样误差,可以通过下列那些途径(⑵⑷⑸)(1)降低总体方差(2)增加样本容量。(3)减少样本容量(4)改重复抽样为不重复抽样(5)改简单随机抽样为类型抽样2、抽样推断中的抽样误差(⑴⑸)(1)是不可避免要产生的(2)是可以通过改进调查方法来消除的(3)只有调查后才能计算(4)即不能减少,也不能消除(5)其大小是可以控制的3、抽样极限误差(⑴⑵⑷)(1)是所有可能的样本指标与总体指标之间的误差范围(2)也叫允许误差(3)与所做估计的概率保证程度成反比(4)通常用来表示抽样结果的精确度4、影响样本容量的因素有(⑴⑵⑶⑷⑸)(1)总体方差(2)所要求的概率保证程度27\n(3)抽样方法(4)抽样的组织形式(5)允许误差法范围的大小5、不重复抽样的抽样平均误差(⑵⑷)(1)总是大于重复抽样的抽样平均误差(2)总是小于重复抽样的抽样平均误差(3)有时大于,有时小于重复抽样的平均误差(4)在很小时,几乎等于重复抽样的抽样平均误差6、从3000名职工中随机抽取400名调查收入水平,共抽了(⑴⑶⑸)(1)一个样本(2)400个样本(3)一个样本总体(4)400各样本总体(5)400个样本单位7.评价估计量的标准为()。A.一致性B.无偏性C.显著性D.有效性E.综合性8、简单随机抽样一般适合于()(1)具有某种标志的单位均匀分布的总体(2)具有某种标志的单位存在不同类型的总体(3)现象的标志变异程度较小的总体(4)不能形成抽样框的单位(5)总体单位可以编号的总体一、简答题1、什么是抽样平均误差?影响抽样平均误差的因素有哪些?答:抽样平均误差是所有可能的样本指标与被估计的总体参数之间的平均离差,即样本指标的标准差。其影响因素有:⑴总体方差⑵样本容量⑶抽样方法⑷抽样的组织形式2、抽样调查适合于那些场合?答:与其他抽样调查方式相比,抽样调查有经济性、时效性强、准确性高等特点,所以在实际中得到广泛的应用。具体看来,抽样调查主要用于以下场合:⑴对无限总体全面资料的了解;⑵具有破坏性的产品质量检测;⑶对全面调查的结果进行验证和修整3、为什么重复抽样的抽样平均误差大于不重复抽样的抽样平均误差?答:因为在重复抽样情况下,最大(最小)的样本指标等于最大(最小)的变量值;而不重复抽样情况下,最大的样本指标小于最大的变量值,最小的样本指标大于最小的变量值。因此,重复抽样下的样本指标的变动范围大于不重复抽样下的样本指标变动范围,这就必然就有,重复抽样下的样本指标的标准差大于不重复抽样下的样本指标的标准差。而抽样平均误差就是样本指标的标准差,所以,重复抽样的抽样平均误差大于不重复抽样的抽样平均误差4、点估计与区间估计的区别是什么?答:点估计是直接以一个样本估计量来估计总体参数,当已知一个样本的观察值时,便可得到总体参数的一个估计值。其估计过程简单明了,但估计结果的误差大小和把握性无法衡量。区间估计是以点估计值为基础,加减一个误差范围来估计总体参数所在的可能范围。估计过程既考虑了样本指标,又考虑了样本指标的分布,从而能对估计的把握性和误差大小进行说明。5、基本的抽样组织形式有哪些?它们各有什么特点?(财管0203班不做)答:抽样估计的基本形式有:(1)简单随机抽样:其特点是:最符合随机原则,其计算公式可以在理论上得到证明;但由于抽样时,需要对每一个单位进行编号,实际应用受到很大的限制。(2)分层抽样(类型抽样):可以降低抽样误差,提高样本的代表性。27\n(1)等距抽样:抽样单位均匀的分布于总体中,比简单随机抽样的误差小;其抽样误差需借助其它抽样组织形下的误差公式计算;均采用不从复抽样。(2)整群抽样:抽样组织工作简便,但误差较大,通常也只采用不重复抽样。一、计算题1、一家广告公司想估计某类商店去年所花的平均广告费有多少。经验表明,总体方差约为1800000。如置信度取95%,并要使估计值处在总体平均值附近500元的范围内,这家广告公司应取多大的样本?(Zα∕2=1.96)解:(个)2、对一批平常函件按不重复抽样的方法抽取200件,其中免费信件8件.又知道抽样是该批平常函件的1/20,当а=0.0455时,能否认为该批平常函件,免费函件所占的比重不超过5%?并以免费函件所占比重推断该批平常函件免费函件量的范围。解:(1)不能认为免费函件所占比重不超过5%(2)3、设某邮局某月份平常函件的重量服从正态分布,从该月份收寄的平常函件中随机抽查100千克,测得总件数为17600件,它们的平均重量为5.68g,已知总体标准差б=1.5g,试以95%的概率保证程度,确定该局该月份平常函件平均重量的置信区间。解:4、从某商店一年来的发票存根中随机抽取26张,算得平均金额为78.5元,样本标准差为20元,假定发票金额为正态分布,试求出该商店一年来发票平均金额90%的置信区间。(Z=1.68,T=1.708)5、在某一地区中,随机地对100名成年居民做民意测验,有80%的居民支持粮食调价,求在该地区的所有居民中,支持粮食调价的居民的比率的95%置信区间27\n第六章相关与回归分析习题一、填空题1、客观现象之间的数量联系有两种不同的类型:一种函数关系;另一种是相关关系。2、现象之间是否存在相关关系是进行相关与回归分析的基础,其主要测定方法是计算相关系数。3、若估计标准误差愈小,则根据直线回归方程计算的估计值就越能代表实际值。4、对某实验结果做线性回归分析,得到形如y=a+bx的方程,现对回归系数b做显著性检验,该假设检验中原假设为H0:b=0,备择假设为H1:b≠0,若拒绝原假设,则认为x对y有显著的影响。二、选择题单选题:1、相关分析对资料的要求是(⑴)(1)两变量均为随机的(2)两变量都不是随机的(3)自变量是随机的,因变量不是随机的(4)因变量是随机的,自变量不是随机的2、回归方程Y=a+bx中的回归系数b说明自变量变动一个单位时,因变量(⑷)(1)变动a+b个单位(2)变动1/b个单位(3)变动b个单位(4)平均变动b个单位3、相关系数r的取值范围(⑵)27\n(1)-∞