- 143.00 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学同步模拟练习题第一章统计学概述一.判断题1.√2.×3.√4.√5.√6.√7.√8.√9.√10.√二.简答题1.什么是品质数据?什么是数量数据?定性数据说明的是现象的品质特征,是不能用数值来表现其结果通常表现为类别。数量数据说明的是现象的数量特征,是能够用数值来表现,如房屋面积。2.什么是比例相对数?什么是比率相对数?比例相对数是一个总体中各个部分的数量占总体数量的比重,通常用于反映总体的构成或结构。什么是比率相对数是各个不同类别的数量的比值。3.什么是数列?为什么分为动态数列和静态数列?统计数列是将数据按照一定秩序排列得到的变量数列。动态数列是将某指标的各数据按照时间顺序进行排列得到的数列。静态数列是将某同时期的各指标数值按照组别进行排序得到的数列。4.描述统计学是如何研究现象总体的?\n描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。描述统计学的内容包括统计数据的搜集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。1.推断统计学是如何研究现象总体的?推断统计学则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。2.数据分为哪三大指标形式?统计指标表现为绝对数、相对数和平均数三种形式。3.什么是相对数?它与绝对数是什么关系?相对数是两个绝对数的比值,反映事物的相对数量。相对数由两个绝对数相比而得到的。4.定类尺度、定序尺度、定距尺度和定比尺度有哪些不同?定类尺度:将数字作为现象总体中不同类别或不同组别的代码,这是最低层次的尺度。在这种情况下,不同的数字仅表示不同类(组)别的品质差别,而不表示它们之间量的顺序或量的大小。这种尺度的主要数学特征是“=”或“≠”。例如将国民经济按其经济类型,可以分为国有经济、集体经济、私营经济、个体经济等类。定序尺度:可以用数表示量的不同类(组)别,而且也反映量的大小顺序关系,从而可以列出各单位、各类(组)的次序。这种尺度的主要数学特征是“>”或“<”。例如对合格产品按其性能和好坏,分成优等品、一等品、合格品等等。定距尺度:\n定距尺度也称间隔尺度,是对事物类别或次序之间间距的计量,它通常使用自然或度量衡单位作为计量尺度。定距尺度是比定序尺度高一层次的计量尺度。它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。定比尺度:定比尺度是在定距尺度的基础上,确定可以作为比较的基数,将两种相关的数加以对比,而形成新的相对数,用以反映现象的构成、比重、速度、密度等数量关系。上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。高层次的计量尺度具有低层次计量尺度的全部特性,但不能反过来。显然,我们可以很容易地将高层次计量尺度的测量结果转化为低层次计量尺度的测量结果,比如将考试成绩的百分制转化为五等级分制。1.统计学的研究对象是什么?统计学的研究对象有什么特点?统计学的研究对象,是大量现象的的数量方面的总体特征,即数量总体。统计学的研究对象有以下特点:大量性、同质性、差异性。2.什么是离散变量?什么是连续变量?离散变量的变量值是间断的。例如,职工人数、商业企业数、机器设备台数都只能按整数计算,不可能有小数。连续变量的变量值是连接不断的,相邻的两个数值之间可以作无限的分割,一般可以表现为小数。例如,人的身高、体重、年龄等都是连续变量。3.如何理解统计?统计学是收集、汇总和分析统计数据的科学和艺术。4.举例说明实物单位、价值单位和复合单位?实物单位:根据事物的自然属性来计量的单位。如,人口以“人”为单位,汽车以“辆”为单位,鞋以“双”为单位。价值单位:以货币形式对现象进行度量,如国民生产总值、商品销售额等复合单位:是两种计量单位结合在一起的计量单位。如,发电量以千瓦时计量,货物周转量以吨公里计量。第一章数据的收集和整理\n一.判断题1.√2.×3.×4.√5.×6.√7.×8.√9.×10.√11.×二.简答题1.简述普查的特点。普查通常是一次性的或周期性的;规定统一的标准时点;普查的数据一般比较准确,规范化程度也较高;普查的使用范围比较窄,只能调查一些最基本及特定的现象。2.简述抽样调查的特点。经济性;时效性高;适应面广;准确性高。3.设计调查方案主要考虑哪些因素?调查目的;调查对象和调查单位;调查项目和调查表;其他内容如调查时间、调查方法等。4.统计调查时,收集数据的主要方法有哪些?调查访问;邮寄调查、电话调查;座谈会等。5.简述组距分组的几个步骤。第一步:确定组数。第二步:确定各组的组距。\n第三步:确定组限和进行次数分配第四步:绘制统计图。1.为什么频数密度才能准确反映频数分布的实际状况?不等距分组因各组组距不同,各组频数的分布受组距大小不同的影响,因此各组绝对频数的多少并不能反映频数分布的实际状况。为消除组距不同对频数分布的影响,需要计算频数密度,即频数密度=频数÷组距。频数密度能准确反映频数分布的实际状况。2.数据汇总有什么作用?数据汇总指对工作表中的某一项数据进行分类,并对每类数据进行数据计算。数据汇总对统计分析和经营决策非常重要。3.如何理解调查对象和调查单位的关系?调查对象是根据调查目的确定的调查研究的总体,调查单位是构成调查对象中的每一个单位,它是调查项目和指标的承担者或载体,是搜集数据、分析数据的基本单位。第一章数据特征的描述一.判断题1.√2.√3.√4.×5.√6.×7.√8.√9.√10.√\n11.√12.√13.√14√15√二.简答题1.什么是变异系数?为什么要计算变异系数?是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。方差和标准差都是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。变量值绝对水平越高,离散程度的测度值自然也就越大,绝对水平越低,离散程度的测度值自然也就越小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。2.协方差和相关系数是什么关系?为什么要计算相关系数?相关系数是协方差与两个标准查乘积之比。协方差的大小会受到计量单位和数据的均值水平的影响,从而使不同相关总体之间的相关程度缺乏可比性。为了协方差的上述缺陷,需要计算相关系数。3.试比较极差、平均差和标准差三种变异系数的特点,并说明为什么标准差是最常用、最基本的变异指标。根据组距计算极差,是测定标志变动度的一种简单方法,但受极端值的影响,因而它往往不能充分反映社会经济现象的离散程度。平均差是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。由于平均差采用了离差的绝对值,不便于运算,这样使其应用受到了很大限制。\n标准差是方差的算术平方根,是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。由于标准差能准确地反映出数据的离散程度,同时计算简便,所以是最常用、最基本的变异指标。1.反映离中趋势的指标中?哪个最重要?为什么?反映离中趋势的指标中,标准差最重要。原因如下:极差受极端值的影响;平均差不便于运算;方差的计量单位和量纲不便于从经济意义上进行解释。相比较而言,标准查最好。2.数值平均数与位置平均数是依据什么来区分的?这两类平均数之间有何异同?平均数从其计算方法上看,可分为数值平均数和位置平均数。数值平均数是根据统计分布数列中所有单位的标志值计算出来的平均数,包括算术平均数、调和平均数、几何平均数;位置平均数则是根据标志值在统计分布数列中所处的位置确定的平均数,包括中位数和众数。。位置平均数容易计算,不受极端值干扰。数值平均数会受极端值干扰。3.为什么除了计算一般的平均指标和变异指标外,还需要考察分布的偏度?平均数和标准差是反映次数分布的最重要的两个特征指标,通过他们可以了解统计分布的集中趋势和离散程度。但如果要对统计总体做出更为全面的描述,还需测定偏度。偏度是测定一个次数分布的非对称程度的统计指标。相对于对称分布,偏度有两种:一种是左向偏态,简称左偏,另一种是右向偏态,简称右偏。三.计算题1.某车间工人日产量资料如下:日产量(件)工人数(人)\n10-1213-1516-1819-2110203040计算该车间平均每个工人的日产量及标准差。平均日产量(件)标准差(件)2.甲、乙两班同时对《统计学原理》课程进行测试,甲班平均成绩为70分,标准差为9.0分;乙班的成绩分组资料如下:按成绩分组学生人数(人)60以下60-7070-8080-9090-1002625125计算乙班学生的平均成绩,并比较甲、乙两班哪个班的平均成绩更有代表性。乙班学生的平均成绩(分)乙班学生的标准差(分)\n因为0.129〉0.120,所以乙班学生的平均成绩更具有代表性。第一章时间序列分析一.判断题1.√2.√3.√4.×5.√6.√7.√8.√9.√10.×二.简答题1.什么是时间序列?时期序列与时点序列有什么区别?时间序列是反映现象随着时间的变化而变化的数据系列。时期数列中所排列的指标为时期指标,各时期上的数值分别反映现象在这一段时期内所达到的总规模、总水平,是现象在这一段时期内发展过程的累积总量。观察值具有可加性及数值大小与所属时期长短有密切联系的特点。时点数列中所排列的指标为时点指标,各时点上的数值分别反映现象在各该时点上所达到的总规模、总水平,是现象在某一时点上的数量表现。观察值具有时间上的不可加性及各时点上观察值大小与相邻两时点间间隔长短无密切联系的特点。2.一般平均数和序时平均数有什么区别?\n序时平均数又称为动态平均数,是现象在时间ti(i=1,…,n)上取值的平均数。它可以概括性地描述出现象在一段时期内所达到的一般水平。序时平均数作为一种平均数,与一般平均数有相同点,即它们都抽象了现象的个别差异,以反映现象总体的一般水平。但二者又有明显的区别,主要表现在:序时平均数抽象的是现象在不同时间上的数量差异,因而它能够从动态上说明现象在一定时期内发展变化的一般趋势;一般平均数抽象的是总体各单位某一数量标志值在同一时间上的差异,因此,它是从静态上说明现象总体各单位的一般水平。1.什么是移动平均法?移动平均法有什么优缺点?移动平均法是趋势变动分析的一种较简单的常用方法。该方法的基本思想和原理是,通过扩大原时间序列的时间间隔,并按一定的间隔长度逐期移动,分别计算出一系列移动平均数,这些平均数形成的新的时间序列对原时间序列的波动起到一定的修匀作用,削弱了原序列中短期偶然因素的影响,从而呈现出现象发展的变动趋势。该方法可以用来分析预测销售情况、库存、股价或其他趋势。移动平均法的优点在于计算简便,运用灵活,不受现象复杂性影响。其缺点主要有三个:一是失去首尾两头的数据;二是不能较好地进行长期趋势的预测;三是对周期性处理不好就会影响数列的趋势性。4.计算平均发展速度时,几何平均法与累计法的应用条件有何不同?计算平均发展速度时,几何平均法的应用条件是要求现象呈均匀变动。计算平均发展速度时,累计法适合计算波动较大的现象的平均发展速度。5.测定长期趋势的方法有哪几种?测定长期趋势的分析方法有许多,如随手画法、移动平均法、最小二乘法等,后两种方法较常用。6.定基发展速度、环比发展速度,发展速度和增长速度的关系如何?\n环比发展速度与定基发展速度之间存在着重要的数量关系:观察期内各个环比发展速度的连乘积等于相应时期的定基发展速度;两个相邻的定基发展速度,用后者除以前者,等于相应时期的环比发展速度。增长速度等于发展速度减1,但各自说明的问题是不同的。发展速度说明报告期水平较基期发展到多少;而增长速度说明报告期水平较基期增长多少(扣除了基数)。当发展速度大于1时,增长速度为正值,表示现象的增长程度;当发展速度小于1时,增长速度为负值,表示现象的降低程度。7.什么是季节变动分析?常用的有哪几种分析方法?季节变动是指一些现象由于受自然条件或经济条件的影响在一个年度内随着季节的更替而发生比较有规律的变动,例如,农产品的生产量、某些商品的销售量等,都会因时间的变化而分为农忙农闲、淡季旺季。季节变动往往会给社会生产和人们的经济生活带来一定影响。季节变动分析,就是认识这些变动的规律性,以便更好地安排、组织社会生产与生活。测定季节变动的方法主要有月平均法和趋势剔除法两种。8.简述趋势剔除法的主要步骤。第一步:对原数据计算移动平均数;第二步:计算具体的季节比率;第三步:计算月平均值,消除不规则波动;第四步:计算季节比率;第五步:使用季节比率进行预测。三.计算题1.已知某饭店2004年的营业额比1998年增长64%,2005年的营业额比1998年增长86%,问2005年的营业额比2004年增长多少?1998至2005年间,平均增长速度是多少?(1)2005年销售额比2004年增长的百分数(2)1998至2005年间平均增长速度:根据公式\n1998至2005年间平均增长速度:109.27%2.某地区1984年平均人口数为120万人,1995年人口变动情况如下:月份125911次年1月月初人数122125132147151157计算:(1)1995年平均人口数 (2)1984年1995年该地区人口的平均增长速度。解:第一章统计指数一.判断题1.√2.√3.√4.√5.×6.×7.√\n1.×2.√3.√二.简答题1.什么叫质量指标指数?什么叫数量指标指数?质量指标指数简称质量指数,具有质量指标的特征,表现为平均数或相对数的形式,例如物价指数、产品成本指数等等。数量指标指数简称数量指数,具有数量指标的特征,具有总量或绝对数的形式,例如商品销售量指数、工业产品产量指数等等。2.简述派氏物价指数与拉氏物价指数的经济意义。派氏物价指数的经济意义:表明计算期实际销售的商品由于价格变化而增减了多少销售额。拉氏物价指数的经济意义:消费者为了维持基期的消费水平或购买同基期一样多的商品,由于价格的变化将会增减多少实际开支。3.简述构建标准比值综合评价指数的方法。(1)建立综合评价指标体系(2)确定评价公式(3)确定各项指标的评价标准和权数(4)计算企业的个体指数和综合评价指数4.什么是复杂现象总体?使用综合指数法时,会遇到这样两个问题,一是不同商品的数量和价格不能直接加总,或者说,直接加总的结果没有实际经济含义;二是简单综合法编制的指数明显地受到商品计量单位的影响。因此,简单综合指数难以成为现象变动程度的一种客观测度,因为不同商品的价格或销售量都是“不同度量”的现象,它们构成了不能直接加总的“复杂现象总体”。5.什么是总指数?什么是个体指数?\n总指数是考察整个总体现象的数量对比关系的指数。个体指数是考察总体中个别现象或个别项目的数量对比关系的指数。1.举例说明总值指数。诸如商品销售额、产品的成本总额等,它们所对比的现象虽然属于数量指标,但却具有价值总额的特殊形式,这些价值总额通常可分解为一个数量因子和一个质量因子的乘积,而相应的指数则反映了两个因子共同变化的影响。这些指数称为总值指数。2.编制总指数通常有哪两种方式?编制总指数可以考虑两种方式。一是先综合后对比,二是先对比后平均。(一)先综合、后对比的方式如果我们知道某几种商品价格和销售量资料,研究全部商品的价格和销售量变动情况。首先将各种商品的价格或销售量资料加总起来,然后通过对比得到相应的总指数,这种方法通常称为综合(总和)指数法。(二)先对比、后平均的方式首先将各种商品的价格或销售量资料进行对比(计算个体指数),然后通过个体指数的平均得到相应的总指数,这种方法通常称为“平均指数法”。3.简易计分法有哪些优缺点?优点:简便、快捷缺点:评分具有较大的主观随意性。9.编制总指数时,平均指数法与综合指数法有何区别?平均指数法是对个体指数进行平均的结果。综合指数法是将指数指标加总后进行对比的结果。10.为什么全部商品销售额既不属于数量指标指数,也不属于质量指标指数?\n全部商品销售额所对比的现象虽然属于数量指标,但却具有价值总额的特殊形式,所以既不属于数量指标指数,也不属于质量指标指数。三.计算题1.某地三种商品的销售情况如下:商品计量单位价格(元)销售量p0p1q0q1甲件9121250016000乙担60551200016000丙个1.52.560005600试根据上表资料计算:(1)拉氏形式的价格指数;(2)派氏形式的价格指数。参考答案:(1)98.04%(2)97.63%2.某农贸市场三种商品的价格和销售量资料如下:商品基期报告期零售价零售量零售价零售量ABC3582504201004610350500120试根据上表资料计算:(1)拉氏形式的价格指数;(2)派氏形式的价格指数。参考答案:(1)123.84%\n(2)124.17%第一章概率及其分布一.判断题1.√2.√3.√4.√5.√6.×7.√8.√9.×10.√二.简答题1.什么是概率?概率的统计定义是什么?概率是衡量某一特定事件的机会过可能性的数量指标。在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附近,则数值p称为事件A在该条件下发生的概率,记做P(A)=p。这个定义成为概率的统计定义。2.举例说明哪些事件符合二项分布?哪些事件符合泊松分布?二项分布:新生儿的性别(男性、女性);抛硬币的结果(正面、反面)泊松分布:一分钟内接到的电话次数;一页书上的错字个数;每平方米土地的害虫个数,在一个时间间隔内电话寻呼台收到的呼叫次数;某一地区一段时间间隔内发生的交通事故数等。3.概率分布与直方图的关系是什么?概率分布所描述的是总体特征的分布,直方图所描述的是样本特征的分布。\n1.简述正态分布的特点。正态分布的特点如下:.正态分布的形式是对称的,它的对称轴是过平均数点的垂直线,即关于x=u对称;曲线在Z...在正态分布曲线中,标准差与概率(面积)有一定的关系,曲线对横轴是渐近的;在均值的概率最大;参数不同,分布不同。2.二项分布与泊松分布的共同点和不同点是什么?共同点:二项分布和泊松分布均是常见的离散型分布,在分类资料的统计推断中有非常广泛的应用。不同点:二项分布的极限是泊松分布,当N很大,P很小,一般N*P小于等于5时,可以用泊松分布近似代替二项分布进行计算。6.概率分布的特点是什么?概率分布的特点:变量取值的精确度越高,相应的概率越小;变量取值的误差越大,相应的概率越大。第一章抽样与区间估计一.判断题1.√2.√3.√4.√5.√6.√7.√8.√9.√10.√11.√12.√\n二.简答题1.什么是“放回抽样”?什么是“无放回抽样”?放回抽样:是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位经登录其有关标志表现后又放回总体中重新参加下一次的抽选。每次从总体中抽取一个单位,可看作是一次试验,连续进行n次试验就构成了一个样本。因此,放回抽样的样本是经n次相互独立的连续试验形成的。每次试验均是在相同的条件下完全按照随机原则进行的。无放回抽样:是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位登录其有关标志表现后不再放回总体中参加下一次的抽选。经过连续n次不放回抽选单位构成样本,实质上相当于一次性同时从总体中抽中n个单位构成样本。上一次的抽选结果会直接影响到下一次抽选,因此,不放回抽样的样本是经n次相互联系的连续试验形成的。2.确定必要的抽样数目有何意义?在参数区间估计中,估计值和总体的参数之间存在着一定的差异,这种差异是由样本的随机性产生的。在样本容量不变的情况下,若要增加估计的可靠度,置信区间就会扩大,估计的精度就降低了。若要在不降低可靠性的前提下,增加估计的精确度,就只有扩大样本容量。而增大样本容量要受到人力、物力和时间等条件的限制。如果抽样数目过大,虽然抽样误差小,但调查工作量大,人力、物力和时间耗费大;如果抽样数目过小,抽样误差增大。所以需要在满足一定精确度的条件下,确定必要的抽样数目。3.必要的抽样数目受哪些因素影响?(一)总体的变异程度(总体方差)(二)允许误差的大小(三)概率保证度1-α的大小(四)抽样方法不同(五)抽样组织方式\n1.简述点估计量的主要性质。点估计量的主要性质:无偏性、有效性和一致性。无偏性:如果样本统计量的数学期望等于所估计的总体参数的值,该样本统计量称作总体参数的无偏估计量。有效性:假定含n个元素的一个简单随机样本用于给出同一总体参数的两个不同的无偏点估计量。这时,我们偏好于用标准差较小的点估计量,因为它给出的估计值与总体参数更接近。有较小标准差的点估计量称作比其他点估计量有更好的相对效率。一致性:与一个好的点估计相联系的第三个性质为一致性。粗略地讲,如果当样本容量更大时,点估计量的值更接近于总体参数,该点估计量是一致的。2.为什么与简单随机抽样相比,分层抽样的效果更好?分层抽样是通过分组来提高样本的代表性。因为通过分层使得样本单位在总体中的分布更加均匀,从而样本分布更加接近总体分布,样本指标就更加接近总体指标。分层后总体方差被划分为多个内部差异较小的总体,这些差异较小的方差平均后还是较小。由于各层都抽取,各层之间就不存在抽样误差问题。差异较小的总体条件下不考虑层间方差,层内方差小于简单随机样本的样本方差。分层抽样的抽样误差只取决于各层内方差,而简单随机抽样的抽样误差取决于总方差(相当于各层内方差平均数与组间方差之和),所以其它条件相同的情况下分层抽样的抽样误差总是小于简单随机抽样的抽样误差。所以,与简单随机抽样相比,分层抽样的效果更好。3.什么是简单随机样本?简单随机样本:如果随机样本中每个样本点以相等的概率被抽出,则称之为简单随机样本。4.简述等距抽样和整群抽样的优越性。等距抽样的优越性:能提高样本单位分布的均匀性,样本代表性强。整群抽样的优越性:只存在群间方差,不存在群内方差。\n8.在整群抽样过程中,划分群体的原则是什么?在整群抽样过程中,划分群体的原则是:使群间差异尽可能小,使各群内的总体单位之间的差异尽可能大。三.计算题1.某大学从该校学生中随机抽取120人,调查到他们平均每天参加体育锻炼的时间为30分钟。已知总体方差为36,试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间。(Z0.025=1.96)参考答案:(28.9265,31.0735)2.某种零件的长度服从正态分布,从该批产品种随机抽取9件,测得它们的平均长度为21.4毫米,已知总体标准差为0.15毫米,假定给定置信水平为0.95,试建立该种零件平均长度的置信区间。(Z0.025=1.96)参考答案:(21.302,21.498)第一章假设检验一.判断题1.√2.×3.×4.√5.×6.√7.√8.√9.√10.√二.简答题1.简述假设检验的两个特点。\n简述假设检验的两个特点:假设检验所采用的逻辑推理使反证法;假设检验结果的合理与否,所依据的是“小概率事件实际不可能发生的原理”。1.区间估计与假设检验有何区别?两者的区别: 1、如果总体分布形式已知,只是总体参数未知,则统计推断问题就归结为推断总体参数的问题。抽样估计或称参数估计是根据样本资料估计总体参数的真值,而假设检验是根据样本资料来检验对总体参数的先验假设是否成立。例如,通过随机抽取的样本对某地区居民的平均收入进行推断,如果要求以一定的概率估计总体平均收入,这就是一个参数估计问题,更准确地说,这是一个区间估计问题;如果要求以一定的概率判断总体平均收入是否达到了某一水平或是否有显著提高,这就是一个假设检验问题。 2、区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验不仅有双侧检验也常常采用单侧检验,视检验的具体问题而定。 3、区间估计立足于大概率,通常以较大的把握程度(可信度)1-a去估计总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。在假设检验中,人们更重视拒绝区域。这是因为我们只依据一个样本来进行推断。用一个实例去证明某个命题是正确的,这在逻辑上是不充分的,但用一个反例去推翻一个命题,理由是充足的,因为一个命题成立时不允许有反例存在。所以,假设检验运用的是概率意义上的反证法,在建立假设时本着“不轻易拒绝原假设”的原则。一旦检验结论为拒绝原假设,就会有较大的把握程度(即错误判断的可能性很小);而当不能否定原假设时,只能将它作为真的保留下来,但事实上它有可能不真,所以,接受它有可能是个错误。2.区间估计与假设检验有何联系?区间估计和假设检验虽各有其特点,但也有着紧密的联系。 1、 两者都是根据样本信息对总体参数进行推断。\n 2、 都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。 3、 对同一实际问题的参数进行推断,使用同一样本、同一统计量、同一分布,因而二者可以相互转换。即区间估计问题可以转换成假设检验问题,假设检验问题也可以转换成区间估计问题。这种相互转换形成了区间估计与假设检验。1.什么是原假设?什么是备择假设?选择原假设的原则是什么?原假设又称零假设,是正待检验的假设,记为H0;备择假设是拒绝原假设后可供选择的假设,记为H1。原假设和备择假设是相互对立的,检验结果二者必取其一。接受H0则必须拒绝H1;反之,拒绝H0则必须接受H1。原假设和备择假设不是随意提出的,应根据所检验问题的具体背景而定。常常是采取“不轻易拒绝原假设”的原则,即把没有充分理由不能轻易否定的命题作为原假设,而相应地把没有足够把握就不能轻易肯定的命题作为备择假设。2.双侧检验与单侧检验的应用场合有何不同?左侧检验和右侧检验统称为单侧检验。采用哪种假设,要根据所研究的实际问题而定。如果对所研究问题只需判断有无显著差异或要求同时注意总体参数偏大或偏小的情况,则采用双侧检验。如果所关心的是总体参数是否比某个值偏大(或偏小),则宜采用单侧检验。3.什么是假设检验的第一类错误?原假设本是真的,而做出了否定H0判断,因此也称为"弃真错误"。4.什么是假设检验的第二类错误?原假设H0本来不真,而做出了接收的判断,也叫取伪错误。5.假设检验两类错误的概率有何关系?假设检验两类错误的概率是互为消长的关系。一般场合,当n固定时,减少第一类错误的概率必然导致增加第二类错误的概率;反之,减少第二类错误的概率必然导致增加第一类错误的概率。\n9.假设检验时,为什么“接受原假设”并非肯定原假设就是正确的?假设检验的基本思想是应用小概率的原理。所谓小概率原理,是指发生概率很小的随机事件在一次实验中是几乎不可能发生的。根据这一原理,可以做出是否接受原假设的决定。但小概率事件并非绝对不能发生,如果小概率事件发生时,推断就可能会犯错误。所谓“接受原假设”并非肯定原假设就是正确的。三.计算题1.某机器制造出的肥皂厚度为5厘米,今欲了解及其性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.4厘米,标准差为0.2厘米,试以0.01的显著性水平检验及其性能良好(即厚度合乎规定)的假设(t0.005(9)=3.2498)H0:μ=5cm;H1:μ≠5cmtt=6.3246>t0.005(9)=3.2498,拒绝H0,肥皂厚度不合规定。2.某机构声称5年来各种新发行债券的承销价高于面值的比率没有超过50%。为了检验此说法,随机抽取了60只新发行债券,其中有24只的承销价高于面值。试以α=0.10的显著性水平进行检验。(Z0.10=1.285)H0:P≥50%;H1:P<50%左侧检验:Z=-1.55<-Z0.10=-1.285,所以拒绝原假设,没有理由怀疑该机构的估计。\n第一章回归分析一.判断题1.√2.×3.×4.√5.√6.×7.√8.√二.简答题1.什么是回归分析?什么是相关分析?所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。2.回归分析与相关分析有何区别与联系。相关分析与回归分析的区别 1、相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要的方法;2、相关分析可以不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量可以都是随机变量。而回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。一般地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量。相关分析与回归分析的联系\n 相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。由于上述原因,回归分析和相关分析在一些统计学的书籍中被合称为相关关系分析或广义的相关分析。1.什么是样本回归函数?什么是总体回归函数?见教材105页至106页。2.简述样本回归函数与总体回归函数的区别。见教材106页。3.回归分析的主要任务是什么?回归分析的主要任务是通过一个变量或一些变量的变化解释另一变量的变化。其主要内容和步骤是,首先根据理论和对问题的分析判断,将变量分为自变量和因变量;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;由于涉及到的变量具有不确定性,接着还要对回归模型进行统计检验;统计检验通过后,最后是利用回归模型,根据自变量去估计、预测因变量。4.什么是理论意义检验?什么是一级检验?理论意义检验主要涉及参数估计值的符号和取值区间,如果它们与实质性科学懂得理论以及人们的实践不相符,就说明模型不能很好地解释现实的现象。一级检验是利用统计学中的抽样理论来检验样本回归方程中的可靠性。6.在实际的回归模型中,发生预测误差的原因有哪些?模型本身中的误差因素造成的误差;回归系数的估真值与其真值不一致造成的误差;自变量的设定值与其实际值的偏离造成的误差;未来时期总体回归系数发生变化而造成的误差。7.什么是拟和程度?\n所谓拟和程度,是指样本观测值聚集在样本回归线周围的紧密程度。三.计算题1.为研究家庭收入和食品支出的关系,随机抽取了10个家庭的样本,得到数据如下:家庭编号12345678910收入(百元)20303340151326383543支出(百元)7991154810910试根据上述数据建立收入和支出间的回归方程,并解释结果。(提示:此题可利用Excel软件直接运算出结果,但提交作业时须写出计算步骤和计算公式)参考答案:X代表收入,Y代表支出Y=2.163+0.206X其中,回归系数b=0.206表示家庭收入每增加1元,食品支出增加0.206元;截距=2.163表示即使在家庭收入为零的情况下,食品支出也需要2.163百元。