[理学]社会统计学练习 78页

  • 1.17 MB
  • 2022-08-13 发布

[理学]社会统计学练习

  • 78页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第一章导论第一节什么是社会统计学社会统计的产生与发展·社会统计学的对象与特点·社会统计的方法·社会统计工作的程序第二节社会统计学的几个基本概念总体与单位·标志与变量·指标与指标体系一、填空1.一般来说,统计这个词包括三个含义:统计工作、统计资料和()。2.()的实践已有几千年的历史,是最早产生的统计。3.()这一学派产生于德国,其创始人为康令(1606~1681)和阿享瓦尔(1719~1772)。4.统计按其内容主要包括两个方面:描述统计和()。5.推论统计有两个基本内容:参数估计和()。6.通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为()。样本中所含的单位数,在统计学上称为样本大小,也叫做()。7.总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为()。凡能用数量的多少来表示的标志,称为()。凡不能用数量的多少来表示而只能文字表述的标志,称为()。8.()是反映总体(或样本总体)的数量特征的概念或范畴。9.统计指标和标志的区别与联系在于:统计指标是说明()特征的,标志则是说明()特征的;统计指标的数值是由标志的数值()而成的。10.要了解有个班级学生的学习情况,则总体是(),总体单位是()。11.凡是相邻的两个变量值之间可以连续不断分割的变量,称为()。凡是各变量值之间是以整数断开的变量,称为()。12.大量观察法之所以称为统计上特有的方法,是与()的作用分不开的。13.大数定律的一般意义是:在综合大量社会现象的数量特征时,个别单位偶然的数量差异会(),使大量社会现象的数量特征借助于()形式,接近用确定的数值显示出必然的规律性。二、单项选择1.统计总体同时具备三个特征()。A同质性、大量性、可比性B同质性、大量性、变异性C数量性、具体性、综合性D数量性、具体性、可比性2.政治算术学派的代表人物是()。A康令B威廉·配第C恩格尔D凯特勒78\n3.西方统计学认为近代统计学之父的是()。A威廉·配弟B阿道夫·凯特勒C海尔曼·康令D约翰·格朗特4.要了解400个学生的学习情况,则总体单位是()。A400个学生B每一个学生C400个学生的成绩D每一个学生的成绩5.下列属于品质标志的是()。A职工的年龄B职工的性别C职工的工资D职工的工龄6.下列属于数量标志的是()。A职工的工龄B职工的性别C职工的籍贯D职工的政治面貌7.按变量的连续性,可把变量分为()。A连续变量和随机变量B离散变量和确定性定量C连续变量和离散变量D离散变量和随机变量8.按变量的性质,可把变量分为()。A连续变量和随机变量B离散变量和确定性定量C连续变量和离散变量D确定性变量和随机变量9.抽查5个学生某课程的考试成绩分别是65、76、89、90、98分,这5个数据是()。A变量B标志C指标D标志值10.社会经济统计认识社会经济现象的数量方面,是指()。A可变的不可以统一度量的量B可变的可以统一度量的量C不变的量D不变的可以统一度量的量11.说明总体中单位的属性或数量特征的名称在统计上称为()。A指标B数据C标志D项目12.对某市高等学校的科研所进行调查,则统计总体是()。A某市所有的高等学校B某一高等学校的科研所C某一高等学校D某市所有高等学校的科研所13.健康状况、企业所有制、工资级别可理解为()。A数量标志B品质标志C数量指标D质量指标14.统计一般有三个含义,即()。A统计调查、统计整理、统计分析B统计工作、统计资料、统计学C统计活动、统计管理、统计预测D统计咨询、统计监督、统计信息三、多项选择1.统计总体的基本特征有()。A客观性B数量性C大量性D同质性E差异性2.下列()是质量指标。A职工人数B平均工资C耕地面积D商品价格E劳动生产率3.统计指标是()。A指反映社会总体现象数量特征的概念;78\nB指反映社会经济现象的具体数值;C指反映社会经济现象数量表现的范畴;D指在具体时间、地点、条件下存在的社会总量的数目;E指反映社会经济现象的综合指标。4.下面属于数量标志的有()。A年龄B性别C职业D劳动生产率E体质5.统计指标按其数值的表现形式有()。A总量指标B相对指标C平均指标D变异指标E动态指标6.下列指标中,属于总量指标的有()。A育龄妇女比重B住宅竣工面积C铁路营运里程D森林覆盖率E人均寿命7.下列哪些指标是质量指标()。A实物劳动生产率B产品一等品率C人口密度D产值比上年增长的百分比E产品单位成本8.描述统计与推断统计的关系()。A描述统计是推断统计的发展B推断统计是描述统计的的发展C描述统计是推断统计的前提D推断统计是描述统计的前提E描述统计与推断统计是统计学的两大基本内容四、判断题1.社会统计描述,即通过部分研究对象的统计资料对研究对象的总体的性质进行推论与归纳。()2.所有的统计指标都是变量。()3.统计所研究的对象就是社会经济现象的数量方面。()4.由于统计总体的不确定性,品质标志和质量指标之间存在着变换关系。()5.统计指标就是指反映社会经济现象的数量特征的概念。()6.推论统计需要的统计资料相对而言较少,所以在人力、物力及时间等方面比较经济,研究和应用的范围也拓宽了许多。()7.工人的收入和学生的体重都是确定性变量。()8.经济指标具备反映社会生活状况全貌的能力。()9.随机变量在相同的条件下进行观测,其可能实现的值不止一个。()10.数量指标是由数量标志值汇总而来的,质量指标是由品质标志值汇总来的。()五、名词解释1.社会统计学2.国势学派3.政治算术学派4.数理统计学派5.大量观察法6.大数规律7.描述性统计8.推论性统计9.样本10.标志11.虚拟变量12.指标体系13.总体和总体单位六、问答题78\n1.什么是大量观察法和大数定律?2.狭义的社会统计学与经济统计学是怎样一种关系?3.试述总体的三个基本特征。4.试举例说明现实总体和想象总体。5.分别说明数量标志和品质标志,并举例。6.试述数量指标和质量指标的区别,并举例说明。7.推论统计有哪两个基本内容?8.试述统计指标和标志的联系和区别。9.试述社会统计工作的程序。78\n第二章社会统计资料的搜集第一节调查的方法及种类原始资料与次级资料·静态资料与动态资料·全面调查与非全面调查·经常性调查与一次性调查·问询法与观察法·报告法与实验法·文献法第二节统计调查的组织形式普查·重点调查与典型调查·抽样调查·随机抽样与非随机抽样第三节概念的操作化与测量抽象定义和操作化定义·信度和效度·测量层次(定类测量、定序测量、定距测量、定比测量)社会学研究的科学性第四节统计误差登记性误差与代表性误差·抽样误差·无反应偏差一、填空1.()是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。()是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为();凡某时期内变动累计的资料称为()。3.()调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。4.()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。5.统计误差有()和()两类,其中()在全面调查和非全面调查中都可能发生。6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于()。7.统计调查从调查范围上分,可分为()和()。8.统计调查按调查登记时间是否连续,可分为()和()。9.统计调查从调查目的上,可分为()和专项调查。10.()误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。二、单项选择1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫()。78\nA简单随机抽样B类型抽样C等距抽样D整群抽样。2.搞好重点调查的关键是()。A力求统一要求和统一行动B选择好重点单位C选择最有代表性的单位D遵循随机原则。3.下列资料,属于静态资料的是()。A某厂89年职工工资总额为76万元;B某乡89年粮食总产量为1亿3千万公斤;C某市89年末人口为36.3万人;D某市89年征用土地125亩。4.关于统计调查的组织形式,下面正确的描述有()。A普查是一种专门组织的一次性调查;B满足一定条件,重点调查的结果可以用来推断总体;C抽样调查是一种全面调查;D典型调查是在研究现象的总体中,选择其中的重点单位进行调查。5.应用()方式抽取样本时,必须避免抽样间隔和现象本身的节奏性或循环周期相重合。A随机抽样B系统抽样C整群抽样D分层抽样6.下面能进行除法运算的测量尺度是()。A定比尺度B定类尺度C定距尺度D定序尺度7.教育程度是()的测量。A定比尺度B定类尺度C定距尺度D定序尺度8.智商是()的测量。A定比尺度B定类尺度C定距尺度D定序尺度9.籍贯是()的测量。A定比尺度B定类尺度C定距尺度D定序尺度三、多项选择1.下面属于定类尺度的()。A教育程度B专业C班级D考试分数E性别2.下面属于定序尺度的()。A教育程度B受重视程度C收入D考试分数E性别3.下面属于定距尺度的是()。A智商B温度C班级D收入E籍贯4下面属于定比尺度的是()。A智商B温度C路程D收入E籍贯5.统计测量的层次可以分为()。A定类尺度B定序尺度C定距尺度D定比尺度E定量尺度四、问答题1.何谓抽样调查?抽样调查的优点是什么?2.什么是分层抽样?什么是整群抽样?请从它们各自的适用性来谈谈它们的区别。78\n第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”·频数(或次数)分布数列·品质数列(定类和定序)与变量(定距)数列第二节统计表统计表的格式、内容与种类·统计表的制作规则第三节变量数列的编制离散变量数列与连续变量数列·单项数列与组距数列·组距和组数的确定·等距分组与异距分组·开口组与闭口组·频数密度与标准组距频数·累计频数第四节统计图频数分布曲线(直方图、折线图、曲线图)·累计频数分布曲线·洛仑兹曲线与基尼系数一、填空1.统计表从内容上看,是由()和宾词两部分构成的。2.主词是统计表要说明的();宾词是用来说明主词的()。3.变量数列有两个构成要素()和()。4.基尼系数为(),表示收入绝对不平均;基尼系数为(),表示收入绝对平均。5.统计表通常有一定格式,统计表各部位的名称分别是()、横行标题、纵栏标题、()。6.实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配(),反之,则收入分配()。7.对于连续变量,恰是某一组限的数据应按照()的原则归入相应的组别。8.统计表按主词的分组情况,可分为简单表、简单分组表和()。9.统计分组的关键在于()和划分各组界限。二、单项选择题1.统计表的数字部分中符号“……”代表的含义是(   )。A.某项数字不存在B.缺少某项数字78\nC.某项数字较大D.提醒注意核计2.某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为(   )。A.正偏B.负偏C.对称D.不能作出结论3.上限与下限之差是(   )。A.组限B.组距C.组中值D.极差4.累计频数分布曲线一般都呈(   )。A.钟型曲线B.U型曲线C.J型曲线D.逻辑斯蒂曲线三、多项选择题1.累计频数分布曲线()。A.只有持续增长或持续减少两种形状B.呈对称的钟型C.一般呈S状D.斜率为零处对应于空组E.曲线最高处对应于含有最多单位的间距2.如果某连续变量的数值分布很不均匀,且有极端值出现,则数列应编制( )。A.开口组 B.闭口组C.等距数列 D.异距数列E.单项式数列3.统计表从格式上看,可以分为(   )等部分。A.总标题B.主词C.宾词D.横行、纵栏标题E.指标数值四、判断题1.对于直方图,如果矩形的总面积为1,各矩形的面积必定等于各组的相对频数。()2.洛仑兹曲线一般表现出为一条下凹的曲线,下凹的程度愈大,收入分配愈平均。()3.将收集到得的数据分组,组数越多,丧失的信息越多。()4.离散变量既可编制单项式变量数列,也可编制组距式变量数列。( )五、名词解释1.统计分组2.统计表3.洛仑兹曲线4.基尼系数六、应用题78\n1.指出下表格各部分的名称2002年我国城乡人口情况按城乡分人口数(万人)比重(%)城镇乡村502127824139.0960.91合计128453100.002.将上表画成直方图和折线图3.简述制作表格的注意事项。4.已知某社区50名退休老人的年龄如下:81、56、76、67、79、62、72、61、77、6260、73、65、58、70、60、59、69、58、6880、59、62、59、83、68、63、70、69、5964、75、66、74、65、87、58、81、68、6356、58、77、57、72、65、65、61、73、79试编一频数分布数列(要求:第一组下限取56;组距取4)。5.简述编制离散数列和连续数列组距的不同之处。78\n第四章集中趋势测量法第一节算术平均数简单算术平均数·加权算术平均数·算术平均数的性质第二节中位数对于未分组资料·对于分组资料·四分位数与其他分位数·中位数的性质第三节众数对于未分组资料·对于分组资料·众数的性质第四节几何平均数与调和平均数及其他几何平均数·调和平均数·各种平均数的关系一、填空1.某班级中男生人数所占比重是66.7%,则男生和女生的比例关系是()。2.在频数分布图中,()标示为曲线的最高点所对应的变量值。3.在频数呈偏态分布时,()必居于和M0之中。4.算术平均数、调和平均数、几何平均数又称为()平均数,众数、中位数又称为()平均数,其中()平均数不受极端变量值得影响。5.调和平均数是根据()来计算的,所以又称为()平均数。6.加权算术平均数是以()为权数,加权调和平均数是以()为权数的。7.对于未分组资料,如总体单位数是偶数,则中间位置的两个标志值的算术平均数就是()。二、单项选择1.分析统计资料,可能不存在的平均指标是()。A众数B算术平均数C中位数D几何平均数2.对于同一资料,算术平均数,调和平均数和几何平均数在数量级上一般存在如下关系()。A≥≥B≥≥C≥≥D≥≥3.下面四个平均数中,只有()是位置平均数。A算术平均数B中位数C调和平均数D几何平均数4.从计算方法上看,是()。A算术平均数B调和平均数C中位数D几何平均数78\n5.由右边的变量数列可知:()。完成生产定额数工人数10-2020-3030-4040-5050-603520251015A>;B>;C>30D>306.某车间三个小组,生产同种产品,其劳动生产率某月分别为150,160,165(件/工日),产量分别为4500,4800,5775(件),则该车间平均劳动生产率计算式为()。A(件/工日)B(件/工日)C(件/工日)D(件/工日)7.关于算术平均数的性质,不正确的描述是()。A各变量值对算术平均数的偏差和为零;B算术平均数受抽样变动影响微小;C算术平均数受极端值的影响微小;D各变量值对算术平均数的偏差的平方和,小于它们对任何其它数偏差的平方和。8.N个变量值连乘积的N次方根,即为()。A几何平均数B算术平均数C中位数D调和平均数9.在一个左偏的分布中,小于平均数的数据个数将()。A超过一半B等于一半C不到一半D视情况而定10.分组数据中,若各组变量值都增加2倍,每组次数都减少一半,则其中位数的数值将()。A增加2倍B不变C减少一半D无法判断11.一个右偏的频数分布,一般情况下,下面的()的值最大。A中位数B众数C算术平均数D几何平均数12.对于同一资料,算术平均数,调和平均数和几何平均数在数量级上一般存在()关系。A≥≥B≥≥C≥≥D≥≥13.在社会统计学中,()是反映集中趋势最常用、最基本的平均指标。A中位数B算术平均数C众数D几何平均数78\n14.对于钟型分布,当―Mo>0时为()。A正偏B负偏C正态D不一定三、多项选择1.算术平均数的特点是()。A受抽样变动影响微小;B受极端值影响大;C在频数分布图中,标示为曲线最高点所对应的变量值;D如遇到开口组时,不经特殊处理往往算不出来;E如遇到异距分组时,不经特殊处理往往算不出来。2.中位数是()。A一种根据位置来确定的总体的代表值;B处于任意数列中间位置的那个变量值;C易受极端变量值影响的平均数;D在顺序排列的数列中,在位上的那个变量值;E将总体的变量值均等地分为两部分的那个变量值。3.当遇到分组资料有开口组的情况时,非经特殊处理,下面无法求出的统计指标有()。A算术平均数B几何平均数C中位数D众数E调和平均数4.()可统称为数值平均数A算术平均数B几何平均数C调和平均数D众数E中位数5.几何平均数的计算公式有()ABCDE6.如果变量值中有一项为零,则不能计算()。A算术平均数B几何平均数C中位数D众数E调和平均数四、名词解释1.中位数2.众数3.调和平均数4.几何平均数5.平均指标五、判断题1.无论分布曲线是正偏还是负偏,中位数都居算术平均数和众数之间。()2.各标志值平方和的算术平均数是。()78\n3.中位数是处于任意数列中间位置的那个数。()4.N个变量值连乘积的平方根,即为几何平均数。()5.各变量值的算术平均数的倒数,称调和平均数。()六、计算题1.若一总体为2、3、5,求下列各值:(1)N(2)X1(3)X2(4)X3(5)Xn(6)(7)(8)(9)(10)2.已知某社区50名退休老人的年龄如下:81、56、76、67、79、62、72、61、77、6260、73、65、58、70、60、59、69、58、6880、59、62、59、83、68、63、70、69、5964、75、66、74、65、87、58、81、68、6356、58、77、57、72、65、65、61、73、79①试编一频数分布数列(要求:第一组下限取56;组距取4);②试求该社区退休老人年龄的算术平均数和中位数;③试求该社区退休老人年龄的标准差和标准差系数。3.已知一未分组资料为2、3、5、8、9、12,试求:算术平均数、中位数、众数、调和平均数、几何平均数。4.某街道8户居民在某月的收入分布如下:(单位:元)257,278,305,278,340,413,327,241。求8户居民收入的算术平均数和中位数,并指出众数。5.某工厂50名职工每周工资数分配情况如下表,试求:(1)算术平均;(2)中位数;(3)众数;(4)调和平均数;(5)几何平均数。工资数(元)人数60-62363-651066-682069-711372-744合计5078\n6.对100名吸烟者作调查,每日吸烟量统计如下表:每日吸烟量(支)1~56~1011~1516~2021~2525~3031~35人数918302216311)这是离散变量类型还是连续变量类型;2)求平均每人每日吸烟量;3)指出中位数组和众数组。7.某市场有四种规格的苹果,每斤价格分别为1.40元、1.80元、2.80元和1.50元。试计算:(1)四种苹果各买一斤,平均每斤多少元?(2)四种苹果各买一元,平均每斤多少元?8.求下列数字的算术平均数,中位数和众数。57,66,72,79,79,80,123,130.9.某班学生年龄资料如下:(单位:岁)17,18,16,20,18,17,17,18,24,19,19,18,16,20,19,17,19,16,20,21,17,18,19,16,18,17,18,20,23,21,17,18,22,22,21。要求:按每一岁编制一个变量数列,并计算平均年龄、中位数和众数。10.某社区2口之家有8户,3口之家有25户,4口之家有20户,5口之家有12户,6口之家8户,7口之家3户,8口之家2户。(1)求该社区户均人口;(2)求居民户人口的众数;(3)求居民户人口的中位数。11.某乡某年粮食亩产量资料如下:按亩产量分组(斤)亩数400以下90400-500175500-600740600-700385700以上120合计1510要求:计算该乡的平均亩产量和亩产量的中位数。12.试求下述资料的几何平均数。X(元)30507090110130f(次数)35456313.某乡镇企业30名工人月工资资料如下:(单位:元)78\n206,181,210,191,209,211,207,199,194,191,219,187,218,197,203,206,185,206,201,205,207,221,205,195,206,229,211,201,196,205。(1)请按5组将上面原始数据编制成频数分布表(采用等距分组);(2)计算该厂工人的平均工资(要根据上表来计算);(3)计算该厂工人工资的中位数。14.下面是60个国家中农民家庭百分比的分布,试计算这60个国家农民家庭百分比的算术平均数、中位数组距10~2020~3030~4040~5050~60合计频数7162112460若出现下列情况,请指出算术平均数和中位数所受影响(增大、减少、保持不变)a.最后一组的组距扩大到50~70,各组频数不变。b.每一组的组距增加5%(如变成10~25,25~40,…),各组频数不变。c.各组组距不变,10~20组的频数变为5,20~30组的频数变为18。d.各组组距不变,各组频数加倍。15.根据下表求:(1)中位数;(2)众数;(3)四分位差。作案次数(次)频数f3次或以下45678次或以上57115146987233七、简答题1.算术平均数的性质是什么?2.中位数的性质是什么?3.众数的性质是什么?78\n第五章离中趋势测量法第一节全距与四分位差全矩与全矩的性质·四分位差第二节平均差对于未分组资料·对于分组资料·平均差的性质第三节标准差对于未分组资料·对于分组资料·标准差的性质及方差·标准分(Z分数)第四节相对离势变异系数(全矩系数·平均差系数·标准差系数)·异众比率一、填空1.对收集来的数据,数值最大者和最小者之差叫作(),又称之为()。2.各变量值对其算术平均数(或中位数)离差绝对值的算术平均数,称之为()。3.全距由于没有度量()之间的变异性,所以数据资料的利用率很低。4.用绝对离势除以均值得到的相对指标,即为()。5.所谓(),是指非众数的频数与总体单位数的比值。6.偏斜系数是以标准差为单位的算术平均数与众数的离差,其取值一般在()之间。偏斜系数为0表示(),偏斜系数为或则表示极右或极左偏态。二、单项选择1.下面资料中哪个厂子的平均工资代表性意义最大(),哪个厂子最小()。平均工资(元)职工人数工资标准差(元)A甲厂1083469.80B乙厂9653011.40C丙厂12821012.10D丁厂841759.602.变异指标中,以两数之差为计算基准的是()。A全距B平均差C标准差D方差3.比较两个性质不同的变量数列的平均数的代表性大小,必须计算()。A标准差B平均差C全距D标准差系数4.设有甲乙两个变量数列,甲数列的平均数和标准差分别为20和2.5,乙数列的平均数和标准差分别为50和5.2,这些数据说明()。78\nA甲数列的稳定性高于乙数列B甲数列的稳定性低于乙数列C甲乙两数列的稳定性相同D甲乙两数列的稳定性无法比较5.某企业1994年职工平均工资为5200元,标准差为110元,1998年职工平均工资增长了40%,标准差扩大到150元。职工平均工资的相对变异()。A增大B减小C不变D不能比较三、多项选择1.凡用绝对数来表达的变异指标,统称绝对离势,主要有()。A极差B平均差C四分位差D标准差E标准分2.凡用相对数来表达的变异指标,统称相对离势,主要有()。A标准差B异众比率C标准差系数D平均差系数E偏态系数。3不同总体间的标准差,不能进行简单对比的原因是()。A平均数不一致B总体单位数不一致C标准差不一致D计量单位不一致E离差平方和不一致4.平均差的性质是()。A易受极端值的影响B要采取绝对值进行运算C数据信息利用率很低D以算术平均数为基准求出的平均差,其值最小E受抽样变动影响大。5.若<,>,由此可推断:()。A乙组的代表性好于甲组;B乙组的标志均衡性比甲组好;C甲组的代表性好于乙组;D甲组的标志均衡性比甲组好;E甲组的标志变动度比乙组大。6.下面易受极端值影响的指标有()A平均差B标准差C算术平均数D全距7.比较不同企业的同种产品平均质量水平的稳定性时,可选用()A极差B标准差C平均数D平均计划完成程度E标准差系数8.对比两个计量单位不同的变量数列标志值的离散程度,应使用()A平均数B全距C均方差系数D标准差E平均差系数四、简答题1.Z分数的性质有哪些?2.简述平均差的性质。五、计算题78\n1.某工厂50名职工每周工资数分配情况如下表,试求:1)平均差;2)第1及第3四分位数;工资数(元)人数60-62363-651066-682069-711372-744合计502.已知一数列为2,3,5,7及8,试求其平均差。3.某年级学生一次考试的成绩如下表,求学生成绩分布的全距、标准差系数。成绩(分)50-6060-7070-8080-9090-100学生数(人)1518302064.有一自然数列,,,从中删去一数为5,试求新的数列分布的算术平均数和标准差为多少?5.某车间职工工资分布情况如下表,求该车间职工的平均工资,职工工资的中位数以及标准差。按月工资分组100-120120-140140-160160-180180-200工人人数1518302166.求下列数字的全距、平均差、标准差和标准差系数。26374321587.已知算术平均数等于12,各变量值平方的平均数为169,试问标准差系数为多少?8.根据下表,求四分位差。某少教所少年犯入所前的作案次数作案次数(次)频数f3次或以下45678次或以上5711514698723378\n9.某车间两个小组开展劳动竞赛,每人日产量如下(件):甲组:12,15,17,10,12,20,18,16,19,14乙组:8,16,10,9,24,23,25,10,11,20试计算两组职工平均日产量及其标准差系数。10.某社区2口之家有8户,3口之家有25户,4口之家有20户,5口之家有12户,6口之家8户,7口之家3户,8口之家2户。(1)求居民户人口的标准差;(2)标准差系数。78\n第六章概率与概率分布第一节概率论随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法第二节概率的数学性质概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数一、填空1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设()。2.分布函数和或的关系,就像向上累计频数和频率的关系一样。所不同的是,累计的是()。3.如果A和B(),总合有P(A/B)=P〔B/A〕=0。4.()和()为抽样推断提供了主要理论依据。5.抽样推断中,判断一个样本估计量是否优良的标准是()、()、()。6.抽样设计的主要标准有()和()。7.在抽样中,遵守()是计算抽样误差的先决条件。8.抽样平均误差和总体标志变动的大小成(),与样本容量的平方根成()。如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应()。9.若事件A和事件B不能同时发生,则称A和B是()事件。10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是();在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是()。二、单项选择1.古典概率的特点应为()。A基本事件是有限个,并且是等可能的;78\nB基本事件是无限个,并且是等可能的;C基本事件是有限个,但可以是具有不同的可能性;D基本事件是无限的,但可以是具有不同的可能性。2.随机试验所有可能出现的结果,称为()。A基本事件;B样本;C全部事件;D样本空间。3.以等可能性为基础的概率是()。A古典概率;B经验概率;C试验概率;D主观概率。4.任一随机事件出现的概率为()。A在–1与1之间;B小于0;C不小于1;D在0与1之间。5.若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则=()。A0.8B0.08C0.12D0.24。6.若A与B是任意的两个事件,且P(AB)=P(A)·P(B),则可称事件A与B()。A等价B互不相容C相互独立D相互对立。7.若两个相互独立的随机变量X和Y的标准差分别为6与8,则(X+Y)的标准差为()。A7B10C14D无法计算。8.抽样调查中,无法消除的误差是()。A登记性误差B系统性误差C随机误差D责任心误差9.对于变异数D(X),下面数学表达错误的是()。AD(X)=E(X2)―μ2BD(X)=E[(X―μ)2]CD(X)=E(X2)―[E(X)]2DD(X)=σ10.如果在事件A和事件B存在包含关系AB的同时,又存在两事件的反向包含关系AB,则称事件A与事件B()A相等B互斥C对立D互相独立三、多项选择1.数学期望的基本性质有()AE(c)=cBE(cX)=c2E(X)CE(XY)=E(X)E(Y)DE(XY)=E(X)·E(Y)2.概率密度曲线()。A位于X轴的上方B位于X轴的下方C与X轴之间的面积为0D与X轴之间的面积为178\nE与X轴之间的面积不定。3.重复抽样的特点是()。A每次抽选时,总体单位数始终不变;B每次抽选时,总体单位数逐渐减少;C各单位被抽中的机会在每次抽选中相等;D各单位被抽中的机会在每次抽选中不等;E各次抽选相互独立。4.对于抽样误差,下面正确的说法是()。A抽样误差是随机变量;B抽样平均误差是一系列抽样指标的标准差;C抽样误差是估计值与总体参数之间的最大绝对误差;D抽样误差是违反随机原则而产生的偏差;E抽样平均误差其值越小,表明估计的精度越高。5.关于频率和概率,下面正确的说法是()。A.频率的大小在0与1之间;B.概率的大小在0与1之间;C.就某一随机事件来讲,其发生的频率是唯一的;D.就某一随机事件来讲,其发生的概率是唯一的;E.频率分布有对应的频数分布,概率分布则没有。6.随机试验必须符合以下几个条件()。A.它可以在相同条件下重复进行;B.每次试验只出现这些可能结果中的一个;C.预先要能断定出现哪个结果;D.试验的所有结果事先已知;E.预先要能知道哪个结果出现的概率。四、名词解释1.数学期望2.对立事件3..随机事件4.事件和5.事件积6.互斥事件7.互相独立事件8.先验概率9.经验概率五、判断题1.对于连续型随机变量,讨论某一点取值的概率是没有意义的。()2.把随机现象的全部结果及其概率,或者把随机现象的或几个结果及其概率列举出来,就可以称作概率分布。()3.社会现象是人类有意识参与的后果,这一点只是改变概率的应用条件,并不改变社会现象的随机性质。()4.在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。()5.抽样的随机原则就是指客观现象的随机性。()6.样本均值是总体均值的一个无偏估计量。()7.样本方差是总体方差的一个无偏估计量。()78\n8.样本容量的大小与抽样推断的可信程度成正比。()9.重复抽样的误差一定大于不重复抽样的抽样误差。()10.抽样误差的产生是由于破坏了抽样的随机原则而造成的。()11.当样本容量n无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。()12.所谓抽样分布,就是把具体概率数值赋予样本每个或每组结果的概率分布。()六、计算题1.某系共有学生100名,其中来自广东省的有25名;来自广西省的有10名。问任意抽取一名学生,来自两广的概率是多少?2.为了研究父代文化程度对子代文化程度的影响,某大学统计出学生中,父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%。问学生中任抽一名,其父母有一人具有大学文化程度的概率是多少?3.根据统计结果,男婴出生的概率为;女婴出生的概率为。某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?4.根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4。问现年60岁的人活到70岁的概率是多少?5.根据统计结果,男婴出生的概率为;女婴出生的概率为。某单位有两名孕妇,求这两名孕妇生女婴数的概率分布。6.一家人寿保险公司在投保50万元的保单中,每千名每年由15个理赔,若每一保单每年的运营成本与利润的期望值为200年,试求每一保单的保费。7.位对全单位订报纸情况进行了统计,其中订《人民日报》的有45%,订《扬子晚报》的有60%,两种报纸都订的有30%。试求以下概率:1)只订《人民日报》的;2)至少订以上一种报纸的;3)只订以上一种报纸的;4)以上两种报纸都不订的。8.根据某市职业代际流动的统计,服务性行业的工人代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业的代际向上流动的概率是多少?9.消费者协会在某地对国外旅游动机进行了调查,发现旅游者出于游览名胜的概率为0.219;出于异族文化的吸引占0.509;而两种动机兼而有之的占0.102。问旅游动机为游览名胜或为异族文化吸引的概率是多少?78\n10.根据生命表,年龄为60岁的人,可望活到下年的概率为P=0.95;设某单位年龄为60岁的人共有10人,问:(1)其中有9人活到下年的概率为多少?(2)至少有9人活到下年的概率是多少?11.假定从50个社区的总体中随机抽取一些社区(这些社区的规模和犯罪率之间关系的数据如下表),(1)用不回置抽样得到了一个4个社区的样本,试问其中恰好有一个大社区,一个中社区以及两个小社区的概率是多少?(2)在一个用回置法得到的3个社区的样本中,得到至少一个高犯罪率社区和两个小社区的概率是多少?属性大中小高犯罪率285低犯罪率1641512.已知随机变量x的概率分布如下:X012340.10.20.40.20.1试求:1);2);3)令Y=,求;4);5)。13.A、B、C为三事件,指出以下事件哪些是对立事件:1)A、B、C都发生;2)A、B、C都不发生;3)A、B、C至少有一个发生;4)A、B、C最多有一个发生;5)A、B、C至少有两个发生;6)A、B、C最多有两个发生。14.从户籍卡中任抽1名,设:A=“抽到的是妇女”B=“抽到的受过高等教育”C=“未婚”求:(1)用符号表达“抽到的是受过高等教育的已婚男子”;(2)用文字表达ABC;(3)什么条件下ABC=A。15.1-1000号国库券已到期,须抽签还本付息,求以下事件的概率:(1)抽中701号;(2)抽中532号;(3)抽中小于225号;(4)抽中大于600号;(5)抽中1020号;78\n(6)抽中大于或者等于700号;(7)抽中小于125号或者大于725号;(8)抽中小于50号或者大于700号。16.一个口袋中装有10只球,分别编上号码1,……10,随机地从这个口袋去3只球,试求:(1)最小号码是5的概率;(2)最大号码是5的概率。17.共有5000个同龄人参加人寿保险,设死亡率为0.1%。参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。求保险公司一年内从这些保险的人中,获利不少于30000元的概率。18.在一批10个产品中有4个次品。如果一个接一个地随机抽取两个,下面的每个随机事件的概率是多少?(1)抽中一个是次品,一个是合格品;(2)抽取的两个都是次品;(3)至少有一个次品被选取;(4)抽取两个合格品。七、问答题1.什么是概率?2.何谓先验概率和经验概率,举例说明。3.事件互不相容与相互独立这两个概念有何不同?4.频率分布和概率分布有何区别和联系?八、计算举例1.(1)掷一枚质地均匀的硬币一次,用表示掷得正面的次数,则随机变量的可能取值有哪些?(2)一实验箱中装有标号为1,2,3,3,4的五只白鼠,从中任取一只,记取到的白鼠的标号为,则随机变量的可能取值有哪些?2.从装有6只白球和4只红球的口袋中任取一只球,用表示“取到的白球个数”,即求随机变量的概率分布。3.某班有学生45人,其中型血的有10人,型血的有12人,型血的有8人,型血的有15人,现抽1人,其血型为随机变量,求的概率分布。4.写出下列随机变量可能取的值,并说明随机变量所取的值表示的随机试验的结果。①一袋中装有5只同样大小的白球,编号为1,2,3,4,5.现从该袋内随机取出3只球,被取出的球的最大号码数为;78\n②盒中有6支白粉笔和8支红粉笔,从中任意取3支,其中所含白粉笔的支数;③从4张已编号(1号~4号)的卡片中任意取出2张,被取出的卡片编号数之和。5.袋内有5个白球,6个红球,从中摸出两球,记。求的概率分布。6.同时掷两颗质地均匀的骰子,观察朝上一面出现的点数,求两颗骰子中出现的最大点数的概率分布,并求大于2小于5的概率。7.同时掷两颗质地均匀的骰子,观察朝上一面出现的点数,求两颗骰子中出现最小点数的概率分布。8.从装有6个白球、4个黑球和2个黄球的箱中随机地取出两个球,规定每取出一个黑球赢2元,而每取出一个白球输1元,取出黄球无输赢,以表示赢得的钱数,随机变量可以取哪些值呢?求的概率分布。9.袋中装有黑球和白球共7个,从中任取2个球都是白球的概率为,现在甲、乙两人从袋中轮流摸取1球,甲先取,乙后取,然后甲再取……取后不放回,直到两人中有一人取到白球时即止,每个球在每一次被取出的机会是等可能的,用表示取球终止时所需要的取球次数。(1)求袋中原有白球的个数;(2)求随机变量的概率分布;(3)求甲取到白球的概率.10.某同学参加科普知识竞赛,需回答三个问题.竞赛规则规定:每题回答正确得100分,回答不正确得-100分,假设这名同学每题回答正确的概率均为0.8,且各题回答正确与否相互之间没有影响。(1)求这名同学回答这三个问题的总得分的概率分布和数学期望;(2)求这名同学总得分不为负分(即≥0)的概率。11.从一副洗得很好的扑克牌中做了3次抽取,假定使用回置法,求至少得到1张A和1张K的概率是多少?12.假如对1000个大学生进行歌曲欣赏调查,发现其中有500个学生喜欢民族歌曲,400个学生喜欢流行歌曲,而这些学生中有100人属于既喜欢民族歌曲又喜欢流行歌曲的,剩下来的学生两歌曲都不喜欢。如果我们随机地从该总体中抽取一个学生,并设事件A为该学生喜欢民族歌曲,事件B为该学生喜欢流行歌曲,试解决下列问题:①用数字证明P(A且B)=P(A)P(B/A)=P(B)P(A/B)。78\n②得到一个喜欢两种风格歌曲之一的学生的概率是多少?③随机地选取一个由3个学生组成的样本,要求这三个学生全都有相同的欣赏方式,得到这种样本的概率是多少?④做一个一枚硬币独立78\n第七章假设检验第一节二项分布二项分布的数学形式·二项分布的性质第二节统计检验的基本步骤建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法第四节中心极限定理抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理第五节总体均值和成数的单样本检验已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验一、填空1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于()分布。2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的(),它决定了否定域的大小。3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(),原假设为真而被拒绝的概率越()。4.二项分布的正态近似法,即以将B(x;n,p)视为()查表进行计算。5.已知连续型随机变量~(0,1),若概率P{≥}=0.10,则常数=()。6.已知连续型随机变量~(2,9),函数值,则概率=()。二、单项选择1.关于学生t分布,下面哪种说法不正确()。A要求随机样本B适用于任何形式的总体分布C可用于小样本D可用样本标准差S代替总体标准差2.二项分布的数学期望为()。An(1-n)pBnp(1-p)CnpDn(1-p)。78\n3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为()。A大于0.5B-0.5C1D0.5。4.假设检验的基本思想可用()来解释。A中心极限定理B置信区间C小概率事件D正态分布的性质5.成数与成数方差的关系是()。A成数的数值越接近0,成数的方差越大B成数的数值越接近0.3,成数的方差越大C成数的数值越接近1,成数的方差越大D成数的数值越接近0.5,成数的方差越大6.在统计检验中,那些不大可能的结果称为()。如果这类结果真的发生了,我们将否定假设。A检验统计量B显著性水平C零假设D否定域7.对于大样本双侧检验,如果根据显著性水平查正态分布表得Zα/2=1.96,则当零假设被否定时,犯第一类错误的概率是()。A20%B10%C5%D.1%8.关于二项分布,下面不正确的描述是()。A它为连续型随机变量的分布;B它的图形当p=0.5时是对称的,当p≠0.5时是非对称的,而当n愈大时非对称性愈不明显;C二项分布的数学期望==,变异数==;D二项分布只受成功事件概率p和试验次数n两个参数变化的影响。9.事件A在一次试验中发生的概率为,则在3次独立重复试验中,事件A恰好发生2次的概率为()。ABCD10.设离散型随机变量~,若数学期望,方差,则参数的值为().A,=0.6B,=0.4C,=0.3D,=0.2三、多项选择1.关于正态分布的性质,下面正确的说法是()。A正态曲线以呈钟形对称,其均值、中位数和众数三者必定相等。78\nB对于固定的值,不同均值的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置。C对于固定的值,不同均值的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置。D对于固定的值,值越大,正态曲线越陡峭。2.下列概率论定理中,两个最为重要,也是统计推断的数理基础的是()A加法定理B乘法定理C大数定律D中心极限定理E贝叶斯定理。3.统计推断的具体内容很广泛,归纳起来,主要是()问题。A抽样分布B参数估计C方差分析D回归分析E假设检验4.下列关于假设检验的陈述正确的是()。A假设检验实质上是对原假设进行检验;B假设检验实质上是对备择假设进行检验;C当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误;D假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确;E当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确5.选择一个合适的检验统计量是假设检验中必不可少的一个步骤,其中“合适”实质上是指()A选择的检验统计量应与原假设有关;B选择的检验统计量应与备择假设有关;C在原假设为真时,所选的检验统计量的抽样分布已知;D在备择假设为真时,所选的检验统计量的抽样分布已知;E所选的检验统计量的抽样分布已知,不含未知参数。6.关于t检验,下面正确的说法是()。At检验实际是解决大样本均值的检验问题;Bt检验实际是解决小样本均值的检验问题;Ct检验适用于任何总体分布;Dt检验对正态总体适用;Et检验要求总体的已知。四、名词解释1.零假设2.第一类错误3.第二类错误4.显著性水平5.总体参数6.检验统计量7.中心极限定理五、判断题1.在同样的显著性水平的条件下,单侧检验较之双侧检验,78\n可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。()2.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。()3.检验的显著性水平(用表示)被定义为能允许犯第一类错误的概率,它决定了否定域的大小。()4.第一类错误是,零假设H0实际上是错的,却没有被否定。第二类错误则是,零假设H0实际上是正确的,却被否定了。()5.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合适。()六、计算题1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人;其百分数为多少?2.共有5000个同龄人参加人寿保险,设死亡率为0.1%。参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。求保险公司一年内从这些保险的人中,获利不少于30000元的概率。3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有:问能否证明统计报表中人均收入μ=880元是正确的(显著性水平α=0.05)。4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:(岁),(岁)。问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05)7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩电的拥有率为62%。问能否认为彩电拥有率有所增长?(α=0.05)8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。但有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平0.05,请指出否定域。9.孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的,子二代豌豆中,红花对白花之比为3:1。某次种植试验的结果为:红花豌豆352株,白花豌豆96株。试在=0.05的显著性水平上,检定孟德尔定律。78\n10.一个样本容量为50的样本,具有均值10.6和标准差2.2,要求:(1)请用单侧检验,显著性水平0.05检验总体均值为10.0的假设;(2)请用双侧检验,显著性水平0.05检验总体均值为10.0的假设;(3)请比较上述单、双侧检验犯第一类错误和犯第二类错误的情况。11.设要评价某重点中学教学质量情况,原计划升学率为60%,在高校录取工作结束后,现在一个由81个学生组成的随机样本中,发现升学率55%,用显著性水平为0.02,你能否就此得出该校的工作没有达到预期要求的结论。为什么?12.在重复抛掷一枚硬币49次的二项试验中,试求成功29次的概率?13.某市2003年居民的户均收入是3500元,为了了解该市居民2004年的收入情况,有关调查部门作了一个共100户的收入情况的抽样调查,样本户均月收入为3525,标准差为100元。据此,你有多大把握说该市居民户均收入是增加了。14.某单位共有5名孕妇,求以下概率(设婴儿性别男为22/43,21/43):(1)全为男婴;(2)全为女婴;(3)3男2女。15.某地区回族占全体居民人数的6%,今随机抽取10位居民,问其中恰有2名是回族的概率是多少?16.工人中吸烟的比例为0.5%。某车间有工人300名,求以下概率:(1)全部吸烟;(2)2人吸烟;(3)100人吸烟;(4)160人吸烟。17.某工厂总体的10%是技术人员,求7人委员会中4人是技术员的概率,并指出检验所需的假设。18.设某股民在股票交易中,每次判断正确的概率是60%。该股民最近作了100次交易。试求至少有50次判断正确的概率。19.某市去年的数字显示:进城农民工参加社保的比例是30%。今年在进城农民工中随机抽取400人进行调查,经计算得该样本总体的参保率为33%,试在=0.05的显著性水平上,检定“今年该市农民工参保情况有了改进”的零假设。20.根据调查,儿童的智商分布为N(100,102),某幼儿园共有儿童250名,问智商在110~120之间的儿童共有多少名?21.根据调查,女大学生的身高分布为N(163,62),某大学共有女大学生1500名,问身高在164~168厘米之间的女大学生共有多少名?22.已知连续型随机变量~(0,1),求(1)概率{=1};(2)概率{0<<3};(3)概率{<-1.5;(4)概率{>1.2};78\n(5)概率{≤1};(6)概率{≥3}.23.某批袋装大米重量kg是一个连续型随机变量,它服从参数为的正态分布,任选1袋大米,求这袋大米重量9.9kg~10.2kg之间的概率.24.某批螺栓直径cm是一个连续型随机变量,它服从均值为0.8cm、方差为0.0004cm的正态分布,随机抽取1个螺栓,求这个螺栓直径小于0.81cm概率.25.某省文凭考试高等数学成绩分是一个离散型随机变量,近似认为连续型随机变量,它服从正态分布(58,10),规定考试成绩达到或超过60分为合格,求:(1)任取1份高等数学试卷成绩为合格的概率;(2)任取3份高等数学试卷中恰好有2份试卷成绩为合格的概率.26.已知连续型随机变量~(3,4),求:(1)概率;(2)概率{>3.92};(3)数学期望(-+5);(4)方差(-+5)。七、问答题1.简述中心极限定理。2.试述正态分布的性质与特点。78\n第八章常用统计分布第一节超几何分布超几何分布的数学形式·超几何分布的数学期望和方差·超几何分布的近似第二节泊松分布泊松分布的数学形式·泊松分布的性质、数学期望和方差·泊松分布的近似第三节卡方分布(分布)分布的数学形式·分布的性质、数学期望和方差·样本方差的抽样分布第四节F分布F分布的数学形式·F分布的性质、数学期望和方差·F分布的近似一、填空1.对于超几何分布,随着群体的规模逐渐增大,一般当≤()时,可采用二项分布来近似。2.泊松分布只有一个参数(),只要知道了这个参数的值,泊松分布就确定了。3.卡方分布是一种()型随机变量的概率分布,它是由()分布派生出来的。4.如果第一自由度或第二自由度的F分布没有列在表中,但邻近的第一自由度或第二自由度的F分布已列在表中,对于Fα(,)的值可以用()插值法得到。5.()分布具有一定程度的反对称性。6.()分布主要用于列联表的检验。7.()分布用于解决连续体中的孤立事件。8.分布的图形随着自由度的增加而渐趋()。9.当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时()可采用二项分布来近似。10.()事件是满足泊松分布的。二、单项选择1.已知离散性随机变量x服从参数为λ=2的泊松分布,则概率P(3;λ)=()。A4/3e2B3/3e2C4/3e3D3/3e378\n2.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时,()分布可以用二项分布来近似。At分布BF分布C分布D超几何分布3.研究连续体中的孤立事件发生次数的分布,如某时间段内电话机被呼叫的次数的概率分布,应选择()。A二项分布B超几何分布C泊松分布DF分布4.对于一个样本容量n较大及成功事件概率p较小的二项分布,都可以用()来近似。A二项分布B超几何分布C泊松分布DF分布。5.与Fα(,)的值等价的是()。AF1-α(,)BF1-α(,)C1/Fα(,)D1/F1-α(,)6、只与一个自由度有关的是()A分布B超几何分布C泊松分布DF分布三、多项选择1.属于离散性变量概率分布的是()。A二项分布B超几何分布C泊松分布DF分布2.属于连续性变量的概率分布的是()。A分布B超几何分布C泊松分布DF分布3.下列近似计算概率的正确方法是()。A用二项分布的概率近似计算超几何分布的概率B用二项分布的概率近似计算泊松分布的概率C用泊松分布的概率近似计算超二项分布的概率D用正态分布的概率近似计算超二项分布的概率E用正态分布的概率近似计算F分布的概率4.分布具有的性质是()。A恒为正值B非对称性C反对称性D随机变量非负性E可加性5.F分布具有的性质是()。A恒为正值B非对称性C反对称性D随机变量非负性E可加性6.一般地,用泊松分布近似二项式分布有较好的效果是()。An/N≤0.1Bn≥1078\nCp≤0.1Dk≥30Ek2>2四、名词解释1.超几何分布2.泊松分布3.卡方分布4.F分布五、判断题1.在研究对象为小群体时,二项式分布和超几何分布的基本条件都能得到满足。()2.成功次数的期望值λ是决定泊松分布的关键因素。()3.泊松分布的数学期望和方差是相等的。()4.在计算F分布的概率时,只需要知道分子的自由度和分母的自由度两个因素就可以了。()5.k个独立标准正态变量的平方和被定义为卡方分布。()6.卡方分布的随机变量是若干个独立标准正态变量的平方和。()7.相互独立的两个卡方变量与其自由度的商的比值为F分布的变量。()8.当群体规模逐渐增大,以致不回置抽样可以作为回置抽样来处理,这时泊松分布可采用二项分布来近似。()9.泊松分布用于解决连续体中的孤立事件。()10.F分布具有一定程度的反对称性。()六、计算题1.某社区要选派8名积极申请参加公益活动的居民从事一项宣传活动。申请者为12名女性居民和8名男性居民。社区宣传活动的组织者把他们的名字完全混合后放在一个盒子里,并从中抽取8个。试问,抽出4名女性居民的概率是多少?2.有16名二年级学生和14名三年级学生选修了社区管理课。假设所有学生都会来教室上课,而且是随机进入教室的。试问,当一名学生进入教室时,恰逢已在教室就坐的5位都是三年级的概率是多少?3.某区进行卫生大检查,现对区内全部40个单位进行卫生合格验收。检查团随机抽查4个单位,只要有1个单位不合格就取消该区的卫生评先资格。如果该区确有10%的单位卫生不合格,试问:(1)抽查的4个单位中有1个单位是不合格单位的概率是多少?(2)经抽查,该区没被取消评先资格的概率是多少?(3)计算分布的期望值和方差。4.设在填写选民证时,1000个选民证中共有300个错字被发现。问在一张选民证上有一个错字的概率是多少?78\n5.某社区对失业者进行某项培训,参加培训的共有100人。根据以前的培训经验,项目负责人估计有4%的培训者不能掌握这门技术。问在参加培训的100名失业者中至少有5人为未掌握这项技术的概率是多少?6.每小时有30个老人穿过一条人行道。在5分钟内,没有老人穿过该人行道的概率是多少?7.从一正态总体中抽出一个容量为20的样本。已知总体的方差为5。求样本的方差在3.5到7.5之间的概率。8.查表求F0.95(15,7)的值。9.已知Z0.1=1.64。求(1)的值。10.已知F0。01(120.12)=1.88,F0。01(∞,12)=1.85。求F0。01(150.12)的值。11.一页书上印刷错误的个数是一个离散型随机变量,它服从参数为(>0)的泊松分布,一本书共400页,有20个印刷错误,求:(l)任取l页书上没有印刷错误的概率;(2)任取4页书上都没有印刷错误的概率.12.某种产品表面上疵点的个数是一个离散型随机变量,它服从参数为=的泊松分布,规定表面上疵点的个数不超过2个为合格品,求产品的合格率。13.每10分钟内电话交换台收到呼唤的次数是一个离散型随机变量,它从参数为(>0)的泊松分布,已知每10分钟内收到3次呼唤与收到4次呼唤的可能性相同,求:(1)平均每10分钟内电话交换台收到呼唤的次数;(2)任意10分钟内电话交换台收到2次呼唤的概率.14.设离散型随机变量服从参数为(>0)的泊松分布,且已知概率=,求:(l)参数值;(2)概率{1<≤3};(3)数学期望;(4)方差.七、问答题1.简述卡方分布的性质。2.简述F分布的性质。78\n第九章参数估计第一节点估计点估计的概念·总体参数合理估计的标准(无偏性、一致性、有效性)第二节区间估计抽样估计的精确性和可靠性·抽样平均误差与概率度·区间估计的步骤及大样本总体均值的区间估计第三节其他类型的置信区间σ未知,小样本总体均值的区间估计·总体成数的区间估计·总体方差的区间估计第四节抽样平均误差简单随机抽样的抽样平均误差·分层抽样的抽样平均误差·整群抽样的平均抽样误差·系统抽样的抽样平均误差第五节样本容量的确定影响样本容量的因素·抽样条件与样本容量的确定一、填空1.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和()。2.对总体均值求置信区间的方法是:从()起向两侧展开一定倍数()的抽样平均误差(),并估计很可能就包含在这个区间之内。3.假设在某省抽样调查的1600名城镇待业人员中有1024名青年,则待业人员中青年占比重的0.95置信区间为()。4.在其他条件不变得情况下,如果允许误差缩小为原来的1/2,则样本容量将增加为原来的()。二、单项选择1.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是()估计。A有效B一致C无偏D精确2.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个()的估计量。A有效B一致C无偏D精确3.估计量的()指统计量的抽样分布集中在真实参数周围的程度。A有效性B一致性C无偏性D精确性78\n4.用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大到原来的()。A2倍B3倍C4倍D5倍5.除抽样误差外,影响允许误差大小的因素还有()。A总体标准差B样本标准差C推断估计的把握程度D随机因素。6.在用样本指标推断总体指标时,把握程度越高则()。A误差范围越小B误差范围越大C抽样平均误差越小D抽样平均误差越大三、多项选择1.在统计中,为了确定每一种估计究竟如何,就必须掌握以下标准()。A无偏性B精确性C一致性D有效性E权变性2.对于大样本,置信区间的大小主要由()这两个量所决定。ABCDE(X)3.影响抽样误差的因素有()。A总体标志变异程度B样本标志值的大小C样本容量D抽样方法E抽样方式4.影响样本容量大小的因素有()。A总体标准差大小B允许误差的大小C置信度D抽样方法E抽样方式5.在其他条件不变的情况下,抽样极限误差的大小与置信度的关系是()。A抽样极限误差范围越大,置信度越大B成正比关系C抽样极限误差范围越小,置信度越小D成反比关系E抽样极限误差范围越大,置信度越小6.分层抽样误差的大小主要取决于()。A总体标志值的变异程度B各层内标志值的变异程度C各层间标志值得变异程度D各层样本容量的大小E各层样本容量的分配方法7.在概率度一定的条件下,()。A置信区间越大,应抽取的单位数越多B置信区间越小,应抽取的单位数越多C抽样估计的效度要求越高,应抽取的单位数越少D抽样估计的效度要求越低,应抽取的单位数越少E应抽取的单位数也是确定的四、名词解释1.点估计2.区间估计3.置信区间78\n五、判断题1.就参数估计而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。()2.抽样平均误差可以认为是决定区间估计信度的关键因素。()3.进行区间估计,置信水平总是预先给定的。()4.在参数估计中,概率度的大小由显著性水平所决定,它可以认为是决定区间估计信度的关键因素。()5.可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-)”。()六、计算题1.已知初婚年龄服从正态分布,根据21个人的抽样调查有:(岁),(岁),求置信水平为95%的初婚年龄的置信区间。(已知t0。05(21)=1.721、t0。05(20)=1.725、t0。025(21)=2.080、t0,025(20)=2.086)。2.某工厂妇女从事家务劳动时间服从正态分布N(,)。根据36人的随机抽样调查,每天平均从事家务劳动时间为:=2.65小时。求的双侧置信区间(置信度取0.95和0.99两种)。3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P的置信区间(置信度为0.95)。4.某工厂根据200名青年职工的抽样调查,得知其中有60%参加各种形式的业余学习。求青年职工参加业余学习成数的区间估计。(置信水平取0.90)5.电视台要调查电视观众收看电视剧《渴望》的收视率。问在95%的置信度下,允许误差,问样本容量需要多大才能最大限度地满足调查要求?6.某企业有职工1385人,现从中随机抽出50人调查其工资收入情况如下:月收入(元)220285310330375405440495530工人数(人)4668107432试以0.95的置信度估计该企业职工的月平均工资收入所在范围。7.某食品公司所生产的牛肉干中,随机抽7盒,称得各盒重量如下:9.6、10.2、9.8、10.0、10.4、9.8、10.2。如牛肉干盒重量近似于正态分布,求置信水平为95%的情况下,牛肉干盒平均重量的置信区间是多少?8.从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。78\n9.如果认为该市农民工参保率是35%,若要求在95%的置信水平上保证这一比例的估计误差不超过6%,试问调查的样本容量应该有多大?10.若某一居民小区中住房拥有者的比例近似0.75,那么建立总宽度为0.03的95%的置信区间,需要多大样本?若住房拥有者的比例改为0.5,那么建立总宽度为0.03的95%的置信区间,又需要多大样本?11.已知总体服从正态分布(100,3),,,…是正态总体的样本,为样本均值,若概率{≤101}≥0.95,问样本容量至少应取多大?七、问答题1.简述统计量成为总体参数的合理估计的三个标准。2.简述在参数估计中准确性和可靠性的辨正统一的关系。78\n第十章双样本假设检验及区间估计第一节两总体大样本假设检验两总体大样本均值差的检验·两总体大样本成数差的检验第二节两总体小样本假设检验两总体小样本均值差的检验·两总体小样本方差比的检验第三节配对样本的假设检验单一试验组的假设检验·一试验组与一控制组的假设检验·对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对双样本均数差的区间估计·σ12和σ22未知,对对双样本均值差的区间估计·大样本成数差的区间估计·配对样本均值差的区间信计一、填空1.所谓独立样本,是指双样本是在两个总体中相互()地抽取的。2.如果从N(μ1,σ12)和N(μ2,σ22)两个总体中分别抽取容量为n1和n2的独立随机样本,那么两个样本的均值差(―)的抽样分布就是N()。3.两个成数的差可以被看作两个()差的特例来处理。4.配对样本,是两个样本的单位两两匹配成对,它实际上只能算作()样本,也称关联样本。5.配对样本均值差的区间估计实质上是()的单样本区间估计6.当n1和n2逐渐变大时,(―)的抽样分布将接近()分布。7.使用配对样本相当于减小了()的样本容量。8.在配对过程中,最好用()的方式决定“对”中的哪一个归入实验组,哪一个归入控制组。9.单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于()。10.方差比检验,无论是单侧检验还是双侧检验,F的临界值都只在()侧。二、单项选择1.抽自两个独立正态总体样本均值差(―)的抽样分布是()。AN(μ1―μ2,―)BN(μ1―μ2,+)78\nCN(μ1+μ2,―)DN(μ1+μ2,+)2.两个大样本成数之差的分布是()。AN(-,―)BN(-,+)CN(+,―)DN(+,+)3.为了检验两个总体的方差是否相等,所使用的变量抽样分布是()。AF分布BZ分布Ct分布D分布4.配对小样本的均值的抽样分布是()。AZ分布B自由度为n的t分布C自由度为(n—1)的t分布D自由度为(n—1)的分布5.若零假设中两总体成数的关系为p1=p2,这时两总体可看作成数p相同的总体,它们的点估计值是()。Ap1+p2Bp1p2Cp1-p2D6.在σ12和σ22未知,但可假定它们相等的情况下,σ的无偏估计量是()。AB•CD三、多项选择1.两个成数之差的假设检验所使用的测量尺度包括()。A定类尺度B定序尺度C定距尺度D定比尺度2.在单一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法包括()。A前测B试验刺激C中测D计算试验效应E后侧3.下列关于配对样本假设检验的陈述正确的是()。A78\n两个样本在其他方面相同,经检验后测不同于前测的变化,是由于实验刺激所造成。B对于“前—后”对比型配对样本的假设检验,是用均值差检验的。C单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于实验刺激D配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来E否定零假设,即说明该实验刺激有效4.下列关于配对的陈述正确的是()。A配对的目的在于减小无关变量引起的差异B使用配对样本相当于减小了一半样本容量C与损失的样本容量比较,Sd减小得更多D在配对过程中,最好用掷硬币的方式决定“对”中的哪一个归入实验组,哪一个归入控制组E对许多未知的变量,依赖于匹配过程“对”的内随机化,期望未被控制的变量的作用被中和。5.对于大样本,σ12和σ22未知,对均数和的估计区间是()。A上限(+)―Zα/2B下限(+)+Zα/2C上限(+)―tα/2(n1+n2―2)D下限(+)+tα/2(n1+n2―2)E[(―)―tα/2(n1+n2―2),(―)+tα/2(n1+n2―2)]6.进行方差比检验时,()。A计算F值时,、大者在分母上B计算F值时,、小者在分母上C双侧检验,F的临界值在右侧D单侧检验,F的临界值在左侧E单侧检验,F的临界值在右侧四、名词解释1.独立双样本2.配对样本3.单一试验组的试验4.一试验组与一控制组的试验78\n五、判断题1.均值差的抽样误差比各个均值的抽样误差大,是因为它多了一个误差来源。()2.对于小样本,σ12和σ22未知,两样本均值差的抽样服从Z分布。()3.匹配的目的就在于尽可能对实验变量以外的其他独立变量进行控制。()4.σ12和σ22未知时,可以利用样本的信息检验他们是否可能相等。()5.把和中的较大者放在分子上,那么无论是单侧检验还是双侧检验,F的临界值都只在右侧,这样就可以统一使用右侧检验的方法得出检验的结论。()6.两个样本在其他方面相同,经检验后测不同于前测的变化,是由于实验刺激所造成。()7.配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来。()8.两个成数的差的检验适用于各种量度层次的数据。()9.配对样本均值差的区间估计是两个的单样本区间估计。()10.配对样本是由两个样本中的个体按序组合而成的。()六、计算题1.独立随机样本取自均值未知,标准差已知的两个正态总体。如果第一个总体的标准差为0.73,抽出的样本容量为25,样本均值为6.9;第二个总体的标准差为0.89,抽出的样本容量为20,样本均值为6.7。试问,两个总体的均值是否显著相等(α=0.05)?2.对两所学校学生组织的社会活动获奖情况进行调查,发现甲校共组织60次,有18次获奖;乙校共组织40次,有14次获奖。据此,能否认为乙校获奖次数的比例高于甲校(α=0.05)?3.为研究睡眠对记忆的影响,在两种条件下对人群进行了试验。(1)在早7点放电影,被测者晚上睡眠正常,第二天晚上就电影的50项内容进行测试;(2)在早7点放电影,被测者白天情况正常,同一天晚7点就电影的50项内容进行测试。样本是独立的,每组人数15人,测试结果为:=37.2个正确,S1=3.33,n1=15;=35.6个正确,S2=3.24,n2=15。假定两种条件下总体均服从正态分布,且方差相等,是否认为睡眠对记忆有显著影响(α=0.05)?4.某公司调查了甲居民区的网民(21户)和乙居民区的网民(16户)的平均上网小时数。对这两个独立样本得到的数据是:=16.5小时,S1=3.7小时;=19.5小时,S2=4.5小时。要求(α=0.10):(1)两个居民区网民每天上网时间的方差是否相等?78\n(2)是否认为甲居民区的网民(21户)比乙居民区的网民(16户)的平均上网小时数少。5.某项研究对10名高血压患者进行心理治疗。下表中给出了每人在治疗前后的血压数量,试判断这种疗效是否显著(α=0.01)?患者序号起始血压(mmHg)疗后血压(mmHg)123456789101411691581801471601751631481631421651501761431571701571431626.一个研究小组想知道城市家庭和农村家庭每月购物次数是否不同。假定两个总体的购物次数服从正态分布,调查员选取了城市家庭(=8.6次/月,σ1=2.3次/月,n1=50)和农村家庭(=7.4次/月,σ2=2.8次/月,n2=50)的独立样本。试求城市家庭每月购物次数和农村家庭每月购物次数之差的置信区间(α=0.05)。7.对某工段8名工人进行的技能培训前后的产量数据如下表所示工人甲乙丙丁戊己庚辛培训后培训前86875693849375798087589177827466试问此项培训是否有效?(α=0.05)8.在第1题中,试求两个总体均值之差的范围(α=0.05)。9.在第3题中,试求μ1―μ2的95%的置信区间。10.在第4题中,试求μ1―μ2的95%的置信区间。11.在第5题中,试求μd的95%的置信区间。12.在第6题中,试以95%的置信水平检验城市家庭是否显著地多于农村家庭每月购物次数?78\n13.在第7题中,试求μd的95%的置信区间。14.为了了解居民对银行加息的看法。对200名城市居民的抽样调查,有90人赞成;对200名农村居民年的抽样调查,有126人反对。问城市居民和农村居民对加息赞成的比例是否存在显著差异?七、问答题1、什么是配对样本?配对的目的是什么?2、简述配对样本的一试验组与一控制组的实验设计中消除额外变量影响的基本方法。78\n第十一章非参数检验第一节符号检验符号检验的方法·符号检验的特点和作用第二节配对符号秩检验配对符号秩检验的方法·配对符号秩检验的效力第三节秩和检验秩和检验的方法·秩和检验的近似第四节游程检验游程的概念·游程检验的方法·差符号游程检验第五节累计频数检验累计频数检验的方法·累计频数检验的应用一、填空1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。2.符号检验的零假设就是配对观察结果的差平均起来等于()。3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。4.秩和检验检验统计量U是U1和U2中较()的一个。5.秩尺度之统计量的均值和标准差只取决于()。6.()常被用作经验分布与理论分布的比较。7.绝对值相等的值,应将它们的秩()。8.符号检验,在分布自由检验中称为()。9.符号检验和配对符号秩检验,都只适用于()样本。10.数据序列ABBABAAABABBABBAAAAAB的总游程数是()二、单项选择1.下列检验中,不属于非参数统计的方法的是()。A总体是否服从正态分布B总体的方差是否为某一个值C样本的取得是否具有随机性D两组随机变量之间是否相互独立2.下列情况中,最适合非参数统计的方法是()。A反映两个大学新生成绩的差别B反映两个大学新生家庭人均收入的差别C反映两个大学三年级学生对就业前景的看法差别D反映两个大学在校生消费水平的差别3.不属于非参数检验的是()。A符号检验B游程检验C累计频数检验DF检验78\n4.在累计频数检验中,卡方的自由度为()。An1B2Cn2Dn1+n25.配对符号秩检验的效力()。A小于符号检验B大于t检验C介于符号检验与t检验之间D无法与符号检验及t检验比较6.如果我们说非参数检验的效力是80%,下列哪种解释正确。()。A如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要80个数据;B如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要80个数据;C如果用参数检验需要100个数据,那么在同等的检验效力下,非参数检验只要20个数据;D如果用非参数检验需要100个数据,那么在同等的检验效力下,参数检验只要20个数据;7.对于秩和检验,U1、U2和n1、n2的关系是()。AU1+U2=n1+n2BU1U2=n1n2CU1/U2=n1/n2DU1U2=n1+n28.对于累计频数检验,所使用统计量D的正确确定方法是()。A∑()B∏()Cmax()Dmin()9.配对符号秩检验中,用正态近似法的条件是()。An>10Bn>20Cn>25Dn>4010.游程秩检验中,用正态近似法的条件是()。An1>10,n2>10Bn1>20,n2>20Cn1>25,n2>25Dn1>40,n2>4011.设从两个未知的总体1和总体2中分别独立、随机地各抽取1个样本,样本1的容量为n1,样本2的容量为n2,进行秩和检验的检验统计量为()。AU1=n1n2+―R1BU2=n1n2+―R2CU=U1+U2=n1n2DU=min(U1,U2)EU=max(U1,U2)12.非参数检验又称为自由分布检验、无分布检验是指()。A总体真的无分布B总体分布事先不知道,也无法研究C总体分布事先不知道,但可以研究78\nD事先对总体分布已知13.字符串“ABBAAABBABBBBAAA”的游程总数是()。A4B3C7D16E5三、多项选择1.在非参数检验中,可以用正态近似法的是()。A符号检验B配对符号检验C秩和检验D游程检验E累计频数检验2.我们期望采用非参数检验代替均值差检验的情况是()。A没有根据采用定距尺度,但可以安排数据的秩;B数据不具备定距尺度的特征,但可以安排数据的秩;C样本小,且不能假定具有正态分布;D样本虽小,但能假定具有正态分布;E定距尺度的数据,且是大样本。3.下列能用于配对样本检验的有()。A符号检验Bt检验C配对符号秩检验D秩和检验E游程检验4.下列能用于独立样本检验的有()。A符号检验B累计频数检验C配对符号秩检验D秩和检验E游程检验5.非参数检验与参数检验的主要区别是()。A无需知道总体参数;B无需估计总体参数;C无需设定总体为何分布;D数据必须是定比或定距;E数据可以是定比、定距、定序或定类6.下列可以作为符号检验的原假设有()。A两个样本之间没有显著差异B两个样本之间具有显著差异Cp=0Dp=0.5Ep=17.下面正确的说法是()。A在累计频数检验中用卡方近似计算方法实际上更趋于保守78\nB秩和检验中如果同数值的数目很大,应该用累计频数检验代替秩和检验C秩和检验中如果同数值的数目较小,Z计算式要加以修正D配对符号秩检验时,如果同数值的数目很大,不能用正态近似法E绝对值相等的值,应将它们的秩均分之8.符号检验的缺点是()。A检验快速B检验的效力低C数据的利用不充分D用于统计决策是保守的E对数据的要求不高四、名词解释1.非参数检验2.符号检验3.配对符号秩检验4.秩和检验5.游程6.游程检验7.差符号游程检验8.累计频数检验五、判断题1.非参数检验不能充分利用全部现有的资料信息。()2.非参数检验不可以用于处理等级的资料和定性的信息。()3.符号检验是二项检验的一种实际应用。()4.配对符号秩检验对于非正态分布的d值,是最佳检验,其检验效力大大高于符号检验。()5.累计频数检验适用于样本容量较大而等级划分又很有限的情况。()6.累计频数检验很少用作经验分布与理论分布的比较。()7.秩和检验中如果同数值的数目较多,Z计算式要加以修正。()8.在累计频数检验中用卡方近似计算方法实际上更趋于保守。()9.秩和检验中如果同数值的数目很大,应该用秩和检验代替累计频数检验。()10.绝对值相等的值,它们的秩也应相同。()六、计算题1.从某总体中抽出10个样本单位做“前”和‘后“的观察对比,对比的数据如下表所示:单位序号“前”观察“后”观察单位序号“前”观察“后”观察78\n123454446403836493626201167891015152724181618161713要求:(1)分别用符号检验和配对符号秩检验,研究观察前后有无显著差别(α=0.05);(2)对两种检验的结果进行简要评价。2.为了研究当夫妻在对某一问题的看法类似时妻子是否更保守,研究者随机抽取了50对夫妇进行了调查。研究结果发现只有9对夫妇的差异较大,而其中9对夫妇的妻子确比丈夫保守,1对夫妇的丈夫比妻子保守。试问研究结果是否证实了事先的假设(α=0.05)?3.为了解一部关于大学生恋爱问题的宣传片对大学生的影响,对13个观看过宣传片的13个班级进行了问卷调查。调查结果如下表所示:班级12345678910111213观前%观后%6368414955547076405048466979626448563550605468695259试在显著水平0.05下,检验此宣传片的效果。4.一位教师给200人的班级上课,在过去的几年里,所有学生成绩的中位数为71.5分。在他改上小班课后,35人小班学生成绩的秩和计算为T+=420,T-=210。问在显著水平0.05下,他改为小班上课的效果如何?5.为研究某大学毕业生的薪水与其性别有无关系,研究者调查了该专业往届的一个班级毕业生的薪水如下表所示。问薪水的分布与性别是否有显著关系。(α=0.05)男毕业生薪水(元)女毕业生薪水(元)35504000480053005800570054004900495035003000450042005000520025003800400078\n510051505750525041006.研究者为研究居住在两个城区的通勤费哪个更贵,在某大公司里随机抽取了住在1区的职员30名和住在2区的职员40名,把它们的每日平均通勤费进行统一排列,并计算出R1=1241,R2=1244。假设没有相同的秩。问在显著水平0.05下,是否能得出1区的通勤费比2区更高的结论?7.某研究机构对某职业的声望在两地进行了调查,得到如下资料:甲地92264341743128乙地5853261152518试用游程检验法判断该职业在两地是否有显著差异。(α=0.05)8.为了研究老人居住方式不同对健康的影响,调查者把老人分为独住和与子女同住两种情况,调查各自的满意度。调查资料汇总如下:独自居住与子女同住很不满意较不满意一般较满意很满意109474422147753735120试问,在0.01的显著性水平下哪种居住方式更有益于老人健康?9.社会分层研究中把成年男子分成6个社会层次,数字越大,社会层次越高。为了研究社会层次与社会流动性的关系,调查者了510人,把它们分为流动愿望高和流动愿望低两个类型,综合分类人数数据如下:层次流动愿望高流动愿望低123456284554754825595047452113试问,在0.01的显著性水平下社会层次对社会流动性的影响是否显著?78\n10.以下是某大学各年级同学参加政治性社团与娱乐社团的人数调查数据:娱乐社团(人数)政治社团(人数)一年级二年级三年级四年级五年级468193241131971438813638试问,在0.05的显著性水平下参加社团的类型与年级高低有无关系?11.为测试试题卷的出题顺序与成绩的关系,调查者把某班人数等分,其中一半做最先难后易的A卷,另一半做先易后难的B卷。考试成绩如下表所示:考生ABCDEFGHIJA卷成绩B卷成绩8382849690649171757242615278698175787865试用游程检验法判断两种不同的出题方式是否有显著差异。(α=0.05)七、问答题1.简述非参数检验的优点。2.简述简便检验的作用。78\n第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数第三节定序变量的相关分析同序对、异序对和同分对·Gamma系数·肯德尔等级相关系数(τa系数、τb与τc系数)·萨默斯系数(d系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE性质·相关指数R第六节曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线)一、填空1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是()变量。2.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是()。3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值是服从();(2)分布中围绕每个可能的值的()是相同的。4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为()的变量,因变量是随()的变化而发生相应变化的变量。5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(),并据以进行估计和预测。这种分析方法,通常又称为()。6.积差系数r是()与X和Y的标准差的乘积之比。二、单项选择1.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在()关系。A直线正相关B直线负相关C曲线正相关D曲线负相关78\n2.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示()。A无相关B低度相关C中等相关D高度相关3.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有()。A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。4.关于相关系数,下面不正确的描述是()。A当01时,表示两变量不完全相关;B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。5.欲以图形显示两变量X和Y的关系,最好创建()。A直方图B圆形图C柱形图D散点图6.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为()。A0.50B0.80C0.64D0.907.在完成了构造与评价一个回归模型后,我们可以()。A估计未来所需样本的容量B计算相关系数和判定系数C以给定的因变量的值估计自变量的值D以给定的自变量的值估计因变量的值8.两变量的线性相关系数为0,表明两变量之间()。A完全相关B无关系C不完全相关D不存在线性相关9.身高和体重之间的关系是()。A函数关系B无关系C共变关系D严格的依存关系10.在相关分析中,对两个变量的要求是()。A都是随机变量B都不是随机变量C其中一个是随机变量,一个是常数D都是常数11.在回归分析中,两个变量()。A都是随机变量B都不是随机变量C自变量是随机变量D因变量是随机变量12.一元线性回归模型和多元线性回归模型的区别在于只有一个()。A因变量B自变量C相关系数D判定系数13.以下指标恒为正的是()。A相关系数rB截距aC斜率bD复相关系数14.下列关系中,属于正相关关系得是()。A身高与体重B产品与单位成本C正常商品的价格和需求量D商品的零售额和流通费率三、多项选择1.关于积差系数,下面正确的说法是()。A积差系数是线性相关系数78\nB积差系数具有PRE性质C在积差系数的计算公式中,变量X和Y是对等关系D在积差系数的计算公式中,变量X和Y都是随机的2.关于皮尔逊相关系数,下面正确的说法是()。A皮尔逊相关系数是线性相关系数B积差系数能够解释两变量间的因果关系Cr公式中的两个变量都是随机的Dr的取值在1和0之间E皮尔逊相关系数具有PRE性质,但这要通过r2加以反映3.简单线性回归分析的特点是()。A两个变量之间不是对等关系B回归系数有正负号C两个变量都是随机的D利用一个回归方程,两个变量可以互相推算E有可能求出两个回归方程4.反映某一线性回归方程y=a+bx好坏的指标有()。A相关系数B判定系数Cb的大小D估计标准误Ea的大小5.模拟回归方程进行分析适用于()。A变量之间存在一定程度的相关系数B不存在任何关系的几个变量之间C变量之间存在线性相关D变量之间存在曲线相关E时间序列变量和时间之间6.判定系数r2=80%和含义如下()。A自变量和因变量之间的相关关系的密切程度B因变量y的总变化中有80%可以由回归直线来解释和说明C总偏差中有80%可以由回归偏差来解释D相关系数一定为0.64E判定系数和相关系数无关7.回归分析和相关分析的关系是()。A回归分析可用于估计和预测B相关分析是研究变量之间的相互依存关系的密切程度C回归分析中自变量和因变量可以互相推导并进行预测D相关分析需区分自变量和因变量E相关分析是回归分析的基础8.以下指标恒为正的是()。A相关系数B判定系数C复相关系数D偏相关系数E回归方程的斜率9.一元线性回归分析中的回归系数b可以表示为()。A两个变量之间相关关系的密切程度B两个变量之间相关关系的方向C当自变量增减一个单位时,因变量平均增减的量D当因变量增减一个单位时,自变量平均增减的量78\nE回归模型的拟合优度10.关于回归系数b,下面正确的说法是()。Ab也可以反映X和Y之间的关系强度。;B回归系数不解释两变量间的因果关系;Cb公式中的两个变量都是随机的;Db的取值在1和-1之间;Eb也有正负之分。四、名词解释1.消减误差比例2.确定性关系3.非确定性关系4.因果关系5.单相关和复相关6.正相关与负相关7.散点图8.皮尔逊相关系数r9.同序对10.异序对11.同分对五、判断题1.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。()2.不管相关关系表现形式如何,当=1时,变量X和变量Y都是完全相关。()3.不管相关关系表现形式如何,当=0时,变量X和变量Y都是完全不相关。()4.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。()5.如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。()6.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。()六、计算题1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。78\n对于民族音乐的态度(Y)年岁(X)Σ老中青喜欢不喜欢383830153346Σ2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。身高(cm)171167177154169体重(kg)5356644955身高(cm)175163152172162体重(kg)66524758503.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次5967128111103244.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数τc。文化程度婚姻美满大学中学小学美满9165一般83018不美满3475.以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员211224334558667789910106.某原始资料为:X6573918876539667828578\nY571313.574.5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。7.根据下述假设资料求回归方程。X1234567Y23.023.424.125.226.126.927.38.某10户家庭样本具有下列收入(元)和食品支出(元/周)数据:收入(X)20303340151326382543支出(Y)7981154810910要求:1)写出最小平方法计算的回归直线方程;2)在95.46%把握下,当X=45时,写出Y的预测区间。9.根据下述假设资料,试用积差法求相关系数。输出X(亿元)12106168910输出Y(亿元)1286111081110.下面是对50名被调查者的英语成绩和法语成绩的抽样调查:求Gamma系数。英语法语优中差优中差1053410626411.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的斯皮尔曼等级相关系数。(10分)选手名ABCDEFGHIJ演唱水平(X)综合素质(Y)1234567891021537491068七、问答题1.简述积差系数的特性。2.简述回归分析和相关分析之间的密切联系。78\n第十三章检验与方差分析第一节拟合优度检验拟合优度检验(比率拟合检验)·正态拟合检验第二节无关联性检验独立性、理论频数及自由度·频数比较和连续性修正·关系强度的量度第三节方差分析总变差及其分解·自由度·检验统计量Fo的计算·相关比率·方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验·积差系数的检验·回归方程的区间估计一、填空1.方差分析可以对多个总体()是否相等进行检验。2.列联表是按()标志把两个变量的频数进行交互分类的。3.在使用检验法进行列联表检验所使用的自由度为()。4.在对()的列联表进行检验时,存在着=的关系。5.列联表检验是通过()而不是通过相对频数的比较进行的。6.方差分析是()检验的推广,一般用于处理自变量是一个()定类变量和因变量是一个定距变量之间的关系。7.在对6×5的列联表进行方差分析时,与组间平方和相联系的自由度为(),与组内平方和相联系的自由度为(),与总平方和相联系的自由度为()。8.方差分析中把已解释的变差对总变差的比值称为()。9.检验两个总体变量(定距—定距变量)是否具有线性关系,主要是检验总体的()是否等于零。10.对于定距—定距变量计算积差系数r时,要求相关的两个变量均为()变量。在回归分析中,只有()变量才是随机的。11.在实际运用中,方差分析的结果常用一种称为()的标准形式的表格表示出来。12.取±1SY/X,那么在散点图上约有()%的观测点落在其间。13.取±2SY/X,那么在散点图上约有()%的观测点落在其间14.取±3SY/X,那么在散点图上约有()%的观测点落在其间。78\n二、单项选择1.在比率拟合优度检验中,对于选定的显著性水平α求临界值,此时的自由度是()。A实验数据总数n―1B变量X的取值种类数c―lC实验数据总数n—变量X的取值种类数cD实验数据总数n+变量X的取值种类数c2.在正态拟合优度检验中,对于选定的显著性水平α求临界值,此时的自由度是()。A数据的分组数B数据的分组数―lC数据的分组数―2D数据的分组数―33.使用检验法对n×c列联表进行无关联性检验,与这个检验统计量相联系的自由度()。An―1Bc―lCn―cD(n—1)×(c—1)4.对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部分卡方影响最大。这是利用了卡方分布的()。A恒正性B方差为期望值的2倍C可加性D前三者5.在方差分析中,自变量是()。A定类变量B定序变量C定距变量D定比变量6.在直线回归分析中,相关比率PRC=0.750。那么,积差系数r=()。A0.750B0.5625C1.333D0.866三、多项选择1.可以用于拟和优度检验的方法有()。A检验BF检验C累计频数检验D游程检验2.方差分析法()。A可以用于一个总体均值是否相等的检验B可以用于两个总体均值是否相等的检验C可以用于三个总体均值是否相等的检验D可以用于多个总体均值是否相等的检验3.对拟和优度推断结果,下列说法正确的是()。A当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际情况切合零假设B数据少如果否定了零假设,这一否定的可靠性是很大的C规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多大实际意义78\nD若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持4.使用检验拟和优度,下列说法正确的是()。A相对频数相同的列联表,在统计检验中其显著性相同B相对频数相同的列联表,在统计检验中其显著性并不相同C相对频数相同的列联表,样本容量增加K倍,不变D相对频数相同的列联表,样本容量增加K倍,变也扩大K倍5.相关比率PRE度量的可以是()。A定类—定距变量之间的相关程度B定距—定距变量之间的相关程度C线性相关D非线性相关6.下列说法正确的是()。A方差分析的优点在于,一个检验可以代替多个均值差检验B方差分析总是优于一系列的均值差检验C方差分析中的自变量X如果是二分变量,不论采用方差分析或均值差检验,其结果完全相同D总变差分解的思想可以直接推广至多因素显著性检验7.方差分析所包含的假定包括()。A正态分布B独立随机样本C等方差性D非负性四、名词解释1.拟和优度检验2.列联表3.理论频数4.方差分析5.方差分析表6.总变差7.组内变差8.组间平方和9.相关比率10.估计标准误差五、判断题1.理论频数fe与观测频数fo越接近,经验分布与理论分布拟合程度越好。()2.对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不大。()3.规模极大的试验可把零假设有极细微的差别检测出来。()4.如何求得列联表中的理论频数就成了独立性检验的关键。()5.检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点。()6.检验不适用于定类变量和定序变量的相关统计。()78\n7.在2×2列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测方向的(Zα/2)2来找出的近似值。()8.相对频数相同的列联表,在统计检验中其显著性也相同。()9.组内变差反映了数据的c个“中心”的散布程度。()10.组间平方和反映了数据围绕各“中心”的散布程度。()11.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量。()12.我们不可以从总平方和减去组间平方和来求组内平方和。()13.只可用于一个定类变量与一个定距变量的相关程度的测定。()14.方差分析的优点在于,一个检验可以代替多个检验。()15.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。()16.拟合值Yc上下设置一个合适区间,那么Y被估计到的可能性便会大大增加。()六、计算题1.一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。为此,他在某校随机抽取了4500个本科生,这些学生的分布是:一年级1200人,二年级1100人,三年级1150人,四年级1050人。试问,在给定显著性水平α为0.05下,四个年级学生人数构成是否均匀?2.一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规律两种粉色杂交后,后代将以白∶粉∶红=1∶2∶1的比例出现。他做了一项杂交实验,植株了100株后代,结果发现:21株白,61株粉,18株红。试问,在给定显著性水平α为0.05下,是否植株后代以白:粉:红=1∶2∶1的比例出现?3.某种动物的两个品种杂交后可能出现四种特征。某种理论分析表明,可能出现的四种特征的数量将以9∶3∶3∶1的比例出现。生物学家为此做了一项实验,检查了160个后代,结果发现具有着四种特征的后代的数量分别是72、38、32、18。试问,在给定显著性水平α为0.05下,是否杂交后代以9∶3∶3∶1的比例出现?4.某公司对电视机的可靠性进行了一次调查,使用100台电视机作样本,记录了在电视机出现故障之前所经历的月份。根据经历的月份(按等级划分),下表给出了出现故障的实际分布月份和故障按照正态概率分布月份:出现故障之前的月份(等级)出现故障之前的实际月份出现故障之前的期望月份78\n17以下17—2021—2324—2627—2930以上624281814109172725157要求:检验故障的实际分布与正态分布是否有明显差别(α取0.05)。5.下表是三个年龄组的100名居民对生活质量要求的分布频数(按高、中、低分类):年龄(岁)生活质量要求总计高中低17—3011—3545—651211815131013117403520总计313831100试问,居民对生活质量的要求与年龄是否有明显的关系(α取0.05)。6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。小于5次5—10次5次以上合计10公里以内10—20公里20公里以上42321931237305111036037合计936146200试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?(α取0.05)7.为研究职业的代际流动问题,在某地随机抽取了160名职业区民进行调查,调查的结果如下表所示:父辈职业合计脑力劳动体力劳动农业劳动子辈职业脑力劳动体力劳动农业劳动25155835751050386062合计45506516078\n试问,子辈职业与父辈职业之间是否存在相关关系?(α取0.05)8.某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法。研究者随机抽出来自农村和城市的两个家长样本,调查结果表明:在来自城市的200位家长中,123人支持,36人反对,41人没有看法;在来自农村的300位家长中,145人支持,85人反对,70人没有看法。试问,家长对学生延长在校时间的看法是否与其居住在城市或农村有关?(α取0.01)9.某连锁商业企业在同城三个不同地点开设了三个分店,从这三家商店随机抽出5天的营业额的数据如下表所示:单位:万元第一家分店第二家分店第三家分店第一天10714第二天12118第三天9812第四天81310第五天111011要求:(1)求三家店每天的平均每天的营业额和5天的平均每天营业额;(2)求总变差、组内变差和组间平方和;(3)编制方差分析表;(4)检验三个商店的地点不同对每天的营业额是否有显著的影响(5)计算商店的地点不同对每天的营业额之间的相关比率。10.为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调查三种职业家庭的子女数的资料如下:工人:1,3,4,4,6,2,3,4,3,5,2,4;干部:3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1;知识分子:6,4,2,2,3,0,5,3,1,2,1。要求:(1)求三种职业家庭户均子女数;(2)求总变差、组内变差和组间平方和;(3)编制方差分析表;(4)检验不同职业的生育观是否有显著的不同。(5)计算职业与子女数量之间的相关比率。11.有关雇员初始年薪和他10年后的年薪之间的一项调查,共抽取了13名雇员。数据表明,二者之间的积差系数是0.570。现给定α=0.05,试检验此相关系数是否显著。12.1992—2003年我国城镇居民人均消费性支出和人均可支配收入的数据见下表:78\n单位:千元年份人均可支配收入人均消费性支出1992199319941995199619971998199920002001200220032.0272.5773.4964.2834.8395.1605.4255.8546.2806.8607.7038.4721.6722.1112.8513.5383.9194.1864.3324.6164.9985.3096.0306.511要求:(1)计算我国城镇居民人均消费性支出和人均可支配收入的积差系数;(2)检验所计算的积差系数的显著性;(3)建立我国居民人均消费支出依人均可支配收入的线性回归模型;(4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与积差系数的数量关系;(5)计算估计标准误差;(6)已知某年我国居民人均年可支配收入为8000元,试以95%的置信度预测人均年消费性支出的估计区间。13.某银行25家分行的不良贷款额与贷款余额调查数据如下(单位:亿元):分行编号各项贷款余额不良贷款额167.30.92111.31.131734.8480.83.25199.77.8616.22.77107.41.68185.412.5996.1178\n1072.82.61164.20.312132.241358.60.814174.63.515263.510.21679.331714.80.21873.50.41924.7120139.46.821368.211.62295.71.623109.61.224196.27.225102.23.2要求:(1)计算各项贷款余额和不良贷款额的积差系数;(2)检验所计算的积差系数的显著性;(3)建立不良贷款额依各项贷款余额的线性回归模型;(4)对回归模型进行F检验;(5)计算估计标准误差;(6)求出贷款余额为100亿元时,不良贷款95%的置信区间.七、问答题1.对于拟合优度检验,解释统计推断的结果时,应注意些什么?2.简述相关比率、积差系数之平方r2和相关指数R之间的关系。78\n第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类·发展水平·动态比较指标(增长量、发展速度、增长速度)·动态平均指标(平均发展水平、平均增长量、平均发展速度、平均增长速度)第二节时间数列的趋势分析历时曲线·修匀与拟合法·随手绘法·移动平均法·半数平均法·最小平方法第三节指数分析法动态指数及其分类·质量指标综合指数·数量指标综合指数·用与个体指数的联系来求综合指数·其他权数形式的质量和数量综合指数·指数体系与因素分析·静态指数(环境质量指数、欧希玛指数、人文发展指数)一、填空1.编制时间数列的目的是为了进行()分析,分析所研究现象的发展过程和变动规律。2.在对比两个时间的发展水平时,我们把所要研究的时间的发展水平称为()。3.平均增长速度和增长速度之间()直接联系。4.在时间数列中指标较多,而且变动的规律又不十分明显时,可以用扩大()并以各时距计算的()作为替代的做法,来对原数列加以修整。5.用直线拟合法描述现象长期发展变动趋势,要求原始数据呈()变动。6.价格上涨后,用同样多的货币只能购买原商品的90%,则物价指数为()。7.我国1987年的人口是1983年的105.17%,1986年的人口是1983年的103.67,则1987年的人口比1986年的人口增加了()%。8.要计算某厂生产情况的产品产量总指数,同度量因数是()。9.产值总变动指数等于产品产量总指数和产品价格总指数的(),产值实际发生的总差额等于产量因素引起的差额和价格因素引起的差额的和。10.用逐期增长量与前期水平相比得到的是();用累积增长量与固定基期水平相比得到的是()。11.在综合指数公式中,()还起着权衡被综合的各个变量值地位轻重的作用,所以它又常常被称为权数。12.环比发展速度与定基发展速度之间存在以下数量关系:一是定基发展速度等于相应时期内各环比发展速度的();二是相邻两个定基发展速度(),即得环比发展速度。13.已知算术平均数等于4,各变量值平方和的平均等于25,则标准差为()。14.某厂某种产品的产量经3年后增加到原来的8倍,该产品的平均发展速度是(),平均增长速度是()。78\n15.时点数列有两个特点:一是数列中各项指标数值();二是数列中各指标数值大小与()没有直接联系。16.()是指时间数列中原有的各种统计指标数值,它反映现象在各个时期上所达到的规模或水平。17.说明多种事物综合变动的指数称为(),其特点是各事物的度量单位不同,不能()。18.时间数列一般由两个基本要素构成,即被研究现象所属的()和反映该现象的()。19.按水平法计算的平均增长量,其实质就是以最初水平()为基础,假设现象以每期平均增长量()()增长,最末水平()的理论值恰好与其实际值相等。二、单项选择1.对某社区1973-1991年各年居民人数进行5年移动平均处理,形成的新数列有()。A19项B18项C15项D16项2.从计算方法上看,是()。A算术平均数B调和平均数C中位数D几何平均数3.,式中同度量因素是()。AQ0BQ1CP0DP14.某市连续五年人口增长数是稳定的,五年里其人口环比增长速度()。A降低的B提高的C稳定不变的D先升后降的5.某厂计划将劳动生产率提高2%,实际提高了6%,超额完成计划()。A3.9%B%C4%D103.9%6.用几何平均法计算平均发展速度,实际上只与数列的()有关。A最初水平和最末水平B最初水平C最末水平D中间水平7.对我国1952-1983年各年职工人数资料进行7年移动平均,形成的新数列有()项A25B26C27D28。8.某种产品报告期与基期比较,产量增加了6%,单位产品成本下降6%,则生产费用是()A增加B减少C不增不减D无法确定9.已知某厂今年与去年相比产值增长速度为12%,则发展速度是()。A112%;B88%;C-88%;D-112%。10.某个体户开业三个月,收入情况是:第一个400元,第二个月380元,第三个月420元,于是他每月平均收入为()。A395B400C263D60011.按指标性质不同,统计指数可以分为()。A个体指数和总指数B静态指数和动态指数;C综合指数和平均数指数D质量指标指数和数量指标指数。78\n12.在式中,权数是()。ABCD13.在下面综合指数中,属于数量指标综合指数的是()。ABCD。14.在下面综合指数中,属于质量指标综合指数的是()。ABCD。三、多项选择1.生活质量指数有以下几个组成部分()。A人均收入指数B婴儿死亡率指数C1岁估计寿命指数D识字率指数E人均GDP2.下列变量的时间数列,哪些相加没有经济意义()。A年平均工资数列B年高校毕业生数数列C月生产工人比重数列D月流动资金周转次数E年铁路通车里程数数列3.就资料的时间过程来分,下面属于动态资料有()。A粮食产量B住宅竣工面积C社区绿地面积D工资收入E公路通车总里程4.1990年,联合国开发计划署(UNDP)取()这几项指标,在进行指数化处理并加以算术平均后,构造了人文发展指数。A收入B环境质量C期望寿命D受教育水平E婴儿死亡率四、名词解释1.发展水平2.发展速度3.动态指数4.个体指数5.可变构成指数6.逐期增长量7.累积增长量五、判断题1.时期数列中各指标的数值与时间间隔长短有直接联系,时期越长,指标数值越大。()2.平均发展速度与发展速度之间没有直接联系。()3.累积增长量是各报告期水平与前一期水平相减计算的增长量。()78\n4.1986年底按工业部门划分的企业职工人数属于时点数列。()5.采用加权调和平均数计算平均数,其权数是标志总量。()6.各分组平均数在不同时期同时上升,则总平均数一定也上升。()7.环比增长速度的连乘积等于相应期内的定基增长速度。()8.每增长百分之一的绝对值是增长量除以增长百分比之值。()9.由序时平均数计算序时平均数,以时间长度为权数。()10.方程法求平均发展速度是利用计算期水平的理论值和等于实际值的和推倒出来的计算方法。()11.用最小二乘法和半数平均法计算同一时间数列资料,结果是二者截距不同,二者斜率是相同的。()12.相邻的两个环比发展速度相除,即得定基发展速度。()13.增长量、发展速度、增长速度是通过发展水平求得的,统称为动态比较指标。()14.环比发展速度等于相应时期内各定基发展速度的连乘积。()15.按照我国习惯做法,数量指标综合指数一般是以基期质量指标作为同度量因素。()16.时点数列中的数据必定动态资料,动态资料是不能相加的。()六、计算题1.根据下表数据,求加权物价综合指数年份t物品1物品2物品3价格数量价格数量价格数量199840966211835781999411046011539832.已知产品价格以P来表示,产品产量以Q来表示,在下面各式后面的括号中填入相应的指标名称。=()=()=()()=()题中,是个体指数还是综合指数?是质量指数还是数量指数?指出中什么是变量,什么是权数?3.在下面各式的括号中选择算术平均数或调和平均数指数填入。(算术平均数指数,变量,权数)78\n(调和平均数指数,变量,权数)指出在中什么是变量,什么是权数?在中什么是变量,什么是权数?4.某地区工农业总产值增长速度如下表,(1)计算表中所缺数字;(2)求这7年的平均增长速度。年份1980198119821983198419851986环比增长速度(%)6.77.2()()9.0()8.8定基增长速度(%)()()21.8()45.357.8()5.某养鱼场两年生产情况如下表,(1)求该场产品价格综合指数;(2)用于价格变动导致的产值变动额;(3)求该场产品产量综合指数;(4)由于产品产量变动导致的产值变动额;(5)总变动指数和产值总变动额。产品产值(万元)89年比88年产量增加(%)19881989青鱼465614链鱼7490196.已知某养鱼场1986年销售鱼的产值是27万元,销售青鱼的产值是23万元,1987年鲢鱼产量是1986年的87%,青鱼产量是1986年的134%,求该场鲜鱼产量总指数和由鱼产量变化引起的产值变动额。7.美国1880年到1960年历次人口普查人口总数如下表,假设人口增长呈非线性增长,并且人口增长速度与人口自身规模成正比,请根据表给数据写出预测人口变动趋势的指数曲线,并且推算美国1990年人口总数是多少?年份人口数(千人)188043403189055101190066809年份人口数(千人)1910817321920948211930110287年份人口数(千人)1940118215195013494219601584558.78\n已知某地区四个物质生产部门从业人员年平均数以及各部门平均劳动生产率的资料如下,(1)计算可变构成的社会劳动生产率指数及社会劳动生产率的绝对增长量;(2)计算固定构成的劳动生产率增长而使国民经济平均劳动生产率增长的绝对增长量;(3)计算构成变动的劳动生产率指数,及受构成变动影响的社会劳动生产率的绝对增长量。物质生产部门各部门的劳动生产率水平(元/人)各部门从业人员人数基期报告期基期报告期工业农业建筑业其他1440050001000066002166770001100073332900046000800017000360003600010000180009.根据1995-2002年我国城镇总人口的资料,计算增长量、发展速度、增长速度共六个动态比较指标。年份19951996199719981999200020012002发展水平城镇总人口(单位:亿人)3.523.733.954.164.374.594.815.0210.某住宅小区5年绿化面积统计结果如下表,(1)请问该数列是时期数列还是时点数列;(2)计算以85年为基期的累积增长量,逐期增长量、定基发展速度、环比发展速度、定基增长速度、环比增长速度;(3)求平均年增长量。年份198519861987198819891990年末绿化面积(万米2)3.794.385.736.237.427.8111.假设某市人口变动的长期趋势呈直线形式,根据下表资料,求出最佳拟合的直线趋势方程。年份人数(万人)年份人数(万人)197023.0197425.2197123.4197526.1197224.1197626.9197324.9197727.3197828.0198229.2197928.2198330.1198028.3198430.6198128.7198531.212.我国国际互联网用户发展情况如下表所示,①用最小平方法,求其指数曲数拟合方程;②估计2003年我国国际互联网用户有多少。78\n年份人数1995199619971998199920002001200272133565216015767675530149185021717365623565254167913.新建住宅峻工面积是住房和生活服务统计的主要指标之一,某市历年来新建住宅面积增加的情况如下,请把表中空缺的数据填上。年份1998199920002001200220032004环比增长速度—8.013.0()()7.0()定基增长速度—()()22.0()25.339.114.根据下述动态数列计算序时平均数。年份1992199319941995199619971998通车里程数24,58125,07225,8732717129,23729,86231,19315.某厂上半年各月人数资料如下表:月份一月二月三月四月五月六月七月月初人数500510514526()()570月平均人数()()()533549564要求:1)填空;2)分别计算该厂第一季度、第二季度和上半年平均人数。16.某企业1989年前三个月工资总额分别以7%,11%,5%的增长速度逐月增加,问前三个月该企业工资总额总的增长速度是多少?17.某养鸡场近两年生产情况如下:要求:1)求该产品价格总指数;2)求由于价格变动导致的产值变动额。产品产值(万元)06年比05年产量增加%2005年2006年肉鸡465614鸡蛋74901978\n18.如果某市年初人口=194,886人,年末人口=199,364人,求年平均人口。19.某市2007年上半年对该市流动人口数进行了五次调查,调查结果如下:调查时间1月1日2月1日4月1日6月1日6月15日人数(万人)48.839.446.867.766.5求该市2007年上半年流动人口的平均人数。20.某厂产量时间序列资料如下:年份1995199619971998产量(吨)12223440要求:用最小二乘法求出时间趋势理论值。21.某产品生产总费用2006年为94万元,2007年增加到100万元,产品产量增长11.2%。试计算该产品生产总费用变动中,产品产量和单位成本两因素变动的影响程度和影响的绝对值。22.假设资料如下:某厂生产情况产品名称计量单位产量价格(元)基期报告期基期报告期甲乙丙盒斤瓶10005000800150060007000.801.001.400.721.502.80分别计算该厂产品产量综合指数和出厂价格综合指数。23.某校工资支出和教职员工人数资料入下表,求一季度人均工资是多少?月份一月二月三月四月a.学校工资支出(元)b.月初教职员工数(人)123424203132894207141372198134280181C.人均工资(元/人)602.1656.3746.0——24.我国第三次全国人口普查的资料显示:婴儿死亡率为37.6‰,1岁平均预期寿命为69.25岁,15岁以上人口识字率为65.51%。用这三个数字计算我国1982年生活质量指数。25.某企业2003年1~4月份工业产值和在职职工人数资料如下表:月份一月二月三月四月78\n工业产值(元)4910497451165210月初职工人数(人)96899110091032求该企业一季度人均产值是多少?26.某地区三种零售商品的流转情况如下表,试求:1)零售额总指数和零售额增加额;2)求价格综合指数和因价格下降而减少的零售额;3)求零售量综合指数和因零售量增长而增加的零售额。商品计量单位零售量单价(元)1999年2000年1999年2000年甲乙丙万斤万斤万斤40012850012.582.004.005.001.804.004.5027.2002~2006年某市社会消费品零售额如下表,据此求出现象变动的直线拟合方程,并预测2007年社会消费品零售额。单位:亿元年份20022003200420052006社会消费品零售额79.687.288.298.4121.128.某市历年新建住宅竣工面积统计如下表:单位:百万米2年份99年00年01年02年03年04年05年06年07年新建住宅竣工面积13.213.715.116.016.019.420.421.623.8(1)该时间数列是时期数列还是时点数列;(2)求出拟合该时间数列变化趋势的直线方程;(3)推测2008年该市新建住宅竣工面积为多少。29.某工厂生产甲、乙、丙三种产品,2000年产值分别为32万元、78万元、44万元,2001年三种产品的产量分别增加了20%、-5%和15%,产值分别为46万元、66万元、50万元。求:(1)该厂产品产量综合指数;(2)由于三种产品产量变化增加的产值额;(3)该厂产品价格综合指数;(4)由于三种产品价格变化增加的产值额;(5)该厂产品产值指数。78\n30.以下是1990-1996年我国城镇新建住宅面积的增长情况,请把表中空缺的数据填上。年份1990199119921993199419951996增长速度环比(%)——()25.0()()5.05.3定基(%)——11.0(38.878.0106.4()()31.某单位资料如下表所示,试从相对数和绝对数两方面分析工资水平和职工数对工资总额的影响。级别职工数工资总额(万元)基期报告期基期报告期低级中级高级1001501608016017029.046.064.030.055.072.0七、问答题1.时期数列及其特点2.时点数列及其特点3.简述指数体系的含义78

相关文档