- 21.02 KB
- 2021-05-17 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
(2020更新)国家开放大学电大专科《统计学原理》期末试题标准题库及答案(试卷号:20XX):
(2020更新)国家开放大学电大专科《统计学原理》期末试题标准题库及答案(试卷号:20XX) 第一套 一、单项选择(每题 2 分,共计 20 分) 1. 在某个或某些属性上的属性表现相同的诸多实体构成的集合称为( )。
A.同类实体 B.异类实体 C.总体 D.同类集合 2. 不能自然地直接使用数字表示的属性称为()属性。
A.数量属性 B.质量属性 C.水平属性 D.特征属性 3. 属于总体边界清晰,个体不清晰的变量是()。
A. 一列车的煤炭 B. 滇金丝猴种群 C. 大兴安岭的树 D. 工业流水线的一 批产品 4.()是选择个体及采集个体属性值的途径。
A.调查方法 B.调查工具 C.调查准则 D.调查程序 5.从某生产线上每隔 25 分钟抽取 5 分钟的产品进行检验,这种抽样方式属于() A. 简单随机抽样 B. 等距抽样 C. 整群抽样 D. 分层抽样 6.抽样调查和重点调查都是非全面调查,二者的根本区别是() A.灵活程度不同 B.组织方式不同 C.作用不同 D.抽取样本的方式不同 7. 按随机原则进行抽样的抽样称为() A.问卷设计 B.调查 C.抽样设计 D.随机抽样 8. 统计学将由许多个小实体构成的同类实体看作集合,称之为() A.总体 B.个体 C.总量 D.变量 9. 根据总体的形态,总体可以分为() A.时间总体和空间总体 B.实在总体和想象总体 C.时点总体和时期总体 D.平面总体和线性总体 10. 统计工作过程由()两个步骤构成。
A.统计设计和统计实施 B.统计实施和调查设计 C.现场调查和调查设计 D.统计设计和调查设计 二、多项选择(每题 2 分,共计 10 分) 1. 按照信息科学和数据库理论,信息的构成要素主要包括() A.实体 B.属性 C.调查 D.情况 2. 属性的基本类别包括()。
A.数量属性 B.质量属性 C.水平属性 D.特征属性 3. 下列属于总体边界清晰,个体边界不清晰的是() A.一艘石油巨轮的石油 B.一列车的煤炭 C.公园一片草地 D. 大兴安岭的树 4. 现场调查方法包括的方式有( ) A.访问 B.观察 C.实验 D.测量 5. 按照调查的范围划分,调查分为( ) A.全面调查 B.非全面调查 C.概率调查 D.非概率调查 三、判断题(每题 2 分,共计 20 分) 1.文字是一种数据。(√) 2.特性可以独立存在,不依赖于观察者的主观视角。(×) 3.信息构成要素中的实体,只能是通过普通感官直接感知的内容。(×) 4.所谓组件构成实体不可缺少的一部分,是客观存在,不依赖于观察者的主观视角,一旦 缺少了组件,实体便不完整。(√) 5.数量属性与质量属性是属性的基本分类,也是最重要的分类。(√) 6.统计学将由许多个小实体构成的同类实体看作集合,称之为总体;将构成总体的许多小实体看成集合的元素,特别的,如果小实体都不可再分则称为个体。
(×) 7.统计调查都是对样本中的个体进行的,故其结果可称之为个体数据,但统计调查的最终 目标却是要获得总体数据所包含的信息。(√) 8.统计数据的获取过程包含调查和汇总两个阶段。(√) 9.数据一般只包括文字、符号、数码、数字、数值等类型,个体信息量巨大的音频、视频、 图像并 不包括在内。(√) 10.如在总体的每个层里独立进行抽样,则称为分层抽样。
(×) 四、简答题(每题 10 分,共计 50 分) 1.简述分类变量与数值变量的根本区别。
答:数值型变量是指值可以取一系列的数,这些值对于加法、减法、求平均值等操作是有意义的,而分类变量对于上述的操作是没有意义的。
由于属性可以分为数量属性和质量属性,因此,可以分为数量变量和分类变量。数量变量是指可以自然地直接使用数值表示其变量值的变量。分变量是指不可以自然地可直接使用数字表示其变量值。
2.简述信息与数据的异同。举例说明有些信息不是数据。
答:数据和信息是不可分割的两个术语,但它们又有一定的区别。首先是概念不同,数据是对客观事物记录下来的可以鉴别的符号。这些符号不仅指数字,且包括回字符、字图形等;信息是经过加工后并对客观世界产生影响的数答据。其次,数据只有经过加工处理后才能成为信息。例如,“0、 1、2..”、“阴、 雨、下降、气温””学生的档案记录、 货物的运输情况”等都是数据。数据经过加工后就成为信息。
3.请分别指出下列描述中的实体与属性。
1) 汽车的颜色 2) 家庭的人口数 3) 国内生产总值最多的国家 4) 人的身高 答: (1) 汽车是实体、颜色是属性 (2) 家庭人口数实体 (3)国内生产总值最高的国家是实体 (4)人的身高是实体 4.统计调查的八要素有哪些? 答:统计调查具有八个要素:调查主体、调查客体、调查内容(项目)、调查方法、 调查工具、调查准则、调查程序、调查结果。
5. 简述抽样设计的内容和抽样的一般步骤。
答:抽样设计的内容: ⑴定义目标总体 ⑵决定抽样框 ⑶抽样调查的组织形式和抽样方法的选择 ⑷精度的确定 ⑸确定样本量 ⑹经费核算抽样的一般步骤: ①界定总体②指定抽样框③实施抽样调查并推测总体④分割总体⑤决定样本规模⑥决定抽样方式⑦确定调查的信度和效度 第二套 一、单项选择(每题 2 分,共计 30 分) 1. 对一个变量而言,其()指的是全面调查获得的所有变量值(或组)与其对应频率的 一揽子表示。
A.分布 B.总体分布 C.样本分布 D.频数 2.( )指的是抽样调查获得的所有变量值(或组)与其对应频率的一揽子表示。
A.分布 B.总体分布 C.样本分布 D.联合总体分布 3. 以文字叙述方式表达简单变量的分布,一般用于变量值极少的场合(如性别)的分布的 表达方法是()。
A. 语示法 B. 表示法 C. 图示法 D. 函数法 4. 以表格陈列的方式表达较复杂变量的分布,用于变量值较少的场合(如年龄段)的分布 的表达方法是()。
A. 语示法 B. 表示法 C. 图示法 D. 函数法 5. 以图形方式表达复杂变量的分布的表达方法是()。
A. 语示法 B. 表示法 C. 图示法 D. 函数法 6.()既可以反映较少类数也可以反映较多类数的分类变量分布,甚至也能反映分组 化的数值变量分布,居于优先选择地位。
A. 饼形图 B. 柱形图 C. 条形图 D. 直方图 7. 在变量值极少的场合,在一个圆形内,以顶点在圆心的扇形的相对面积(即占整个圆形 面积的比例)表示概率大小,以扇形的颜色或其他标记表示对应变量值(既可是分类变量也 可是数值变量的)。这样的图称为( )。
A. 饼形图 B. 柱形图 C. 条形图 D. 直方图 8. 在所有总体分布特征中,最重要的分布特征是()。
A. 中位数 B. 众数 C. 标准差 D. 均值 9. 某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。
A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 10.总量指标数值大小() A.随总体范围扩大而增大 B.随总体范围扩大而减小 C.随总体范围缩小而增大 D.与总体范围大小无关 11.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和() A.小于 100% B.大于 100% C.等于 100% D.小于或大于 100% 12.众数是()。
A. 出现次数最少的次数 B. 出现次数最少的标志值 C. 出现次数最多的变量值 D. 出现次数最多的频数 13. 在一组数据中,每个数据类型出现的次数称为()。
A.参数 B.频数 C.众数 D.组数 14.集中趋势最主要的测度值是( )。
A.几何平均数 B.算术平均数 C.众数 D.中位数 15. 以下分布中不属于离散型随机变量分布的是()。
A.超几何分布 B.伯努利分布 C.几何分布 D.正态分布 二、多项选择(每题 2 分,共计 10 分) 1. 分布的表达方法有( )。
A. 语示法 B. 表示法 C. 图示法 D. 函数法 2. 分布图的主要形式包括( )。
A. 饼形图 B. 柱形图 C. 条形图 D. 直方图 3. 均值的计算方式包括( )。
A.算术平均数 B.加权平均数 C.中位数 D. 方差 4. 可以反映数值变量离散程度分布特征的是( ) A.中数 B. 四分位差 C.偏度 D.标准差 5. 以下分布中属于连续型随机变量分布的是()。
A. 超几何分布 B. 指数分布 C. 几何分布 D 正态分布 三、计算分析题(每题 10 分,共计 60 分) 1 .某技术小组有 12 人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分 别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并 说明几个计算结果之间有何关系?
2. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工 序的次品率分别为 0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种 零件的次品率。
3. 已知参加某项考试的全部人员合格的占 80%,在合格人员中成绩优秀只占 15%。试求 任一参考人员成绩优秀的概率。
4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射 击)。某射击选手第一发命中的可能性是 80%,第二发命中的可能性为 50%。求该选手两发 都脱靶的概率。
5.已知某地区男子寿命超过 55 岁的概率为 84%,超过 70 岁以上的概率为 63%。试求任一刚 过 55 岁生日的男子将会活到 70 岁以上的概率为多少?6. 某班级 25 名学生的统计学考试成绩数据如下: 89,95,98,95,73,86,78,67,69,82,84,89,93,91,75,86,88,82,53,80, 79,81,70,87,60 试计算:(1)该班统计学成绩的均值、中位数和四分位数; 答:`X=81.2 Me=82 Q=74 QM=89 (2)该班统计学成绩的方差、标准差。
第三套 一、单项选择(每题 2 分,共计 40 分) 1.估计量的含义是指()。
A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2.根据一个具体的样本求出的总体均值的 95%的置信区间()。
A.以 95%的概率包含总体均值 B.有 5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 3.无偏估计是指() A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 4.总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的 临界值乘以() A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 5.当样本量一定时,置信区间的宽度() A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 6.当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 7.一个 95%的置信区间是指() A.总体参数中有 95%的概率落在这一区间内 B.总体参数中有 5%的概率落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有 95%的区间包含该总体参数 D. 在用同样方法构造的总体参数的多个区间中,有 95%的区间不包含该总体参数 8. 95%的置信水平是指() A.总体参数落在一个特定的样本所构造的区间内的概率为 95%
B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为 95% C.总体参数落在一个特定的样本所构造的区间内的概率为 5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为 5% 9.一个估计量的有效性是指() A.该估计量的数学期望等于被估计的总体参数 B.该估计量的一个具体数值等于被估计的总体参数 C.该估计量的方差比其他估计量大 D.该估计量的方差比其他估计量小 10.一个估计量的一致性是指() A.该估计量的数学期望等于被估计的总体参数 B.该估计量的方差比其他估计量小 C.随着样本量的增大该估计量的值越来越接近被估计的总体参数 D.该估计量的方差比其他估计量大 11.置信系数( 1−a )表达了置信区间的() A.准确性 B.精确性 C.显著性 D.可靠性 12.在置信水平不变的条件下,要缩小置信区间,则() A.需要增加样本量 B.需要减小样本量 C.需要保持样本量不变 D.需要改变统计量的抽样标准差 13.在其它条件不变的情况下,总体数据的方差越大,估计时所需的样本量() A.越大 B.越小 C.可能大也可能小 D.不变 14.在其它条件相同的情况下,95%的置信区间比 90%的置信区间() A.要宽 B.要窄 C.相同 D.可能宽也可能窄 15.指出下面的说法中哪一个是正确的() A.样本量越大,样本均值的抽样标准差就越小
B.样本量越大,样本均值的抽样标准差就越大 C.样本量越小,样本均值的抽样标准差就越小 D.样本均值的抽样标准差与样本量无关 16.指出下面的说法中哪一个是正确的() A.置信水平越大,估计的可靠性就越大 B.置信水平越大,估计的可靠性就越小 C.置信水平越小,估计的可靠性就越大 D.置信水平的大小与估计的可靠性无关 17.指出下面的说法中哪一个是正确的() A.在置信水平一定的条件下,要提高估计的可靠性,就应缩小样本量 B.在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量 C.在样本量一定的条件下,要提高估计的可靠性,就降低置信水平 D.在样本量一定的条件下,要提高估计的准确性,就提高置信水平 18.在一项对学生资助贷款的研究中,随机抽取 480 名学生作为样本,得到毕业前的平均欠 款余额为 12168 元,标准差为 2200 元。则贷款学生总体中平均欠款额的 95%的置信区间为 () A.(11971,12365) B.(11971,13365) C.(11971,14365) D.(11971,15365) 19.从一个正态总体中随机抽取n=20的一个随机样本,样本均值为17.25,样本标准差为3.3。
则总体均值的 95%的置信区间为() A.(15.97,18.53) B.(15.71,18.79) C.(15.14,19.36) D.(14.89,20.45) 20.某地区的写字楼月租金的标准差为 80 元,要估计总体均值的 9
5%的置信区间,希望的边 际误差为 25 元,应抽取的样本量为() A.20 B.30 C.40 D.50 二、多项选择(每题 2 分,共计 10 分) 1.在抽样推断中() A.抽样指标的数值不是唯一的 B.总体指标是一个随机变量 C.可能抽取许多个样本 D.统计量是样本变量的涵数 2.从全及总体中抽取样本单位的方法有() A.简单随机抽样 B.重复抽样 C.不重复抽样 D.概率抽样 3.在抽样推断中,样本单位数的多少取决于() A.总体标准差的大小 B.允许误差的大小 C.抽样估计的把握程度 D.总体参数的大小 4.区间估计和点估计的理论其核心分别是()。
A. 中心极限定理 B. 大数定理 C. 切比雪夫大数定理 D. 辛钦大数定理 5.简单随机抽样() A、试用于总体各单位呈均匀分布的总体; B、适用于总体各单位标志变异较大的总体 C、在抽样之前要求对总体各单位加以编号 D、最符合随机原则 三、简答题(每题 10 分,共计 20 分) 1.简述以样本均值估计总体均值的理由? 答:样本均值估计总体均值的理由: ①对于待估 参数总体均值而言,样本均值作为估计量随着样本量的增 大可以非常接近、需要时可以无限接近总体均值; ②样本均值几乎符合所有估计量的优良标准; ③区间估 计能够可靠地实现以样本均值估计总体均值的目标。
2.随机试验满足三个条件是什么? 答:随机试验需要满足的三个条件: ①所有可能结果已经知道为(Nn)个; ②试验当然是可重复进行的(尽管这是在想象力进行,所有的条件环境均可严格地受到控制) ; ③具体试验之前无从知晓具体结果。
五、计算分析题(每题 15 分,共计 30 分) 1. 在一项家电市场调查中,随机抽取了 200 个居民户,调查他们是否拥有某一品牌的 电视机。其中拥有该品牌电视机的家庭占 23%。求总体比率的置信区间,置信水平分别为 90%和 95%。
2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3 周的时间里选取 49 名顾客 组成了一个简单随机样本。
假定总体标准差为 15 元,求样本均值的抽样标准误差; 在 95%的置信水平下,求允许误差; 如果样本均值为 120 元,求总体均值 95%的置信区间。
第四套 一、单项选择(每题 2 分,共计 40 分) 1.对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为() A.参数估计 B.双侧检验 C.单侧检验 D.假设检验 2
.研究者想收集证据予以支持的假设通常称为() A.原假设 B.备择假设 C.合理假设 D.正常假设 3.在假设检验中,原假设和备择假设( ) A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 4.在假设检验中,第Ⅰ类错误是指() A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设 5. 当备择假设为: ,此时的假设检验称为() A.双侧检验 B.右侧检验 C.左侧检验 D.显著性检验 6.某厂生产的化纤纤度服从正态分布,纤维纤度的标准均值为 1.40。某天测得 25 根纤维的 1 0 H : m < m 纤度的均值为 x =1.39,检验与原来设计的标准均值相比是否有所下降,要求的显著性水平 为α=0.05,则下列正确的假设形式是() A.H0: μ=1.40, H1: μ≠1.40 B.H0: μ≤1.40, H1: μ>1.40 C.H0: μ<1.40, H1: μ≥1.40 D.H0: μ≥1.40, H1: μ<1.40 7.一项研究表明,司机驾车时因接打手机而发生事故的比例超过 20%,用来检验这一结论的 原假设和备择假设应为( )。
A. H0:μ≤20%, H1: μ>20% B. H0:π=20% H1: π≠20% C. H0:π≤20% H1: π>20% D. H
0:π≥20% H1: πzα 8.在假设检验中,不拒绝原假设意味着()。
A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 9.若检验的假设为Ho: u≥μ0,H: μ<μo ,则拒绝域为( B ) 10.若检验的假设为 H0: μ≤μ0, H1: μ>μ0 ,则拒绝域为() A. z> zα B. z<- zα C. z> zα/2 或 z<- zα/2 D. z> zα或 z<- zα 11. 如果原假设 H0为真,所得到的样本结果会像实际观测取值那么极端或更极端的概率称为 () A.临界值 B.统计量 C. P 值 D. 事先给定的显著性水平 12. 对于给定的显著性水平α,根据 P 值拒绝原假设的准则是() A. P= α B. P< α C. P> α D. P= α=0 13. 下列几个数值中,检验的 p 值为哪个值时拒绝原假设的理由最充分( ) A.95% B.50% C.5% D.2% 14. 若一项假设规定显著性水平为α=0.05,下面的表述哪一个是正确的() A. 接受 H0 时的可靠性为 95% B. 接受 H1 时的可靠性为 95% C. H0为假时被接受的概率为 5% D. H1为真时被拒绝的概率为 5% 15. 进行假设检验时,在样本量一定的条件下,犯第一类错误的概率减小,犯第二类错误的 概率就会( ) A. 减小 B. 增大 C. 不变 D. 不确定 16. 容量为 3
升的橙汁容器上的标签表明,这种橙汁的脂肪含量的均值不超过 1 克,在对标 签上的说明进行检验时,建立的原假设和备择假设为 H0: μ≤1, H1: μ>1,该检验所犯的第 一类错误是( ) A.实际情况是μ≥1,检验认为μ>1 B.实际情况是μ≤1,检验认为μ1 C.实际情况是u≥1, 检验认为u<1 D.实际情况是u≤1, 检验认为u>1 17. 如果某项假设检验的结论在 0.05 的显著性水平下是显著的(即在 0.05 的显著性水平下 拒绝了原假设),则错误的说法是() A.在 0.10 的显著性水平下必定也是显著的 B.在 0.01 的显著性水平下不一定具有显著性 C.原假设为真时拒绝原假设的概率为 0.05 D.检验的 p 值大于 0.05 18. 在一次假设检验中当显著性水平α=0.01,原假设被拒绝时,则用α=0.05 时,( ) A. 原假设一定会被拒绝 B. 原假设一定不会被拒绝 C. 需要重新检验 D. 有可能拒绝原假设 19. 哪种场合适用 t 检验统计量?() A. 样本为大样本,且总体方差已知 B. 样本为小样本,且总体方差已知 C. 样本为小样本,且总体方差未知 D. 样本为大样本,且总体方差未知 20.当样本统计量的取值未落入原假设的拒绝域时,表示( ) A. 可以放心地接受原假设 B. 没有充足的理由否定原假设 C. 没有充足的理由否定备择假设 D. 备择假设是错误的 二、简答题(每题 10 分,共计 20 分) 1.简述假设检验的步骤。
答: (1) 建立合适的原假设和备择假设。
(2)给出显著性水平。
(3)选定检验统计量。
(4)查出相应的分位点,并据此确定拒绝域。
(5)计算检验统计量的具体数值。若该值落入拒绝域,则拒绝原假设;否则,保留原假设。
(6)以计算所得的检验统计量的具体数值为分位点,倒查其”显著性水平”,获得p值。
2.简述假设检验与区间估计之间的关系。
答:①置信区间具有假设检验的主要功能:在a水准上可回答差别有无统计学意义; ②置信区间可提供假设检验没有提供的信息:根据置信区间上、下限的数值大小可判断差别是否具有实际 意义医学教|育网搜集整理; ③假设检验可提供确切的P值,置信区间只能在预先确定的置信度100 (1-a) %水平上进行推断,没有精 确的概率值,且賄可能增大类错误; ④置信区间推断量的大小,即推断总体均数范围;假设检验推断质的大小即推断总体均数是否存在不同。
只有把置信区间和假设检验结合起来,互相补充才是对问题比较的完整分析。
三、计算分析题(20 分,共计 40 分)
1.某一小麦品种的平均产量为 5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高 产量。为检验改良后的新品种产量是否有显著提高,随机抽取了 36 个地块进行试种,得到 的样本平均产量为 5275kg/hm2,标准差为 120/hm2 。试检验改良后的新品种产量是否有显著 提高?
2、一种罐装饮料采用自动生产线生产,每罐的容量是 255ml,标准差为 5ml。为检验每罐容 量是否符合要求,质检人员在某天生产的饮料中随机抽取了 40 罐进行检验,测得每罐平均 容量为 255.8ml。取显著性水平 a=0.05 ,检验该天生产的饮料容量是否符合标准要求?(本 题 10 分)