统计学期末习 10页

  • 42.00 KB
  • 2022-08-29 发布

统计学期末习

  • 10页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
统计学期末复习(仅供参考)单项选择题20个,40分,论述题4个,20分,计算题40分(15+6+6+6+7)第3章累积分布图p51,第4,第7,第8章单项选择题1.指出下面的数据哪一个属于分类数据(C)A某种产品的销售价格(元):21262228B对某一事物的看法:同意保持中立反对C购买商品时的支付方式:现金、信用卡、支票D某汽车生产企业各季度的产量(万辆):20253036A、D属于数值型数据,B属于顺序数据2.下列哪一个属于顺序变量(B)A年龄B受教育程度C企业所属的行业D性别C、D属于分类变量A属于数值型变量3.一项调查表明,在所抽取的2000个消费者中,他们每月在网上购物的平均花费是200元,这项调查的样本是(B)A.所有网上购物的消费者B.2000个消费者C.所有在网上购物的消费者的网上购物的平均花费金额D.2000个消费者的网上购物的平均花费金额A是总体,C是参数,D是统计量4.最近发表的一项调查表明,‘汽车消费税率调整后,消费者购买大排量汽车的比例显著下降’。这一结论属于(D)A.对样本的描述B.对样本的推断C.对总体的描述D.对总体的推断5.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是‘价格便宜’。研究者使用的方法是(推断统计方法)6.分层抽样的特点是(B)A使得总体中的每一个元素都有相同的机会被抽中B在抽样之前先将总体的元素划分为若干类,使得每一类都有相同的机会被抽中C先将总体划分为若干群,使得每一群都有相同的机会被抽中D先将总体各元素按某种顺序排列,使总体中的每一个元素都有相同的机会被抽中A是简单抽样的特点,C是整群抽样的特点,D是系统抽样的特点7.一名学生为了完成统计学作业,在《统计年鉴》中找到2010年城镇家庭的人均收入数据,这一数据属于(C)A.分类数据B.顺序数据C.截面数据D.时间序列数据8.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的总体是(B)样本是(A)参数是(D)统计量是(C)\nA.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入9.为了调查某学校的购书费支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是(C)A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样10.为了调查某学校的购书费支出,从全校抽取4个班级的学生进行调查,这种调查方法是(B)A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样11.为了调查某学校的购书费支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是(D)A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样12.为了解女性对某种化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查,这种调查方式是(C)A.简单随机抽样B.分层抽样C.方便抽样D.自愿抽样13.研究人员根据对研究对象的了解有目的选择一些单位作为样本,这种调查方式是(A)A.判断抽样B.分层抽样C.方便抽样D.自愿抽样14.下面的哪种调查方法的结果不能用于对总体有关参数进行估计(D)A.分层抽样B.系统抽样C.整群抽样D.判断抽样15.如果要收集某一特定群体的有关资料,适宜采用的调查方式是(C)A.系统抽样B.整群抽样C.滚雪球抽样D.判断抽样16.下面哪种抽样方式属于非概率抽样(D)A.系统抽样B.整群抽样C.分层抽样D.滚雪球抽样17.一家公司的人力资源部主管要研究公司雇员的饮食习惯,改善公司餐厅的现状,将问卷发给就餐者,填写后再收上来。他的收集数据的方法属于(A)A.自填式问卷调查B.面访式问卷调查C.实验调查D.观察式调查18.为掌握商品销售情况,对占该市商品销售额80%的五个大商场进行调查,这种调查方式属于(B)A.代表性抽样B.重点抽样C.抽样调查D.典型抽样典型抽样:如研究青少年犯罪问题,选择一些典型的犯人进行调查。代表性抽样:如某奶粉生产企业想了解消费者对奶粉成分的需求,调查一些年轻的母亲。19.为了解居民对小区物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。这种数据收集方法称为(B)A.自填式问卷调查B.面访式问卷调查C.实验调查D.观察式调查20.如果一个样本因人故意操纵而出现偏差,这种误差属于(B)A.抽样误差B.非抽样误差C.设计误差D.实验误差\n21.某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。物业管理部门利用最初的居民户登记名单进行抽样。但现在的小区中,原有的一些居民已经搬走,同时有些新入住的居民户。这种调查产生的误差属于(B)A.随机误差B.抽样框误差C.回答误差D.无回答误差22.某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。物业管理部门利用居民登记名单进行抽样。但现在的小区中,原有的一些居民已经搬走没有回答问题。这种调查产生的误差属于(D)A.随机误差B.抽样框误差C.回答误差D.无回答误差23.某居民小区的物业管理者怀疑有些居民户有偷电行为。为了了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。发现有些居民户有虚报或瞒报的情况。这种调查产生的误差属于(A)A.有意识误差B.抽样框误差C.回答误差D.无回答误差24.某居民小区的物业管理者怀疑有些居民户有偷电行为。为了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。发现调查员在登记电表数时有抄错的数据。这种调查产生的误差属于(C)A.有意识误差B.抽样框误差C.调查员误差D.无回答误差25.落在某一特定类型或组中的数据个数称为(A)A.频数B.频率C.频数分布表D.累积频数26.一个样本或总体中各个部分的数据与全部数据之比称为(C)A.频数B.频率C.比例D.比率27.样本或总体中各不同类别数值之间的比值称为(D)A.频数B.频率C.比例D.比率28.将比例乘以100得到的数值称为(B)A.频数B.百分数C.比例D.比率29.下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性问题(A)A.环形图B.饼图C.直方图D.茎叶图30.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为(B)A.单变量值分组B.组距分组C.等距分组D.连续分组31.组中值是(B)A.一个组的上限与下限之差B.一个组的上限与下限之间的中点值C.一个组的最小值D.一个组的最大值32.下面的图形中最适合描述一组数据分布的图形是(C)A.条形图B.箱线图C.直方图D.饼图33.对于大批量的数据,最适合描述其分布的图形是(C)\nA.条形图B茎叶图C.直方图D.饼图34.小钱收集了上海、江苏和浙江三省2007年三次产业的增加值的资料,如果要反映2007年这三个省三次产业的结构,用什么图形最为合适?(C)A.直方图B.散点图C.饼图D.折线图35.小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?(D)A.直方图B.散点图C.饼图D.折线图36.对于小批量的数据,最适合描述其分布的图形是(B)A.条形图B茎叶图C.直方图D.饼图37.对于时间序列数据,用于描述其变化趋势的图形通常是(D)A.条形图B.直方图C.箱线图D.线图38.为描述身高与体重之间是否有某种关系,适合采用的图形是(C)A.条形图B.对比条形图C.散点图D.箱线图39.气泡图主要用于描述(B)A.两个变量之间的相关关系B.三个变量之间的相关关系C.两个变量的对比关系D.三个变量的对比关系40.为了研究多个不同变量在不同样本间的相似性,适合采用的图形是(C)A.环形图B.茎叶图C.雷达图D.箱线图41.10家公司的月销售额数据(万元)分别为:72,63,54,54,29,26,25,23,23,20。下列哪种图形不宜用于描述这些数据(B)A.茎叶图B.散点图C.条形图D.饼图42.与直方图相比,茎叶图(B)A.没保留原始数据的信息B.保留了原始数据的信息C.不能有效展示数据的分布D.更适合描述分类数据43.下面的哪个图形不适合描述分类数据(D)A.条形图B.饼图C.帕累托图D.茎叶图茎叶图描述数值型数据。44.下面的哪个图形适合描述顺序数据(C)A.直方图B.茎叶图C.累积频数分布图D.箱线图45.将某企业职工的月收入依次分为2000元以下,2000元—3000元,3000元—4000元,4000元—5000元,5000元以上几个组。第一组的组中值近似为(C)最后一组的组中值近似为(D)A.2000B.1000C.1500D.5500\n第一组为1000-2000最后一组为5000-600046.直方图与条形图的区别之一是(A)A.直方图的各矩形通常是连续排列的,而条形图则是分开排列的B.条形图的各矩形通常是连续排列的,而直方图则是分开排列的C.直方图主要用于描述分类数据,条形图则主要用于描述数值型数据D.直方图主要用于描述各类别数据的多少,条形图则主要用于描述数据的分布直方图描述数值型数据,条形图描述分类型数据47.一组数据排序后处于25%和75%位置上的值称为(C)A.众数B.中位数C.四分位数D.平均数48.非众数组的频数占总频数的比例称为(A)A异众比率B离散系数C平均差D标准差49.四分位差是(A)A上四分位数减下四分位数的结果B下四分位数减上四分位数的结果C下四分位数加上四分位数D下四分位敬与上四分位数的中间值50.各变量值与其平均数离差平方的平均数称为(C)A极差B平均差C方差D标准差51.变量值与其平均数的离差除以标准差后的值称为(A)A标准分数B离散系数C方差D标准差52.经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围之内大约有(A),在平均数加减2个标准差的范围之内大约有(B),在平均数加减3个标准差的范围之内大约有(C)A68%的数据B95%的数据C99%的数据D100%的数据53.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=2,其意义是(A),对于k=3,其意义是(B),对于k=4,其意义是(C)。A至少有75%的数据落在平均数加减2个标准差的范围之内B至少有89%的数据落在乎均数加减3个标准差的范围之内C至少有94%的数据落在平均数加减4个标准差的范刚之内D至少有99%的数据落在平均数加减2个标准差的范围之内54、离散系数的主要用途是(C)A反映一组数据的离散程度B反映一组数据的平均水平C比较多组数据的离散程度D比较多组数据的平均水平55.偏态系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏态系数(A)。A等于0B等于lC大于0D大于156.如果一组数据分布的偏态系数在0.5~1或-1~0.5之间,则表明该组数据属于(B)A对称分布B中等偏态分布C高度偏态分布D轻微偏态分布\n高度偏态分布,偏态系数大于1或小于-1,越接近0,偏态程度越低。57.峰态通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值(A)A等于0B大于0C小于OD等于l58.如果峰态系数k>0.表明该组数据是(A)A尖峰分布B扁平分布C左偏分布D右偏分布K<0时为扁平分布。59.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是(B)。A.1200B经济管理学院C.200D理学院该题是分类数据的众数60.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。描述该组数据的集中趋势宜采用(B)。A众数B中位数C四分位数D平均数61、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。该组数据的中位数是(A)。A赞成B69C中立D22该题是分类数据62.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66.76.86,74.61.89,65,90.69,67.76,62.81,63.68,81.70.73,60,87,75,64,56.该班考试分数的下四分位数和上四分位数分别是(64.25、76)63.对于右偏分布,平均数、中位数和众数之间的关系是(A)A平均数>中位数>众数B中位数>平均数>众数C众数>中位数>平均数D众数>平均数>中位数64.在某行业中随机抽取10家企业,第一季度的利润额(单位,万元)分别是72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的平均数为(39.19),标准差为(19.54),中位数为(27.95)65.某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布.可以判断成绩在60-100分之间的学生大约占(A),可以判断成绩在70—90分之间的学生大约占(C)A95%B89%C68%D99%60-100分在平均数加减2个标准差的范围内,对称分布,约有95%的数据。70-90分再平均数加减1个标准差范围内。66.某班学生的平均成绩是80分,标准差是5分。如果已知该班学生的考试分数为非对称分布,可以判断成绩在70-90分之间的学生至少占(D)A95%B89%C68%D75%非对称分布,70-90分在平均数加减2个标准差的范围内,约有75%的数据。\n67.在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分。假设新员工得分的分布是未知的,则得分在65—95分的新员工至少占(B)A75%B89%C94%D95%68.在某公州进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数足86分,则新员工得分的分布形状是(B)A.对称的B.左偏的C.右偏的D.无法确定69.下列叙述中正确的是(A)。A如果计算每个数据与平均数的离差,则这些离差的和总是等于零B如果考试成绩的分布是对称的,平均数为75.标准差为l2.则考试成绩在63--75分之间的比例大约为95%C平均数和中位数相等D中位数大于平均数70.在离散程度的测度中,最容易受极端值影响的是(A)A极差B四分位差C标准差D平均差71.一组数据的离散系数为0.4,平均数为20,则标准差为(D)A80B0.02C4D8离散系数V=标准差/平均数72.在比较两组数据的离散程度时,不能直接比较它们的标准差.因为两组数据的(D)A.标准差不同B方差不同C数据个数不同D计量单位不同73.一项试验中所有可能结果的集合称为(C)。A.事件B.简单事件C.样本空间D.基本事件74.抛3枚硬币,用0表示反面,1表示正面,其样本空间为Ω=(A)。A.{000,001,010,100,011,101,110,111)B.{1,2,3}C.{O,1}D.{01,10}75.抛掷一枚硬币,观察其出现的是正面还是反面,并将事件A定义为:事件A=出现正面,这一事件的概率记作P(A)。则概率P=1/2的含义是(C)。A.抛掷多次硬币,恰好有一半结果正面朝上B.抛掷两次硬币,恰好有一次结果正面朝上C.抛掷多次硬币,出现正面的次数接近一半D.抛掷一次硬币,出现的恰好是正面76.一家超市所作的一项调查表明,有80%的顾客到超市是来购买食品,有60%的人是来购买其他商品,35%的人既购买食品也购买其他商品。设A=顾客购买食品,B=顾客购买其他商品。则某顾客来超市购买食品的条件下,也购买其他商品的概率为(C)。A.0.80B.0.60C.0.4375D.0.35P(A|B)=P(AB)/P(B)=0.35/0.8=0.4375\n77.某考生回答一道四选一的考题,假设他知道正确答案的概率为1/2,而他不知道正确答案时猜对的概率应该为1/4。分别定义事件A=该考生答对了;B=该考生知道正确答案,考试结束后发现他答对了,那么他知道正确答案的概率为(D)。A.1B.0.25C0.5D.0.878.下面关于n重贝努里试验的陈述中哪一个是错误的(D)。A.一次试验只有两个可能结果,即“成功”和“失败”B.每次试验成功的概率p都是相同的C.试验是相互独立的D.在n次试验中,“成功”的次数对应一个连续型随机变量在n次试验中,“成功”的次数对应一个离散型随机变量79.从一个均值μ=10、标准差σ=0.6的总体中随机选取容量n=36的样本。假定该样本并不是很偏的,则样本均值小于9.9的近似概率(A)。A.0.1587B.0.1268C.0.2735D.0.632480.某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是(B)。A.正态分布,均值为250元,标准差为40元B.正态分布,均值为2500元,标准差为40元C.右偏,均值为2500元,标准差为400元D.正态分布,均值为2500元,标准差为400元中心极限定理,标准差=根号(400^2/100)=4081.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为(B)。A.无偏性B.有效性C.一致性D.充分性82.根据一个具体的样本求出总体均值的95%的置信区间(D)。A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D.要么包含总体均值,要么不包含总体均值置信区间与概率无关83.无偏估计是指(B)。A.样本统计量的值恰好等于待估的总体参数B.所有可能样本估计值的数学期望等于待估总体参数C.样本估计值范围绕待估总体参数使其误差最小D.样本量扩大到和总体单元相等时与总体参数一致83.一个估计量的一致性是指(C)。A.该估计量的数学期望等于被估计的总体参数B.该估计量的方差比其他估计量小\nC.随着样本量的增大,该估计量的值越来越接近被估计的总体参数D.该估计量的方差比其他估计量大84.某厂生产的化纤纤度服从正态分布,标准纤度为1,40.某天测得25根纤维的纤度=1.39,检验与原来的标准相比是否有所变化,则正确的假设是(A)A、H0:µ=1.40,H1:µ≠1.40B、H0:µ≤1.40,H1:µ>1.40C、H0:µ<1.40,H1:µ≥1.40D、H0:µ≥1.40,H1:µ<1.4085.一项研究表明,中学生中吸烟的比例高达30%,为检验这一说法是否属实,正确的假设应为(B)A、H0:µ>30%,H1:µ≤30%B、H0:µ=30%,H1:µ≠30%C、H0:µ≥30%,H1:µ<30%D、H0:µ≤30%,H1:µ>30%86.某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为(A)A、H0:π≤0.2,H1:π>0.2B、H0:π=0.2,H1:π≠0.2C、H0:π≥0.2,H1:π<0.3D.H0:π<0.2,H1:π≥0.287.某企业每月发生事故5起,企业准备制定一项新的安全生产计划,希望新计划能减少事故次数。用来检验这一计划有效性的假设应为(D)A、H0:µ=5,H1:µ≠5B、H0:µ≠5,H1:µ=5C、H0:µ≤5,H1:µ>5D、H0:µ≥5,H1:µ<5二、论述题(4个,20分)1.解释描述统计和推断统计p2描述统计:它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计:它是研究如何利用样本数据来推断总体特征的统计方法。 2.什么是二手资料?使用二手资料应注意什么问题?P14必考与研究内容有关,由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人即考察搜记者的实力和社会信誉度,收集目的,收集方法,收集时间,使用时要注意数据的定义、含义、计算口径和计算方法,避免错用误用滥用,要注明数据来源,以尊重他人的劳动成果。3.直方图与条形图有何区别?P55-56(1)条形图是用图形的长度表示各类别频数的多少,其宽度固定;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示组距,宽度和高度都有意义。(2)直方图各矩形是连续排列的,条形图是分开排列。(3)条形图主要展示分类数据,直方图主要展示数值型数据。4.茎叶图与直方图相比有什么优点?它们的应用场合是什么?P56(选择题)茎叶图既能给出数据的分布状况,又保留了原始数据的信息。而直方图不能保留原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。5.简述中心极限定理的意义p147必考\n设从均值为μ,方差为s σ^2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值X的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布。5.简述评价估计量好坏的标准p161必考 无偏性:指估计量抽样分布的数学期望等于被估计的总体参数 。 有效性:指对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效 。  一致性:随着样本容量的增大,点估计量的值越来越接近被估计总体的参数。6.简述样本量与置信水平、总体方差、估计误差的关系。P179样本量与置信水平成正比,在其他条件不变时,置信水平越大,所需的样本量越大;样本量与总体方差成正比,总体方差越大,所需样本量越大。样本量与估计误差的平方成反比,可接受的估计误差越大,所需样本量越大。 8.解释分类数据、顺序数据、数值型数据的含义p5(选择题)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; 如人口按性别分为男女两类。顺序数据:只能归于某一有序类别的非数字型数据。如一个人的受教育程度可分为小学、初中、高中、大学及以上。数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 分类数据和顺序数据也可称为定性数据或品质数据,数值型数据也可称为定量数据或数量数据。

相关文档