统计学平时作业 29页

  • 197.50 KB
  • 2022-08-13 发布

统计学平时作业

  • 29页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
统计学平时作业学期:专业:班级:姓名:\n统计学作业第一章导论一、单项选择题1、指出下面的数据哪一个属于分类数据()A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据()A、年龄B、工资C、汽车产量D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、了解居民的消费支出情况,则()A、居民的消费支出情况是总体B、所有居民是总体C、居民的消费支出情况是总体单位D、所有居民是总体单位5、统计学研究的基本特点是()A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是()A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是()A、我国每一家工业企业B、我国所有工业企业\nC、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是()A、1000个消费者B、所有在网上购物的消费者C、所有在网上购物的消费者的平均消费额D、1000个消费者的平均消费额9、一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A、分类数据B、顺序数据C、截面数据D、时间序列数据10、一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于()A、访问调查B、邮寄调查C、个别深度访问D、观察调查二、多项选择题1、欲了解某地高等学校科研情况()A、该地所有高等学校所有的科研项目是总体B、该地所有的高等学校是总体C、该地所有高等学校的每一科研项目是总体单位D、该地每一所高等学校是总体单位E、该地所有高等学校的所有科研人员是总体2、下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据:公司名称销售额(百万美元)利润额(百万美元)行业代码BancOne102721427.08CPCIntl.9844580.019TysonFoods645487.019….….….….…..…….…..Woolworth8092168.748\n在这个例子中()A、总体是500强公司,总体单位是表中所列的公司B、总体是500强公司,总体单位是其中每一家公司C、总体是500强公司,样本是表中所列的公司D、总体是500强公司,样本是表中所列公司的销售额和利润额E、总体是表中所有的公司,总体单位是表中每一家公司3、一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过标准,就把整批货退回。这个问题中()A、样本是从所有木材批次中随机抽取的部分批次木材B、样本是从每批木材中随机抽取的5块木材C、总体单位是从所有木材批次中随机抽取的部分批次木材D、总体单位是购买的每一块木材E、总体是购买的全部木材三、判断分析题(判断正误,并简要说明理由)统计运用大量观察法必须对所有的总体单位进行观察。()四、简答题1、报纸上报道一项民意调查的结果说:“43%的美国人对总统的整体表现感到满意。”报道最后写到:“这份调查是根据电话访问1210位成人所得,访问对象遍布美国各地。”这个调查的总体是什么?总体单位是什么?样本是什么?2、一个公司正致力于测试一种新的电视广告的效果。作为测试的一部分,广告在某市的当地新闻节目中下午6:30播出。两天以后,一市场调查公司进行了电话采访以获取记忆率信息(观众记得看过广告的百分比)和对广告的印象。这一研究的总体是什么?总体单位是什么?样本是什么?这种情况下为什么使用样本?简要解释原因。五、简答\n1、什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1、什么是统计学?怎样理解统计学与统计数据的关系?2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?3、举例说明总体、样本、参数、统计量、变量这几个概念。第二章数据的搜集一、单项选择题1、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样2、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样3、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样4、在一项调查中,调查单位和填报单位()A、无区别,是一致的B、有区别,是不一致的C、无区别,是人为确定的D、有区别,但有时是一致的5、对家用电器的平均寿命进行调查,应该采用()A、普查B、重点调查C、典型调查D、抽样调查二、多项选择题1、下列属于原始数据的是()A、统计部门掌握的数据B、说明总体单位特征的数据\nC、说明总体特征的数据D、还没有经过分组汇总的数据E、直接向调查单位登记得到的数据2、统计调查方案的内容包括有()A、确定调查目的B、确定调查对象、调查单位和报告单位C、确定调查项目和调查表D、确定调查方法和调查时间E、确定调查人员、经费等3、重点调查的“重点”单位指()A、在国民经济中作用重要的单位B、标志值在总体标志总量中所占比重比较大的单位C、全部单位中的一小部分单位D、在国民经济中地位显赫的单位E、能反映总体基本情况的单位三、简答题1、抽样调查与重点调查、典型调查有哪些主要区别?2、进行产品质量调查和市场占有率调查,你认为采用什么调查方法最合适?简要说明理由。3、简述普查和抽样调查的特点。第三章数据的整理与显示一、单项选择题1、在累计次数分布中,某组的向下累计次数表明()A、大于该组上限的次数是多少B、大于该组下限的次数是多少C、小于该组上限的次数是多少D、小于该组下限的次数是多少2、数据筛选的主要目的是()A、发现数据的错误B、对数据进行排序C、找出所需要的某类数据D、纠正数据中的错误3、样本或总体中各不同类别数值之间的比值称为()A、频率B、频数C、比例D、比率4、将比例乘以100得到的数值称为()\nA、频率B、频数C、比例D、比率5、下面的哪一个图形最适合描述结构性问题()A、条形图B、饼图C、雷达图D、直方图6、下面的哪一个图形适合比较研究两个或多个总体或结构性问题()A、环形图B、饼图C、直方图D、茎叶图7、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为()A、单变量值分组B、组距分组C、等距分组D、连续分组8、下面的哪一个图形最适合描述大批量数据分布的图形()A、条形图B、茎叶图C、直方图D、饼图9、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为()A、环形图B、茎叶图C、直方图D、箱线图10、10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据()A、茎叶图B、散点图C、条形图D、饼图二、多项选择题1、下列属于定性变量的有()A、职业B、居住区域C、体重D、身高E、汽车产量2、下面的数列属于()身高(厘米)人数比重(%)150~1554020155~16010050160~1656030合计200100A、变量数列B、品质数列C、等距数列D、异距数列E、闭口数列三、简答题1、数值型数据的分组方法有哪些?\n2、直方图与条形图有何区别?3、茎叶图与直方图相比有什么优点?四、应用题1、下面是一个班50个学生的经济学考试成绩:88569179699088718279988534744810075956092836465699964457663696874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。(2)用茎叶图将原始数据表现出来。2、下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课程的成绩。考生编号123456789101112英语664439585234747151416451政治696658566840736562485864专业课154252036214824228353919专业课2906285816454737868668075专业课3815645627063768665217473对英语和政治两门课程做直方图。第四章数据分布特征的测度一、单项选择题1、一组数据排序后处于25%和75%位置上的值称为()A、众数B、中位数C、四分位数D、均值\n2、如果一个数据的标准分数是–2,表明该数据()A、比平均数高出2个标准差B、比平均数低2个标准差C、等于2倍的平均数D、等于2倍的标准差3、经验法则表明,当一组数据对称分布时,在均值加减1个标准差的范围内大约有()A、68%的数据B、95%的数据C、99%的数据D、100%的数据4、离散系数的主要用途是()A、反映一组数据的离散程度B、反映一组数据的平均水平C、比较多组数据的离散程度D、比较多组数据的平均水平5、离散系数()A、只能消除一组数据的水平对标准差的影响B、只能消除一组数据的计量单位对标准差的影响C、可以同时消除数据的水平和计量单位对标准差的影响D、可以准确反映一组数据的离散程度6、峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值()A、等于0B、大于0C、小于0D、等于17、如果峰态系数K>0,表明该组数据是()A、尖峰分布B、扁平分布C、左偏分布D、右偏分布8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是()A、1200B、经济管理学院C、200D、理学院9、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用()A、众数B、中位数C、四分位数D、均值10、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用()A、众数B、中位数C、四分位数D、均值11、对于分类数据,测度其离散程度使用的统计量主要是()A、众数B、异众比率C、标准差D、均值\n12、甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量()A、上升B、下降C、不变D、可能上升,也可能下降13、权数对平均数的影响作用取决于()A、各组标志值的大小B、各组的次数多少C、各组次数在总体单位总量中的比重D、总体单位总量14、当各个变量值的频数相等时,该变量的()A、众数不存在B、众数等于均值C、众数等于中位数D、众数等于最大的数据值15、有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为()A、24B、23C、22D、2116、下列数列平均数都是50,在平均数附近散布程度最小的数列是()A、02040506080100B、04849505152100C、012509899100D、0474950515310017、下列各项中,应采用加权算术平均法计算的有()A、已知计划完成百分比和实际产值,求平均计划完成百分比B、已知计划完成百分比和计划产值,求平均计划完成百分比C、已知各企业劳动生产率和各企业产值,求平均劳动生产率D、已知生产同一产品的各企业产品单位成本和总成本,求平均单位成本18、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?()A、算术平均数B、几何平均数C、中位数D、众数19、假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用()A、算术平均数B、几何平均数C、众数D、调和平均数20、某组数据分布的偏度系数为正时,该数据的众数、中位数、均值的大小关系是()A、众数>中位数>均值B、均值>中位数>众数C、中位数>众数>均值D、中位数>均值>众数\n二、多项选择题1、变量数列中,各组变量值与频数的关系是()A、各组变量值作用的大小由各组频数的多少反映B、各组变量值作用的大小由各组变量值的大小反映C、频数越大的变量值对总体一般水平的影响也越大D、频数越大的变量值对总体一般水平的影响越小E、频数越大,变量值也越大2、应该用加权算术平均法计算平均数的有()A、已知各组职工工资水平和各组职工人数,求平均工资B、已知各组职工工资水平和各组工资总额,求平均工资C、已知各组计划完成百分数和各组计划产值,求平均计划完成百分数D、已知各组计划完成百分数和各组实际产值,求平均计划完成百分数E、已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率3、下列应该用几何平均法计算的有()A、生产同种产品的三个车间的平均合格率B、平均发展速度C、前后工序的三个车间的平均合格率D、平均劳动生产率E、以复利支付利息的年平均利率4、下列说法那些是正确的?()A、应该用均值来分析和描述地区间工资水平B、宜用众数来描述流行的服装颜色C、考试成绩中位数的含义是有一半考生的成绩超过此数D、在数据组高度偏态时,宜用中位数而不是用众数来作为平均数E、一般常用算术平均法来计算年平均增长率三、填空题1、某班的经济学成绩如下表所示:435556565960676973757777787980818283838384868788888990909597该班经济学成绩的平均数为,众数为,中位数为\n,上四分位数为,下四分位数为,四分位差为,离散系数为。从成绩分布上看,它属于  ,你觉得用  描述它的集中趋势比较好,理由  。四、判断分析题(判断正误,并简要说明理由)1、并非任意一个变量数列都可以计算其算术平均数、中位数和众数。()2、某企业某年各季度销售额和利润资料如下:季度1234销售额(百万元)利润率(%)15030180322003521036则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。()3、某企业计划劳动生产率比上年提高10%,实际只提高了5%,表明劳动生产率计划只完成了一半。()4、若数据组的均值是450,则所有的观察值都在450周围。()五、简答题1、简述众数、中位数和均值特点及应用场合。2、某公司下属两个企业生产同一种产品,其产量和成本资料如下:基期报告期单位成本(元)产量(吨)单位成本(元)产量(吨)甲企业乙企业6007001200180060070024001600合计6603006404000试问:报告期与基期相比,该公司下属各企业单位成本都没有变化,但该公司总平均成本却下降了20元,这是为什么?3、一项民意测验询问了2050个成年人,“你对今天的生活状况满意程度如何?”回答分类为满意、不满意和说不清。(1)这一调查的样本规模有多大?(2)回答的答案是属于品质型还是数量型?(3)使用平均数或百分比作为对这一问题的数据的汇总,哪一个更有意义?(4)回答中,8%的人说他们对今天的生活状况不满意,作出这种回答的人是多少?\n第五章抽样与参数估计一、单项选择题1、某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是()A、样本容量为10B、抽样误差为2C、样本平均每袋重量是估计量D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于()A、N(100,25)B、N(100,5/)C、N(100/n,25)D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加()A、一半B、一倍C、三倍D、四倍4、在其他条件不变时,置信度(1–α)越大,则区间估计的()A、误差范围越大B、精确度越高C、置信区间越小D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加()A、1/4B、4倍C、7/9D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是()A、总方差B、群内方差C、群间方差D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使()尽可能小A、总体层数B、层内方差C、层间方差D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是()A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用()\nA、分层抽样B、简单随机抽样C、等距抽样D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选()A、85%B、87.7%C、88%D、90%二、多项选择题1、影响抽样误差大小的因素有()A、总体各单位标志值的差异程度B、调查人员的素质C、样本各单位标志值的差异程度D、抽样组织方式E、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。根据抽样结果进行推断,下列说法正确的有()A、n=200B、n=30C、总体合格率是一个估计量D、样本合格率是一个统计量E、合格率的抽样平均误差为2.52%3、用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布()A、np≤5B、np≥5C、n(1–p)≥5D、p≥1%E、n≥30三、填空题1、对某大学学生进行消费支出调查,采用抽样的方法获取资料。请列出四种常见的抽样方法:、、、,当对全校学生的名单不好获得时,你认为方法比较合适,理由是。四、简答题1、分层抽样与整群抽样有何异同?它们分别适合于什么场合?2、解释抽样推断的含义。五、计算题1、某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知;\n();2、某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,试问样本量应该为多大?3、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。(1)试对家庭每天平均看电视时间进行区间估计。(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05)第八章假设检验一、单项选择题1、按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用()。A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验2、假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定元假设,则可认为()。A、抽样是不科学的B、检验结论是正确的C、犯了第一类错误D、犯了第二类错误3、当样本统计量的观察值未落入原假设的拒绝域时,表示()。A、可以放心地接受原假设B、没有充足的理由否定与原假设C、没有充足的理由否定备择假设D、备择假设是错误的\n4、进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会()。A、都减少B、都增大C、都不变D、一个增大一个减小5、关于检验统计量,下列说法中错误的是()。A、检验统计量是样本的函数B、检验统计量包含未知总体参数C、在原假设成立的前提下,检验统计量的分布是明确可知的D、检验同一总体参数可以用多个不同的检验统计量二、多项选择题1、关于原假设的建立,下列叙述中正确的有()。A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2、在假设检验中,α与β的关系是()。A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β三、判断分析题(判断正误,并简要说明理由)1、对某一总体均值进行假设检验,H0:=100,H1:≠100。检验结论是:在1%的显著性水平下,应拒绝H0。据此可认为:总体均值的真实值与100有很大差异。2、有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。那么原假设可以为:H0:P≤1/3。四、简答题1、采用某种新生产方法需要追加一定的投资。但若根据实验数据,通过假设检验判定该新生方法能够降低产品成本,则这种新方法将正式投入使用。(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。\n(2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果?五、计算题1、某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。假设产品重量服从正态分布。(1)建立适当的原假设和备择假设。(2)在α=0.05时,该检验的决策准则是什么?(3)如果=12.25克,你将采取什么行动?(4)如果=11.95克,你将采取什么行动?第十一章相关与回归分析一、单项选择题1、下面的关系中不是相关关系的是()A、身高与体重之间的关系B、工资水平与工龄之间的关系C、农作物的单位面积产量与降雨量之间的关系D、圆的面积与半径之间的关系2、具有相关关系的两个变量的特点是()A、一个变量的取值不能由另一个变量唯一确定B、一个变量的取值由另一个变量唯一确定C、一个变量的取值增大时另一个变量的取值也一定增大D、一个变量的取值增大时另一个变量的取值肯定变小3、下面的假定中,哪个属于相关分析中的假定()A、两个变量之间是非线性关系\nB、两个变量都是随机变量C、自变量是随机变量,因变量不是随机变量D、一个变量的数值增大,另一个变量的数值也应增大4、如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为()A、完全相关关系B、正线性相关关系C、非线性相关关系D、负线性相关关系5、根据你的判断,下面的相关系数取值哪一个是错误的()A、–0.86B、0.78C、1.25D、06、设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着()A、高度相关B、中度相关C、低相关D、极弱相关7、在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为()A、回归方程B、回归模型C、估计回归方程D、经验回归方程8、在回归模型y=中,ε反映的是()A、由于x的变化引起的y的线性变化部分B、由于y的变化引起的x的线性变化部分C、除x和y的线性关系之外的随机因素对y的影响D、由于x和y的线性关系对y的影响9、如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误()A、=25–0.75xB、=–120+0.86xC、=200–2.5xD、=–34–0.74x10、说明回归方程拟合优度的统计量是(C)A、相关系数B、回归系数C、判定系数D、估计标准误差11、判定系数R2是说明回归方程拟合度的一个统计量,它的计算公式为()A、B、C、D、12、已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R2=()A、97.08%B、2.92%C、3.01%D、33.25%\n13、一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是()A、较高的男子趋于较重B、身高与体重存在低度正相关C、体重较重的男子趋于较高D、45%的较高的男子趋于较重14、下列回归方程中哪个肯定有误()A、=15–0.48x,r=0.65B、=–15-1.35x,r=-0.81C、=-25+0.85x,r=0.42D、=120–3.56x,r=-0.9615、若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R2为()A、0.8B、0.89C、0.64D、0.4016、对具有因果关系的现象进行回归分析时()A、只能将原因作为自变量B、只能将结果作为自变量C、二者均可作为自变量D、没有必要区分自变量二、多项选择题1、下列现象不具有相关关系的有()A、人口自然增长率与农业贷款B、存款期限与存款利率C、降雨量与农作物产量D、存款利率与利息收入E、单位产品成本与劳动生产率2、一个由500人组成的成人样本资料,表明其收入水平与受教育程度之间的相关系数r为0.6314,这说明()A、二者之间具有高度的正线性相关关系B、二者之间只有63.14%的正线性相关关系C、63.14%的高收入者具有较高的受教育程度D、63.14%的较高受教育程度者有较高的收入E、通常来说受教育程度较高者有较高的收入三、判断分析题(判断正误,并简要说明理由)1、一项研究显示,医院的大小(用病床数x反映)和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。()2、应用回归方程进行预测,适宜于内插预测而不适宜于外推预测。()四、简答题1、解释相关关系的含义,说明相关关系的特点。\n2、简述狭义的相关分析与回归分析的不同。五、计算题1、研究结果表明受教育时间与个人的薪金之间呈正相关关系。研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下:受教育年数x年薪(万元)y受教育年数x年薪(万元)y83.0073.1262.00106.4030.34138.5451.6441.2194.3040.9430.51114.64(1)做散点图,并说明变量之间的关系;(2)估计回归方程的参数;(3)当受教育年数为15年时,试对其年薪进行置信区间和预测区间估计(α=0.05)();2、一国的货币供应量与该国的GDP之间应保持一定的比例关系,否则就会引起通货膨胀。为研究某国家的一段时间内通货膨胀状况,研究人员搜集了该国家的货币供应量和同期GDP的历史数据,如下表:单位:亿元年份货币供应量该国GDP19912.2036.05319922.2766.65919932.4548.27019942.8668.98119952.99211.34219963.59211.93119974.02112.76319984.32612.83419994.39214.717\n20004.80415.57720015.28815.68920025.34815.715(1)试以货币供应量为因变量y,该国家的GDP为自变量x,建立回归模型;(2)若该国家的GDP达到16.0,那么货币供应量的置信区间和预测区间如何,取α=0.05。1.某生产车间30名工人日加工零件数(件)如下:302642413644403737254529433136364934473343384232343846433935要求(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算出各组的频数和频率并编制次数分配表。(2)分析该车间工人生产情况。2.假设研究者想估计航空工业行业中经理们每周加班的平均时间,他随机挑选18个样本,计算在给定的星期他们的加班时间,得到的结果如下:(以小时表示)62117207081629381211921251516他选取90%的置信水平。估计该行业的经理每周的平均加班时间。假设总体是正态分布的。(查表知,)3.\n苏州市第四次人口普查显示,该市老年人口老龄化(65岁以上)比率为14.7%。若你作为复旦大学经院暑期社会实践队成员到苏州市对该市人口老龄化问题进行研究,随机调查了400名当地市民,发现有57人年龄在65岁以上。那么你的调查结果是否支持该市老龄化率为14.7%的看法?(α=0.05)4.某部门所属20个企业的可比产品成本降低率(%)与销售利润(万元)的调查资料整理如下(x代表可比产品成本降低率,y代表销售利润)。要求:(1)建立销售利润与可比产品成本降低率的直线回归方程,预测可比产品成本降为8%时,销售利润为多少万元?(2)说明回归系数b的经济意义。5.对10名成年人和10名幼儿的身高进行抽样调查,结果如下:单位:cm成年组166169172177180170172174168173幼儿组68696870717372737475(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?(2)比较分析哪一组的身高差异大?6.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。要求:(1)总体是什么?(2)消费者在网上购物的原因是分类变量、顺序变量还是数值型变量?(3)参数是什么?(4)消费者每月在网上购物的平均花费是200元是参数还是统计量?(5)研究者所使用的主要是描述统计方法还是推断统计方法?7.\n对美国公司与印度公司间的商业往来进行调查。其中的一个问题为:贵公司与印度公司间的贸易往来已经进行了多长时间?随机抽取了44个样本,样本均值为10.455年。假设该问题的总体标准差为7.7年,利用这些信息,求解置信水平为90%时,美国公司与印度公司进行贸易往来的平均年限的总体均值的区间。8.下面是甲地区空气质量指数(0~50表示良好,50~100表示适中)的一组数据:28,42,58,48,45,55,60,49,50。(10分)(1)计算全距、方差和标准差;(2)已知同期观察到的乙地区空气质量指数的平均数为48.5,标准差为11.66,试对两地区的空气质量作出比较。9.一家保险公司收集到由36人投保人组成的随机样本,已知,试建立   投保人年龄95%的置信区间。10某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随即抽取了30名工人,并指定每个人使用其中的在一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果:方差分析表差异源SSdfMSFP-valueFcrit组间2100.3.组内3836———总计29————F0.05(3,30)=2.92F0.05(2,27)=3.35F0.05(2,29)=3.33(1)完成上面的方差分析表(2)若显著性水平为0.05,检验三种方法组装的产品数量之间是否有显著差异?11.对两个大中型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训乙厂:调查40人,14人参加技术培训\n能否根据以上调查结果认为乙厂参加培训的工人数比例高于甲厂?(α=0.05)12、根据以下资料绘制相应的直方图和箱线图,并计算某电器公司销售量的样本均值和样本标准差。某电器公司销售量频数分布表按销售量分组(台)频数f140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24049162720171084513.拥有硕士学位的毕业生年薪的标准差大约为2000元,假定想要估计年薪90%的置信区间,希望边际误差为400元,应抽取多大的样本容量?14.、某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命不能低于1000小时。已知灯泡的燃  烧寿命服从正态分布,标准差为20小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?(α=0.05)15.某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随即抽取10块肥皂作为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能是否良好?\n16.某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.66.76.87.17.37.47.87.8(1)比较两种排队方式等待时间的离散程度;(2)如果让你选择一种排队方式,你会选择哪一种?试说明理由。17.某百货公司6月份销售量数据如下:某百货公司销售量频数分布表按销售量分组140-150150-160160-170170-180180-190190-200200-210210-220220-230230-240频数491627201710845根据以上资料计算该百货公司销售量的样本均值和样本标准差。18.某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95%的置信度估计平均产量的抽样误差和置信区间19、某企业对一批产品进行质量检验,这批产品得数量为5000件,过去几次同类调查所得的产品合格率为93%、95%、96%,为了使合格率的允许误差不超过3%,在95%的概率下应抽查多少件产品?(10分)\n20、研究结果表明受教育时间与个人的薪金之间呈正相关关系。研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下:(15分)受教育年数x年薪(万元)y受教育年数x年薪(万元)y83.0073.1262.00106.4030.34138.5451.6441.2194.3040.9430.51114.64(1)做散点图,并说明变量之间的关系;(2)估计回归方程的参数;21、07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。22、经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。23、食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?24、一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。请回答以下问题:(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?\n25、某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。(1)请写出检验的原假设和备择假设;(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?26、在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?27、某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.66.76.87.17.37.47.87.8(1)画出第二种排队方式等待时间的茎叶图;(2)比较两种排队方式等待时间的离散程度;(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。28、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:每包重量/g包数96-9898-100100-102102-104104-106233474合计50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间;(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;\n29、一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下:15192224301619222431172023253418202327381921232941(1)画出该组数据的茎叶图;(2)画出该组数据的箱线图;30、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经过初步计算得到样本数据的部分描述统计量如下:平均107标准误差4.99样本标准差29.96样本方差897.77(1)确定餐馆月平均用水量95%的置信区间;(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因;(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?请谈谈拒绝和不拒绝原假设的含义;(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)31、一家房地产评估公司想对某城市的房地产销售价格(y)与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):方差分析dfSSMSFSignificanceF回归3.08.0348.620.00残差11.25.39总计14.33Coefficient标准误差tStatP-valueIntercept207.9037617.04860.33690.7425XVariable11.43780.56452.54720.0271XVariable20.85450.26633.20910.0083XVariable30.06260.06560.95380.3607\n(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;(2)检验回归方程的线性关系是否显著;(3)检验各回归系是否显著;(4)计算多重判定系数R2,并说明它的实际意义;(5)计算估计标准误差sy,并说明它的实际意义;(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理由。32.下面是A、B两个班学生的数学考试成绩数据:5576668575627973937667857461787192796583735777709075638173963471569066488158967155856244795795685484613973579468518261100(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;(2)两个班考试成绩的描述统计量如下,试进行比较分析:A班B班平均75中位数75众数73标准偏差10.44样本方差108.90峰值-0.35偏斜度0.11极差41最小值55最大值96平均68中位数67众数57标准偏差17.64样本方差311.10峰值-0.76偏斜度0.11极差66最小值34最大值100(3)要判断考试成绩是否有离群点,可使用哪些方法?(4)要判断考试成绩是否服从正态分布,可使用那些描述性方

相关文档