• 380.24 KB
  • 2022-09-01 发布

《统计学》课程期末考查

  • 14页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
河南城建学院2014~2015年度第二学期《统计学》期末考查学号131412135姓名申圣课题名称关于河南城建学院学生课余时间安排满意程度调查评分2015年5月\n1、编写统计调查研究提纲(5分)。(1)选题思路:相比中学阶段时间紧凑争分夺秒的学习生活,大学生有着非常充裕的课外可自由支配的时间,从开始进入大学校园到毕业离开的这段时间里,大学生怎样度过自己的课余时间成了每一位大学生面临的问题(2)研究目标:为了更好的了解大学生课余时间的安排,方便下一届大学生对自己课余时间的安排做参考,使大学生能更好地安排自己的生活学习(3)统计过程的步骤:(1)先进行小规模抽样,抽取总体的1%进行调查,样本数量180份,为避免废卷,发放问卷200份。(2)调查方法是小组成员分区域进行抽样调查,遵守一定的访问行走规则对在校大学生逐一进行走访并填写问卷(3)调查报告的设计:在网络上查阅相关资料后,完成调查报告的设计。(4)对调查所得到的资料进行分析,对调查问卷进行数据统计,得大学生对于在校期间学车的看法及选择驾校的意向。对此次调查所涉及的问题严格按照以上所述进行评价调查分析,最后通过进行基础性统计对调查结果进行总体测算。2、编写调查方案(10分)(1)调查总体范围和包含的个体数量总体范围:河南城建学院学生个体数量:18000(2)调查对象的抽样率和样本数1%180(3)课题涉及的变量有哪些?(a)调查数据变量每周进行的体育锻炼时间长,每周进行自习的时间长,每周上网的时间长对自己课余时间安排的满意度分数(b)二手数据变量无(4)抽样方法和抽样过程采取非概率抽样的方法。在宿舍、校餐厅、图书馆、自习室、运动场、操场等学生集中地区进行,方便抽样(5)如何控制抽样误差1.增加样本个数。2.调查过程仔细认真。3.减少废卷率.3、编写调查问卷(注意甄别不同调查对象,考虑问题答案设计对后续数据分析的影响)(10分)关于河南城建学院在校学生课余时间安排满意情况一、单项选择\n1.亲,您的性别A.男生B.女生2.2015年大学几年级A.一B.二C.三D.四3.一周有()节课4关于男女朋友A.有B没有C.有在外地D.正在追E.不好说5.每月平均陪男女朋友的时间大概是多少(_________________)小时6.如果早晨第一节没课你一般A.早早起床学习B.看看表继续睡C.玩电脑或者手机D其他7.平均每月进行的课外自习的时间长(___________________)小时8.你每月花费在上网的时间是多少(___________________)小时9平均每个月外出学校逛街购物的次数()10平常在上课的课间时间做什么A.继续学习B.扣扣手机C.出去走走D趴下睡觉E其他11.对于学校放的小长假A.回家B.旅游C宅在宿舍玩D继续学霸模式E.兼职赚外快F.其他12课余时间看什么书吗A.中外杂志名著B.和专业有关的书C.只看手机上的电子书D不看13上网的时候一般做些什么A.看新闻娱乐咨讯B.聊天刷动态C.玩游戏D看影视追剧E.查资料学习F.网购G其他14经常做体育锻炼吗A.每天都做B.每周做1-2次C.偶尔做一次D.有规律按计划的做E.只在体育课上做F从不锻炼15请问你每月花费在运动方面比如体育锻炼上面的时间是多少(_____________________)小时16.你喜欢的体育项目是A.各种球类B.长短跑步C.单双杠和自由锻炼D.武术E.其他17针对你自己的课余时间安排有计划吗A.有合理的计划做事休息B.挑最要紧的事做C.想起什么就做什么D.别人做什么我就做什么E.没一点计划F.管我呢俺想咋咋滴相比高中紧张的学习环境你喜欢\nA.喜欢高中的充实B.喜欢大学的自由D.没感觉E.不喜欢上学18每天晚上大概几点睡觉A.8点前B.9点前C.10点前D.11点前E.12点前F.零点后19对于吃饭你一般选择A.带回宿舍去吃B.在餐厅解决掉C.路上边走边吃D.叫外卖20请您给自己的课余时间安排满意度打分,综合满分100(______________)21你对于本次的调查问卷的填写还满意吗A.很满意B.满意C.一般吧D.不太好E.不想填写二、自由回答您对本次的调查问卷有什么建议?谢谢您的合作4、编制数据文件(如果数据文件与问卷不对应,本项不得分)。(5分)A:平均每月进行的体育锻炼的时间长B:平均每月陪男女朋友的时间长C:对自己课余时间的安排满意分数序号ABC序号ABC12014875120158824326565243265636034655360346545960895459608954224905542249061228565612285672317655723176583416785834167892725595927255910183066601730661116339061163490121726766217267613192879631928791454508864545088154256656542566516263269662632691728126667281266184612856846128519571078695710782018258870182588216059571595952214268072142680\n2324068732406824224697462469251335797513357926164088761640882755206977552069283810887838108829372359793723593049244980492449315620788156207832331365823313653334103583341135342030488420304835264559852645593645246586452465373012788730127838351059883510593926959892695940465689046568415607891561784260288926028843343279933432794426279942637945281578952815684624169896241698472035909720359048132489981324894915308099153080504612701004612705、选择一个主要的数值型变量进行数据分组分析(20分)(1)进行分组分析的数值型变量是平均每周进行的体育锻炼时间长(2)制作分组频数频率分布表平均每周进行的体育锻炼时间长频数频率51-6080.0841-50160.1631-40280.2821-30200.211-20260.261-1020.2\n总计1001(3)绘制直方图(4)计算分组后的平均数、众数、中位数,说明分布形态中位数33.5众数34平均数32.78因为众数>平均数>中位数所以数据为左偏分布(5)计算不分组的平均数、众数、中位数,并与分组数据进行误差比较。中位数34众数34平均数32.84误差比较:分组后的中位数小于不分组的,众数都相等,分组后平均数小于不分组的,但都相差不是很大(6)计算分组后的方差、标准差、离散系数方差246.21878标准差15.69136离散系数0.4778124(7)假设所选变量属于正态分布,验证标准分数的经验值大约68%的取值范围(17.02,48.94)内含样本数62实际占百分比62%大约95%的取值范围(1.46,64.22)内含样本数100实际占百分比100%6、分类数据分析(列联分析)(10分)(1)两个被研究的变量组成的原始数据列联表是否有课余时间安排满意度男女朋友很满意比较满意一般较差合计是261711660\n否2088440合计46251910100(2)两个被研究的变量的期望值列联表是否有课余时间安排满意度男女朋友很满意比较满意一般较差合计是27.61511.4660否18.4107.6440合计46251910100(3)检验过程(a)提出假设H0:观察频数与期望频数一致,即大学生是否有男女朋友对课余时间安排有显著影响H1:观察频数与期望频数不一致,即大学生是否有男女朋友对课余时间安排没有显著影响(b)X2值计算表是否有课余时间安排满意度男女朋友很满意比较满意一般较差合计是0.0930.2670.01400.374否0.1390.40.02100.56合计0.2320.6670.03500.934(c)查表得到X2临界值进行检验,进行P检验,决策,得出结论查表得临界值X2(0.05)(3)=7.8147决策:因为X2>X2(0.05)(3),所以拒绝原假设H0,接受备选假设H1。结论:大学生是否有男女朋友对课余时间安排没有显著影响。(d)具体分析解释所得结论结论:观察频数与期望频数一致,即大学生是否有男女朋友对课余时间安排没有显著影响。7、单因素方差分析(15分)(1)被分析的分类变量和数值型变量分别是什么?分类变量:体育锻炼情况数值型变量:对课余时间安排评价得分(2)散点图及判定\n由散点图可观察到,体育锻炼情况不同的同学对课余时间安排的满意度得分在60分以上的人数是不同的,而且经常体育锻炼的同学,其对课余时间的安排越满意。(3)F值计算步骤和结果(包含方差分析计算表)体育锻炼情况每天都要锻炼每周至少一次每月至少一次从不锻炼166893015236506945356814023473503344计算F统计量:每天都要锻炼每周至少一次每月至少一次从不锻炼样本均值57.7567.54331.75总均值50SSA2993.5SSE3134.37MSA997.833MSE261.198df13df212(4)提出假设H0:各水平均值相等,即体育锻炼情况对大学生的课余时间安排情况没有显著影响。H1:各水平均值不全相等,即体育锻炼情况对大学生的课余时间安排情况有显著影响。(5)查表,F检验,得出结论查表得F=3.82>3.078所以拒绝原假设H0,认为各水平之间差异明显,就是说明体育锻炼对大学生的课余时间安排情况有显著影响。(6)使用Excel数据分析工具对所得结论进行验证方差分析:单因素方差分析SUMMARY组观测数求和平均方差\n列14102.51.666667列2423157.75258.9167列3427067.5419列4417243318列5412731.75227.5833方差分析差异源SSdfMSFP-valueFcrit组间10213.542553.37510.420520.0003053.055568组内3675.515245.0333总计1388919(7)分析解释所得结论体育锻炼对大学生的课余时间安排有显著影响。(8)关系强度测量与解释关系强度R^2=0.955=95.5%这表明体育锻炼占课余时间安排情况的影响效应占总效应的95.5%,而残差效应则占4.5%。(9)多重比较分析与最终结论1、提出以下假设。检验一:H0:u1=u2;H1:u1≠u2检验二:H0:u1=u3;H1:u1≠u3检验三:H0:u1=u4;H1:u1≠u4检验四:H0:u2=u3;H1:u2≠u3检验五:H0:u2=u4;H1:u2≠u4检验六:H0:u3=u4;H1:u3≠u42、计算检验统计量检验统计量9.7514.752624.535.7511.253、计算LSDLSD检验一33.18检验二33.18检验三33.18检验四33.18检验五33.18检验六33.184、做出决策|X1-X2|LSD3,不拒绝H0,不能认为每天都要锻炼与从不锻炼之间有显著差异。|X2-X3|F0.05,所以接受H1,即课余时间安排满意程度分数与平均每月进行的锻炼时间长度之间线性关系显著。(8)对每一个自变量原始值,求对应的因变量估计值和置信区间平均每月锻炼时间长x课余时间安排满意分数y预测值y^置信上限置信下限1355568.7709998470.2327687457.521667822546985.051622996.3009549173.802290893608990.19287229101.442204378.943540284154351.6335018862.8828338940.384169865297963.6297504574.8790824652.380418446468878.1966237289.4459557366.94729177389071.3416245382.5909565460.092292528227257.6316261668.8809581746.38229415994046.4922524957.741584535.2429204710264961.0591257572.3084577749.809793749、时间序列分析(10分)(1)编制核心数值型变量时间序列数据(时间为2005~2014年),编制3期移动平均法、指数平滑法(a=0.5),和一元线性回归法(要写出回归方程)的拟合值及方差计算表移动平均法年份平均每月锻炼时间长移动平均预测k=3预测误差预测误差平方200556200660200755572420084954.666666675.66666666732.1111111120095151.666666670.6666666670.44444444420104147636\n201146460020124343.333333330.3333333330.11111111120133942.666666673.66666666713.4444444420144642.66666667-3.33333333311.11111111201542.542.51806.25合计486指数平滑法(a=0.5)年份平均每月锻炼时间长指数平滑法(a=0.5)预测误差预测误差平方2005562006605641620075558-3920084956.5-7.556.2520095152.75-1.753.062520104151.875-10.875118.26562520114646.4375-0.43750.1914062520124346.21875-3.2187510.3603515620133944.609375-5.60937531.4650878920144641.80468754.195312517.60064697201543.90234375-43.902343751927.415787合计486线性回归法XY(Y-Y均值)^22005562361.962006602361.962007552361.962008492361.962009512361.962010412361.962011462361.962012432361.962013392361.962014462361.962015合计48623619.6平均值48.62361.196方差1011902.787b1-1.91515b03897.097一元线性回归方程y=-1.91515X+3897.097当x=2015,拟合值为38.0698\n(2)运用三种方法估计最新一期的预测值移动平均法的预测值F2015=42.5指数平滑法的预测值F2015=43.90234375线性回归法的预测值F2015=38.0698(3)计算三种方法的均方差,判断哪种方法预测效果好,并给出理由移动平均法的均方差S1=5.5677644指数平滑法的均方差S2=5.8991525线性回归法的均方差S3=6.8833132比较可知S1