- 528.25 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
应用统计学实验报告《应用统计学》实验报告班级:管121班姓名:学号:北京建筑大学2015年01月i\n应用统计学实验报告实验1描述统计3一、实验目的与要求3二、实验原理3三、实验步骤31.频数分析FFrequencies)32.描述统计DDescriptives)8实验2统计推断11一、实验目的与要求11二、实验原理11三、实验演示内容与步骤111.单个总体均值的区间估计122.两个总体均值之差的区间估计144.两独立样本的假设检验(两独立样本T检验)175.配对样本T检验1911\n应用统计学实验报告实验1描述统计一、实验目的与要求统计分析的目的在于研究总体特征。但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。二、实验原理描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。三、实验步骤1.频数分析(Frequencies)实验数据1:表2.7为某班级16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。表2.7某班16位学生的身高数据学号性别身高(cm)学号性别身高(cm)1M1709M1502F17310M1573F16911F1774M15512M1605F17413F1696F17814M1547M15615F1728F17116F180基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。比如,在某项调查中,想要知道被调查者的性别分布状况。频数分11\n应用统计学实验报告析的第一个基本任务是编制频数分布表。SPSS中的频数分布表包括的内容有:(1)频数(Frequency)即变量值落在某个区间中的次数。(2)百分比(Percent)即各频数占总样本数的百分比。(3)有效百分比(ValidPercent)即各频数占有效样本数的百分比。这里有效样本数=总样本-缺失样本数。(4)累计百分比(CumulativePercent)即各百分比逐级累加起来的结果。最终取值为百分之百。频数分析的第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。频数分析中常用的统计图包括:条形图,饼图,直方图频数分析的应用步骤:在SPSS中的频数分析的实现步骤如下:选择菜单"文件】一>【打开】—>【数据】"在对话框中的文件类型选项中选择所有文件,找到需要分析的数据文件“SPSS据/学生身高数据.xls”,然后选择打开”。如图1.1所图2.1打开数据选择菜单"分析】一〉【描述统计】一>【频率】如图2.2所示11\n应用统计学实验报告图2.2频率确定所要分析的变量,例如身高。在变量选择确定之后,在同一窗口上,点击统计量按钮,打开统计量对话框,如下图2.3所示,选择统计输出选项。图2.3统计量子对话框表2.1描述性统计量统计量身高(cm)N有效|1611\n应用统计学实验报告统计量身高(cm)N有效16缺失0表2.2Gender频数分布表身高(cm)频率百分比有效百分比累积百分比有效15016.36.36.315416.36.312.515516.36.318.815616.36.325.015716.36.331.316016.36.337.5169212.512.550.017016.36.356.317116.36.362.517216.36.368.817316.36.375.017416.36.381.317716.36.387.517816.36.393.818016.36.3100.0合计16100.0100.011\n应用统计学实验报告11应用统计学实验报告身高(cm)图2.4变量身高的条形图5670901234780555667777777811\n应用统计学实验报告图2.5变量身高的饼图图2.6变量身高的直方图结果分析:由实验结果可知,该班学生的平均身高为166.56cm,其中身高为169cm勺同学数量最多,身高的标准偏差为9.668cm,根据直方图可得,该班学生的身高分布不均。1.描述统计(Descriptives)试验数据2:测量18台电脑笔记重量,见表2.8,对其进行描述统计量分析,并对试验结果作出说明。表2.818台笔记本电脑重量表在舁厅P123456789重量1.751.921.591.851.831.681.891.701.79在舁厅P101112131415161718重量1.661.801.832.051.911.761.881.831.7911\n应用统计学实验报告SPSS的【描述】命令专门用于计算各种描述统计性统计量。选择菜单【分析】一【描述统计】一【描述】,如图2.7所示图2.8描述对话框将待分析的变量移入描述性列表框,将序号、重量2个变量进行描述性统计,以观察重量与序号的关系。Savestandardizedvaluesasvariables对所选择的每个变量进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。其变量名为相应变量名前加前缀z。标准化计算公式:xi-xZi二s11\n应用统计学实验报告图2.9描述对话框选项单击【选项】按钮,如图2.9所示,选择需要计算的描述统计量。各描述统计量同Frequencie的令中的Statistics子对话框中大部分相同,这里不再重复。在主对话框中单击ok执行操作。表2.3描述统计量表描述统计量11\n应用统计学实验报告Zscorq重量)?/|'L=-1.94E-16'|--1,0?Cn:jN=1BZscorN重量)结果输出与分析:结果分析:从实验结果中可以看出,该批次笔记本的平均质量为1.8083kg,而大部分笔记本电脑重量在1.8kg左右,占到了总台数的50犯上。存在个别过轻或者过重的笔记本电脑产品,有可能是不合格产品。实验2统计推断一、实验目的与要求1.熟悉点估计概念与操作方法2.熟悉区间估计的概念与操作方法3.熟练掌握T检验的SPSSt作4.学会利用T检验方法解决身边的实际问题二、实验原理1.参数估计的基本原理2.假设检验的基本原理三、实验演示内容与步骤11\n应用统计学实验报告1.单个总体均值的区间估计例题:某省大学生四级英语测验平均成绩为65,现从某高校随机抽取20份试卷,其分数为:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,问该校英语水平与全区是否基本一致?设a=0.05♦打开SPSS建立数据文件:“某省大学生四级英语测验成绩.sav"。这里,研究变量为:四级英语测验平均成绩成绩,即这20个样本的成绩。♦选择区间估计选项,方法如下:选择菜单【分析】一〉【描述统计】一>【探索】”,打开图3.1探索对话框。♦从源变量清单中将四级英语测验平均成绩”变量移入、因变量列表框中。图3.1探索对话框21\n应用统计学实验报告计算结果表3.1案例处理摘要案例后效缺失合计N百分比N百分比N百分比四级英语测验平均成绩21100.0%0.0%21100.0%表3.2描述统计量标准误四级英语测验平均成均值70.19052.05243绩均值的95%置信区下限65.9092间上限74.47185%修整均值70.1561中值70.0000力差88.462标准差9.40542极小值54.00极大值87.00范围33.00四分位距15.00偏度.060.501峰度-.848.972如上表显示。从上表“95%ConfidenceIntervalforMean”中可以得出区间估计(置信度为95%)为:(65.9092,74.4718),其中lowerBound表示置信区间的下限,UpperBound表示置信区间的上限。点估计是:70.1905四级英语测验平均成绩Stem-and-LeafPlotFrequencyStem&Leaf1.005.42.005.694.006.12243.006.6883.007.0245.007.566881.008.32.008.5721\n应用统计学实验报告Stemwidth:10.00Eachleaf:1case(s)m.oo-80.00-7D.00-6000-50.00-图3.31.两个总体均值之差的区间估计例题:分析某班级学生的高考数学成绩是否存在性别上的差异。数据如表所示:某班级学生的高考数学成绩性别数学成绩男(n=18)858975588680787684899995828760857580女(n=12)9296868378877065706570787256♦打开SPSS按如下图示格式输入原始数据,建立数据文件:工会会员工资差别.spss"。这里,芸员”表示是否为工会会员的变量,y表示是工会会员,n表示非工会会员,报酬”表示女性员工报酬变量,单位:千美元。•计算两总体均值之差的区间估计,采用独立样本T检验”方法。选择菜单“【分析】一【比较均值】一独立样本T检验”,打开对话框。21\n应用统计学实验报告7n计算结果单击上图中OK按钮,输出结果如下图所示。分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以看出,平均报酬为76.89组统计量性别N均值标准差均值的标准误成绩01181481.277876.285710.3685411.431592.443893.055221.单个总体均值的假设检验(单样本T检验)♦判断检验类型该例属于关样本、总体标准差①未知。假设形式为:H。:仙=以0也:(!*(1021\n应用统计学实验报告♦软件实现程序打开已知数据文件,然后选择菜单I分析】一【比较均值】一单样本丁检验”,打开One-SampleTTest对话框。从源变量清单中将产品数量”向右移入TestVariables”框中。One-SampleTTest”窗口中OK按钮,输出结果如下表所示。分别给出样本的容量、均值、标准差和平均标准误。本例中,产品数量均值为81.28。单个样本统计量N均值标准差均值的标准误男1881.2810.3692.444表中的t表示所计算的T检验统计量的数彳1,本例中为33.258。表中的“df,”表示自由度,本例中为17。表中的“Sig”(双尾T检验),表示统计量的P-值,并与双尾T检验的显著性的大小进行比较:Sig.=0.364>0.05,说明这批样本的性别与数学成绩无显著差异。表中的“MeaDifference,”表示均值差,即样本均值与检验值82.28之差,本例中为0.001。表中的“9%ConfidenceInternaloftheDifference,样本均值与检3^值偏差的95%置信区间为(76.12,86.43),置信区间不包括数值0,说明样本数量与81.28无显著差异,符合要求。单个样本检验检验值=0tdfSig.(双侧)均值差值差分的95%置信区间下限上限单个样本检验21\n应用统计学实验报告检验值=0tdfSig.(双侧)均值差值差分的95%置信区间下限上限男33.25817.3640.00176.1286.431.两独立样本的假设检验(两独立样本T检验)备择实验2:分析某班级学生的高考数学成绩是否存在性别上的差异。数据如表所示:某班级学生的高考数学成绩性别数学成绩男(n=18)858975588680787684899995828760857580女(n=14)9296868378877065706570787256♦打开SPSS输入原始数据,建立数据文件:数学成绩性别差异表.spss”。这里,性别”是变量,0表示男生,1表示女生,成绩”表示学生数学成绩变量,单位:分。♦计算两总体均值之差的区间估计,采用独立样本T检验”方法。选择菜单“【分析】一【比较均值】一独立样本T检验”,打开对话框。♦变量选择(1)从源变量清单中将成绩”变量移入检验变量框中。表示要求该变量的均值的区间估计。(2)从源变量清单中将性别”变量移入分组变量框中。表示总体的分类变量。21\n应用统计学实验报告♦定义分组单击定义组按钮,打开定义组对话框。在Groupl中输入0,在Group2中输入1(0表示男生,1表示女生)。完成后单击“继续”按钮回到主窗口。•计算结果单击上图中OK按钮,输出结果如下图所示。(1)GroupStatistics(分组统计量)表分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以看出,男生的平均成绩为81.2778,女生的平均成绩为76.2857。组统计量性别N均值标准差均值的标准误成绩01181481.277876.285710.3685411.431592.443893.05522(2)IndependentSampleTest(独立样本T检验)表LevenesTestforEqualityofVariance,为方差检验,在Equalvariancesassumed21\n应用统计学实验报告(原假设:方差相等)下,F=0.647,因为其P-值大于显著性水平,即:Sig.=0.428>0.05,说明不能拒绝方差相等的原假设,接受两个总体方差是相等的假设。T-testforEqualityofMeans为检验总体均值是否相等的t检验,由于在本例t检验中,其P-值大于显著性水平,即:Sig.=0.206>0.05,因此不应该拒绝原假设,也就是说该班学生的高考数学成绩在性别上没有显著差异。林立样本检赞方差方程的L联加B检骗拘值埔旗检冷FSig.tdfSig.M)均值差值雕误差值羞分的95%置信卮间下限|上限成绩龈方差相等株方差不情.647,4281.2821.2763026,623,206,2134.992064.992063.883533.31241-2.39G31-3J40B6120824413,024995.配对样本T检验配对样本是对应独立样本而言的,配对样本是指一个样本在不同时间做了两次实验,或者具有两个类似的记录,从而比较其差异;独立样本检验是指不同样本平均数的比较,而配对样本检验往往是对相同样本二次平均数的检验。配对样本T检验的前提条件为:第一,两样本必须是配对的。即两样本的观察值数目相同,两样本的观察值顺序不随意更改。第二,样本来自的两个总体必须服从正态分布。例如针对实验前学习成绩何智商相同的两组学生,分别进行不同教学方法的训练,进行一段时间实验教学后,比较参与实验的两组学生的学习成绩是否存在显著性差异。假设某校为了检验进行新式培训前后学生的学习成绩是否有了显著提高,从全校学生中随机抽出30名进行测试,这些学生培训前后的考试成绩放置于数据文件”学生培训.sav”中。在SPSS^t这30名学生的成绩进行配对样本t检验的操作步骤如下:♦选择菜单【分析】一【比较均值】一【配对样本T检验】,打开对话框,如图3.8所示,将两个配对变量移入右边的PairVariables列表框中。移动的方法是先选择其中的一个配对变量,再选择第二个配对变量,接着单击中间的箭头按钮。21\n应用统计学实验报告实例结果分析表中给出了培训前后学生考试成绩的均值、标准差、均值标准误差以及培训前后成绩的相关系数。从表来看,培训前后平均成绩并没有发生显著的提高。表中还给出了配对样本t检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的95函信度下的区间估计。当然也给出了最为重要的t统计量和p值。结果显示p=0.28>0.05,所以,学校的所谓新式培训并未带来学生成绩的显著变化。成对样本统计量StatisticBootstrapa偏差标准误差95%置信区间下限上限对1男均值81.28-.032.3276.3985.50N18标准差10.369-.4252.0605.55913.691均值的标准误2.444女均值76.89.102.5571.7882.22N18标准差11.224-.3571.3428.32013.525均值的标准误2.64621\n应用统计学实验报告成对样本统计量StatisticBootstrapa偏差标准误差95%置信区间下限上限对1男均值81.28-.032.3276.3985.50N18标准差10.369-.4252.0605.55913.691均值的标准误2.444女均值76.89.102.5571.7882.22N18标准差11.224-.3571.3428.32013.525均值的标准误2.646a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples成对样本相关系数N相关系数Sig.相关系数Bootstrapa偏差标准误差95%置信区间下限上限对1男&女18-.203.419.007.195-.588.225a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对1男-女4.38916.7553.949-3.94312.7211.11117.282成对样本检验Bootstrap均值Bootstrapa偏差标准误差显著性水平(双侧)95%置信区间下限上限对1男-女4.389-.1293.744.253-3.44311.776a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples21