2019统计学实验报告 26页

  • 26.89 KB
  • 2022-09-01 发布

2019统计学实验报告

  • 26页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
统计学实验报告  四川师范大学数学与软件科学学院  课程名称:统计学指导教师:赵凌  试验项目实验一实验二实验三实验四实验五实验六实验七    试验名称数据的整理与展示数据的特征度量区间估计假设检验列联分析方差分析时间序列成绩  班  级:20XX级统计7班学  号:20XX060706姓  名:高镱洋总成绩:  数学与软件科学学院实验报告  学期:_20XX__至__20XX__第___二____学期  20XX  年4月21日课程名称:__统计学_____专业:___统计学_______20XX级7__班实验编号:实验一  实验项目:数据的整理与展示指导教师:__赵凌___姓名:高镱洋____  学号:20XX060706  _实验成绩:__  _  一、实验目的及要求:利用图表展示数据,对数据分布的形状和特征有一个大致的了解。问题一1、实验内容:  某百货公司连续40天的商品销售额数据如下:  单位:万元  41  25  294738  34\n30  38  43  4046  3645  3737  3645  43  33  4435  28  46343037  44  26  38  4442  36  37  37  493942  32  36  35要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。2、实验步骤:  第一步:确定组数,根据数据特点,确定5组;第二步:确定各组的组距,定为5;  第三步:根据分组整理成频数分布表,在Excel中[数据]找到[数据分析],再[直方图]选项进行制作。在[接受区域]方框内输入各组的上限:30、35、40、45、50;  第四步:  3、实验结果及评论1)得到频数分布表:  接收  3035404550其他  频率  66141040  2)得到直方图:  问题二  1、实验内容:给下面的数据绘制散点xy2253254201308167182、实验步骤:  第一步:在Excel中分别找两列将X,Y的数据输入;\n  第二步:在[插入]中找到[散点图],分别将X,Y的值输入列和行,得到散点图。3、实验结果与评价  得到散点图如下:  数学与软件科学学院实验报告  学期:_20XX__至__20XX__第___二____学期  20XX  年4月21日课程名称:__统计学__专业:___统计学_______20XX级7__班实验编号:实验二  实验项目:数据的特征度量  指导教师:__赵凌___姓名:高镱洋____  学号:20XX060706  _实验成绩:__  _  一、实验目的及要求:讨论分布特征值的计算方法、特点及其应用场合。  问题一1、实验内容:  一家汽车零售店的10名销售人员5月份销售的汽车数量排序后如下:24710101012121415要求:计算汽车销售量的众数、中位数和平均数。计算销售量的四分位数。计算销售量的标准差。说明汽车销售量分布的特征。2、实验步骤:  第一步:在工作表中的第一列依次输入10名销售人员销售汽车的数量。第二步:在[公式]选项中找到相应数据处理的函数,对数据进行处理。3、实验结果及评价:因为众数为出现次数最多的,即众数为10;  中位数是处于一组数据中间位置上的值,则中位数为10;平均数=数据总和/数据个数,得平均数为法一:\n  利用QUARTILE函数可以计算一组数据的四分位数,QUARTILE,当quart=1,函数返回值为下四分位数QL=,当quart=3时,返回值为上四分位数QU=12.法二:  QL位置=/4=11/4=,QL=4+×=,QU位置=3/4=33/4=,QU=12+(14-12)×=(3)利用STDEV函数计算样本标准差,得标准差为汽车销售量的波动较大,集中趋势点的数值是10.    问题二1、实验内容:  在某地区抽取120家企业,按利润额进行分组,结果如下:  按利润额分组200—300300—400400—500500—600600以上合计企业数1930421811120要求:计算120家企业利润额的平均数和标准差。计算分布的偏态系数和峰态系数。2、实验步骤:  第一步:取每组区间的中间数,并在工作表中的一列输入数据;  250350450550650  19个30个42个18个11个  第二步:使用AVERAGE函数算平均数,用STDEVP函数算标准差。第三步:利用SKEW函数计算偏态系数第四步:利用KURT函数计算峰态系数2、实验结果及评价:  平均数=,标准差=(2)计算偏态系数得;计算峰态系数得-\n  问题三1、实验内容:  对10名成年人和10名幼儿的身高进行抽样调查,结果如下:  成年组幼儿组  16668169691726817770180711707317272  174168173737475  要求:如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?  比较分析哪一组的身高差异大?2、实验步骤:  第一步:在工作表上,找两列分别将成人组和幼儿组的数据输入;第二步:利用STDEV函数分别对成人组合幼儿组的数据进行分析,得到标准差,进行比较。3、实验结果及评论:  会采用平均数来计量,因为从统计思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。  分别计算两组数据的标准差:成人组为,幼儿组为,所以成人组的身高差异大。  问题四1、实验内容:  一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同时间内组装的产品数量:\n  方法A164167168165170165164168164162163166167166165方法B129130129130131130129127128128127128128125132方法C125126126127126128127126127127125126116126125要求:你准备采用什么方法来评价组装方法的优劣?  如果让你选择一种方法,你会做出怎样的选择?试说明理。2、实验步骤:  第一步:在Excel中将方法A、B、C的数据分别输入三列;第二步:用AVERAGE函数分别对三组数据进行分析。2、实验结果及分析  分别算出A、B、C三组的平均值为,,,可以看出A方法优于B方法优于C方法。  选择平均值的原因是:利用平均数作为其代表值,则可以使误差相互抵消,能反映出事物必然性的数量特征。    数学与软件科学学院实验报告  学期:_20XX__至__20XX__第___二____学期  20XX  年4月21日课程名称:__统计学__专业:___统计学_______20XX级7__班实验编号:实验三实验项目:区间估计  指导教师:__赵凌___姓名:高镱洋____  学号:20XX060706  _实验成绩:__  _  一、实验目的及要求:在点估计的基础上,给出总体参数估计的一\n  个区间范围,该区间通常样本统计量加减估计误差得到。问题一:  1、实验内容:从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。  1)样本均值的抽样标准差X等于多少2)在95%的置信水平下,边际误差是多少?2、实验步骤:  第一步:标准差公式X其中σ=5,n=40。  第二步:对样本均值进行标准化处理Z差为z2nn计算出样本均值的抽样标准差。  X~N(0,1),则边际误n,置信水平(1-a)=95%.  3、实验结果及分析  1)样本均值的抽样标准差X等于5/=  2)在95%的置信水平下,边际误差是×=.*5/SQRT(40)  问题二1、实验内容:  从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差σ=85414,试构建总体均值的95%的置信区间。2、实验步骤:  第一步:分析题目,知总体标准差σ已知,而为大样本,则  ZX~N(0,1)。n第二步:置信区间为95%得a=,则公式得到置信区间Xz3、实验结果及分析:  将数据代入公式后得到置信区间为\n  问题三  2n1、实验内容:已知两个正态总体的方差1和2未知但相等,即1=2。从两个总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:来自总体1  来自总体2  2222n1=14  n2=7x1=  x2=  2=s12=  s2构建1-2的95%的置信区间。  2、实验步骤:  2(n11)S12(n21)S2第一步:给出总体方差的合并估计量S;  n1n222p  第二步:两个样本均值之差的标准化,且服从t分布  (X1X2)(12)~t(n1n22);  11Spn1n2第三步:两个总体均值之差1-2在1-置信水平下的置信区间为  X121Xtnn2S12212pnn214、实验结果及分析:  得到置信区间为    问题四  1、实验内容:从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:  来自总体1  来自总体2  x1=25  x2=23\n  2=20s12=16  s22设n1=n2=10,12,≠2,求1-2的95%的置信区间。  2、实验步骤:  第一步:据分析,可知此题为小样本,且1,≠2未知,则统计量为:  22t(X1X2)(12)SSn1n22122~t(v),其中自度v2222S1n1S2n2n11n21S2S212n1n22  第二步:两个总体均值之差1-2在1-置信水平下的置信区间为  2S12S2X1X2t2(v)  n1n23、实验结果及分析:  得到置信区间为    数学与软件科学学院实验报告  学期:_20XX__至__20XX__第___二____学期  20XX  年4月21日课程名称:__统计学__专业:___统计学_______20XX级7__班实验编号:实验四实验项目假设检验  指导教师:__赵凌___姓名:高镱洋____  学号:20XX060706  _实验成绩:__  _  实验目的:利用样本信息,通过参数估计,对假设成立与否做出判断。问题一:  1、实验内容:\n  某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=,总体标准差为s=。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为。试问新机床加工零件的椭圆度的均值与以前有无显著差异?2、实验步骤:  第一步:提出假设:H0:m=;  H1:m;第二步:题分析应该采用z统计量,zx0n  第三步:在Excel中利用NORMSDIST函数,输入z的绝对值得到函数值;第四步:最后计算P值,P为2倍1减去函数值;第五步:比较P值和值:3、实验结果及分析:  计算出P=,小于值,则拒绝H0.  问题二:  1、实验内容:  有一项研究报告说青少年经常上网聊天,男生的比例至少超过女生10个百分点,即  12≥10%(1为男生比例,2为女生比例)。现对150个男生和150个女生进行上网  聊天的频度调查,其中经常聊天的男生有68人,经常聊天的女生有54人。调查结果是否支持研究报告的结论?2、实验步骤:第一步:做出假设:H0:  12≥10%;H1:125%;第二步:根据题意分析,应该采用z统计量ZP0~N(0,1),P值为6/50=  0(10)n第三步:计算出\nz统计量以及临界值za,,并比较两者大小,得出结论。3、实验结果及分析:  解得z值为,而临界值za=,则落入拒绝域,拒绝原告,即该批食品不能出厂。    数学与软件科学学院实验报告  学期:_20XX__至__20XX__第___二____学期  20XX  年4月21日课程名称:__统计学__专业:___统计学_______20XX级7__班实验编号:实验五实验项目列联分析  指导教师:__赵凌___姓名:高镱洋____  学号:20XX060706  _实验成绩:__  _  一、实验目的:使用拟合优度检验和独立性检验对分类数据进行分析。问题一:  1、实验内容:  一项统计结果声称,某市老年人口的比重为%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为%的看法?(=)  2、实验步骤:  第一步:根据题意,做出假设:H0:=%;H1:%  第二步:确定期望值,如果原假设成立,那么在400人中,65岁以上的老年人口数应该为400x=59,65岁以下的有400-59=341,则59和341就是期望值;第三步:进行2检验,得到2统计量2第四步:计算出比较大小,得出结论。\n  3、实验结果及分析:  观察值fij  期望值eij  fijeij  (fijeij)    22。  i1j1rc(fijeij)2eij;  (fijeij)2eij  57  59  -2  4  343  341  2  4    2i1j12rc(fijeij)2eij=  又分布自度为1,临界值为,则统计量小于临界值,未落入拒绝域,故原告成立,支持该市老年人口比重为%的看法。  问题二:  1、实验内容:  为了提高市场占有率,A公司和B公司同时开展了广告宣传。在广告宣传战之前,A公司的市场占有率为45%,B公司的市场占有率为40%,其他公司的市场占有率为15%。为了了解广告战之后A、B和其他公司的市场占有率是否发生变化,随机抽取了200名消费者,其中102人表示准备购买A公司产品,82人表示准备购买B公司产品,另外16人表示准  备购买其他公司产品。检验广告战前后各公司的市场占有率是否发生了变化()2、实验步骤:  第一步:根据题意,做出:H0:1=2=3=\nH1:原假设中至少有一个不成立  第二步:得到期望值;  第三步:进行2检验,得到2统计量2第四步:计算出比较大小,得出结论。  3、实验结果及分析:  观察值fij  期望值eij  fijeij  (fijeij)    22。  i1j1rc(fijeij)2eij;  (fijeij)2eij  102  90  12  144  82  80  2  4  16  30  -14  196    2统计量2i1j12  rc(fijeij)2eij=  又得值为,则落入拒绝域,说明发生了变化。  问题三:  1、实验内容:  一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。检验各地区与原料之间是否存在依赖关系()  2、实验步骤:  第一步:根据题意,做出假设:H0:地区与原料等级之间独立H1:地区与原料等级之间不独立;\n  第二步:根据独立性的概率乘法公式算出地区与等级的不同组合的期望比例;第三步:计算出每种组合方式的期望值;  第四步:第三步:进行检验,得到统计量第五步:计算出比较大小,得出结论。  2。  222i1j1rc(fijeij)2eij;  3、实验结果及分析:  行列  观察值fij期望值eij  fijeij(fijeij)    2(fijeij)2eij  1  1  52  1  2  64  1  3  24  42  -18  324  2  1  60  2  2  59  -  2  3  52  3  1  50  -  3  2  65  -  3  3  74    统计量22rc(fijeij)2eij=  i1j1又得值为,则落入拒绝域,说明存在依赖性。    2  数学与软件科学学院实验报告  学期:_20XX__至__20XX__第___二____学期  20XX  年4月21日课程名称:__统计学__专业:___统计学_______20XX级7__班实验编号:实验六实验项目方差分析  指导教师:__赵凌___姓名:高镱洋\n____  学号:20XX060706  _实验成绩:__  _  一、实验目的:利用方差分析,通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。问题一:  1、实验内容:  从3个总体中各抽取容量不同的样本数据,结果如下:  样本1158148161154169样本2样本3153169142158156180149    检验3个总体的均值是否有显著差异()  2、实验步骤:  第一步:做出假设:H0:m1=m2=m3=m4即无显著差异;H1:mi(i=1,2,3,4)不全相  等,即存在差异。  第二步:在Excel中利用【数据分析】中的【方差分析】,得到所需数据;第三步:根据所得数据分析,得出结论。3、实验结果及分析:  方差分析:单因素方差分析SUMMARY组列1列2列3观测数543求和790600507平均方差方差分析差异源SS组间组内598总计因FFcrit,故应拒绝原告,即种子的不同品种和不同的施肥方案对收获量都有显著的影响。    问题四  1、实验内容:\n  为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项实验,考察三种广告方案和两种广告媒体,获得的销售量数据如下:  A广告方案BC广告媒体报纸电视8121282226143010181814  检验广告方案、广告媒体或其交互作用对销售量的影响是否显著:H0:m1=m2=m3即无显著差异;H1:mi(i=1,2,3,)不全相等,即存在差异。  列因素:H0:mi(i=1,2,)全都相等;;H1:mi(i=1,2)不全相等交互作用:H0:无交互作用;H1:有交互作用。  第二步:在Excel中利用【数据分析】中的【有重复双因素方差分析】,得到所需数据;第三步:根据所得数据分析,得出结论。  3、实验结果及分析:  在Excel中需要将数据调整为:  报纸  123456  81222141018  电视  12826301814  再选中全体进行方差分析。\n  下表可知:对行因素来说,F>Fcrit,故应拒绝原告,即广告方案对销售量有显著影响;而对列因素、交互作用来说,F