- 257.56 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
加载“数据分析”功能Excel菜单栏“工具”选项屮“数据分析”工具是统计分析时经常需要用到的,在初次使用时会发现在Excel相应位置中找不到这一选项,其原因在于在安装Office办公集成软件或MicrosoftExcel时,一般使用的是“自动”或“典型”安装。为此,盂要使用者自己加载这一功能。操作步骤是:在Excel界血中,单击“工具“菜单,显示各种条目,选中“加载宏”命令,在弹出的“加载宏”对话框中选择'‘分析工具库”,单击“确定”按钮,如图0・1和图0-2所示。图0-1在“工具”菜单中单击“加载宏”选项图0-2在“加载宏”列表中选择“分析工具库”在加载成功“数据分析”选项后,单击“工具”菜单,即可出现“数据分析”选项,如图0-3所示。\n闿文件(巳編辑(或视图(刃插入①格式(◎工具(I)数据(0窗口(刺▼.尊拼写⑸…F7□319昌R血妙图0・3在“工具”菜单中单击“数据分析”选项实验三抽样与参数估计实验目的:熟练使用随机数字表及抽样命令抽取所需要的样本单位并进行简单的参数估计,本部分提供了两种抽样方法和四种参数估计的基本方法有利于学习者根据自己特点选择适当的方法进行参数估计,有利于帮助学习者理解抽样分布的含义实验要求:同学们利用随机数字表从同一总体中抽选样本量相同的样本,根据样本数据利用描述统计命令计算样本均值及标准差,然后利用多个样本均值能够做出抽样分布;能够利用Excel计算得到不同分布下的临界值及总体均值的置信区间,并能结合实际背景对所得结果进行统计意义解释。实验内容:任务一:1、利用实验指导三中的抽样方法对给的成绩进行抽样,随机抽取50个,计算样本的均值,标准差(直接利用数据分析里面的描述统计),抽样平均值的平均误差,及格率,及格率标准差(pl31例子),及格率抽样平均误差。2、均值估计:结合书本的计算公式利用抽样的结果,在置信度分别为0.8,0.9,0.9545,0.99下,估计总体的均值的置信区间3、比例估计:结合书本的计算公式利用抽样的结果,在置信度分别为0.8,0.9,0.9545,0.99下,估计总体的及格率的置信区间4、计算总体的实际均值和实际及格率,与上述的估计区间进行对比,说明总体的实际均值和实际及格率在哪些上述估计区间内,从而得出结论,说明区间估计的有效性。任务二:1、针对自己的调查项目,找至少一个重要数据,做出一定的区间估计,均值估计或比例估计都可以,写出结论。任务三:将任务一、二中的重要结果和结论,以美观的方式填入实验报告3中,下\n周一上午前交打印稿给学习委员,下周一上午学习委员交我办公室928。一.抽样工具法在Excel的“数据分析”T具中有一个“抽样”T具,可以较简单迅速地完成一些常规的抽样任务。(该工具是重复抽样的!)下而说明如何使用数据分析工具中“抽样”工具抽取样本。首先需要编制总体单位编号表。总体单位编号,可按随机原则也可按照与调查目的有关或无关的标志排队编号。案例同上把800名学生的编号输入的Excel表格中,如表3-1所示。表3・1总体单位编号表(部分)ABCDEFGHIT111121314151617118191221222324252627282923431323334353637383934142434445464748494551525354555657585956789616263646566676869671727374757677787978182838485868788898919293949596979899910102013040506070RO90100l在Excel表中输入总体编号后,町按以下步骤操作完成抽样工作:第一步:在“工具”菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“抽样”,回车打开“抽样”对话框。(见图3・1〜图3-3)MicrosoftExceI・Bookl亘文件(巳编辑©观图(叟插入①格式9)工具⑴数据(①窗口(呢)▼c*.朝拼写(5)…F7匚图3-1在“工具”菜单中单击“数据分析”选项图3-2从“分析工具”列表中选择“抽样”\n输入输入区域a):□标志G-)$A$r$J$80[确定]I取消]|帮助QD]O周期QE)间隔:◎随机®>样本数:输出选项©输出区域(Q):O新工作表组E):O新工作薄趙)图3・3“抽样”工具对话框第二步:在“抽样”对话框屮进行相应设置。木例在“输入区域⑴”(总体单位编号所在区域)输入Al:J80(在Excel执行过程中自动更换为绝对引用形式,即在字符和数字前加$号,使用者没有必要考虑这两种形式的不同)。Excel将从A列开始抽样,然后按顺序抽取B列至J列。如果“输入区域⑴”的第一行或笫一列有标题,则需单击“标志(L)”前面的复选框(使具出现对钩,表示己被选定)。第三步:在“抽样方法”选择区域具体选择抽样模式。1、“周期(毋”模式,即等距抽样或机械抽样。采用此模式,需要将总体单位数除以所需样本数,求得取样的周期间隔。本例屮如果在100名学生中抽取10名进行调查,800/50=16,可在“间隔框”中输入16(如果计算得到的周期间隔不是整数,取整即可)。2、“随机(R)”模式适用于简单随机抽样、分层抽样、整群抽样和多阶段抽样。如采川简单随机抽样,只需在“样木数”框屮输入所需的样木单位数。木例,可在“样木数”框屮输入50。其他抽样方法具体做法与简单随机抽样的区别在于第二步“输入区域”上的不同。如采用分层抽样,事先要计划好分几层,每层要抽取多少样木,每层的总体单位编号在何区域。在每一层中,分别采用简单随机抽样,步骤同上。整群抽样需要対群进行编号然后抽样,多阶段抽样,每阶段抽样可以是简单随机抽样、分层抽样或等距抽样。第四步:指定“输出区域(O)”。“输出区域(O)”是指Excel结果输出的起始位置,输入单元格的行列号即可,本例输入“L1”。当然,也可以选择“新工作表(P)”或“新工作薄(W)”作为放置抽样结果的位置。完成以上操作后,回车确认,即在指定的位置给出抽样结果。见图3-4。ABCDEFGHI.TKL1111213141516171819161221222324252627282929133132333435363738393424414243444546474849410551525354555657585958466162636465666768696100771727374757677787977088182838485868788898789919293949596979899944图3・4“抽样”输出结果(部分)说明:在简单随机抽样时,也可以不对数据进行编号,而直接対数据本身进行“抽样”,操作过程相同。\n二、区间估计区间估计:二样木均值(或比例)土临界值Z*抽样平均误差••垂复抽样平均误差=标准差/妬•不重复抽样的平均误差二重复抽样的平均误差*再冷样本算术平均值、标准差略Ponir样本比例V比例标准差1、n很大时(n>30)置信度为q临界值z山查表或者NORMS1NV函数求得:(1)查表:查附表一:F(t)=q对应的t即为所求(2)NORMSINV函数:求岀a/2=(1-q)/2,单击某一单元格输入“二-NORMSINV(a/2)”例如:置信度为q=80%,贝惮击某一单元格输入“=-NORMSINV(0.1)”2、表格法(n很小的时候)所谓表格法是指用表格的形式,一步步求出所需的置信区间。在美国,人公司的首席执行官每年的红利报酬平均是多少?8家公司的样木提供的每年薪水或红利数据如下:公司年薪或红利(1000美元)可口可乐公司3654通用汽车公司1375英特尔公司2184摩托罗拉公司1736《读者文摘》协会公司1708西尔斯公司3095斯普林特公司1692韦尔斯.法戈公司2125假设首席执行官年薪或红利服从正态分布,求总体均值的95%的置信区间是多少?这是一个正态总体但方差未知的情况,可用样本方差代替总体方差,用占由度为ml的\nT统计虽对总体均值进行区间估计。公式如下:其屮,&/2为T分布的上刃2分位点,x为样本均值,汕为样本标准差。下面用表格法求出了所需的置信区间,如表3-2所示。表3-2表格法计算过程ABCD1样本数据计算指标计算公式结果23654.00样本个数二COUNT(A2:A9)8.0031375.00样本均值二AVERAGE(A2:A9)2196.1342184.00洋本标准差=STDEV(A2:A9)785.3151736.00抽样平均误差二D4/SQRT①2)277.6561708.00置信水平0.950.9573095.00自由度二D2-17.0081692.00T值=TTbTV(l-D6,D7)2.3692125.00误差范围=D8*D5656.5310置信下限二D3-D91539.5911置信上限二D3+D92852.66从上表的计算结果可以看出,在95%的置信度下首席执行官年薪或红利的置信区间为[1539.59,2852.66]o换句话说,首席执行官年薪或红利的平均值有95%的对能性在1539.59到2852.66之内上面主要介绍了单总体求总体均值直信区间的一些方法,对于求总体比例、方差以及两个总体均值、比例Z差,方差Z比的区间估计同样适用。我们需要不断的学习,丰富我们的知识面,学到老,是我们良好的生活态度!