- 422.50 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
用EXCEL数据分析工具进行抽样(2009-08-1120:27:13)标签:excel 数据分析 工具 抽样 随机 间隔 分类:市场调查 离开市场调查行业已经近三年,抽样这玩意都好久没碰了,今天突然需要进行抽样,现重新温习下如何在EXCEL进行抽样,主要利用EXCEL里的加载项“数据分析”进行介绍。如果你的EXCEL尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘的支持下加载“数据分析库”。加载成功后,可以在工具的下拉菜单中看到“数据分析”选项。2007则需要在“EXCEL选项”--“加载项”--“分析工具库”进行加载。 操作步骤: 1.打存放需要抽样数据的EXCEL表格,本例采用手机号码进行介绍。 2.选择“工具”—“数据分析”—“抽样”后,出现对话框,依次选择: 输入区域:把原始总体数据放在此区域中,数据类型不限,数值型或者文本型均可; 抽样方法:有间隔和随机两种间隔抽样需要输入周期间隔,输入区域中位于间隔点处的数值以及此后每一个间隔点处的数值将被复制到输出列中。当到达输入区域的末尾时,抽样将停止;\n随机抽样是指直接输入样本数,电脑自行进行抽样,不用受间隔的规律限制。样本数:在此输入需要在输出列中显示需要随机抽取总体中数据的个数。每个数值是从输入区域中的随机位置上抽取出来的,请注意:任何数值都可以被多次抽取!所以在样本中的数据一般都会有重复现象,解决此问题有待于EXCEL软件的完善。目前我们可以使用“高级筛选”功能进行无重复数据筛选才可得出最终数据,所以抽样所得数据实际上会有可能小于所需数量。请根据经验适当调整在数据样本选取时的数量设置,以使最终所得样本数量不少于所需数量。 输出区域:在此输入对输出表左上角单元格的引用。所有数据均将写在该单元格下方的单列里。如果选择的是“周期”,则输出表中数值的个数等于输入区域中数值的个数除以“间隔”。如果选择的是“随机”,则输出表中数值的个数等于“样本数”; 3.然后单击确定就可以得到抽样结果。间隔抽样结果: 随机抽样结果:\n 从随机抽样结果可以看出刚好有两个重复的号码,如果号码多了就需要用刚才提到的高级筛选功能进行筛选。统计学读物推荐 一、统计学基础部分 1、《统计学》DavidFreedman等著,魏宗舒,施锡铨等译中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mindonstatistics(英文版)》机械工业出版社 只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematicsastostatisticsissomethinglikehammer,nails,woodastoahouse,it'sjustthematerialandtoolsbutnotthehouseitself。 3、《MathematicalStatisticsandDataAnalysis(英文版.第二版)》机械工业出版社 看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。\nAmazon上有书评。 4、《BusinessStatisticsadecisionmakingapproach(影印版)》中国统计出版社 在实务中很实用的东西,虽然往往为数理统计的老师所不屑 5、《UnderstandingStatisticsinthebehavioralscience(影印版)》中国统计出版社 和上面那本是一个系列的。老外的书都挺有意思的 6、《探索性数据分析》中国统计出版社和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 7、数理统计引论 著译者:陈希孺 出版者:科学出版社 《数理统计学简史》陈希孺 8《概率论与数理统计教程》魏宗舒 二、回归部分 1、《应用线性回归》中国统计出版社 还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 2、《RegressionAnalysisbyexample(3rdEd影印版)》 这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分析,怎么看图,怎么看结果。看完才觉得回归真得很好玩 3、《Logistics回归模型——方法与应用》王济川郭志刚高等教育出版社不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格 三、多元 0、《多元统计分析引论》张尧庭,方开泰著科学出版社 1、《应用多元分析(第二版)》王学民上海财经大学出版社 现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。 2、《AnalyzingMultivariateData(英文版)》Lattin等著机械工业出版社这本书有很多直观的感觉和解释,非常有意思。对数学要求不高,证明也不够好,但的确是“统计书”,不是数学书。 3、《AppliedMultivariateStatisticalAnalysis(5thEd影印版)》Johnson&Wichem著中国统计出版社 个人认为是国内能买到的最好的多元统计书了。Amazon上有人评论,评价很高的。不过据王学民老师说,这本书的证明还是有不太清楚,老外实务可以,证明实在不咋的,呵呵 四、时间序列 1、《商务和经济预测中的时间序列模型》弗朗西斯著 Amazon上五星推荐的书,讲了很多很新的东西也非常实用。我看完才知道,原来时间序列不知有AR(1)MA(1)啊,哈\n 2、《ForecastingandTimeSeriesanappliedapproach(thirdedition)》Bowerman&Connell著 本书的主讲Box-Jenkins(ARIMA)方法,附上了SAS和Minitab程序 五、抽样 1、《抽样技术》科克伦著张尧庭译 绝对是该领域最权威,最经典的书了。王学民老师说:这本书不是那么好懂的,数学系的人,就算看得懂每个公式,未必能懂它的意思(不是数学系的人,还是别看了吧)。 2、《Sampling:DesignandAnalysis(影印版)》Lohr著中国统计出版社 讲了很多很新的方法,无应答,非抽样误差,再抽样,都有讨论。也很不好懂,当时偶是和《AdvanceMicroeconomic Theory》一起看的,后者被许多人认为是梦魇,但是和前者一比,好懂多了。主要还是理念上的差距。我们的统计思想和数据感觉有待加强啊 六、软件及其他 1、《SAS软件与应用统计分析》王吉利张尧庭主编 好书啊!!!! 2、《SASV8基础教程》汪嘉冈编中国统计出版社 主要讲编程,没怎么讲统计。如果想加强SAS编程可以考虑。 3、《SPSS11统计分析教程(基础篇)(高级篇)》张文彤北京希望出版社 当初第一次看这本书,发现怎么几乎都看不懂,尤其是高级篇,现在终于搞清楚了:) 4、《金融市场的统计分析》张尧庭著广西师范大学出版社 张老师到底是大家,薄薄的一本书,言简意赅,把主要的金融模型都讲清楚了。看完会发现,分析金融单单数学模型还是纸上谈兵,必须加上统计模型和统计方法才能真正应用。本书用的多元统计(代数知识)比较深。