统计学案例集 46页

  • 1.17 MB
  • 2022-08-13 发布

统计学案例集

  • 46页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
统计学教学案例集统计学精品课建设小组2004年11月\n《统计学》精品课程建设【案例一】全国电视观众抽样调查抽样方案一、调查目的、范围和对象1.1调查目的准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。1.2调查范围全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。1.3调查对象全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。二、抽样方案设计的原则与特点2.1设计原则抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。2.2需要考虑的具体问题、特殊要求及相应的处理方法2.2.1城乡区分13\n《统计学》精品课程建设城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采用第二种处理方式。在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。2.2.2抽样方案的类型与抽样单元的确定全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。本抽样方案采用分层五阶抽样。各阶抽样单元确定为:第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等);第二阶抽样:街道、乡、镇;第三阶抽样:居委会、村委会;第四阶抽样:家庭户;第五阶抽样:个人。为提高抽样效率,减少抽样误差,在第一阶抽样中对区、县采用按地域及类别分层。在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。2.2.3自我代表层的设立根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。这样自我代表层共有8个,包括以下城市与地区:13\n《统计学》精品课程建设北京市、天津市、上海市;广州市、成都市、长沙市、西安市;西藏自治区。三、样本区、县的抽选方法3.1全国区、县的调查总体根据2001年的全国行政区划资料,全国(港澳台除外)共有787个市辖区,此外有5个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同一个市辖区,则共有792个区;全国共有1674个县(包括自治县及旗、自治旗、特区与林区等)、400个县级市,县级行政单位的总数为2074个,这中间包括福建省的金门县,不能进行调查,因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此次调查的调查总体。3.2区、县分层为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层。分层可以按多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量。在本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。关于这方面已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来分类。而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在省的人文发展指数及县的人均GPT)的资料都无法得到,经过多方研究,我们对区县的分层按以下两种标识进行。(1)地域我国幅员广大,各地经济、社会、文化与气候的地域差异极大,而所有这些因素都与电视观众的收视行为密切相关。我们首先将所有县按所在省(自治区、直辖市)的地理位置分成3大层13个子层,[各省括号内的数字为它们的人文发展指数(HumanDevelopmentIndex,简称HDI),在全国的排位,参见附表]。地域分层如表1:13\n《统计学》精品课程建设表1全国区、县的地域分层大层所含省、自治区、直辖市第一大层(东部地区)子层10:上海(1)、北京(2)、天津(3)(每个都作为自我代表层)子层11:辽宁(5)、山东(9)子层12:江苏(7)、浙江(6)子层13:福建(8)、广东(4)、海南(13)第二大层(中部地区)子层21:黑龙江(10)、吉林(12)子层22:河北(11)、河南(18)、山西(16)子层23:安徽(20)、江西(23)子层24:湖北(14)、湖南(17)第三大层(西部地区)子层31:内蒙古(21)、新疆(15)、宁夏(26)子层32:陕西(25)、甘肃(28)、青海(29)子层33:重庆(22)、四川(24)子层34:广西(19)、云南(27)、贵州(30)子层30:西藏(自我代表层)需要说明的是以上划分的层,还考虑了其他一些因素,各省按联合国制定的标准计算的人文发展指数仅是考虑因素之一。例如,按人文发展指数,广西(第19位)实际上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区,我们的划分与它一致,这样便于资料的汇总发布。又如海南,根据人文发展指数(第13位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为而言,与广东、福建划在一子层内是合理的。(2)区、县类别同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区)和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程度有较大差异。我们将各大层中所有的区、县除已划为自我代表层的以外,(如下称抽样总体)分成以下5类,每类组成1个小层:一类区,二类区,县级市,一类县,二类县。全国抽样总体中所有区县共分成11×13\n《统计学》精品课程建设5=55个小层。其中区的划分标准为区中非农业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;县的划分标准为人均国内生产总值,高的为一类县,低的为二类县。区县划分类别的标准在三大层中各不相同,具体标准如下:区类别的划分标准:东部地区与中部地区:非农人口在总人口中的比例大于或等于80%为一类区,小于80%为二类区;西部地区:非农人口在总人口中的比例大于或等于70%为一类区,小于70%为二类区。县类别的划分标准:东部地区:人均GDP在5000元以上为一类县;5000元以下为二类县。中部地区:人均GDP在4000元以上为一类县;4000元以下为二类县。西部地区:人均GDP在3000元以上为一类县;3000元以下为二类县。3.3自我代表层的区、县情况根据最新行政区划,自我代表层中的7个城市所辖的区、县构成情况如表1。表2自我代表城市的辖区、县构成城市一类区二类区直辖市中的县及其它县级市县总计北京市855-18天津市774-18上海市973-19广州市552-12成都市524819长沙市23139西安市440513西藏自治区包括1个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)及71个县。3.4抽样总体区县情况按3.2划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在(抽样总体)总人口中的比例如表3与表4所示。13\n《统计学》精品课程建设表3抽样总体中各小层的区县数地域子层一类区二类区县级市一类县二类县合计东部地区114362471968239东部地区123047533137198东部地区132441515942217中部地区215626403632190中部地区22396756140148450中部地区232634193195205中部地区242044394269214西部地区31278349161221西部地区3211161551131224西部地区33542145585201西部地区3419273074175325合计3004143986299432684表4抽样总体各小层人口占总人口的比例(%)地域子层一类区二类区县级市一类县二类县合计东部地区111.35122.27663.17280.76723.629511.1972东部地区120.69921.64873.88321.41052.28099.9226东部地区130.50831.21873.44372.34971.71509.2354中部地区211.02000.50231.77091.10351.00375.4004中部地区220.92631.91282.78584.52916.359316.5133中部地区230.52721.18001.06821.16374.93858.8776中部地区240.61061.59282.54152.27573.251910.2726西部地区310.43430.22190.73191.22651.36923.9838西部地区320.29760.55130.42570.72333.05675.0546西部地区330.14542.11320.95811.87153.89618.9843西部地区340.36290.94781.32542.64995.272210.5582合计6.883114.166222.107220.070536.7730100.000013\n《统计学》精品课程建设3.5区、县的抽样方法及样本量抽样总体中各层(指小层,下同)内对区、县的抽样采用按人口的PPS系统抽样,样本量一般为2;少数人口较多的小层样本量定为3。样本量的具体分配见表5。样本区、县总量为121个。表5各小层的区县样本量的分配地域子层一类区二类区县级市一类县二类县合计东部地区112332212东部地区122232211东部地区132232211中部地区212222210中部地区222233313中部地区232222311中部地区242222210西部地区312222210西部地区322222311西部地区332222311西部地区342222311合计2223262327121四、抽样总体中样本区、县内的抽样方法4.1样本区内的抽样每个一类样本区内采用街道(镇)、居委会、家庭户及个人的4阶抽样;每个二类样本区内采用街道(乡、镇)、居(村)委会、家庭户及个人的4阶抽样,样本量皆为90。具体方法如下。4.1.1对街道(乡、镇)的抽样样本区内对街道(乡、镇)抽样采用按人口的PPS系统抽样,每个样本区抽3个街道(乡、镇),其中一类区不抽乡。13\n《统计学》精品课程建设4.1.2对居委会的抽样样本街道、镇(乡)内对居(村)委会的抽样采用按人口的PPS系统抽样,每个样本街道、镇、乡各抽2个居(村)委会(其中一类区不抽村委会)。为操作方便,这里的人口数也可用户数。4.1.3对家庭户的抽样样本居(村)委会内对家庭户的抽样采用随机起点的等概率系统抽样,即等距抽样。每个居(村)委会固定抽取15户。在抽样时,必须首先清点居(村)委会管辖范围内的实际家庭户数,且规定排列的顺序。4.1.4样本户内具体调查对象的确定对每个被抽中的样本户,在13岁以上(含13岁)的成员中,完全随机地确定一名为具体调查对象。为确保家庭成员中的每一个这样的成员都有相等的概率被抽中,采用二维随机表来确定。表6确定户内调查对象的二维随机表序号姓名性别年龄1234567891011121111111111111221211221121233211322131234413223143241554123412354266315243514627714362525743884571263753199514382765281010359417286941111615104983276121272941161831054.2样本县(县级市)内的抽样每个样本县内采用乡(镇)、村(居)委会、家庭户及个人的4阶抽样,样本量为60。具体方法如下。13\n《统计学》精品课程建设4.2.1对乡、镇的抽样确定县城所在的镇(城关镇)为必调查镇,对其余乡(镇)采用按人口的PPS系统抽样,再抽2个乡(镇),每个样本县共调查3个乡(镇)。4.2.2对村(居)委会的抽样在每个城关镇中用按人口PPS抽样抽取2个样本居(村)委会。对其它两个样本乡、镇内,也用同样的方法抽2个村委会。为操作方便,这里的人口数也可用户数。4.2.3对家庭户的抽样样本村(居)内对家庭户的抽样与样本居委会内对家庭户的抽样完全相同,仍采用随机起点的等概率系统抽样,即等距抽样。每个村(居)固定抽取10户。4.2.4具体调查对象的确定在样本户中确定具体对象的方法与4.1.4中情形完全相同,即用二维随机表来确定。4.3儿童样本的确定在城乡每个样本户中,除抽取一位13岁以上的观众作为调查对象外,如果还有4-12岁的儿童,则需要抽取1位进行儿童观众的调查。如果符合年龄的条件多于1位,则仍按二维随机表的方法确定。对于自我代表的7个城市中,为保证儿童的样本量,对每个样本户,调查所有满足年龄的儿童。五、自我代表层中的抽样方法5.1自我代表城市的抽样方法每个需要进行推断的城市皆作为自我代表层,在层内也进行分层抽样,层的划分标准与其它子层中的区、县标准基本相同。只不过不再对县分类,且将县级市(仅长沙市有一个)也作为一般县处理。这样每个城市皆分为一类区、二类区及县三层。考虑到上海市浦东新区的特殊性(既包括完全城市化的市区,也包含相当广泛的农村),将该区作为自我代表层处理。13\n《统计学》精品课程建设考虑到在一个城市范围内的调查,交通比较方便,故为提高效率,根据每个城市的实际情况,保证(或适当增加)样本区的数量,减少每个样本区、县内的的样本量。每个样本区县规定都抽2个街道(乡、镇),每个样本街道、乡、镇抽2个居(村)委会。样本区内每个居(村)委会样本量仍为本15户,样本县(县级市)内每个村(居)委会样本量仍为10户。如果有可能,对一类区也可不对区进行抽样,直接对街道进行抽样。根据每个必调查城市所属的区县数,确定样本区、县数如下表(表中的数字为样本区、县数,括号中的数字为每个区、县的样本户数):表7自我代表城市的样本量城市一类区二类区县总样本量北京市4(60)2(60)2(40)440天津市3(60)2(60)2(40)380上海市4(60)3(60)﹡2(40)500广州市3(60)2(60)2(40)380成都市﹡3(60)2(60)2(40)380长沙市2(60)3(60)2(40)380西安市﹡4(45)2(60)2(40)380总计13209605602840﹡其中浦东新区在商业区抽一个街道,在农业区抽一个镇。﹡成都、西安两市由于一类区数量较少,故对一类区进行全数调查,其中西安市每个一类区中抽1个街道,每个街道抽3个居委会。若有条件在每个区中直接抽3个居委会最好。5.2西藏自治区的抽样方法西藏自治区的抽样也采用分层抽样法,其中拉萨市城关区抽4个居委会,日喀则市除城关镇外,再抽两个乡镇,共6个居(村)委会。以上两市均作为自我代表层,每层各抽取60户;其余71个县则采用按人口的PPS抽样抽2个县,每个县调查40户。西藏自治区总样本量为200户。六、总样本量与抽样误差的估计6.1总样本量13\n《统计学》精品课程建设根据前述抽样设计,本方案13岁以上观众总的样本量为:1)自我代表层共2840+200=3040户,其中区样本为2400户,县样本为640户。2)抽样总体分11个子层,55个小层,样本区县共121个,其中样本区45个,样本县(县级市)76个。每个样本区抽90户,故区样本为4050户;每个样本县抽60户,县样本共4560户,共计8610户。3)全国总样本量为11650户,其中区样本为6390户,县样本为5260户。6.2抽样误差的估计本方案的设计效应deff估计为2.0,相当于简单随机抽样的样本量n0=5825,在95%置信度下比例型目标量的绝对误差限d,经计算约为1.28%。七、目标量的估计及其方差估计根据方案设计,(小)层内样本是近似自加权的,因此层目标量的估计及其方差估计较为简单。而地区(大层)与全国目标量的估计则可用表4中的人口比例为权加权并汇总自我代表层得出,相应的方差估计也随之可得。具体公式另给。参考文献[1]冯士雍,倪加勋,邹国华,《抽样调查理论与方法》,中国统计出版社,1998.[2]中华人民共和国民政部编,中华人民共和国行政区划简册,中国地图出版社,2001。[3]联合国开发计划署,中国人类发展报告---1999,中国财政经济出版社,1999[4]胡鞍钢,邹平等,中国发展报告社会与发展—中国社会发展地区差距研究,浙江人民出版社,2000。[5]L.基什(L.Kish)著,倪加勋等译,抽样调查,中国统计出版社,1997。13\n《统计学》精品课程建设附表:1997年全国各省市人类发展指数(HDI)省、市自治区平均预期寿命指数教育指数国内生产总值指数人类发展指数人类发展指数排位上海0.8320.8240.9750.8771北京0.7980.8400.9630.8672天津0.7890.8100.9570.8523广东0.7920.7890.9490.8434辽宁0.7540.8010.9390.8315浙江0.7800.7350.9490.8216江苏0.7730.7350.9450.8177福建0.7260.7370.9440.8028山东0.7600.7020.8490.7709黑龙江0.7000.7900.8090.76610河北0.7560.7590.6760.73011吉林0.7160.8040.6100.71012海南0.7500.7450.6320.70913湖北0.7040.7610.6550.70714新疆0.6270.7730.6560.68515山西0.7330.7820.5220.67916湖南0.6990.7760.5110.66217河南0.7530.7450.4870.66118广西0.7290.7410.4780.64919安徽0.7410.7130.4820.64620内蒙古0.6780.7400.5170.64521重庆0.6890.7270.4890.63522江西0.6850.7640.4550.63523四川0.6890.7230.4410.61724陕西0.7070.7410.4040.61725宁夏0.6990.6690.4400.60326云南0.6420.6650.4420.58327甘肃0.7040.6670.3390.57028青海0.5930.5450.4450.52829贵州0.6550.6590.2330.51630西藏0.5770.4350.3450.4523113\n《统计学》精品课程建设【案例二】请对下面的问卷客观地评价汽油的销售本次调查由国家汽油代理商组织,希望更多地了解消费者购买汽油时的期望。所有信息都会被保密。表格填好后请返回给我们。1.姓名和地址2.年龄和性别3.婚姻状况4.年龄状况:21岁以下21—40岁40—60岁60岁以上5.大多数汽油是由您购买的还是您的妻子买的?6.去年您买了多少汽油?5000升以上5000—10000升10000—2000升20000升以上7.您的汽油油箱容积多大?8.在您选购汽油时,价格的重要程度如何?9.请您尽可能充分地陈述什么原因使得您购买一种品牌的汽油而不买另外一种?10.您喜欢那些免费提供礼物的加油站,是不是?11.当您用车执行公务时,您将获赠的礼物或赠券留给自己,还是上交给您的雇主?12.您每年行驶的里程是长是短?谢谢您的合作。根据您对上述问题的回答,重新起草上面的调查问卷。14\n《统计学》精品课程建设【案例三】某市造纸行业产品产量与结构分析某市造纸业在“十五”期间的产品产量、原材料消耗量、专用设备技术状况以及调查预测的2006年各类产品的需求量等资料如下:表1“十五”期间各类产品产量单位:万吨产品名称产量预测的1996年需求量2001年2005年印刷用纸6.510.513.39书写用纸5.04.96.86技术配套用纸0.71.11.33包装用纸5.98.210.12其他用纸1.12.03.33生活用纸7.51331.56纸板6.211.428.78其中:白纸板0.40.61.23箱纸板1.32.04.32挂面纸板0.050.51.20瓦楞纸板2.32.47.89合计26.739.766.59表2“十五”期间主要原材料消耗量单位:万吨原材料原材料消耗量2001年2005年木浆5.56.7苇浆2.83.6蔗渣浆0.91.2竹浆0.40.5废纸浆4.18.6麻、布、棉浆1.83.2禾草浆9.915.6其他浆0.71.0合计26.140.416\n《统计学》精品课程建设表3专用设备技术状况单位:台专用设备合计国际水平国内先进水平国内一般水平国内落后水平磨木机5——31蒸球190——11674蒸锅5—122造纸设备170—343124要求:根据以上资料,对该市造纸行业的产品产量和结构进行分析。分析方法说明:(1)对产品产量与结构进行分析,首先需要利用数字资料描述产品产量及其结构现状以及发展趋势,其次根据一定的研究目的分析产品结构的合理性。(2)分析研究可以采用静态分析与动态分析相结合的办法。静态分析主要是研究产品结构的现状,分析当前的产品结构是否满足社会需要,是否适应现有的生产力发展水平,从中确定哪些是合理的,哪些是不合理的;同时通过动态分析,反映产品结构演变的历史过程,预测产品结构将沿着什么方向发展,这种发展是否适应经济发展的客观需要。在研究过程中,要结合本地区或本企业的实际情况,如原材料供应、设备状况、技术力量、企业管理水平等,进行多因素的对比分析,找出调整产品结构与提高产品产量的症结所在,并提出切实可行的措施。16\n《统计学》精品课程建设【案例四】时间序列分析在经济预测中的应用一、案例简介为了配合《统计学》课程时间序列分析部分的课堂教学,提高学生运用统计方法分析解决实际问题的能力,我们组织了一次案例教学,其内容是:对烟台市的未来经济发展状况作一预测分析,数据取烟台市1978—1998年国内生产总值(GDP)的年度数据,并以此为依据建立预测模型,对1999年和2000年的国内生产总值作出预测并检验其预测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果,是反映国民经济活动最重要的经济指标之一,科学地预测该指标,对制定经济发展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时,我们首先将数据资料印发给学生,并讲清本案例的教学目的与要求,明确案例所涉及的教学内容;然后给学生一段时间,由学生根据资料,运用不同的方法进行预测分析,并确定具体的讨论日期;在课堂讨论时让学生自由发言,阐述自己的观点;最后,由主持教师作点评发言,取得了良好的教学效果。经济预测是研究客观经济过程未来一定时期的发展变化趋势,其目的在于通过对客观经济现象历史规律的探讨和现状的研究,求得对未来经济活动的了解,以确定社会经济活动的发展水平,为决策提供依据。时间序列分析预测法,首先将预测目标的历史数据按照时间的先后顺序排列成时间序列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。本案例的最大特色在于:它汇集了统计学原理中的时间序列分析这一章节的所有知识点,通过本案例的教学,可以把不同的时间序列分析方法进行综合的比较,便于学生更好地掌握本章的内容。二、案例的目的与要求(一)教学目的1.35\n《统计学》精品课程建设通过本案例的教学,使学生认识到时间序列分析方法在实际工作中应用的必要性和可能性;1.本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机的结合在一起,以巩固学生所学的课本知识,深化学生对课本知识的理解;2.本案例是对烟台市的国内生产总值数据进行预测,通过对实证结果的比较和分析,使学生认识到对同一问题的解决,可以采取不同的方法,根据约束条件,从中选择一种合适的预测方法;3.通过本案例的教学,让学生掌握EXCEL软件在时间序列分析中的应用,对统计、计量分析软件SPSS或Eviews等有一个初步的了解;4.通过本案例的教学,有助于提高学生运用所学知识和方法分析解决问题的能力、合作共事的能力和沟通交流的能力。(一)教学要求1.学生必须具备相应的时间序列分析的基本理论知识;2.学生必须熟悉相应的预测方法和具备一定的数据处理能力;3.学生以主角身份积极地参与到案例分析中来,主动地分析和解决案例中的问题;4.在提出解决问题的方案之前,学生可以根据提供的样本数据,自己选择不同的统计分析方法,对这一案例进行预测,比较不同预测方法的异同,提出若干可供选择的方案;5.学生必须提交完整的分析报告。分析报告的内容应包括:选题的目的及意义、使用数据的特征及其说明、采用的预测方法及其优劣、预测结果及其评价、有待于进一步改进的思路或需要进一步研究的问题。一、数据搜集与处理时间序列数据按照不同的分类标准可以划分为不同的类型,最常见的有:年度数据、季度数据、月度数据。本案例主要讨论对年度数据如何进行预测分析。考虑到案例设计时的侧重点,本案例只是对烟台市国内生产总值进行预测,故数据的搜集与处理过程相对简单。我们通过查阅《烟台统计年鉴》、《烟台五十年》等有关的资料获得烟台市1949—2000年23年的国内生产总值资料数据(原始数据详见表3)。该指标是反映国民经济发展情况最重要的指标之一,我们选择该指标进行预测具有较强的实用价值。此外,预测的方法具有普遍的适用性,使用者也可以将其应用于其它的研究领域。35\n《统计学》精品课程建设资料数据是预测的依据和基础,一般是根据确定的预测目标及影响因素搜集有关的资料和数据,并结合初步拟定的预测模型,对所搜集的数据进行分析和处理,然后再选取适当的预测模型。我们可以将整个数据处理过程概括如下,见图1。明确预测目的确定预测内容收集和整理资料选择预测方法结果是否合理计算预测结果推荐预测结果进行综合评价精度的约束时间的约束资金的约束YN图1经济预测流程图一、建议使用的预测分析方法(一)确定性时间序列分析法1.指标法:平均增长量法、平均发展速度法;2.趋势预测法:移动平均法、指数平滑法、曲线拟合法。(二)随机性时间序列分析法1.ARIMA模型预测;2.组合模型预测。35\n《统计学》精品课程建设一、案例分析过程(一)确定性时间序列分析法1.平均增长量法该方法是利用历史资料计算出它的平均增长量,然后再假定在以后各期当中,它仍按这样一个平均增长量去增长,从而得出在未来一段时期内的预测值。根据烟台市的国内生产总值1949年—1998年的观察值,我们计算出GDP的平均增长量为150647.69万元(水平法)和38437.81万元(总和法),利用其对烟台市1999年和2000年的GDP值进行预测并与实际GDP值[1]1999年为8010000万元,2000年为8700000万元。比较,结果见表1。表1平均增长量法预测结果1999年2000年GDP预测值(万元)预测相对误差(%)GDP预测值(万元)预测相对误差(%)水平法7550647.75.697701295.412.44累计法7438437.87.107476875.615.00教师点评:①平均增长量法不仅得到了GDP数据未来取值的预测值,而且还让学生更加深刻地认识到平均增长量在计算时水平法与总和法的区别所在,图1较明显地反映出平均增长量计算水平法与累计的区别,即水平法仅考虑首尾年份的数值,而不考虑中间年份的数值变化,因而有;②而总和法则考虑了整个样本区间上的总体变化情况,有,从而图2中A的面积和B的面积应该相等。A图2由平均增长量推算出的时间序列变化图35\n《统计学》精品课程建设1.平均发展速度法该方法就是利用时间序列资料计算出它的平均发展速度,然后再假定在以后各期当中,它仍按这样一个平均发展速度去变化,从而得出时间序列的预测值。我们计算出GDP在1978年—1998年间的平均发展速度为118.277%(几何法)和118.170%(方程法)[2]在该问题中几何法与方程法计算出的平均发展速度差别不大。,利用其对烟台市1999年和2000年的GDP进行预测得到结果见表2。表2平均发展速度法预测结果1999年2000年GDP预测值(万元)预测相对误差(%)GDP预测值(万元)预测相对误差(%)几何法8364664-4.479455081.6-7.49方程法8306352-3.749323713.9-6.00教师点评:①同平均增长量的计算一样,平均发展速度的计算方法也有两种,其中几何法也只是考虑起始年份的取值,有,而方程法则要考虑到整个年份取值的变化,有,方程法的内插预测曲线与原始曲线所夹的面积A和面积B也相等;②在方程式法计算中,计算平均增长速度可以采取试错法(让学生尝试着编写小的循环程序求解)或插值法;③同平均增长量的计算一样,平均发展速度的计算方法也有两种,其中几何法也只是考虑起始年份的取值,而方程法则要考虑到整个年份取值的变化;④由预测的结果可以看出,无论是平均增长量法还是平均发展速度法只适于作短期预测,否则预测相对误差会显著提高。35\n《统计学》精品课程建设BA图3由平均发展速度推算出的时间序列变化图1.移动平均法移动平均法是根据时间序列资料,采取逐项移动平均的办法,计算一定项数的序时平均数,以反映长期趋势的方法。移动平均法主要有简单移动平均法,加权移动平均法,趋势移动平均法等。这里主要介绍简单移动平均法。记为t期移动平均数;N为移动平均项数。由于移动平均可以平滑数据,消除周期变动和不规则变动的影响,使长期趋势显示出来,可以利用其进行外推预测。预测公式为:,即以第t期移动平均数作为第t+1期的预测值。表3移动平均预测结果年份序号t原始GDP三期移动平均值(T=3)五期移动平均值(T=5)194918263————1950125639————1951229327————195233499324409.67——195343672529986.33——195454079633681.6728989.40195564175237504.6733496.00195674820439757.6736718.60195784660843584.0040494.00195895175945521.3342817.0035\n《统计学》精品课程建设1959105869948857.0045823.801960115934852355.3349404.401961125227556602.0052923.601962135340856774.0053737.801963146201255010.3355097.801964156540755898.3357148.401965167601460275.6758490.001966178838867811.0061823.201967189175876603.0069045.801968198222985386.6776715.801969209206387458.3380759.2019702110560388683.3386090.4019712212258493298.3392008.20197223131998106750.0098847.40197324141524120061.67106895.40197425145245132035.33118754.40197526177917139589.00129390.80197627191185154895.33143853.60197728218721171449.00157573.80197829257782195941.00174918.40197930276146222562.67198170.00198031304923250883.00224350.20198132311590279617.00249751.40198233340400297553.00273832.40198334407773318971.00298168.20198435470404353254.33328166.40198536572569406192.33367018.00198637660180483582.00420547.20198738847263567717.67490265.201988391150970693337.33591637.801989401258556886137.67740277.2019904114852821085596.33897907.6019914217216371298269.331080450.2019924322960461488491.671292741.6019934432542351834321.671582498.2019944542786002423972.672003151.2019954653940003276293.672607160.0019964761524004308945.003388903.6019974867500005275000.004275056.2019984974000006098800.005165847.0019995080066006767466.675995000.0035\n《统计学》精品课程建设图4烟台市GDP的移动平均预测曲线由图4,我们可以得出这样的结论:移动平均法对原始序列产生了一个修匀作用,并且移动平均所使用的间隔期越长,即N越大,修匀的程度也越大,但对原始数据的反应越不灵敏;反之,则反是。为此,我们需要依据误差分析选择间隔时期N,见表4。表4烟台市GDP移动平均预测法的误差分析单位N=3N=5平均误差(ME)万元295708.35431300.80平均绝对百分误差(MAPE)%28.3340.611999年的预测相对误差%20.5827.36由表4中的分析知,在N=3时产生的误差较小,因此,选定N=3进行预测,得到1999年烟台市GDP的预测值为6767466.7万元。教师点评:①简单移动平均法只适合作近期预测,且如果目标的发展趋势存在其它较大的变化,采用简单移动平均法就会产生较大的预测偏差和滞后;②移动平均法会损失一部分数据,因而需要的数据量较大;③移动平均法对所平均的N个数据等权看待,而对期以前的数据则完全不考虑,这往往不符合实际。1.指数平滑法指数平滑法可以改变移动平均法的后两个缺点,指数平滑的计算公式为:35\n《统计学》精品课程建设,其中:为权数,为一阶指数平滑值。二阶指数平滑就是在一阶指数平滑的基础上再进行一次指数平滑,高阶的依此类推。由于指数平滑存在着滞后现象,因此,无论一次指数平滑或二次、三次指数平滑值[3]在具体计算时,取,。(数据略),都不宜直接作为预测值。但可以利用它来修匀时间序列,以获得时间序列的变化趋势,从而建立预测模型。由相应的指数平滑数值,可以建立如下的指数平滑二次曲线趋势预测模型。其中,、、为当前时间点处的一次、二次、三次指数平滑值,为预测时段长。为了预测烟台市GDP的1999年和2000年值,可以取t=49,分别取1和2。由指数平滑数值可计算出:=7583559.18,=936865.62,=294704.17,故得二次曲线指数平滑预测模型为:(1)分别令=1、=2得预测结果见表5。表5指数平滑预测结果年份1999年2000年预测值(万元)8815128.9910636107.17预测相对误差(%)-10.10-20.92教师点评:(1)在作指数平滑时,涉及到初始值和权数的选取问题,不同的取值导致结果各不相同;(2)由于指数平滑法也存在着严重的滞后现象,所以直接用平滑值去预测未来值会带来较大的误差,当建立指数平滑模型进行预测时,就会大大地减少预测误差。1.曲线拟合法35\n《统计学》精品课程建设曲线拟合法亦称趋势拟合法或时间回归法,该方法根据时间序列随时间变化趋势,运用LS拟合一条曲线,而后利用该曲线随时间变化规律对时间序列的未来取值进行预测。我们根据烟台市GDP(1978—1998)资料拟合出如下曲线:GDP=29669.339+12267.158×T-4330.927×T2+473.564×T3-18.571×T4+0.244×T5R2=0.9905。这里T为趋势项(1978年取值为0,以后每隔一年递增1),各估计参数均通过了显著性检验。GDP的实际值、拟合值和拟合残差如图5所示,图5表明曲线较好地拟合了数据的动态变化规律,拟合程度达到了99.05%。现在我们就用它来对GDP的未来取值进行预测,结果见表6。图5曲线拟合图表6曲线拟合预测结果年份1999年2000年预测值(万元)937209510957270预测相对误差(%)-17.05-24.57教师点评:①拟合的曲线类型的选取。在进行曲线拟合时,我们可以选取多项式曲线、指数曲线、对数曲线和增长曲线等,这里只是拟合了其中的多项式曲线,对于其它类型曲线留给学生课后讨论;②多项式曲线阶数的选取。在多项式曲线拟合之前,首先要根据时间序列的变化规律确定拟合几次曲线,然后在具体选择阶数时要根据可决系数来确定,同时还要考虑到建模的节约性原则,在没有显著增加时,停止增加曲线的阶数;③模型参数估计方法的选取。在估计模型参数时,既可以将非线性模型线性化,也可直接在Eviews3.0软件中作NLS估计,文中的结果便是直接估计得出。35\n《统计学》精品课程建设(一)随机性时间序列分析方法在实际问题中,由于一些反映社会经济现象的时间序列可以看成是随机过程在现实中的一次样本实现,并且我们所遇到的经济时序大多是非平稳的(直观上看,它们带有明显的趋势性或周期性),所以可以将其视为均值非平稳的时序,用下面的模型来描述:(2)其中,表示序列中随时间变化的均值,是确定性趋势部分,可以用一定的函数形式来拟合;为中剔除随时间变化均值后余下的部分,可以认为是零均值的平稳过程,因而可以用平稳的ARMA模型来描述。在具体处理时,有两种方法可供选择。其一:不考虑的具体形式,通过一定的数学手段(差分运算、对数运算与差分运算结合)将其剔除,对余下的部分拟合ARMA模型,最后经过反运算由的结果得出的结果,实际上即是建立ARIMA模型;其二:考虑到的具体形式,用一定的函数拟合得,直到余差序列平稳,再对拟合ARMA模型得,最后综合两部分可得,实际上即是建立组合模型。在本案例中GDP是一个非平稳的序列。由GDP的时序图(见图1和图2)可以看出它带有明显的增长趋势,初步将其识别为非平稳的,单位根检验结果(见表7)也证实了这一点。表7单位根检验结果变量ADF检验值检验类型(c,t,k)临界值结论D.W.值GDP-0.9319(c,t,1)-3.5045不平稳1.5293GDP-1.8229(c,0,1)-1.6495*平稳1.9345y-8.7682(c,0,1)-2.9228平稳1.9411注:1.检验类型中的c和t表示带有常数项和趋势项,k表示所采用的滞后阶数;2.表中的临界值是由Mackinnon给出的数据计算出的在5%显著性水平下的临界值,带*号的为在10%的水平下显著。1.ARIMA模型预测第一步:模型识别。由于GDP水平序列是非平稳的,而一阶差分序列是平稳的。故我们对其一阶差分序列进行识别,根据样本自相关和偏自相关函数图初步将其识别为自回归(AR)类模型。35\n《统计学》精品课程建设第二步:模型定阶。由于时间序列的自相关呈现拖尾性而偏自相关函数呈现出1阶截尾,则可将模型初步定为1阶自回归模型,然后再根据AIC准则确定的最优阶仍为1阶,从而可以对GDP拟合ARIMA(1,1,0)模型。图6自相关、偏自相关函数图第三步:模型估计。在Eviews3.0中,我们采用OLS法对模型的参数进行估计,结果如下:D(GDP,1)=515358.5+[AR(1)=0.964310][4]软件中的这种做法避免了先对差分序列建立ARMA模型,然后再求和得到GDP序列的预测,它将这两个过程一次性完成。(8.6387)R2=0.8762F=325.467AIC=25.9892其中D(GDP,1)为GDP的1阶差分序列,AR(1)为D(GDP,1)的1阶自回归项。第四步:诊断检验。我们发现模型拟合后的残差序列为白噪声序列,从而认为该模型是适应的,模型的拟合效果见图7。35\n《统计学》精品课程建设图7ARIMA模型拟合图至此,我们已经建立了时间序列GDP的ARIMA(1,1,0)模型,接下来的工作就是利用该模型对数据进行预测。在Eviews软件中forcast菜单下使用dynamic方法,结果见表8。表8ARIMA模型预测结果年份1999年2000年预测值(万元)80451958685755预测相对误差(%)-0.481.251.组合模型预测首先,建立组合模型,其过程如下:(1)拟合确定性趋势部分。由GDP的时间序列图,发现它具有指数上升的趋势。为此,我们可以将确定性趋势部分拟合成指数增长模型:[5]参数估计时,使用了NLS,其初始值可由1978年的GDP数据初步确定;t的取值同曲线拟合法。,T为趋势项(取值同曲线拟合预测法)。(2)对剩余序列[6]的单位根检验结果(见表7)表明它是一个平稳序列。用Box-Jenkins法拟合适应的ARMA模型,模型为:,模型是我们选择的最优模型,建立的方法和过程同ARIMA模型的建立。35\n《统计学》精品课程建设(3)建立组合模型。我们以已估计出来的指数增长模型的参数和ARMA模型的参数作为初始值,用非线性最小二乘法对组合模型的参数进行整体估计,得到最终的组合模型。最终的估计的估计结果为:表9组合模型的估计结果估计方程GDP=×EXP(×T)+×(GDP(-1)-×EXP(×(T-1)))+×(GDP(-2)-×EXP(×(T-2)))变量FD.W.对应值605.1785(3.5301)0.1938(30.8869)1.6923(20.5398)-1.1986(-10.8913)0.9987278.13322.2440注:括号中的值为系数估计对应的t-统计量JB=1.9716Q(4)=7.1601Q(8)=14.209ARCH(1)=0.559WHITE=0.7508RESET(1)=1.37模型可以写成:(3)其中,,我们对模型进行了一系列的统计检验。t-统计量表明模型中各参数均是显著的;F检验表明模型从总体上的显著的;J-B检验表明残差的分布是正态分布;D.W.检验表明残差没有一阶自相关,Q检验表明残差没有高阶自相关;ARCH检验表明不存在异方差现象;RESET检验表明模型的设置是正确的。因而该模型是适应的。由图5可以看出模型具有较高的拟合程度,拟合优度达到了0.9981,它较真实地刻画了GDP序列的动态变化规律。故可以利用模型(2)对烟台市GDP数据的未来取值进行预测。图8组合模型拟合图35\n《统计学》精品课程建设利用该组合模型进行预测,其结果见表10。表10组合模型预测结果年份1999年2000年预测值(万元)85265409529310预测相对误差(%)-6.49-8.34教师点评:①随机性时间序列分析是从系统的观点出发,既考虑到时间序列的确定性趋势,又考虑到它的随机波动性,在描述现实经济现象时,往往能得到令人满意的效果;②组合模型的经济含义较ARIMA模型为强;③案例中所讨论的组合模型实质为:回归模型+时间序列模型。(一)综合点评我们对烟台市的GDP数据进行了多种预测方法的尝试,得出了预测结果,并计算出预测的相对误差。其中最大的误差值达到-17.68%,是由平均发展速度法所得出的;最小的只有-0.518%,是由ARIMA模型预测法所得到。总的看来,随机性时间序列分析的预测误差较确定性时间序列分析的为小;而时间序列模型法的预测误差又较指标法的为小。总之,在案例中解决问题的方案不是唯一的,但存在一个比较优良的解决方案,学生们应该根据限制条件在各种方案的优缺点比较中找出比较优良的方案。一、需要讨论和解决的问题(一)课堂上需要讨论的内容学生可以分成小组,根据学生所学知识,对本案例进行分析,提交分析报告,在课堂上由老师组织讨论和交流。讨论的具体内容包括:1.试述时间序列分析的基本思想;2.在移动平均分析中,移动项数N如何选择;3.指数平滑中,平滑系数的选择十分重要,值既代表模型对时间序列变化的反应速度,又决定预测中修匀随机误差的能力,应如何进行平滑系数的选择;4.在进行随机性时间序列分析时,模型检验结果的含义及如何进行模型的选优;5.让学生分析和比较各种不同预测方法的特点、适用条件和在计算过程中应该注意的问题等,并对预测效果作出评价;6.指出各种预测方法的不足,提出改进措施;35\n《统计学》精品课程建设1.资料搜集与数据处理与数据处理应注意的问题(1)对所得的资料、数据如何进行初步诊别;(2)在进行多指标的时间序列分析时,要注意数据之间的可比性。包括:时间、空间、指标的内容和计算方法等;(3)对于无数量标志的因素,如何采用适当的方法使之数量化;(4)关于异常数据的处理;对于不真实的数据,或即使是真实数据,但不能反映预测变量正常变化情况的异常数据,应进行分析、处理。注意在数据不多的情况下,若将异常数据剔除掉,则会使数据更少,不利于建立合适的预测模型。因此,可以在分析产生异常数据原因的基础上,根据历史数据变化发展的趋势,对数据进行适当的处理[7]如果预测方法采用的时间序列分析法,则可将异常数据的前后两期数据取算术平均值或几何平均值作为异常数据的修正值。在具体选择时,若历史数据的变化呈线性趋势时,则宜采用算术平均值作为修正值。若历史数据的变化呈曲线趋势时,则宜用几何平均值作为修正值。。(二)需要进一步讨论的内容[8]任课教师可以根据学生学习情况的不同,有针对性地组织该部分内容的讨论。1.认识回归分析和时间序列分析的异同线性回归模型和时间序列模型是两类常用的预测模型。两者相比,各有千秋[9]详见参考文献11。。前者可含、也可不含解释变量的滞后项,而后者有自回归模型AR(p)、滑动平均模型MA(q)、自回归滑动平均模型ARMA(p,q);前者可以是年度、季度、月度模型,但不能揭示出被解释变量的非线性特征,而后者是季度或月度模型,能揭示出被解释变量的非线性特征;前者的解释变量涵义明确,政策分析性强,而后者的解释变量是被解释变量的滞后项或平滑项,政策分析性弱;前者的估计简单,直接使用最小二乘法,但对含解释变量的滞后项的回归模型,则需要识别它的阶数,而后者均需先估计它的阶数后,使用最小二乘法,利用前者进行预测时需要知道解释变量的值,这又是一个预测问题,而利用后者进行预测时不存在这个问题。2.了解组合模型的构造原理本案例把回归模型和时间序列模型结合起来构成组合模型,研制出一种回归与时间序列加法模型,提高了拟合程度和预测能力。除此之外,我们还可以构造其它的组合预测,只要我们采用某种恰当的方法,把不同模型的计算结果综合起来,相互取长补短,就能达到提高预测精度和增加预测结果可靠性的效果[10]详见参考文献12。。35\n《统计学》精品课程建设1.掌握模型建立过程中,有关技术性问题在预测过程中,建立预测模型会遇到一些技术性的问题(如:方程式法平均发展速度指标的计算问题,非线性模型的线性化问题,NLS估计的初始值选择问题,ARIMA模型理论估计与软件中的做法区别问题等),这些问题的解决,对学生独立思考问题的能力也是一个有益的训练。2.各种预测方法的特点不同的预测方法有各自的特点:(1)预测的时间范围不同,有的适宜作短期预测,有的可以作中、长期预测;(2)条件不同,有的方法计算复杂,需要时间序列资料苛刻,有的则比较简单,对资料要求也不高;(3)适用场合不同,有的对任何时间序列资料均可,有的只适合于平稳发展的时间序列,有的对时间序列的具体变化形态还有要求;(4)预测精度不同,有的具有较高的精度,有的只是作一种趋势性的判定,建模者可以根据一些指标(如:①平方和误差:;②平均绝对误差:;③均方根误差:;④平均绝对百分比误差[11]一般认为如果MAPE的值低于10,则认为预测精度较高。:;⑤均方百分比误差:;⑥Theil不等系数[12]根据均方误差的分解,还可以定义三个与希尔不等系数相关的指标。偏差率BP反映了预测值均值和实际值均值间的差异;方差率VP反映了它们标准差的差异;协变率CP反映了剩余的误差。值得说明的是:CP=1-BP-VP,当预测是比较理想时,均方误差大多数集中在协变率上,而其余两项都很小。:)[13]①、②和③属于绝对指标,其它属于相对指标建议使用。进行适当的选取。附一:参考文献1.王振龙:《时间序列分析》,中国统计出版社,2000、2;2.易丹辉:《统计预测——方法与应用》,中国统计出版社,2001、4;3.王庆石、卢兴普:《统计学案例教材》,东北财经大学出版社,1999、12;4.江之源:《经济预测方法与模型》,西南财经大学出版社,1999、9;35\n《统计学》精品课程建设1.暴奉贤、陈宏立:《经济预测与决策方法》,暨南大学出版社,1991、12;2.庞皓、杨作廪:《统计学》,西南财经大学出版社,2001、2;3.Pindyck,Rubinfeld著,钱小军译:《计量经济模型与经济预测》,机械工业出版社,1999、11;4.杨海山、苏永明:《统计学》,中国物资出版社,1999、2;5.王艳明、许启发:时间序列分析在经济预测中的应用,《统计与预测》,2001、6;6.杨海山:统计数据质量评估的组合模型,《统计与决策》,2001、7;7.葛新权:线性回归与时间序列加法预测模型,《预测》2000年第1期。8.周伟、王建军:陕西省国民经济发展的组合预测研究,《系统工程理论与实践》1998年第6期。附二:分析软件1.办公自动化软件:EXCEL、ACCESS等2.统计软件:SPSS、SAS等3.计量经济软件:TSP、EVIEWS等35\n《统计学》精品课程建设附三:时间序列预测方法的特点附表各种预测方法及其特点方法时间范围适用情况应做工作定性预测法短、中、长期对缺乏历史统计资料或趋势面临转折的事件进行预测需做大量的调查研究工作趋势外推法中期到长期当被预测项目的有关变量用时间表示时,用非线性回归只需要因变量的历史资料,但用趋势图作试探时很费时间分解分析法短期适用于一次性的短期预测或在使用其它预测方法前消除季节变动的因素只需要序列的历史资料移动平均法短期不带季节变动的反复预测只需要因变量的历史资料,但初次选择权数时很费劲指数平滑法短期具有或不具有季节变动的反复预测只需因变量的历史资料,是一切反复预测中最简单的方法,但建立模型所费的时间与自适应过滤不相上下博克斯—詹金斯法短期适用于任何序列的发展形态的一种高级预测方法计算过程复杂、繁琐景气预测法短、中期适用于时间序列趋势延续及转折预测收集大量历史资料和数据并需进行大量计算灰色预测法短、中期适用于时间序列的发展呈指数型趋势收集对象的历史数据状态空间模型和卡尔漫滤波短、中期适用于各类时间序列的预测收集对象的历史数据并建立状态空间模型35\n《统计学》精品课程建设【案例五】企业产品质量指数的编制某针织厂主要产品的质量参数、部颁质量标准、产品产量及产品平均出厂价格资料如表1所示。表1产品质量有关资料产品名称主要质量参数参数属性质量水平质量标准产量(万米)平均出厂价格(元)2002年2004年绒布干重强力(直)强力(横)密度(直)密度(横)缩水率(直)缩水率(横)区间区间区间区间区间逆逆263.5260.86225.2064.1253.502.675.25261.84264.20226.8064.8254.503.962.80259-273225-264186-21559-6253-56861176.89单面布干重强力(直)强力(横)密度(直)密度(横)缩水率(直)缩水率(横)区间正正区间区间逆逆122.40210.24145.1087.6075.202.601.96126.03202.95143.9091.5775.583.501.89120-126225.5014787-9272-765.56.5351.12.21外衣布干重强力幅宽区间正区间153525153147.3554150139-150550148-1805.862.39涤盖布干重强力幅宽区间正区间246466.50180249.18466.50180232-250450177-18028.502.18要求:根据以上资料,编制该厂工业产品质量指数,并对产品质量状况进行分析评价。46\n《统计学》精品课程建设方法说明产品质量指数的编制步骤及基本方法如下:一、计算产品主要质量参数的质量系数由于产品质量参数有正指标、逆指标和区间值指标等不同类型,因而质量系数也有几种不同的计算方法。设K为产品质量系数,K1为产品某一质量参数报告期实际值,K0为产品某一质量参数基期实际值或标准值。1.正指标质量系数的计算公式为:K=K1/K02.逆指标质量系数的计算公式为:K=(1/K1)/(1/K0)=K0/K13.区间值指标又分为以下几种情况:(1)报告期和基期参数值均在质量规定的区间范围内,动态质量系数按1计算;报告期参数值在区间范围内,静态质量系数按1计算。(2)报告期和基期参数值至少有一个超出区间上限,按逆指标方法计算动态质量系数;报告期参数值超出区间上限,按逆指标方法计算静态质量系数,用区间上限值与报告期实际值相比。(3)报告期和基期参数值至少有一个超出区间下限,按正指标方法计算动态质量系数;报告期参数值超出区间下限,按正指标方法计算静态质量系数,用报告期实际值与区间下限值相比。(4)报告期和基期参数值一个超出区间上限,一个超出区间下限时,先求出两个参数值与区间中点的差的绝对值,然后对比求出动态质量系数。二、计算产品综合质量系数1.企业某种产品的综合质量系数的计算公式为:K=K/n式中,K为某种产品综合质量系数,n为该产品质量参数的个数。2.工业部门、地区等综合单位计算产品综合质量系数时采用下列公式:综合单位某产品综合质量系数46\n《统计学》精品课程建设=(企业某产品综合质量系数×企业该产品产量)/企业产品产量=KQ/Q一、计算工业产品综合质量指数工业产品综合质量指数的计算公式为:Ik=KW/W式中,Ik为工业产品综合质量指数;W为各产品综合质量系数的权数,本例是采用产品总价值指标计算的权数。46\n《统计学》精品课程建设【案例六】大众鞋厂布鞋市场营销决策一、背景资料大众鞋厂是一家有30年历史的老厂,主要以硫化布鞋为主导产品,过去经济效益一直较好。但从2001年开始,产品出现积压,经营出现亏损。厂领导觉得问题非常严重,如果不能想办法扭亏增盈,厂子就面临关门的结局。因此,他们找到某管理咨询公司,请他们帮助诊断亏损原因,提出扭亏增盈的对策。下面是企业的有关统计资料:表1近两年生产、销售及利润情况表指标单位2000年2001年增减绝对额增减%产量万双10671-35-33销售量万双10274-28-27.5平均销售价格元/双4.414.730.327.3销售收入万元450350-100-22.3单位成本元/双4.345.080.7417.1总成本万元443376-67-15.1税金万元54-1-20%利润万元2-30-32-表2主要成本费用指标指标单位00年01年增减绝对额增减%单位生产成本元/双3.724.110.3910.5生产成本万元380304-76-25.8销售费用万元1310-3-33.3管理费用万元4651510.9财务费用万元411714.3总成本万元443376-67-15.146\n《统计学》精品课程建设表32001年价格调整对销量影响情况表月份3月4月5-7月8-11月出厂价格(元/双)4.494.715.156.7去年销量(万双)13112820前年销量(万双)11102950注:价格提高的主要原因是同期原材料价格上涨导致单位成本上升,销售量下降对单位成本上升也有一定影响。咨询公司进厂后实施的《鞋类市场需求调查问卷》、《鞋类市场需求调查表》和《鞋类市场需求调查汇总表》如下:居民鞋类市场需求调查问卷尊敬的顾客:您好!为了促进有关企业改进生产,更好地满足消费者需求,我们特组织这次关于鞋类市场的调查活动,请给予大力支持。1、请问您在去年是否穿过表中所列的几种鞋子?(穿过请在表中第1栏打√)2、您是否经常穿该种鞋?(请将序号填在表中第2栏):①经常穿,②有时穿,③很少穿。3、您对这种鞋是否满意,若满意,令您满意的原因是什么?(请将序号填在表中第3栏):①质量好,②价格合理,③式样新颖,④花色多样,⑤轻便舒适,⑥其它(请注明)若不满意,不满意的原因是什么?(请将序号填在表中第4栏):①质量差,②价格偏高,③式样不好,④花色单一,⑤穿着不舒适,⑥其它(请注明)4、请将您近两年购买的鞋子的数量和价格以及今年的需要量分别填在表中第5、6、7、8、9栏。5、请问您最喜爱的品牌是什么?请将品牌名称填在表中第10栏,若没有牌子,请注明“无”。谢谢合作!企业管理咨询公司46\n《统计学》精品课程建设表1鞋类市场需求调查表职业性别年龄居住(城或乡)种类是否穿过(1)是否经常穿(2)满意的原因(3)不满意的原因(4)购买数量价格(元)今年需要量(9)最喜爱的品牌(10)前年(5)去年(6)前年(7)去年(8)布鞋市外产          大众鞋厂          市内其它          自产          解放鞋          网球鞋          运动鞋          健美鞋          皮鞋          旅游鞋          表2鞋类市场需求调查汇总表(一)种类是否穿过是否经常穿满意的原因不满意的原因①②③①②③④⑤⑥①②③④⑤⑥布鞋市外产4021181013111731211171817931大众鞋厂7023255001402321市内其它2671034190010010110221自产10151551031413620解放鞋13351481322326220网球鞋471212681281110526432运动鞋573338172624262151514231793健美鞋38911113839317510711皮鞋10391362041256244232214727181913旅游鞋91643125303450253419152921239746\n《统计学》精品课程建设表3鞋类市场需求调查汇总表(二)种类购买数量价格(元)今年需要量最喜爱的品牌前年去年前年去年布鞋市外产34337-108-1231大众鞋厂1064.56.26市内其它14167.69.26小计5855--43 解放鞋111513148 网球鞋2622121710 双星运动鞋5648141537 回力健美鞋2768816 双星皮鞋1171287473128 金利来旅游鞋891105910041 奇安特大众鞋厂产品销售区域为本市和邻近4个地区的48个市县,人口约有2000万人。另外,销售队伍及政策:目前全厂有销售人员14人,销售政策规定,销售人员按销售收入的2%提成,不发工资,出差须经批准,只报住宿费和车费,伙食费自理。据了解,销售人员认为厂领导不重视销售,大半人员整天在家不出门,靠打电话联系业务。他们对自己的收入也不满意,说外地厂子的销售人员收入能达到1-2万元。案例分析要求:1、根据所给资料分析该厂亏损的原因是什么?并说明分析所用的是什么方法?2、咨询公司进厂与厂领导一起进行了初步分析:一种意见认为,老百姓现在普遍穿皮鞋、旅游鞋,不需要布鞋,所以产品卖不出去,形成积压。也有人并不同意这种看法。针对这种情况,你有什么好办法能解决问题?3、如果今年固定费用预计为90万。单位变动成本为5.18元,如果销售价格为6.7元,请测算保本销售量,如果销售价格调整到6.2元,保本点销售量是多少?二、案例分析46\n《统计学》精品课程建设1、首先分析利润下降导致亏损的因素由:利润=销售收入-总成本-税金,可知利润下降32万可分解为如下等式:利润下降=销售收入变动-总成本变动-税金变动-32万=-100万-(-67万)-(-1万)由此可知:利润下降的主要影响因素是销售收入下降和总成本下降,税金影响可以忽略不计。2、销售收入下降的因素分析由于销售收入=销售量*平均销售价格,因此根据两因素分析,得到如下分析结果:由于销售量下降影响销售收入下降:-28万双*4.41元/双=-123.5万由于销售价格提高影响销售收入增加:0.32元/双*74万双=23.5万以上两因素共同影响:-123.5万+23.5万=-100万就是说,销售收入下降主要是由于销售量下降引起的,销售价格的提高使销售收入有所增加。3、总成本变化因素分析由上面分析可知,总成本虽然下降了67万,但其下降幅度(15.1%)比销售收入下降幅度(22.3%)小。由于总成本=生产成本+销售费用+管理费用+财务费用,因此,可以从其具体构成因素去分析。总成本的变动是由这三个因素共同变动的结果:即:总成本变动=生产成本变动+销售费用变动+管理费用变动+财务费用变动-67万=-76万+(-3万)+5万+7万由此可以得出结论:总成本下降主要是由生产成本下降引起的,管理费用和财务费用不但没有下降反而有较大幅度的上升,两项合计上升12万,直接减少利润12万。销售费用变动影响不大。生产成本下降原因的进一步分析:由生产成本=销售量*单位生产成本,可进行如下分析:由于销售量下降影响生产成本下降:-28万双*3.72元/双=-104万由于单位成本提高影响总成本增加:0.39元/双*74万双=28万以上两因素共同影响:-104万+28万=-76万由此可见,生产成本变化中,对利润下降的影响因素是单位生产成本的上升。46\n《统计学》精品课程建设由于单位成本上升的主要原因是原材料涨价,在销售量下降的情况下很难通过降低原材料消耗来消化涨价因素。因此,可以适当提高产品销售价格来减少亏损。由前面分析可知,由于销售价格提高,增加的销售收入为23。5万,这样与单位成本增加冲抵后,只减少利润4。5万。因此,单位生产成本的上升对利润下降的影响也不是主要因素。利润下降32万销售收入下降100总成本下降67税金下降1销售量影响-123.5销售价格影响23.5生产成本下降76财务费用增加7单位生产成本影响增加28销售费用下降3管理费用增加55万销售量影响下降1044、销售量下降的原因分析调查汇总结果表明,近几年居民鞋类消费结构是发生了一些变化,每百人买布鞋数量,前年45双,去年43双,今年只需要33双,比前年下降26.7%。但是,经过测算,布鞋仍有很大市场空间。按照大众鞋厂的市场销售区域,共计有2000万人,按每百人需要33双计算,市场需求量为660万双,而该厂的年产量才只有100有万双左右。因此,首先可以排除“布鞋积压是市场不需要”这一原因。根据市场调查得出结论:市场占有率下降,营销能力弱。46\n《统计学》精品课程建设表4大众鞋厂及其竞争对手市场占有率的变化企业前年购买去年购买今年需要量双数市场占有%双数市场占有%双数市场占有%市外产3458.633603172.1大众鞋厂1017.2610.9614市内其它1424.21629.1613.9小计581005510043100从表中可以看出,大众鞋厂的市场占有率前年为17.2%,去年只有10.09%,去年比前年下降了6.3个百分点。今后预计也只有14%。而外地鞋厂的市场占有率从前年的58.6%提高到去年的60%,今年预计达到72%。市场被外地鞋厂所抢占。如何提高产品的市场占有率呢?根据营销组合4P,可以从产品、价格、渠道和促销等方面进行分析。从产品方面看,大众布鞋的产品质量不高,属于大路货,调查中也所反映。但与往年比较,产品质量基本稳定,而且市场上还有假冒大众鞋产品的现象。所以,质量也不是销售下降的主要原因。花色品种问题是个重要问题,是产品市场竞争能力的重要方面。要提高市场占有率,打入更大的市场,需要增加适销对路的新品种。但这也不是造成目前销售下降的主要因素。价格是造成销售量下降的原因之一。前年平均价格为4.5元,去年4月提高到4.7元,5月提高到5.2元,8月又提高到6.7元。4、5月份提价幅度不大,对销售基本没有影响,8月份提价幅度较大,因此从8月份销售量一下降下来了。3-7月平均销售量10.4万双,比前年同期增长4%;8-11月平均销售量只有5万双,比前年同期下降60%。去年由于材料涨价,适当提高价格是应该的。前年实际平均单位成本为4.34元,去年为5.08元,提高了17.1%;而去年8月以后价格提高了49%。提高的幅度大了点。除了材料涨价因素外,产量下降,也是导致单位生产成本上升的原因之一。通过与同类产品比较发现,市场上布鞋价格多在8元以上,最高达到11.7元。大众布鞋价格6.7元还是比较低的。从调查问题卷看,70%的消费者认为其“价格合理”。因此,价格也不是主要原因。46\n《统计学》精品课程建设销售下降的主要原因是营销不力。经过进一步了解,销售渠道与其他厂家没有什么区别。主要问题是促销力度不够。目前市场上同类产品基本都不打广告,主要促销手段是人员促销。大众鞋厂目前有14位销售人员,其中一半因种种原因不出去促销。另一半虽然出去,但由于收入低,积极性也不高。根据厂里规定,销售人员按销售收入提成2%,不另发工资。去年销售350万,可提7万元,人均5000元,出差经批准,只报销住宿费和车船费,外出伙食费高,出去多了就所剩无几了。经过初步了解,其它厂子的销售人员年收入都在1-2万元,而且出差补助中有伙食费。因此,加大营销力度首先要充实销售队伍,提高销售人员积极性。三、对策建议与措施近期继续以硫化布鞋为主导产品,靠老产品扭亏增盈,积极开发新品种,改善经营管理,降低管理费用,提高销售人员收入,加大营销力度。具体措施:1、提高销售提成比例为8%,不报销差旅费用。若年销售80万双,销售收入500万元,可提40万元,销售人员增加到20人,人均年收入2万元,每人年差旅费最高不超过5000元,每人收入在1.5万元。2、产品价格调整为6.2元。允许各地销售人员根据实际情况灵活作价,高于6.2元的部分由厂里提60%,其于归销售人员。保本点分析:固定费用预计为90万,销售价格6.7元,单位变动成本5.18元。每双贡献收益1.52元,保本销售量=90万/1.52=59.2万双。这就是说,销售量达到59万双,按14个销售人员计算,人均毛收入可达2.1万,企业可以扭亏,多销售1万双,增加盈利1.52万元,如果销售达到上年水平74万双,可盈利22.8万元。如调整销售价格为6.2元,单位变动成本仍为5.18元。每双贡献收益1.02元,保本销售量=90万/1.02=88万双。这就是说,销售量达到88万双,按20个销售人员计算,人均毛收入可达2.2万,企业可以扭亏,多销售1万双,增加盈利1.02万元,如果销售量恢复到前年102万双水平,可盈利14万元。46

相关文档