- 311.01 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
教学中的测量与评价\n附1统计学基础知识\n统计是关于测验分数和其它数字资料的组织、分析和解释。教师至少应掌握能使他们完成下列工作的统计知识:1.分析和描述课堂测验的结果;2.理解测验手册和研究报告中的统计内容;3.理解测验中使用的各种结果参数。在此,介绍基本的统计概念和技能。内容包括:新术语知识;关于统计符号的知识;简单的数学运算技能;计算机辅助统计分析。涉及的统计测量:集中趋势的测量(平均程度);差异的测量(分数的离散性);关系的测量(相关性)。\n(一)分析未分组的分数从一组学生中直接获得的分数通常是随意(与分数无关的方式)排列的。如下表:表1\n1.简单排序通常,最大的分数排为1级,次大的分数排为2级;分数33出现了两次,落在了3级和4级的位置,所以将级数平均,每个分数排为3.5级。28分的同理。表2\n2.集中趋势的测量对表1中的分数进行计算可以得到平均值为30。由于平均值的计算用到了所有的分数,一个极高或极低的分数会产生影响。(1)(算术)平均值(Mean)平均值是最常用的集中趋势量度。其计算方法是将一列分数相加然后除以分数个数。表3\n中数的计算:如果分数的个数是奇数个,将其按从大到小的顺序(或这从小到大的顺序)排列,找出中间的分数;如果分数的个数是偶数个,将其按从大到小的顺序(或这从小到大的顺序)排列,然后找出中间的两个分数并算术平均;当分布的中间分数是相等的分数时,用中间分数的精确上下限做插值法。(2)中数(Median,简称Mdn或P50,)中数是将一列分数分为相等的两半的分数,无论每个分数的大小如何,总有一半分数在中数之上而另一半在中数之下。一个极高或极低的分数不影响中数的值。详情参见后面的实例表3\n(3)众数(Mode)众数是一列分数中出现次数最多的分数。如表1中的28分。众数是最不可靠的统计平均数,通常仅作为对集中趋势的一个初步估计。表3\n3.差异的测量如果知道了一列分数的离散程度,就可以更充分地描述这列分数。用表述分数离散程度的数学来确定这种不同,就是差异的测量。三种常用的差异量数(MeasuresofVariation)是:全距(Range);标准差(StandardDeviation);四分位距(Interquartilerange)。\n(1)全距全距是最简单最粗略的差异量数。其计算方法为最高分减去最低分。全距提供了对差异的快速估计,但它并不可靠,因为它基于两端分数的位置。例如:A、B两组同学的智商的平均值均为110。但是A组的最高和最低分分别为115和105,B组为140和80。如果在A组增加一位智商为140和一位智商为80的同学,则A、B两组的全距相同。\n(2)四分位差四分位差(Q)是表示一组分数的分散情形。它是根据分数中间值(50%处)为Q2,25%处为Q1,以及75%处为Q3的四分位差值来表述数据分散情形的。显然,Q不是一个点,而是一段距离。(计算方法与中数的计算方法类同。)\n(3)标准差(SD)差异和分数分布的最有用的量度是标准差。它本质上是一系列分数偏离其均值的平均程度。由于它考虑了每一个分数与均值的偏差,因而与全距和四分差相比,是差异的最稳定的量度。计算方法:用每个分数减去算术平均值,得出差值“X”,即离均差;求出每个离均差的平方“X2”;求∑X2;求(∑X2)/N,然后开方所得的算术平方根即是。SD一样代表的是一段距离。当分数分布为正态分布时,它等于平均值上下包括大约68%的个体的分数距离。\n表4\n在前面,主要阐述了如何计算未分组的统计值。这种方法对于分析较少的数据十分有用。然而,在处理25个以上的分数时,最好的方式是将分数组合成次数分布,然后进行统计计算。不过,现在计算机已经比较普及,利用专业的软件,可以比较轻松地对大量的数据进行分析。在这里,将分数组合成次数分布的形式进行统计计算的内容,作为方法和分析拓展来给予讲解。\n(二)对分组数据的统计计算1.组成次数分布表以表5中的处理过程为例,说明在设计表时需要遵循的几点。表5分数区间的个数通常在10~20之间;在确定最适当的分数区间时,可以用全距除以15,并取最接近商的奇数。因为奇数可使每个区间的中点为整数;表中所有的分数区间大小一致;分数区间的端点不能重复;分数间隔按顺序排列,一般最大值在顶端。全距=49-18=31全距/15=2.07区间大小为3。\n真正的上限和下限以表5中的处理过程为例,分数间的间隔为1,测验分数仅表示一段距离的中点,如20分代表19.5~20.5的一段距离,21分代表20.5~21.5的一段距离,这样分数才能够完好衔接。因此,分数区间真正的上限和下限也要进行相应的处理。例如:18~20分的区间的真实上限是20.5分,真实下限是17.5分。用分数表示上下限是为了使用上的方便;在一定的统计计算中,则需要使用真正的上、下限。\n2.次数分布图最常用的有两种:直方图:用一系列长方条来表示数据,长方条的底与分数区间相对应,其高度表示次数,即落在该分数区间内的学生人数。次数多边形:多边形的顶点的横坐标是每个区间的中点,相应的纵坐标是次数。\n3.中数和四分位差的计算(1)中数(Mdn)的计算分数的总数N除以2;(可能是小数,或直接用N/2)从次数一栏的下端开始,将每个区间的次数相加,知道包含中数的区间为止;用N/2减去上一步中求出的和;用上一步得到的数字除以中数所在区间(简称:中数区间)中的分数个数,然后乘以区间的宽度;将上一步的结果加上中数所在区间的真实下限,所得结果就是中数。40÷2=20;1+2+3+4+7=17;20-17=3;3/8×3=1.13;32.5+1.13=33.63=Mdn\n上述过程可以写为公式表示,其中:L-中数所在区间的真实下限;N-全部分数的个数;S-L以下所有区间的分数之和;f-中数区间的次数或分数个数;I-区间的宽度。\n(2)四分位差(Q)的计算用公式求出Q1和Q3的值。公式中的值的含义和计算中数的公式中的一致,但L和f现在是指相应的四分位数所在的区间。用Q减去Q然后除以2,就可以得到四分位差的值。对表5中的数据来说:Q1=29.5,Q3=38.0Q=4.25现在可以用中数33.63和四分位差4.25来描述表5中的数据。也就是说:这一列分数的中点是33.63,而且在它上、下各四分位差包含中间大约50%的分数(正态分布中为50%),这种简单的统计描述可以代替整个分数的分布。\n4.平均值和标准差的计算(算术)平均值和标准差的意义和计算公式已经在前面给出。但是,在使用次数分布表的时候却不是怎么方便,需要做一些修改后,按一系列简单步骤完成计算后,即可达到目的。下面是具体的步骤:\n靠近分数分布中间的位置选择任一分数区间,令该区间在偏差(d)一栏中为0,这一区间的中间为假设的均值,即AM,在上表中为区间33-35的中点34;确定每个区间与零区间的偏差(d)并填入(d)栏中;算出(fd)和(fd2);表6\n代入下列公式中,其中AM-假设均值C-校正数I-分数间隔的宽度对表6中数据的计算结果:\n(三)相关系数的计算相关系数表达了两列分数相互关联的程度,其取值范围为[+1,-1],+1表示完全正相关,-1表示完全负相关,为0时表示两列分数之间不相关。但是,这仅仅是从数学上而言,具体的意义还需要具体的分析。其手工计算方法较为复杂,在此不再讨论。值得指出的是:相关系数表示两列分数相互关联的程度,而不是因果关系。如果X列分数与Y列分数相关,可能有以下几种解释:X是Y的原因;Y是X的原因;X和Y可能存在共同的原因。X和Y仅存在数学意义上相关,而无实际意义。\n一般情况下,相关系数:0~0.3,表明无相关性;0.3~0.5,表明低度相关;0.5~0.8,表明显著相关;0.8~1,表明高度相关;\n(四)计算机辅助计算分析用于统计分析的软件较多,最常用的专业软件有SPASS、STATA等。一般性的分析可以用MS-Office中的Excel及其同类的Open-office中的表格,WPS表格,永中Office表格等。具体的可以查阅相关资料,例如Excel的帮助文件。而且一般情况下,使用Excel及其同类软件就可以满足我们的需要。\n前面为了应用上的方便,简单明了地介绍了几种常用的统计分析参量。具体使用时,目前计算机已经非常普及,只要按照相关软件的要求执行即可。其它的还有t-检验、z-检验等,在这里就不专门介绍了,需要的时候可根据情况自己查阅相关资料。(五)小结