- 434.51 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
心理统计学笔记云南师范大学09级应用心理学专业本科学员:勾洪斌 098150003绪论一、统计学、教育与心理统计学统计学是研究统计原理和方法的科学。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行对待的原理和方法。教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一门交叉学科,是专门研究如何搜集、整理、分析在教育和心理方面由实验或调查所获得的数字资料,并如何根据这些数字资料所传递的信息,进行科学推论找出客观规律的一门科学。二、学习教育与心理统计学的意义(一)教育与心理统计学为教育与心理科学研究提供了一种科学方法(二)教育与心理统计学是教育与心理科研定量分析的重要工具(三)广大教育和心理工作者学习教育教育与心理统计学的具体意义(1)是教育与心理科学研究的需要。(2)是科学化教育管理的需要。(3)为学习教育与心理测量学、教育评价学打下基础。(4)是科学训练的需要。统计学所使用的推理及思考问题的方法是科学研究中常用的方法,统计方法的训练也是一种科学方法的训练,能学会科学的推理与思考方法,对为了研究工作是非常必要的。三、教育与心理统计学的基本内容教育与心理统计学的内容,按其目的与功能可分为描述统计、推断统计、多元统计分析、实验设计四部分。描述统计学。主要研究如何将实验或调查得到的大量数据简缩成有代表性的数字,使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。推断统计学。推断统计是以描述统计为基础,以解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特征。实验设计。实验者为了揭示实验中自变量与因变量的关系,在实验之前所制订的实验计划,称实验设计。描述统计学、推断统计学以及实验设计这三部分内容不是截然分开的,而是具有密切联系的。描述统计是推断统计的基础,推断统计离不开描述统计所计算的特征数;描述统计只是对数据进行一般的分析归纳,若不进一步应用推断统计对事物做进一步的分析,有时就会使统计结果失去意义,达不到统计分析的目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然,一个好的实验设计,也必须符合基本的统计方法的要求。四、学习教育与心理统计学的几个预备性的知识(一)随机现象与随机变量在科学研究中搜集到的数据往往都是以一个个分散的数字形式出现的,即便使用同一种测量工具,观测同一事物,只要是进行多次,所获得的数据也不会完全相同。数据的这种特点叫变异性。如对同一个心理特点进行测量,只要观察多人或多次,所得到的数据就不会全然相同,这些数据总是在一定范围内变化的。造成数据上下波动的原因,出自观测过程中一些偶然的不可控制的因素—33\n随机因素。随机因素使测量产生的误差称作随机误差或偶然误差。由于这种随机误差的存在,使得在相同条件下观测的结果常常不只一个,并且事先无法确定,这是客观世界存在的一种普遍现象,人们称这类现象为随机现象。随机现象的各种结果总是可以用一定的数量来表现,而且表现为实验结果数值的不确定性,因而称为变量。这种变量受随机因素的影响,呈现随机变化,具有偶然性的一面,但也具有规律性的一面。通过大量的实验或观测,这种规律性可以揭示出来。我们把这种具有变化规律的表示随机现象各种结果的变量称为随机变量。如学生的身高、体重、性别、智商、成绩等等。随机变量具有离散性、变异性与规律性的特点。(二)变量的类型变量按照不同的划分方式可以分为不同的类型,而不同类型的变量所适用的统计方法是不同的。(1)随机变量与非随机变量(2)连续变量与非连续变量(间断变量、离散变量)实验数据按其是否具有连续性可划分为连续变量与非连续变量。连续变量可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。如学生的身高、体重、智商、学科成绩等等。非连续变量在量表上的任何两点只能取得有限个数值,两个单位之间不能再划分细小单位,数字形式一般是取整数。如名次、人数等等。连续变量与非连续变量其分布规律不同,各种表列及图示方法不同,所使用的统计方法也有区别。(3)因变量与自变量因变量是指被影响的变量,而自变量是指自由变化的能影响其它变量的变量。在教育与心理科研和实验中,必须要明确研究对象,确定哪些是作为因变量来研究的,哪些是作为自变量来研究的。否则,实验设计就无从进行。,y是因变量,x是自变量。随机变量按性质分有如下四种:(1)称名变量(Nominal),用于说明某一事物与其它事物在属性上的不同或类别上的差异,但不说明差异的大小。如性别、年级等。(2)顺序(等级)变量(ordinal),指按事物的某一属性,把它们按多少或大小加以排列的变量。这种变量不具有相等的单位。如名次、等级评定、喜爱程度、品质等级、能力等级等。(3)等距变量(interval),是指变量之间具有相等的距离,除了有量的大小外,还具有相等的单位,但没有绝对意义上的零。如天气温度、各种能力分数、智商等。只能加减,不能乘除。(4)比率变量(ratio),除了有量的大小,相等单位外,还有绝对意义上的零。如身高、体重、反应时等。可以加减乘除。(三)总体、个体、样本总体(又称母体),样本与个体是统计学中常用的名词。总体是指具有某种特征的一类事物的全体,构成总体的每个基本单元称为个体。从总体中抽取的一部分个体,称为总体的一个样本。总体与样本具有相对性。这依研究对象而定。(四)连加和(1)连加和符号及意义(2)连加和的性质(C为不为0的常数)1.2.3.33\n(3)约定:表示所有x相加。第一章常用的统计表与图次数分布表与图一、次数分布的意义次数分布有两层含义,一是一数据在各个不同数值点上所出现的次数情况(如75分在100个人的班级中出现了8次),二是一批数据在整个取值范围内各个等距区间中所出现的次数情况(70~80这个区间内出现了15次)。二、次(频)数分布表(一)简单次数分布表(连续变量)简称次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。其制表步骤如下:(1)求全距(2)决定组数(3)决定组距(4)写组限(5)次数登录(f)(6)组中值(点)。(二)相对次数分布表相对次数就是各组的简单次数(f)与总次数(N)的比值。相对次数较大的组,则说明落入该组内的数据个数占全部数据个数的比例也较多。相对次数主要能反映各组数据的百分比结构。(三)累积次数分布表(F)累积次数指分数组中处于某个数值以上或以下的分数个数。在简单次数分布表中,如果把某个确定值(精确上限)以下的个数累积起来,叫以下累积(向上累积);如果把某个确定值以上(精确下限)的个数累积起来,叫以上累积(向下累积)。一般,我们所讲的是以下累积。(四)累积相对次数分布表和累积百分数分布表累积相对次数:把相对次数累积起来或累积次数除以总次数。累积相对次数等于累积相对次数乘以100。累积相对次数和累积百分数可以看出某个分数值以下的人数占了总人数的百分比结构。三、次数分布图(一)次数直方图次数直方图是由若干宽度相等,高度不一的直方条紧密排列在同一基线上构成的图形。其绘图步骤如下:(1)建立坐标系。纵轴为量尺,即次数,横轴为各组分数的组中值。(2)每一直方条的宽度由组距i确定并已体现在横轴的等距刻度上,所有的直方条以各组的组中值为对称点。(3)在直方图横轴下边标上图的编号和图的题目。(二)次数多边图次数多边图是利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。其绘制步骤如下:(1)纵轴和横轴的要求与制作与次数多边图相同,但要求在横轴上最低组与最高组外各增加一个次数为0的组(用组中值表示)。(2)描出各点。(3)用线段把相邻的各点依次连接起来,连同横轴上两个次数为0的点构成一闭合的多边形。当次数足够大,组距不断变小时便会形成一条光滑的曲线。即次数分布曲线。(三)相对次数直方图与多边图不同点在于纵轴是相对次数的量尺。(四)累积次数曲线图33\n有直方图和曲线图两种,但最常见的是曲线图。其绘制步骤如下:(1)纵轴为累积次数,横轴意义不变。(2)横轴是各组的上限,纵轴是累积次数。(3)用连续光滑的曲线把点的轨迹连起来,再与横轴上最低组的下限所在点连起来,形成“S”形曲线。累积曲线图有正偏态、负偏态和正态三种。(五)累积相对次数曲线图与累积百分数曲线图与(四)同,只不过纵轴是累积相对次数或累积百分数。几种常用的统计分析图一、散点图散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。在平面直角坐标系中,横轴一般代表自变量,纵轴一般代表因变量,横轴既可以作为连续性变量的量尺,也可以作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺。二、线形图线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一种事物发展变化的趋势模式,还适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。三、条形图条形图是用宽度相同的长条来表示各个统计事项之间的数量关系。与直方图不同的是,条形图通常用于描述离散性变量(如属性变量)的统计事项。四、圆形图圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。各统计事项在总体中的比例乘以圆周角(360度),求出各相应扇形的圆心角。第二章常用统计参数数据的集中情况指一组数据的中心位置。在教育与心理统计学中,经常用集中量数来代表一群分数水平高低,用差异量数来描写这群分数的离散程度。一群分数的集中点叫集中量数,反映这群分数在横轴上的位置,它一般作为这群分数的代表值。描写分数离散程度的量数叫差异量数。表示总体统计特征的量数称为参数,用希腊字母表示。表示样本统计特征的量数称为统计量,用英文字母表示。归纳以上描述,也就是说一组变量的次数分布特征,或者说,要描述一组变量的全貌必须计算这组变量的两方面的特征量,既:中心位置:中心位置用以度量一组数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为位置度量中量数(集中量数)。离散性:反映一组数据的分散程度即次数分布的离散程度。第一节集中量数一、算术平均数(一)含义:观测值的总和除以观测值的总次数所得的商,总体平均数用表示,样本平均数用表示。(二)计算公式:33\n(三)加权算术平均数(1)如果已知有K个组以及每一组的平均数和这一组的样本容量,求所有值的总平均数。如,已知甲、乙、丙三班的平均数以及人数,求这三班的总平均数。甲90分30人乙87分42人丙75分50人=(2)次数分布表(分组数据)求平均数表2—1组中值组别次数累积次数8280—848537775—7910457270—7412356765—6919236260—6444以每组组中值作为这组分数的代表值(平均数),次数作为这组的样本容量,而后参加计算,用加权平均数求法,即:=71.91也可用计算器在统计状态下计算。(四)平均数的意义与应用算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。(五)算术平均数的性质(1)所有的观测值都加上一个常数C,则总体平均数也加上C。(2)所有的观测值都乘以一个常数C,则总体平均数也乘以一个常数C。(3)所有的观测值都乘以一个常数C再加上一个常数d,则总体平均数也乘以一个常数C再加上一个常数d(4)离均差之和为零。(5)在所有观测值的离差平方和中,离均差平方和最小。(六)算术平均数的优缺点33\n优:算术平均数具有反应灵敏,确定严密,简明易解,计算简便并能作进一步的代数演算特点,较少受抽样变动的影响,是应用最普遍的一种集中量数。如果一组数据是比较准确可靠且又同质,而且需要每一个数据都加入计算,同时还要作进一步的代数运算时,一般都使用算术平均数表示集中趋势。缺:(1)算术平均数具有易受极端数据的影响。(2)若出现模糊不清的数据时,无法计算平均数,因为计算平均数需要每一个数据都加入计算。(3)凡不同质数据不能计算平均数。所谓同质数据是指使用同一个观测手段,采用相同的观测标准,能反映某一问题的同一方面特质的数据。如果使用了不同质的计算平均数,则该平均数不能作为这一组数据的代表值。例如,在教育方面,计算平均成绩时,如果各科考试的难易水平和评分标准等各不相同,这时若用总平均数表示一个学生的学习成绩,就是不准确的。二、中数()(一)定义:中数,又称中点数,中位数(Median),一组数据从大到小或从小到大排列,位于中间位置的那个数,或者说,是指位于一组数据中较大一半与较小一半中间位置的那个数。这个数可能是数据中的某一个,也可能根本不是原有的数。(二)求法(1)原始数据(未分组数据)求中数根据中数的概念,首先将数据依其取值大小排列成序,然后找出位于中间的那个数,就是中数。有两种情况;1.数据个数是奇数的情况。则取序列为第(N+1)/2的那个数为中数。2.数据个数是偶数的情况。则取序列为第N/2与第(N/2)+1个这两个数据的均数为中数。(2)次数分布表(分组数据)求中数将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。其具体步骤如下:1.求N/2,并找出N/2(累积次数)所在的分组区间。2.求含有中数那一区间以下各区间的次数和(即中数组区间下限以下的累积次数)记为3.求N/2与之差。4.求序列为第N/2那一点的值。求中数的公式整理如下:使用于向上累积次数分布表:紧邻这一组的下一组累积次数;:中数所在组的精确下限;f:表示这一组的简单次数;i:组距;N;总次数确定中数所在组:第一个大于N/2的累积次数所在组。这样表2—1的中数即为:N/2=1/2*53=26.5,而第一个大于26.5的累积次数所在组是70—74所在组,故分布表的中数为,(三)中数的意义及应用优:中数是根据观测数据计算而来,不能凭主观臆定。计算简单,容易理解。缺:反应不灵敏,两极端数据变化,对中数不产生影响;计算中数时不是每个数据都加入计算,受抽样的影响较大,不如平均数稳定;中数乘以数据的总个数与数据的总和不等;中数不能作进一步的代数运算。在一般情况下,中数不被普遍应用。但在一些特殊情况下,它的应用受到重视。这些情况是:33\n(1)当一组观测结果中出现两极端数据时。(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。(3)当需要快速估计一组数据的代表值时,也常用中数。三、众数()(一)含义:众数又称范数,密集数,通常数等。众数是指在次数分布中出现次数最多的那个数的数值。它也是一种集中量数,也可用来代表一组数据的集中趋势。(二)求法(1)直接观察求众数不论是分组数据还是未分组数据,都可用观察法求众数。如有一组数据2、3、5、3、4、3、6,其中3的出现次数最多,因此3为众数。数据整理成次数分布表后,观察次数最多那一组区间的组中值为众数。同一组数据,由于分组时组距大小可不同,各区间的上下限也可能不一致,故次数分布表内,次数分布最多那一组的组中值可能不同,故众数也可能不同,可见,众数受分组的影响。(2)用公式求众数用公式计算的众数称为数理众数。皮尔逊经验法:。(三)众数的意义及应用众数的概念简单明了,容易理解,但不稳定,受分组的影响,也受样本变动的影响,计算时不需要每一个数据都加入,因而较少受极端数据的影响,观察众数不是严格计算而来,用计算方法所得众数亦是一个估计值。同时众数不能作进一步代数运算。总数乘以众数也不等于数据的总和。众数也不是一个优良的集中量数,应用也不广泛。但在一些情况下也常用:(1)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时,可用众数表示典型情况,如工资收入常以次数最多者为代表值;(3)当次数分布中有极端数据时,有时也用众数;(4)当粗略地估计次数分布的形态时,有时用平均数与众数之差,表示次数分布是否偏态的指标。第二节差异量数一、两极差(R)两极差也叫全距,就是最大值与最小值之间的距离。二、平均差(meandeviation,MD或averagedeviation,AD)平均差又叫中心动差,是次数分布中所有原始数据与平均数距离绝对值的平均。平均差是对分布的变化性的较全面的一个度量。为了衡量所有数据偏离其均值的程度,先考虑每个观测值离开其均值的偏差,然后再把这些偏差连加起来,但由于离均差之和为零,所以用了一个绝对值。即例如,有5名被试的错觉实验结果,错觉量为1618202217的平均数是18.6,AD=1.92。平均差是根据分布中每一个观测值计算求得的,它较好地度量了次数分布的离散程度,由于离均差之和为零,要用到绝对值,不利于进一步的运算与分析。因而在实践中不常使用,这就需要引进一种不需要绝对值而又没有负数的量数。三、方差(Variance)与标准差(Standarddeviation)(一)定义及定义公式33\n方差又叫变异数、均方(平均平方偏差),在数理统计中又常称二阶中心或二级动差。它是对分布的变化性的更全面的度量。由于离均差之和为零,为了得到描述分布形状的有价值的度量,先将所有偏差作平方计算,那么就都是正值,然后再求平均才有意义。这样得到的结果就叫做平均平方偏差或简称均方差:(1)总体方差与总体标准差(2)样本方差与样本标准差(二)计算原始数据求方差与标准差用总体方差举例:=求以下数据的方差和标准差,方差分别为:40,标准差为:6.3246。40,60,50,50,40,50,50,50,60,50,50(三)方差与标准差的性质(1)如果每个观测值都增加一个常数C,则方差与标准差不变;(2)如果每个观测值都乘以一个常数C,则方差扩大C的平方倍,标准差扩大C倍;(3)如果每个观测值都乘以一个常数C在加上一个常数d,则方差扩大C的平方倍,标准差扩大C倍。(四)方差与标准差的意义(1)反应灵敏,每个数据取值的变化,方差或标准差都随之变化;(2)有一定的计算公式严密确定;(3)容易计算;(4)适合代数运算;(5)受抽样变动的影响小,即一同样本的标准差或方差比较稳定;(6)简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。(五)方差与标准差的应用(1)差异系数(CV)同一特质使用同一种测量工具得到的不同样本之间的离散度的比较可以通过直接比较标准差实现。不同特质样本之间的离散度比较可以通过比较差异系数(coefficientofvariation,CV)来实现,差异系数大的则离散程度大。差异系数的公式为:差异系数的适用条件:1.两个或多个样本所测的特质不同,即使使用的观测工具不同,如何比较其离散程度?2.即使使用的是同一种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?例:已知某小学一年级学生的平均体重为25公斤,体重的标准差为3.7公斤,平均身高110cm,标准差为6.2cm,问体重与身高的离散程度哪个大?33\n第三节地位量数(在分布中的相对地位)一、百分位分数()(一)含义百分位分数实际上是一个原始分数,已知它在次数分布中特定地位(m)的原始分数,m是一个百分数,表示比这个原始分数要小的人有百分之几。如,,在这里m=70,83是原始分数,意思是有70%的人低于83分。(已知百分数求原始分数)(二)计算通过百分点确定它所对应的原始分数。(1)原始数据求百分位分数把所有分数从小到大排序通过N乘以百分数确定原始分数所在点。(2)次数分布表求百分位分数表2—2组别次数累积次数累积相对次数65—6981091.0060—64121010.9355—5918890.8250—5425710.6545—4924460.4240—4413220.2035—39990.08确定原始分数所在组数:,第一个大于它的累积次数所在组。组数确定以后,其它符号的含义和求中数中的含义一样。实际上,中数就是百分位分数的特例,即第50百分位分数。例如,求第25、75百分位分数。分别为45.59、57.49。二、百分等级分数(PR)百分位分数:已知百分点m求对应的原始分数百分等级分数:已知原始分数求对应的百分等级(一)含义次数分布中低于这个原始分数的次数百分比,用PR表示。(二)计算公式求原始分数是52分的百分等级,原始分数是62的百分等级。(分别为54、87)百分等级指出原始数据在常模团体中的相对位置,百分等级越小,原始数据分布中的相对位置越低。反之,越高。33\n三、评价表示相对地位的量数,是个顺序变量,PR可以表示任何一个分数在该团体中的相对地位。在测量学中,常用百分等级表示常模量表。第四节相关量数一、什么是相关事物之间相互关系有多种,概括起来有以下几种情况:(一)因果关系因果关系即一种现象是另一种现象的因,而另一种现象则是果。例如学习的努力程度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应强度的因等等。(二)相关关系即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。即事物之间有关系,一变量会影响另一变量,但它们之间既不是因果关系也不是共变关系,那么它们之间存在统计关系(相关关系)。二、相关系数(,r)两变量之间相关密切程度的数字指标[-1,1]方向(性质):正相关:方向一致,如身高与体重成正比。负相关:方向相反,如初学打字,练习次数越多,错误越少。零相关:不存在线性相关,如成绩好坏与身高无关,不是不相关,因为有可能是曲线相关。相关程度: 完全正相关:+1 完全负相关:—1零相关:0相关形式: 线性相关(相关散点图) 非线性相关(曲线相关)相关因素多少:单相关:两变量之间,如身高与体重 复相关:多个变量之间,如工资水平受工龄、劳动时间、职称等影响。我们要研究的是[-1,1]之间的线性相关,单相关。三、相关系数的解释,弱相关;,低相关;,显著相关;,高度相关。(1)相关系数绝对值在[0,1.00]之间不同时,表明相关密切程度不同,绝对值越大,表明相关程度越高。(2)相关关系不是等距量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,r=0.50与r=0.25,只能说前者比后者密切程度高而不能说前者是后者的两倍。(3)存在相关关系,不一定存在因果关系,存在因果关系的变量相关系数一定为1。四、相关系数的计算(线性相关)计算相关系数一般要求成对的数据,即若干个个体中的个体要有两种不同的观测值。例如每个学生的数学和语文成绩;每个学生的智力分数与学习成绩;每个学生的英语听力水平和口语水平。(一)积差相关(积矩相关)()33\n皮尔逊(Pearson)(英)二十世纪初提出的,因而也叫皮尔逊相关(1)适用条件连续变量成对出现正态分布:要求总体正态,至于用来计算的样本数据,并不要求一定为正态分布。(2)定义公式=其中称为协方差(3)计算公式D=X-Y例如,被试的身高(cm)和体重(公斤)均服从正态分布,求其相关密切程度:(r=0.792)被试12345678910身高170173160155173188178183180165体重50454744505350495245(二)等级相关(1)spearman等级相关1.适用条件1.1两列变量都是等级或顺序变量的时候。1.2确定不了数据的分布形态的时候。1.3积差相关运算太繁,转用等级相关。等级转化:数据:827148968254等级:2.54612.5582应该是在第2、3位,重复了两次,故其等级为(2+3)/2=2.52.计算公式D为等级相减之差例:学习12345678910纪律14329568107D0-202-4110-1333\n(2)kendal和谐系数1.适用条件kendal和谐系数又称阅卷者信度或评分者一致性系数,用于评价多个等级变量之间的相关密切程度。或者说用于评价多个评委对被试评定等级的一致性程度。2.计算公式表示评委在某被试上的评定的等级之和。例:学生评委ABCRi113152213633249444210555515(三)质与量的相关质与量的相关是指一列变量为等距的测量数据,另一列变量是按性质划分的类别,欲求这样两列变量的直线相关,称之为质与量的相关,包括点二列相关、二列相关。点二列相关1.适用条件如果两列变量中有一列为等距或比率变量而且其总体是正态分布,另一列变量只是名义上的变量,而实际上是按事物的性质划分两类的变量。如性别为男女,选择答案为是否,生命状态为生死等。这类变量称为二分称名变量。2.计算公式其中为与一个二分变量对应的连续变量的平均数,为与另一个二分变量对应的连续变量的平均数,为整个连续变量的标准差,p和q分别为二分变量在总体中各自所占的比率。例:下表为随机抽取15名儿童(8名男童,7名女童)对暴力卡通片的反应数据,其中1表示最不强烈的反应,11为最强烈的反应,试分析男女儿童对暴力卡通片的反应之间是否有联系。(0代表女孩,1代表男孩)1111111100000003245423445785910相关系数为0.7341,经显著性检验,p=0.0005。第三章概率与概率分布第一节概率一、与概率的相关的现象33\n(一)两种不同类型的概率现象(1)确定性现象:在一定条件下,事先可以断言必然会发生某种结果的现象。(2)随机现象:在一定条件下,事先不能断言会发生哪一种结果的现象。(二)随机现象的两个显著特点(1)偶然性:一次试验前不能预言会发生哪一种结果,这是随机现象的偶然性。(2)必然性:在相同条件下,进行大量次重复试验,呈现出统计规律性,这说明随机现象具有必然性。而正是因为必然性或者说规律性,我们才可以用重复实验的办法来统计出事物或者说现象发生的可能性(概率)。二、随机事件与概率(1)随机事件:随机现象中出现的各种可能的结果称为随机事件(如正面朝上1,反面朝上0)简称事件。随机事件中有两种极端情况,必然事件和不可能事件。(2)频率:在随机事件中,某事件A发生的次数m与试验的总次数n的比值,这个比率称为事件A发生的频率。,如在丢硬币实验中,n=5次,假如正面朝上为事件A,出现的次数为2次,则事件A发生的频率为2/5。(3)概率(后验概率):是随机事件A的频率在n时的极限,称为此事件A的概率,也就是说,在大量重复n次试验中,当n无限增大时,事件A发生的频率m/n稳定在一个确定的常数附近,我们就用这个数表示事件A发生的概率,记作:P(A)=m/n(4)概率(先验概率):先验概率是在特殊情况下直接计算的比值。它是真实的概率值而不是估计值。它必须是在这样的条件下发生的:①实验的每一种可能结果(基本事件)是有限的;②每一个基本事件出现的可能性相等。如果试验由n个有限的基本事件组成,事件A包括m个基本事件,则在一次随机抽样中,事件A发生的概率为:P(A)=m/n。如一副牌52张(52个基本事件),抽取到任何一张的概率是相等的1/52,如果事件A为红桃,则事件A由13个基本事件,故红桃出现的概率为P(A)=13/52。(5)值域:[0,1]三、概率的基本性质(一)概率的公理系统(1)任何一个随机事件发生的概率都是非负的。(2)必然事件发生的概率为1,必然事件是指在一定条件下必然发生的事件。(3)不可能事件发生的概率为0,不可能事件是指在一定条件下必然不会发生的事件。概率越接近1,其发生的可能性越大,越接近0,发生的可能性越小。(二)概率的加法定理若A,B是两个互不相容事件,则A,B至少有一个发生的概率为两个事件分别发生的概率之和。P(A+B)=P(A)+P(B)互不相容事件是指在一次实验中不可能同时出现的事件称为互不相容事件,若事件A发生则事件B就不可能发生。例如对学生进行考核,如果成绩为优这一事件出现,则成绩为良这一事件就一定不会出现。若该生得优的概率为0.10,得良的概率为0.50,依据加法定理,该生考核成绩为优良的概率为0.10+0.50=0.60。再如,掷一个sai子,求事件A={出现点数不超过4}的概率为:就一次实验而言,6个点数(1,2,3,4,5,6点)是互不相容事件,故事件A发生的概率为,1/6+1/6+1/6+1/6=4/6。(三)概率的乘法定理若A,B是两个相互独立事件,则A和B同时发生的概率为两事件分别发生的概率之积。P33\n(A·B)=P(A)×P(B)相互独立事件是指一个事件的出现对另一个事件的出现不发生影响。如果事件A的概率随事件B是否出现而改变,事件B的概率随事件A是否出现而改变,则称事件A和B为相关事件或相依事件。例如从52张牌中有放回连续抽取两次,问第一次抽取到红桃6,第二次抽取到方块6的概率为,1/52*1/52=1/2704;两次都为红色的概率为1/2*1/2=1/4。再如,掷sai子,连续掷两次,则两次都出现点数为3的概率为1/6*1/6=1/36。五、排列与组合:第二节二项分布(离散型随机变量的概率分布)一、二项实验与二项分布(一)二项实验二项实验又称贝努里实验,它有几个前提条件:①任何一次实验恰好有两个结果,如成功与失败、对与错、正面与反面,而且每次实验成功与失败、对与错、正面与反面的概率不变;②假定事件A(成功、对、正面)发生的概率为P,则对立事件(失败、错、反面)发生的概率为q,则q=1-P;③共有n次实验,各次实验相互独立,即各次实验之间无相互影响,每一次实验的概率并不会因为其它实验的结果而受到影响(抽样是有放回的)。凡符合上述要求的实验称为二项实验。在教育与心理实验中,社会调查研究中,二项实验的例子是很多的。如,测验中的是非题(对、错);四选一选择题(答对概率为1/4,答错概率为3/4);丢硬币(正面朝上,反面朝上);民意调查中支持某候选人,不支持某候选人等等。(二)二项分布在n次重复实验中事件A出现的次数X就称为二项变量,X的概率分布就叫做二项分布。或者说,二项分布是指统计变量中只有性质不同的两项群体(即二项实验的结果)的概率分布。二项分布可以说是两个对立事件的概率分布。二、二项分布概率的计算二项分布与二项定理有密切的关系:在n次独立实验的条件下,事件A出现的次数x的概率为:如果用概率P的形式来表示可写成:例1:掷硬币实验。有10个硬币掷一次或一个硬币掷10次,问五次正面向上的概率是多少?根据题意,n=10,p=1/2,q=1/2例2:在一个男女居民各占半数的大居民区中,抽取一个n=10的随机样本,问样本中正好有4位女性居民的概率是多少?假定按抽样是有放回的来计算误差很小。33\n例3:假定已知某个大厂(总体)中喜欢某个电视节目的职工占60%,现从这个总体中随机抽取6位职工进行调查,设X=样本中喜欢该电视节目的人数。求样本中恰好有3人喜欢该节目的概率。(0.2765)三、二项分布的均值与标准差及其应用例:有一个出色的扣球手扣球命中率为0.80,若每次扣20个球,则每次平均能扣中多少个球?(16个)四、二项分布的形状与性质(1)二项分布是一种离散型随机变量的概率分布。(2)若p=q,不管n多大,二项分布呈对称型。当n很大时,二项分布接近于正态分布,当n趋近于无穷大时,正态分布是二项分布的极限。(3)若pq时,为偏态分布,当n时,近似正态分布。第三节正态分布(连续型随机变量的概率分布)一、正态分布的含义正态分布也称为常态分布或常态分配,是连续随机变量的概率分布的一种。其概率分布是一种呈钟型的对称曲线,叫正态曲线或高斯曲线。这是统计学中最普遍也是最常用的一种分布。例如在度量自然现象和经济现象时测量误差一般是服从正态分布的。又例如人的智商、能力的高低、考试成绩、社会调查中某种态度的得分、行为表现以及身高、体重等身体状态等一般都近似服从正态分布。某变量服从正态分布写作:~N()二、正态分布的特征(一)正态分布的密度函数为(二)正态曲线下的面积为1,由于它在平均数处左右对称,故过平均数点的垂线将正态曲线下的面积划分为相等的两部分,即各为0.50。(三)正态分布是由平均数和标准差唯一决定的分布。它随随机变量的平均数和标准差的大小及单位不同而有不同的分布形态。平均数决定曲线在横坐标上的位置(总体水平的高低),标准差决定总体的离散程度(分布形态)。如果平均数相同,标准差不同,这时,标准差大的正态分布曲线低阔,标准差小,则正态分布曲线高狭。(四)在正态分布曲线下,标准差与概率(面积)有一定的数量关系。如:离开平均数正负1个标准差之间包含总面积的68.26%;正负1.96个标准差之间,包含总面积的95%;正负2个标准差之间包含总面积的95.44%;正负2.58个标准差之间包含总面积的99%;正负1.64个标准差之间包含总面积的90%;正负3个标准差之间包含总面积的99.74%。三、标准正态分布与标准分数(一)标准正态分布任何正态分布都可以通过或33\n转换成标准正态分布。转化成标准正态分布后,所有的原始分数都变成了标准分数,所有的普通正态分布曲线下横坐标上的数据都转变成了标准正态分布下的标准分数,因而把不等单位的原始数据转变成了可以比较(加减乘除)的标准分数。正态分布的两个重要参数是平均数和标准差,而标准正态分布的这两个参数分别为0和1。标准正态分布可写成N(0,1)。标准正态分布中,几个特殊的Z分数之间所包含的面积如下:P(-11.8)=0.03593×803P(0.630),趋近正态分布。(三)原总体服从正态,但未知的抽样分布服从df=n-1的t分布。(四)原总体非正态,未知的抽样分布在n>30时,服从df=n-1的t分布。三、t分布t分布也是钟形对称的分布,与正态分布相比,中间稍低而尖翘,两头高而平缓。t分布因自由度的不同而形成不同的形态,而正态分布是由平均数和方差决定的分布,标准正态分布只有一条曲线,而t分布随着自由度的增大,曲线形态会越来越接近正态分布,当df趋近无穷时,t分布曲线与正态分布曲线重合。四、影响统计量抽样分布的因素(一)统计量本身的种类(二)原总体的分布形态(三)样本容量(四)原总体的参数信息第四节参数估计一、参数估计参数估计分为点估计与区间估计两类。(一)点估计(1)点估计33\n点估计就是从一个适当的样本统计量来估计总体的未知参数值。例如上例中由400个职工的人均收入来推测企业全体职工的人均收入。统计量为数轴上的某一点值,所以称为点估计。例如对总体平均数的估计,可用样本平均数;对总体方差的估计可用样本方差。(2)判断估计量优劣的标准:1.无偏性。2.有效性。3.一致性。4.充分性。(二)区间估计区间估计是用数轴上的一段距离表示未知参数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出总体的未知参数落入某一区间的概率有多大。(1)区间估计的思想方法以点估计量为中心,建立一个区间如[T1,T2],使得所估计的区间能覆盖被估参数,且有一定概率作保证,也就是说,这个区间称为置信区间,区间的两个端点称为置信区间的上下限。(2)置信区间与显著性水平置信区间是指在某一置信度保证时,总体参数所在的区域距离或区域长度。置信区间的估计是与对这种估计的可信度(置信水平)的要求分不开的,要求估计的越可靠,即置信水平越高则估计的区间也应越大。社会研究一般用95%或99%的置信水平,通常用1-表示。显著性水平,是指估计总体参数落在某一区间时,可能犯错误的概率。一般取0.05或0.01。0.95的置信区间是指总体参数落在该区间之内,估计正确的概率为95%,而出现错误的概率为5%。(3)区间估计的原理与标准误区间估计是根据样本分布的理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。统计学中规定的正确估计的概率一般为0.95或0.99,那么显著性水平就为0.05或0.01,这是依据0.05或0.01属于小概率事件,而小概率事件在依次抽样中是不可能出现的原来规定的。区间估计的原理是样本分布理论。即在进行区间估计值的计算及估计正确概率的解释上,是依据该样本统计量的分布规律及样本分布的标准误差(SE)。也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误差才能计算总体参数可能落入的区间长度,才能对区间估计的概率进行解释。二、总体平均数的区间估计(一)若总体服从正态分布,总体方差已知,例如,总体服从正态分布,,现从中抽取一样本,n=25,,求1-=0.95的的置信区间。解:因为总体正态,方差已知故,置信区间为,区间为[54.472,61.528](二)若总体非正态,已知(n>30),样本均数趋向于正态分布,其置信区间为33\n,(三)若总体正态,未知,服从df=n-1的t分布,,无论样本容量大小,置信区间为[],另外,如果n>30,可用正态分布做。例如,n=25,,S=13.72,求的0.95的置信区间。解:,查表得,则置信区间为[73.1064,84.43](四)若总体非正态,且未知,n>30时,服从df=n-1的t分布,置信区间为[],。第五章假设检验第一节假设检验的原理与步骤一、关于假设检验的假设在进行任何一项研究时,都希望根据已有的理论和经验事先对研究结果作出一种预想的希望证实的假设。这种假设叫科学假设,同统计学术语表示时叫研究假设,记作。统计检验假说的宗旨是确定以事实支持的概率。例如:某校一个班进行比纳智力测验,结果,已知比纳测验的常模,问该班智力水平(不是一次测验结果)是否确实与常模水平有差异?。研究上面问题时,目的是想通过一次测验结果看看该班智力水平是否与一般水平不同,即检验这一次结果与常模水平是否显著。若以表示该班多次测验结果的总平均数或表示总体中与该班相似的多个班级的平均结果,则检验的目的是要证实,即要证实研究假设:。由于为研究假设取得肯定的支持难度很大,在实验研究中,研究者常常不对的真实性直接检验,而是采用检验它的虚无形式,即检验虚无假设。虚无假设是研究假设的否定式。虚无假设用。运用统计方法若证明为真,则为假;若为假,则为真。因而虚无假设是统计推论的出发点,人们在进行研究时,总是从虚无假设出发,通过计算某一检验统计量来推翻虚无假设,从而得到希望证实的研究假设。所以要想解决上述例子,首先得建立统计假设::检验虚无假设的基本思想是:与33\n的较小差别是由机遇产生的,因而不是真正的差别。如果两者的差别较大,并且这种差别的出现大于一定概率时,我们可以通过推翻虚无假设,而间接接受研究假设。假设的类别及其关系:(1)类别:原假设,又叫零假设,虚无假设。研究假设,又叫备择假设。(2)关系:两者的并集为全域;两者的交集为空集。区分两种假设:凡是有等于号的作为原假设。假设的建立原则:希望得到的结果作为研究假设或题目的问法作为研究假设,它的否定形式即为原假设。二、统计决策的原理统计决策的原理是“小概率事件原理”。在一次随机抽样中小概率事件不会也不可能发生,小概率事件的小概率记为,称为显著性水平(Levelofsignificant),所谓显著性水平就是研究者拒绝真的虚无假设之最大概率值,通常取0.10,0.05,0.01三个值比较多。随着的取值越来越小,则说明其显著性水平越来越高。小概率是否出现,是统计决策的依据。(小概率事件出现,则拒绝原假设,否则,接受原假设)。三、统计假设检验的思想方法由一、二点可以看出统计假设检验的思想方法是:带有概率值保证的反证法。四、差异显著性检验的原理由于统计中的假设检验目的在于检验差异,所以这种检验又叫差异显著性检验。统计检验是推论统计的一种方法,总结一、二、三点,可以看出差异显著性检验的原理是:从样本(我们实际观察)的统计量的差异能否作出一般性结论——总体参数之间确实存在差异。要检验这种差异,必须建立与之对立的虚无假设(不存在差异,是误差因素引起的),经过检验如果所得到差异超过了统计学规定的某一误差限度,则表明差异已经不属于抽样误差,而是总体确实有差异,这种情况叫做差异显著,应拒绝虚无假设;反之,若所得到差异未达到规定限度,说明差异主要来源于抽样误差,这时称差异不显著,应接受虚无假设。五、一个例子例:某校历年招收新生都要测其IQ,历年新生的IQ服从正态分布,,从今年新生的总体中抽取一个n=50的样本测验,测得其,问今年新生的IQ与往年一样吗?()解题分析:首先要建立研究假设和虚无假设,以虚无假设为真为出发点,进行检验,如果拒绝虚无假设,则接受研究假设。检验的是从样本平均数与总体平均数之间的差异是否能得出这个样本所来自的总体(今年新生)与往年新生是否有显著性差异。既然虚无假设是无显著性,则意味着今年新生总体与往年新生可以看作是同一总体,也就可以把这个样本看作是从的总体中抽取的样本,则样本平均数的抽样分布为正态分布,即,则对假设的检验可以用Z检验,因为。故此题可解:33\n(1)建立统计假设:(2)计算检验统计量:Z==(3)查临界值:(4)与临界值比较:2.121>1.96,超出了误差限度,落在1.96的右边,发生了小概率事件,拒绝虚无假设,即虚无假设为假,研究假设为真,从而认为今年新生的IQ同往年不一样,今年新生与往年新生不属于同一总体。差异主要是由于总体确实有差异而不是抽样误差。附:六、假设检验的步骤通过这个例子,可以看出假设检验的一般步骤为:首先建立统计假设,在虚无假设为真的前提下,收集样本数据,找到抽样分布,考查检验统计量值,如果检验统计量值大于事先规定的限度值,则根据“小概率事件原理”拒绝虚无假设,反之,接受虚无假设。(1)建立统计假设(2)收集样本数据(3)找出抽样分布(4)计算检验统计量值(5)与临界值比较,大于临界值,进入危机域,拒绝虚无假设;小于或等于临界值,接受虚无假设。七、统计决策时的两类错误在统计决策过程中,我们是冒着犯两类错误的风险的。第一类错误叫型错误,也叫型错误。即如果为真,而检验统计量大于临界值,从而拒绝了虚无假设,即当为真时而拒绝了的错误称为第一类错误,简称“弃真”错误。犯这类错误的概率为。当不真时而接受了的错误称为第二类错误又叫型错误,简称“纳伪”或“取伪”错误。犯这种错误的概率为,因而又称为型错误。八、假设检验的二种方法双侧检验与单侧检验如果我们关心的是与差异,并不关心比大还是小,所以这时在两侧都需要一个临界点,临界点以外的区域为的拒绝区域。如果显著性水平定为0.05,则两端拒绝区域的面积比率为0.025,这种强调差异而不强调方向性的检验叫双侧检验。反之,如果目的在于检验其是否显著低于一般水平或是否高于一般水平,则区域集中于的一端。这种强调某一方向的检验叫单侧检验,通常适用于检验某一参数是否“大于”或“优于”、“快于”另一参数等一类问题。第二节总体均值的显著性检验(单总体)单总体均值的显著性检验是指对样本平均数与总体平均数的差异进行的显著性检验(one-sampleTtest33\n)。检验单个变量的均指是否与给定的常数之间存在差异。例如,研究人员可能想知道一组学生(样本)的IQ平均数与120分之间的差异。若检验的结果差异显著,表明样本所来自的总体平均数与原总体平均数有差异,或者说样本平均数与总体平均数的差异已不能认为是抽样误差了,这个样本可以认为来自另一个总体。根据总体的分布形态、总体方差是否已知,抽取样本的容量,可以采用以下不同的检验方法。一、总体正态分布,总体方差已知例:全市统一考试的数学成绩服从正态分布,=62分,=10.2,从某校随机抽取90名学生的考试成绩,算出其=68分,问该校成绩与全市平均成绩差异是否显著?()由题目所给出的数据中,我们仅看到该校的考生平均成绩比全市的平均成绩高一些,这种差异究竟是来自偶然误差还是来自系统误差,是否存在显著性差异,还不得而知,因而我们还需按照假设检验的步骤来进行显著性检验,看看这6分的差异是否能说明90名学生所来自的总体即学校的平均成绩()与全市平均成绩之间确实存在显著性差异。解:(1)建立假设:或(2)计算检验统计量:由于总体方差一已知,样本来自于正态总体,故,则由抽样分布可知,检验统计量为:(3),,即拒绝原假设。从而可以认为,该校的学生考试成绩与全市的平均成绩有显著差异,从该校平均成绩68分,全市平均成绩62分来看,该校学生的学业平均水平高于全市的平均水平。二、总体服从正态分布,总体方差未知例:学生的学习成绩与教师的教学方法有关,某校一教师采用了一种他认为新式有效的教学方法。经过一年的教学后,从该班随机抽取了36名学生的考试成绩,分别为:48.54953.549.55652.5,而该学年考试中,全年级的总平均分数为52分,试分析采用这种教学方法与未采用新教学方法的学生考试成绩有无显著差异?该年级学生考试成绩服从正态分布()解:总体服从正态分布,总体方差未知,在原假设的前提条件下,样本平均数的抽样分布服从自由度为n-1的t分布。由已知条件计算样本统计量为=51.5,S=2.9833\n(1)建立假设(2)计算检验统计量:(3)查临界值:(4)与临界值比较:(5)作出结论:接受原假设,即新方法没有取得显著性差异。教学效果并不比旧方法好。注意,我们不能说教学效果反而比旧方法差,只能说与旧方法一样好,因为并没有拒绝原假设,如果检验统计量是负数并且绝对值比临界值大,这时候才能作出教学效果反而比旧方法差这样的结论。三、总体非正态若总体不是正态分布,就不能进行Z检验,t检验,而应采用非参数检验。但实际上,当样本容量较大的情况下,也可以近似地应用Z检验。在抽样分别的讨论中,中心极限定理指出:从平均数为,标准差为的总体(无论正态与否)中随机抽样,则样本平均数的分布将随着样本容量的增大而趋近于正态分布,即。所以当n大于30时,尽管总体分布未知或非正态,对于平均数的显著性检验仍可以用Z检验。当总体方差未知时,也可以用t检验进行(前提条件也是大样本)。第三节平均数差异的显著性检验这种检验的目的是在于通过两个样本平均数之间的差异()检验各自所来自的两个总体之间的差异()。由于涉及到的是两个总体,故需要考虑两个总体的前提性条件,包括总体是独立总体还是相关总体、两总体的分布和方差情况如何、两总体方差是否一致以及两个样本容量大小,是否相同等。这些条件下,所使用的检验方法是不同的,即公式是不同的。一、两总体正态分布,并且相互独立(独立的判断,r=0)(一)两总体方差均已知设有两个服从正态分布的相互独立的总体X和Y,它们的均值分别为和,方差分别为和,从两个总体中分别抽取一个随机样本,两总体差异显著性检验就是要通过这总体的两个样本带来的信息即样本平均数的差异去推论总体平均数之间是否存在差异(差异是由误差因素引起的还是真实的差异),要进行这样的推论,这里设计到样本平均数之差的抽样分布即样本平均数之差会服从什么样的分布,从而决定采用何种检验。所以至关重要的是要知道样本平均数之差的抽样分布以及其分布的标准误。方差的一个重要性质是当两个变量独立时,其和或差的方差等于各自方差的和,即:33\n由总体的已知信息,此时,的抽样分布也服从正态分布,且这一抽样分布的平均数是原总体两平均数之差,其标准误是。即:~N(,)则检验统计量为:Z=例如:两总体服从正态分布,从中分别抽取两样本,甲样本:n=180,=82,乙样本:n=160,=78.2,已知两总体的标准差分别为11.5和10.5,在=0.01的水平上检验两总体的平均数有无显著差异。解:(1)建立假设:(2)计算检验统计量:Z==3.185(3)Z=3.185>2.58,拒绝原假设。(二)两总体方差未知,但相等(通过样本方差进行齐性检验,从而推断总体方差是否齐性)在这一条件下,的抽样分布服从df=的t分布,平均数为,(当两样本容量不等时)(当两样本容量相等时)检验统计量为:t=例如:从两正态总体中分别抽取两样本,男:n=26,=84,=60;女:n=21,=81,=65,在=0.05的水平上检验初二学生数学学习有无性别差异。(t=1.296,33\n)(三)两总体方差未知且不等(n>30)(1)的抽样分布近似正态分布。(2)检验统计量为:Z=在王孝玲《教育统计学》P143,n<30时,用t检验t=。二、两总体正态,但相关的均值差异显著性检验两相关总体的判断方法的:其一、同一批被试的两列测量值是相关的。其二、一一严格配对的两组被试是相关的。(一)给出原始配对数据的两总体均值的显著性检验检验统计量为t=(d=X-Y),服从df=n-1的t分布。例如:甲教学法:8258888379947477乙教学法:7261698385875749d:10-3190-671728问甲教学法是否优于乙教学法。(=0.05)(1)检验的假设为:(2)t=2.151>1.896=(3)拒绝原假设即认为甲教学法优于乙教学法。(二)给出相关系数的两总体均值的显著性检验(1)抽样分布也是服从t分布。(2)检验统计量为:t=注意:独立时,r=0。第六章方差分析方差分析又称变异数分析(AnalysisofVariance),其主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。33\n第一节方差分析的基本原理从一个例子开始,如为研究三种不同教材的质量,抽取三个实验班分别使用其中一种教材,而对其他因素加以控制,经过一段实验后进行测试,取得三种实验处理的数据如下:教材j被试iABCK=312345707472687175807768757072667270717570检验三种教材的效果是否一致,实际上比较的是三个平均数之间的差异。一、方差分析的目的三个或多个平均数差异检验,采用的手段是用两个方差之比来作决策。例如,在本例中,就是比较三种教材的实验效果是否一致,即三个样本所代表的总体平均数是否相等。二、方差分析的基本原理方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性。不同来源的变异只有当它们可加时,才能保证总变异分解的可能。具体地讲,它是将总平方和分解为几个不同来源的平方和(这里的平方和指实验数据与平均数离差的平方和)。如本例:A、B、C三种实验处理,k表示3种实验处理,n表示每种实验处理中的被试数,表示某一实验处理下被试的平均数,表示所有被试的总平均数。SSt=,总平方和(total);=,组间平方和(betweengroups);=,组内平方和(withingroups),即由实验误差(包括个体差异)造成的变异。。可见,总变异可以分解为组间变异和组内变异。组间差异是由于实验处理效应造成的,因此也可将组间离差平方和记为SSA,组内差异是由于实验误差造成的,因此可将组内离差平方和记为SSE,E表示误差。如果实验数据的总变异主要是由实验因素(处理或自变量)造成的,那么在总变异中组间差异将占较大比例,组内差异将占较小比例,这时有充分理由认为不同教材(实验处理)的教学效果不同,三平均数之间有显著性差异,拒绝原假设。在方差分析中,比较组间差异与组内差异,不能直接比较各自的离差平方和,因为离差平方和的大小与求离差平方和的项数(K或n的大小有关),为消除项数的影响,分别求其均方,用离差平方和除以各自的自由度,用MS表示。组间方差又称组间均方,以或MSA表示:=MSA=,(组间自由度)33\n组内方差又称组内均方,以或MSE表示:=MSE=,(组内自由度)那么,到底三种实验处理之间是否有显著性差异呢?即三个平均数数之间的差异是由于处理因素引起的还是仅仅是实验误差?也就是说这每组内5个数据差异,有实验处理的原因,也有“组内变异”的原因(是由于实验误差或个体差异引起的)。只有实验处理的作用显著大于组内变异的作用时,才能确定实验处理的有效作用,即三种教材效果有显著差异,这时,我们通过方差之比来做决策:F为处理均方和误差均方的比率数。用单侧检验,因为检验的是组间差异是否显著大于组内差异,即总变异主要是由于实验处理造成的还是由于误差因素造成的,如果MSA显著大于MSE,则认为假设各处理平均数相等不成立。F1时,不能拒绝原假设;F>1且F>时,表明实验数据的差异主要是由于处理效应造成的。三、方差分析的基本过程(1)建立假设目的是检验几种实验处理是否有显著差异,因此:至少有一对不等(2)求平方和==N(所有原始数据之方差)=SSA==N(各组平均数之方差)=SSE==(每一组内各原始数据之方差)(3)确定自由度和求均方=MSA=,(组间自由度)=MSE=,(组内自由度)(4)进行F检验(5)列出方差分析表33\n变异来源平方和自由度均方F组间SSAk-1MSAF=MSA/MSE组内SSEN-kMSE总变异SStN-1(6)作出结论五、方差分析的基本条件(1)总体正态性(2)变异的可加性(3)各处理内方差一致性(4)抽样随机性第二节单因素完全随机设计的方差分析研究中有一个自变量,自变量有两个或多个水平。被试的分配:随机抽取若干名被试,然后把被试随机分配给处理(自变量)的各个水平,每个被试只接受一个水平的处理。或者说随机抽取若干名被试,然后把被试随机分成K组,K等于自变量的水平数,每组被试分别接受一个水平的处理。完全随机设计被试分组后,各实验组的被试之间是相互独立的,因而又称“独立组”设计,或称被试间(组)设计。一、方差分析过程第一节中的例子就是一个单因素完全随机设计的例子。为研究三种不同教材的质量,抽取三个实验班分别使用其中一种教材,而对其他因素加以控制,经过一段实验后进行测试,取得三种实验处理的数据。在这里,自变量为教材,教材有三个水平,即三种处理,每一处理下的被试都是从三个实验班随机抽取的,故被试间是相互独立的。故方差分析的过程与前同。(1)建立假设至少有一对不等(2)求平方和==N=15×12.8=192=SSA==N=15×4.67=70=SSE===192-70=122(3)确定自由度和求均方33\n=MSA==17/2=35,=2(组间自由度)=MSE==122/12=10.7,=15-3-12(组内自由度)(4)进行F检验查附表(2,12)=3.89(5)列出方差分析表变异来源平方和自由度均方F组间70235F=MSA/MSE=3.44组内1221210.17总变异19214(6)作出结论不能拒绝原假设,即认为处理效应为0。第三节单因素随机区组实验设计的方差分析一、随机区组实验设计的概念随机区组实验设计就是使用区组方法减小误差变异,即用区组方法分离出由无关变量引起的变异,使它不出现在处理效应和误差变异中,从实验误差中将被试的个别差异区分出来,从而增加实验数据的有效信息,降低实验误差。二、随机区组实验设计及其原则(一)设计原理随机区组实验设计指在实验中将实验对象按一定的标准划分为a个区组,使得区组内的实验对象的个别差异尽可能小,即保证区组内的同质性,并使每个区组均接受所有k个处理,且每个区组内每个处理仅有一个观测,其顺序是随机决定的。(二)设计原则(1)重复。随机区组实验必须有重复,即设置的区组要有2个或2个以上。随机区组实验设计的误差项的自由度应不少于10,即(a-1)(k-1)>=10(a为区组数,k为处理数)。(2)局部控制。随机区组实验设计中最重要的可以说是确保同一区组内被试的同质性。为此,设计中应通过对实验点(小区)的合理安排,通过对实验条件、环境的控制,确保同质性。(3)随机化。随机区组实验设计要求每一区组必须接受所有K种处理,并且在每一区组中接受处理的顺序必须是随机决定的。第七章回归分析33\n第一节回归分析的基本原理一、回归分析的目的回归分析的目的就是确定变量之间数量关系的可能形式,并用一个数学模型来表示这种关系形式。二、回归分析的主要内容(任务)回归分析包括三大部分内容:建立回归方程、检验和评价所建立回归方程的有效性、利用所建立回归方程进行预测和控制。第二节一元线性回归分析一、一元线性回归的模型一元线性回归研究的是具有线性相关关系的因变量和一个自变量之间的回归问题。其模型为:,其中称一元线性回归方程,称为变量y对变量x的一元线性回归方程。一元线性回归方程方差分析的总自由度为N-1,回归自由度为1,剩余自由度为N-2。二、回归方程有效性高低的指标在回归分析中衡量回归方程有效性高低的指标称决定系数或测定系数。决定系数是回归平方和在总平方和中所占的比例。在回归分析中,我们显然希望由自变量所决定的离差平方和在总离差平方和中所占的比例越大越好,如=0.55,说明因变量离差平方和中由自变量x所决定的部分占55%。第八章检验检验解决两类问题:一是通过时间调查与观测所得到的一批数据,其次数分布是否服从理论上所假定的某一概率分布;二是对一批观测数据进行双向多项分类后,检验这两类特征之间是独立无关的还是具有相依相从、连带相关。例如性别与对某个问题的态度是否有关系…,这里性别是一个因素,可分男女两个类别,态度又是一个因素,可分为赞同、不置可否、反对等多种类别。检验的计算公式:=,是实际观测数据,是理论次数。因而检验是衡量实际测量数据与理论数据差异程度的指标;仅用于计数资料;值永远非负;具有可加性。一、总体分布的假设检验(拟合良度检验)总体分布的假设检验也称为总体分布的拟合良好性检验,其主要原理是借助统计量的实得指标来考察实际观测次数与某一理论假定下的次数之间的差异是否显著,从而解决第一类统计检验问题,即解决“从实际调查与观测所得到的一批数据,某次数分布是否服从理论上所假定的某一概率分布”的问题。(一)某实际观测次数是否服从正态分布的检验(检验的原假设是:服从正态分布)33\n例如:优良中及格不及格总和7251882602142814260问此分布是否正态?(1)建立假设:服从正态分布:不服从正态分布(2)计算检验统计量==27.29(3)查表,df=k-1=4(k为等级个数)=13.28<27.29(4)拒绝原假设,即该分布不服从正态分布。(二)某实际观测数据是否服从平均分布的检验例如:有个学校对学生进行考勤,其数据如下,表中数据为缺勤人数。周一周二周三周四周五周六合计13117108116010101010101060问出勤情况正常吗?(1)建立假设:服从平均分布:不服从平均分布(2)计算检验统计量==2.4(3)查表,df=k-1=5(k为等级个数)=11.1>2.4(4)无理由拒绝原假设,即出勤情况正常。二、列联表的检验(独立性检验)(一)2×2列联表的检验2×2列联表就是把样本数据同时按两种特征进行双向分类后形成两行两列的四格数据列联表。2×2列联表下的检验就是利用统计指标来检验特征A和特征B之间是独立无关的还是相依相从连带相关。33\n2×2列联表计算值专用公式:=例如:研究人员随机抽取了170名青年男女大学生的样本,对他们进行心理测验。在对测验结果进行深入分析时,发现这批大学生中60名女生对该心理测验中最后一个题目的反应态度是:作“肯定”回答的有18人,作“否定”回答的有42人;而在110名男生中,在相同的项目上作“肯定”回答的有22人,作“否定”回答的有88人。问,在该心理测验最后这个项目的反应上,青年大学生的性别与态度之间是否存在着某种连带关系?(1)建立假设::性别与反应态度之间是独立无关的:性别与反应态度之间是显著连带关系(2)把已知数据列成列联表态度性别肯定否定小计男生2288110女生184260小计40130N=170(3)计算检验统计量值=2.1577=3.84>2.1577故接受原假设,即认为反应态度与性别无关。(二)r×k列联表的检验(同质性检验)例如:要实行一种新学制,就这种新学制作了态度调查态度地位赞同反对?小计上中下14182022101212710524429小计483542125问这些态度受不受经济地位影响?(态度一样不一样?)(1)建立假设:不受经济地位影响:受经济地位影响(2)计算检验统计量==5.69(3)查表,df=(r-1)(k-1)=4=9.49>5.69故接受原假设,即认为态度与经济地位无关。33