• 1.94 MB
  • 2022-09-01 发布

定量资料统计学方法小结

  • 76页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
实用文档计量资料分析常用的统计学方法小结第二章、定量资料的统计描述频率分布表与频率分布图:描述平均水平的统计指标(描述集中趋势):算数均数、几何均数、中位数与百分位数、众数描述变异程度的统计指标(描述离散趋势):极差、四分位数间距、方差、标准差、变异系数描述分布形态的统计指标:偏度系数、峰度系数第一节频率分布表与频率分布图离散型定量变量和连续型定量变量的频率分布离散型定量变量的取值是不连续的。直接清点各变量值出现的频数计算相应的频率,即为频率分布表。离散型定量变量的频率分布图可用直条图表达,以各等宽矩形直条的高度表示各组频率的大小。大全\n实用文档连续型定量变量的取值是连续的。将数据适当分组,清点各组频数,并计算相应频率,即为频率分布表。连续型定量变量的频率分布图可用直方图表达,纵坐标为频率密度,即频率/组距,直方图面积之和等于1.1、离散型定量变量的频率分布步骤:(1)直接清点各变量值出现的频数(2)计算各组频率,累计频数,累计频率2、连续型定量变量的频率分布步骤:(1)求极差(range):即最大值与最小值之差,又称为全距。(2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。编制频率表的注意事项:(1)分组不宜过粗,也不宜过细。通常分为10~15个组。大全\n实用文档(2)为计算方便,组段下限一般取较整齐的数值。确定各组段上下限时,各组段要连续但不重叠。除去最后一个组段,其余组段应包含下限值,不包含上限值。(3)第一组段应包含最小值,最后一组段应包含最大值。3、频数表和频数分布图用途(1)描述频数分布的类型对称分布:若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布正偏态分布:右侧的组段数多于左侧的组段数,频数向右侧拖尾。偏态分布:负偏态分布:左侧的组段数多于右侧的组段数,频数向左侧拖尾。(2)描述频数分布的特征随机变量的分布具有两个特征——集中趋势与离散趋势。①数据集中(平均):总体中的个体具有某些同性质,这些同性质是的数据趋向同一数值,表现为变量值聚集在某个中心值的周围,称为集中趋势。②数据变异(离散):同一总体中的个体之间又普遍存在各种差别,使得变量值向平均水平左右离散,称为离散趋势。(3)便于发现某些离群值或极端值。大全\n实用文档(4)便于进一步做统计分析和处理第二节描述平均水平的统计指标(描述集中趋势的指标)统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有三种——算数均数、几何均数、中位数。1、算术均数:简称均数(mean)可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。常用μ表示总体均数,用表示样本均数。均数适用于对称分布,特别是正态分布资料。直接计算法(利用原始数据):加权法(利用频数表):大全\n实用文档k:频数表的组段数,f:频数,X:组中值。2、几何均数(geometricmeanG)可用于反映一组原始观察值不对称,但经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。(1)直接法计算公式:大全\n实用文档例有8份血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。根据G的倒数得到平均抗体效价为:1:57(2)加权法公式(频率表法):∑f:各组频数之和,即n2、中位数(medianM)与百分位数(percentilePx)大全\n实用文档是将每个变量值从小到大排列,位置居于中间的那个变量值。理论上有一半的观察值高于中位数,一半的观察值低于中位数。中位数适用于各种分布的变量,特别是偏峰分布的变量。只与位次居中的观察值有关,不受分布两端特大或特小值的影响。因此,在末端无确定值资料,不能计算均数和几何均数的时候,可计算中位数。(1)直接法计算公式:n为奇数时:n为偶数时:(2)频率表法:对于频率表资料,可以通过百分位数法近似计算中位数。百分位数:是指将n个观察值从小到大依次排序后,对于x%位的数值;表示将原始观察值分为两个部分,理论上有x%的观察值小于有(1-x)%的观察值大于。所以百分位数P50就是中位数。大全\n实用文档∑fL:为小于L所在组段的累计频数(1)百分位数(percentile)直接算法:设有n个原始数据从小到大排列,第X百分位数的计算公式为:当为带有小数位时:Trunc(nx%)的意思是n和x%的结果取整数当为整数时:大全\n实用文档例对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。患者:住院天数:(1)n=120,120乘5%等于6,为整数:(2)n=120,120乘99%等于118.8,带有小数,故取整trunc(118.8)=118大全\n实用文档频数表算法:当时,公式(2-9)即为中位数的计算公式例:大全\n实用文档试分别求例2-1频数表的第25、第75百分位数P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.664、众数(mode)众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本;较粗糙。正态分布时:均数=中位数=众数正偏态分布时:均数>中位数>众数大全\n实用文档负偏态分布时:均数<中位数<众数大全\n实用文档第三节描述变异程度的统计指标(描述离散程度的指标)同一总体中的不同个体之间存在差异称为变异。不同的观察指标,其变异程度不同;即使是同一观察指标,在不同总体中,其变异程度也会有所不同。常用的描述变异程度的指标包括极差、四分位数间距、方差、标准差、变异系数。1、极差(Range)极差,也称全距,用R表示:即一组变量值最大值与最小值之差。样本接近的同类资料相比较,极差越大意味着数据越离散,或者说数据之间的变异程度越大。极差计算简单,但仅利用了两端点值,稳定性差。R=最大值-最小值极差的特点:极差只能粗略地说明变量的变动范围。极差只用最大值和最小值计算,未考虑到中间的全部信息。偏态资料时更不稳定。2、四分位数间距(quartilerange)四分位数间距,用Q表示大全\n实用文档P75和P25分别称为上四分位数和下四分位数。四分位数间距定义为P75和P25之差。即Q=P75-P250%()25%()75%()100%()如上图所示,理论上,有1/4个观察值比P75大,有1/4个观察值比P25小,P75和P25之间恰好包括总体中50%的个体观察值。Q越大意味着数据间变异越大。四分位间距可用于各种分布的资料,特别对服从偏峰分布的变量。常把中位数和四分位间距结合起来描述变量的平均水平和变异程度。与极差相比,四分位间距更稳定,但仍未考虑数据中的每个观察值的离散程度。2、方差(variance)方差考虑了所有观察值的变异程度。总体方差用表示,定义为总离均差平方和,∑在总体所有个体中的平均;样本方差用表示。方差越大意味着数据间变异越大。大全\n实用文档(1)平均偏差为利用每一个观察值的信息,计算各观察值偏离平均值的平均差距(即离均差,他们的和称为离均差和)。为免于正负抵消,可将每个观察值与均数的差值的绝对值相加再取平均,称为平均偏差(meandifference)。∑n(2)离均差平方和(sumofsquare,SS)为克服平均偏差使用绝对值不便运算的缺点,可以将“离均差”平方,即计算离均差平方和。其计算公式为:(3)方差(meanofsquare,MS)①将离均差平方和取平均,即为方差(variance)。对于样本资料,取平均值时分母用n-1代替nMS=其中n-1称为自由度(df)大全\n实用文档,在n个离均差平方项中,只有n-1个是独立的,称为自由度(degreeoffreedom,df)其意义是当给定时,随机变量X“自由”取值的个数。总和不变,自由度就少了一个,所以用n-1任何统计量的自由度υ=n-限制条件的个数。②总体方差与样本方差总体方差:样本方差:4、标准差(standarddeviation,SD)(1)方差的平方根为标准差,总体标准差用σ表示,样本标准差用S表示大全\n实用文档,其度量单位与均数一致,所以最常用。标准差的公式还可以写成:利用频数表计算标准差的公式为:(2)标准差的意义和用途大全\n实用文档说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差...标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。用于计算变异系数用于计算标准误(见后)结合均值与正态分布的规律,估计参考值的范围(见后)。5、变异系数(coefficientofvariation,CV)变异系数(coefficientofvariation,CV)常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。CV的意义是变异程度的大小,相对于平均水平的百分比。变异系数没有单位。变异系数越大意味着相对于均数而言变异程度越大。其中S为样本标准差,为样本均数。大全\n实用文档5、分布形态对教学评价的指导意义正态分布:说明学生考试成绩分布比较正常。正偏态分布:说明低分段的学生人数比较多,可能是试题难度偏高或者是此次考查内容学生掌握情况不好。负偏态分布:说明高分段的学生较多,可能是学生知识掌握较好,也可能是试题难度较低。大全\n实用文档平坡型分布:说明学生成绩差距较大,分布不集中,降低整体成绩的是分布在低分段的学生,所以应对这些学生进行个别辅导。陡峭型分布:说明学生成绩分布比较集中,要提高学生成绩,需要进行集体辅导补课。第五节统计表和统计图1、统计表将统计分析的事物及其指标用表的形式表示出来,就是统计表。结构及要求▲标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。▲标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标的单位。▲线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。▲数字:用阿拉伯数字表示。无数字用“—”表示,缺失数字用“¼”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。▲备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*”号,在表下方说明。大全\n实用文档例:统计表由以下几个部分组成:①标题、②标目、③线条、④数字、⑤备注表1某省某工厂1994、1998年四项检测指标异常检出率大全\n实用文档1、统计图将统计分析的事物及其指标用图的形式表示出来,就是统计图。统计图是用点的位置、线段的升降、直条的长短、面积的大小等表达统计数据的一种形式。绘制统计图要根据资料性质和分析目的选择最合适的图形。常用于定量的统计图包括频率直方图、累积频率分布图、箱式图、直条图。(1)一般统计图的制作要素与基本要求①图号与标题图号:用阿拉伯数字标题:简明扼要地概括整个图的内容②标目横标目(主语、横轴)纵标目(谓语、纵轴)大全\n实用文档③尺度单位④图例⑤图域横:纵=7:5(2)统计图的制作▲须根据资料性质、分析目的选用适当统计图,由于统计图不能精确显示数据大小,所以经常需与统计表一同使用。▲一个图一般只表达一个中心内容,表达一个主题,即一个统计指标。▲绘制图形应注意准确、美观,图线粗细应用适当,定点准确,不同事物用不同线条(实线、虚线、点线)或颜色表示,给人以清晰的印象。(3)统计图制作注意事项标题:简明扼要说明资料内容、时间和地点,一般位于图下方中央位置并编号。图域:即制图空间,除圆图外,一般用直角坐标系第一象限表示图域,或者用长方形框架表示。标目:分纵标目和横标目,表示纵轴和横轴数字刻度的意义,一般有度量衡单位。大全\n实用文档图例:对图中不同颜色或图案代表的指标注释。图例通常放在横标目与标题之间,如果图域部分有较大空间,也可以放在图域中。(4)常用统计图①直方图:主要用于描述连续变量的频率分布。横坐标:表示定量变量的组段,纵坐标表示各组段变量值所占的频率密度(频率/组距)。这时频率直方图总面积为1。图6140名正常男子红细胞计数的直方图②累计频率分布图:用于描述连续变量的累计频率分布,横坐标为变量组段,纵坐标为各组段累计频率。可以从累计频率分布图中看出不同总体间相同变量的频率分布差别。其中纵坐标为0.25/0.50/0.75、时所对应的横坐标尺度为上四分位数,中四分位数,下四分位数。还可以看出变量在某指定值以上,或以下,或两个指定值之间的观察对象所占有观测对象的比例。大全\n实用文档③箱式图:描述定量变量的平均水平和变异程度,还可以显示数据中的离群值或极端值。箱式图使用了5个指标:最小值、下四分位数、上四分位数、中位数、最大值。上四分位数(P25)和下四分位数(P75)构成箱体部分,在箱体中标出P50位置。P25和最小值之间、P75和最大值之间分别构成箱子的上下两条触须。触须外可以标出离群值。最小值中位数最大值上四分位数P75下四分位数P25箱子越长表示数据离散程度越大。中间横线若在箱子中心位置,表示数据分布对称,中间横线偏离箱子正中心越远,表示数据分布越偏离中位数。最小值中位数最大值箱图用于比较两组或多组资料的集中趋势和离散趋势。大全\n实用文档④直条图:可描述离散型定量变量和定性变量的频率分布。是用等宽直条的高度表示相互独立的各项指标数量的大小。包括单式条图、复式条图、分段条图。单式条图大全\n实用文档图1某地区四个季度收治病人数⑤趋势图线图半对数线图:半对数线图(semi-logarithmiclinearchart)是线图的一种特殊形式,适合于表示事物发展速度(相对比)。其纵轴为对数尺度,横轴为算术尺度,使线图上的数量关系变为对数关系。小结:独立资料用直条图;连续资料用线图或直方图;构成比资料用百分条图或圆图;双变量资料用散点图;地区性资料用统计地图。大全\n实用文档第四章常用概率分布第三节正态分布一、正态分布的概念1、基本概念(1)正态分布:是自然界最常见的一种分布,其特点是中间频数最多,两边频数逐渐减少且对称。直方图的各长条面积代表各组频率,其高度则代表频率密度(频率/组距),这张图称为频率密度图。如果观察人数增多,组段不断细分,其顶端接近于一条光滑曲线,称为频率密度曲线,线下面积恒等于1。大全\n实用文档(2)正态曲线:是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线。该曲线的函数表达式称为正态分布密度函数。则称X服从正态分布,记作,μ为X的总体均数,为总体方差。2、正态概率密度曲线的位置与形状的特点大全\n实用文档曲线关于曲线下面积恒为1σ决定曲线的形状,μ决定曲线在横轴上的位置。大全\n实用文档μ一定时,σ越大,数据越分散,曲线越矮胖;σ越小,数据越集中,曲线越瘦高。μ增大,曲线沿横轴向右移动,反之曲线向左移动。正态分布特征要点:曲线在均数处最高曲线以均数为中心,两端对称为永远不与x轴相交的钟型曲线曲线有两个重要参数:均数——位置参数,大全\n实用文档标准差——形状(变异度)参数。正态曲线下的面积分布有一定规律正态分布具有可加性二、正态曲线下面积的计算正态曲线下面积的意义:正态曲线下一定区间内的面积代表变量值落在该区间的概率。整个曲线下的面积为1,代表总概率为1。曲线下面积的求法:定积分法和标准正态分布法1、一个共同的规律任何正态分布,概率密度曲线下面积具有相同规律:这是由正态分布性质决定的,与均数和标准差数值无关。大全\n实用文档1、Z变换与标准正态分布对任意一个服从正态分布的随机变量,可作如下标准变换,也称Z变换:经此变换得到的变量Z的密度函数为大全\n实用文档例:X取值在区间求X取值在相应区间的概率,要先确定区间两端点对应的Z值由得:查附表,根据对称性,(1.96,)的曲线下面积也为0.025,所以Z取值在(-1.96,1.96)的概率为1-20.025=0.95,即X取值在为0.095相同方法可计算出X取值在区间为0.99由于1.96和2.58这两个数具有重要意义,要熟记!大全\n实用文档另外由标准正态分布概率密度图形的对称性易知:大全\n实用文档3、正态分布中几个重要概念(1)分位点的概念标准正态分布N(0,1)的“上分位点”通常记成O大全\n实用文档(2)直接查常用标准正态分布的上分位点O(3)由的对称性易知实际例题计算:大全\n实用文档例2-1130名健康成年男子脉搏资料的均数、标准差分别为:71.32与5.80(次/分);问在正态分布假定下,脉搏在65~75(次/分)之间有多少人?三、正态分布的应用1、医学参考值范围的制定(1)重要概念:医学参考值(referencevalue)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准,但不是“金标准”。正常值范围(或参考值范围):医学上常把绝大多数正常人的某指标值的波动范围称为该指标的正常值范围(或参考值范围)。注意:正常人并非指没有任何疾病的人,而指同质前提下排除了足以影响所测指标的因素的人。(2)正常值范围的确定步骤大全\n实用文档1)选定正常人群,并抽取一定的样本含量(一般大样本)。2)根据专业知识确定用单侧或双侧范围。3)根据需要确定可信度。4)按资料特点选定不同方法计算正常值范围上、下限。(3)确定医学参考值范围的方法有两种:1)正态分布法:适于正态分布资料。对数正态分布的资料取对数后可用正态分布法估计。2)百分位数法:适于偏态分布资料或分布不明类型的资料。所需样本含量较大。大全\n实用文档双侧95%医学参考值范围是(),单侧范围是以下(人体有害物质如血铅,发汞等),或以上(如肺活量)。双侧参考值范围:单侧参考值范围:例:测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的95%参考值范围。表2-7282名正常人尿汞值()测量结果尿汞值频数f累计频数累计频率(%)0~454516.08.0~6410938.616.0~9620572.724.0~3824386.232.0~2026393.340.0~1127497.248.0~527998.956.0~228199.664.0~72.01282100.0鉴于正常人的尿汞值为偏态分布,且过高为异常,故用百分位数法计算上侧界值即第95百分位数大全\n实用文档故该地正常人的尿汞值的95%医学参考值范围为<43.6(μg/L)。大全\n实用文档第六章第一节假设检验一.假设检验的原理与逻辑思维:1.背景大全\n实用文档:若两个样本来自同一总体,则它们的差异是由抽样误差引起的,则P>0.05,无统计学意义。若两个样本分别来自不同的总体,则它们之间的差异则是由本质不同引起的,P<0.05,有统计学意义。在统计分析的过程中,我们往往在一开始不知道所选的样本是不是来自不同的总体,不知道它们之间的差异是由抽样误差引起的还是本质不同引起的。为了确定它们的来源,我们需要找到证据来确定它们是来自不同的总体,但是这就像要证明一个人没有骂过人一样,我们不可能从正面来证明他没骂过人,所以从正面证明样本来自不同的总体是非常难的,这时候我们就要从反面来考虑,要证明一个人骂过人是很容易的,只要有一次被抓住就可以了,同样,只要证明两样本是不是来自同一整体就可以了,我们可以用假设检验来实现这一过程。在假设检验中,一般设立一个原假设与一个备择假设。原假设一般与我们想得到的结果相反,我们需要利用所掌握的真实数据来找出假设与现实的矛盾,从而否定这个假设,若否定不了,说明证据不足,无法否定原假设,但不能说明原假设正确。2.原理:原理为反证法与概率论。概率论主要是指小概率,即如果一件事情发生的概率很小(一般小于0.05或小于0.01),事件是“不会发生的”,这句话在大多数情况下是正确的,但它也有错误的时候,因为概率再小也是可能发生的。3.思路:先假设要比较的事物是相同的,再在这种假设成立的情况下,进行逻辑推理。若推理出发生的事是一个小概率事件,一般情况下,一次抽样中是不可能发生的,则反推到假设有误,从而否定假设,若推理出的不是一个小概率事件,则在一次抽样中是可能发生的,则证据不足,不能拒绝原假设。需要注意的是这种拒绝或不拒绝是有可能出错的,其出错可能性为0.05或0.01。二.假设检验的步骤:1.建立假设,确定检验水准:根据研究设计的类型和资料特点等因素选择合适的检验方法,并将需要推断的问题表述为关于总体特征的一对假设:原假设(零假设)与备择假设(对立假设),它们是相互对立的一对假设。大全\n实用文档原假设:记为,一般是假设我们所得到的两个样本数据的总体均数μ相等,即。备择假设:记为,一般是假设我们所得到的两个样本数据的总体均数不相等,即。如果包括与两种情形,则为双侧检验;如果凭借专业知识有充分把握可以排除某一侧,即包括或,则为单侧检验,例要检验缺钙地区儿童前囟门闭合月龄是否大于一般儿童的前囟门闭合的月龄时,根据已知的知识,缺钙地区儿童前囟门闭合月龄不可能比一般儿童的前囟门闭合的月龄少,此时为单侧检验。2.计算检验统计量:根据样本数据计算相应的统计量。统计量是随机样本的函数,其计算公式不应包含任何未知参数。计算出统计量后,再看这个统计量的数据实现值属不属于小概率事件。3.确定p值,作出推断:P值是指:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。根据所得到的统计量,在相应表格里查找到统计量对应的P值,按设计实验时决定的α=0.05或α=0.01的水准决定拒绝或不拒绝。当P≤α,拒绝,接受,两总体均数有差别,即在成立的条件下,得到现在检验结果的概率小于α,因为小概率事件不可能在一次试验中发生,所以拒绝,否则不拒绝。三:假设检验的两个错误:从上面内容可知,无论我们拒绝还是不拒绝,都可能犯错误,其中,假阳性错误称为I型错误,意义是“实际无差别,但下了有差别的结论”,犯这种错误的概率是α大全\n实用文档(其值等于检验水准);假阴性错误称为II型错误,意义是“实际有差别,但下了不拒绝的结论”,犯这种错误的概率是β(其值未知)。用表格来表示为:检验水准α又称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。一般常取0.05或0.01。(方差齐性检验与正态性检验时常取0.10或0.20)1—β为检验效能,意义为当两总体确有差别,按检验水准α所能发现这种差别的能力。四:假设检验的注意事项:1.检验假设是针对总体,而非样本。2.和是互相对立,不是可有可无,而是缺一不可。3.无效假设,通常是某两个或多个总体参数相相同,或总体参数之差为0,或某资料服从某一分布等等。4.假设检验主要是围绕。5.备择假设应该按照实际世界所代表的方向来确定,即它通常是被认为可能比零假设更符合数据所代表的现实。6.大全\n实用文档的内容反映出是单侧检验还是双侧检验。为了时结果具有真实性和可靠性,在建立假设前,先要根据分析目的和专业知识明确单侧检验还是双侧检验,以及检验水准α,不能在假设检验结果得出后再加以选择。1.减少I型错误的主要方法:假设检验时设定α值;减少II型错误的主要方法:提高检验效能;提高检验效能的最有效方法:增加样本量;可以通过实验设计来选择合适的样本量。减少(增加)I型错误,将会增加(减少)II型错误。2.假设检验的结论是根据P值大小作出的,不是百分之百的正确。拒绝,可能产生I型错误;不拒绝,可能产生II型错误。另外,是否拒绝不仅决定于被研究事物有无本质差异,还决定于抽样误差大小、检验水准a的高低以及单侧、双侧检验。因此,当P与α接近时,下结论要慎重,不能绝对化。第二节t检验一.t检验的应用条件:以t分布为基础的检验称为t检验,分为单样本资料的t检验、配对设计资料的t检验和两独立样本资料的t检验。其应用条件是:1.随机样本,两组剂量资料小样本比较。2.各观察值间相互独立,不互相影响。3.来自正态分布总体。4.均数比较时,要求两总体方差相等(方差齐性)。二.单样本资料的t检验:大全\n实用文档1.方法:将样本均数与总体均数比较,其分析目的是推断样本所代表的未知总体均数μ与已知总体均数有无差别。2.过程:原假设为:μ=,备择假设为:μ≠。统计量为:t=,是样本均数,是样本均数的标准误。在成立时,统计量t服从自由度为v=n-1的t分布。3.注意事项:①其适用样本均数与已知总体均数的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数有差别。②已知总体均数一般为标准值、理论值或经大量观察得到的较稳定的指标值。③应用条件是总体标准差未知的小样本资料,且服从正态分布。4.实例:据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?(1)建立检验假设及确定检验水准::μ=,山区成年男子平均脉搏数与一般人群相等。:μ>,山区成年男子平均脉搏数高于一般人群属于单侧检验,α=0.05。(2)计算统计量:n=25,μ=74.2次/分,s=6.5次/分,=72.0次/分。大全\n实用文档将其代入公式,得到t=1.692,已知v=n-1=25-1=24.(3)确定P值,作出推断:由t界值表=1.711,=1.318,得0.10>P>0.05。按α=0.05水准不拒绝,尚不能认为该山区健康成年男子的脉搏均数高于一般健康成年男子的脉搏均数。一.配对设计资料的t检验1.配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。它能够很好地控制非实验因素对结果的影响。在医学科学研究中的配对设计主要适用于以下情况:异体配对设计(包括同源配对设计和条件相近者配对设计)和自身配对设计。2.配对设计的三种方式:①两个同质受试对象分别接受两种处理,如把同一窝出生的、同性别和体重相近的动物配成一对,或把同性别、年龄相近及病情相同的病人配成一对。②同一受试对象或同一标本的两部分,随机分配接受两种不同处理。③将同一受试对象处理(实验或治疗)前后的结果进行比较。3.原理:假设两种处理因素的作用相同,则两因素结果差值的总体均数为0,则用两样本差值的均数与0进行比较。用假设检验的原理进行判断。大全\n实用文档1.方法:即差数的总体均数为0即差数的总体均数不为0当成立时,统计量为:t=,v=n-1为差值的均数,为差值的样本标准差,n是对子数。同样,给定一个小概率α作为检验水准,如果与t值相应的P值小于给定的α,拒绝,否则,不拒绝。2.实例:为研究饮食中缺乏维生素E对肝中维生素A含量的影响,将同种属的大白鼠按性别,年龄、体重相近配成8对,并将每对中的两只大白鼠随机分到正常饲料组和维生素E缺乏组,然后定期将大白鼠杀死,测得其肝中维生素A的含量如下表1。问不同饲料组的大白鼠肝中维生素A含量有无差别?(1)建立检验假设,确定检验水准:=0,不同饲料组的大白鼠肝中含量无差别。大全\n实用文档:≠0,不同饲料组的大白鼠肝中含量有差别。.05。(1)选定检验方法,计算检验统计量n=8,=6.81,=8.0867,=6.81/8=0.851(μmol/g)=0.572(μmol/g)=4.208(2)确定P值,作出推断结论v=n-1=7,查界值表,得=4.029,=4.785,得0.005>P>0.002,按α=0.05水准,拒绝,接受,差异有统计学意义。可认为不同饲料的大白鼠肝中含量有差别,正常饲料的较高。一.两独立样本资料的t检验1.两独立样本资料的t检验是将受试对象随机分配成两个处理组,每一组接受一种处理,从而获得两组资料,它们代表两个总体的两个独立样本,据此推断它们的总体均数是否相等。两样本含量可以相等也可以不相等,但在总例数不变的条件下,当两样本含量相等时,统计检验的效率最高。2.应用条件:两总体分布为正态分布,且方差齐。若方差不齐,则用检验。3.两样本所属总体方差相等(方差齐):①大全\n实用文档方法:将两个正态分布总体分别记为N()和N(),假设检验为::=,即两样本所属的两个总体均数相等:≠,即两样本所属的两个总体均数不相等:t==,v=其中,是利用两样本联合估计的方差:若与t值相应的P值小于给定的α,拒绝,否则,不拒绝。②实例:测得14名慢性支气管炎患者与11名健康人的尿中17酮类固醇(mol/24h)排出量如下,试比较两组人的尿中17酮类固醇的排出量有无差别。患者:10.0518.7518.9915.9413.9617.6720.5117.2214.6915.109.428.217.2424.60健康人:17.9530.4610.8822.3812.8923.0113.8919.4015.8326.7217.29l建立检验假设,确定检验水准:=,即患者与健康人尿中17酮类固醇的排出量相同:≠,即患者与健康人的尿中17酮类固醇的排出量不同.05l计算统计量=14,=212.35,=3549.0919=11,=210.70,=4397.6486大全\n实用文档==15.17(μmol/24h)==19.15(μmol/24h)=29.9993,=2.2068,t=1.8035,v=23l确定P值,作出推断结论查t界值表,推断出0.10>P>0.05,按α=0.05水准,不拒绝,差异无统计学意义。尚不能认为慢性支气管炎病人与健康人的尿中17酮类固醇的排出量不同。1.两样本所属总体方差不等(Satterthwaite近似法)①方法:对自由度进行校正:检验的公式:=,v=②两正态总体分别记为N()和N(),,检验假设如前。作为统计量。给定一个小概率α作为检验水准,如果与t值相应的P值小于给定的α,拒绝,否则,不拒绝。③实例:为了探讨血清SIL-2R含量对白血病的诊断意义,随机抽取正常对照11人和白血病患者13人,测得血清SIL-2R含量如下。比较两组人群血清SIL-2R含量是否不同。白血病组:630.21602.13589.27638.17592.30690.11869.23723.33653.26523.17516.33613.37638.39对照组:179.21180.22183.30160.17187.23大全\n实用文档185.26165.31185.21178.33191.36181.32l:=,即两组人群血清SIL-2R含量相同:≠,即两组人群血清SIL-2R含量不同。.05l=13,=210.70,=90.41=11,=179.72,=9.28l查t界值表,得出P<0.001,按α=0.05水准,拒绝,接受,差异有统计学意义,认为两组血清SIL-2R含量不同,白血病组高于对照组。一.两独立样本资料的方差齐性检验1.常用F检验,其计算公式为F=,=-1,=-1F值是两个样本方差之比,如仅是抽样误差的影响,它一般不会离1太远,F分布就是反映此概率的分布。求得F值后,查表F界值表(方差齐性检验用),得P值,按所取检验水准作出推断结论。2.方法:设有两个随机样本分别独立地取自两个正态整体,判断其总体方差和是否相等,可以做如下齐性检验::=,即两独立样本资料的总体方差相等:≠,即两独立样本资料的总体方差不相等F=,=-1,=-1大全\n实用文档给定一个小概率α作为检验水准,如果与F值相应的P值小于给定的α,拒绝,否则,不拒绝。3.实例:两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量(g)如表5-3所示,问两组动物体重增加量的均数是否相等?先进行方差齐性检验:=,即两种饲料喂养后小白鼠体重增加量的总体方差相同:≠,即两种饲料喂养后小白鼠体重增加量的总体方差不同.05=12,=45.75,=17.659=13,=36.538,=3.269=,F=5.402,=11,=12,查表得≈大全\n实用文档3.34,推出P<0.05,差别有统计学意义,按α=0.05水准,拒绝,接受,认为两组体重增加量的总体方差不等,不不可直接用两独立样本均数t检验。应采用近似t检验(),或采用数据变换,或采用非参数检验。六.补充:u检验根据数理统计的中心极限定理,不论变量X的分布是否服从正态分布,当随机抽样的样本例数足够大,样本均数服从正态分布N(μ,),=为均数标准误。标准正态变量为u==,1.单样本U检验:U=(n较大时)U=()与=1.96,=2.58进行比较2.两大样本均数的比较U=,与=1.96,=2.58进行比较第七章方差分析基础目录:一、方差分析的基本内容P2大全\n实用文档二、完全随机设计的方差分析总变异与自由度的分解P3三、完全随机设计资料方差分析P4四、随机区组设计的方差分析总变异与自由度的分解P6五、随机区组设计的方差分析P7六、析因设计离均差平方和与自由度的分解P9七、析因设计P10八、多个样本均数的两两比较P11九、方差齐性检验P13十、数据变换P14十一、小结P15第七章方差分析基础一、方差分析的基本内容1.基本思想:1.1根据资料的设计类型,即变异的不同来源,将全部观察值总的离均差平方和大全\n实用文档及自由度分解为两个或多个部分,包括:随机误差造成的变异其他因素造成的变异(一个因素一种变异)1.2通过比较不同来源变异的均方(MS),借助F分布做出统计推断,从而了解该因素对观察指标有无影响。1.3其他因素导致的变异“=”或“≠”随机误差造成的变异1.4推断多个总体均数是否有差别(也可用于两个)2.方差分析前提条件:2.1各样本相互独立随机样本2.2均来自正态分布总体:正态性检验D、W或χ2检验2.3各样本总体方差相等,即方差齐性:Bartlettχ2,Levene检验3.选择方差分析时需考虑的6个方面的问题:3.1看反应变量是单变量、双变量还是多变量:单变量3.2看资料属于3种资料类型(计量、计数及等级资料)中的哪一种:计量资料3.3看单样本、两样本或多样本:三组及以上样本选择方差分析,两样本也可用3.4看影响因素是单因素还是多因素:完全随机设计资料是单因素,随机区组设计资料是双因素3.5看是否是配对或配伍设计:是,随机区组设计3.6看是否满足检验方法所需的前提条件,必要时可进行变量变换:对数变换、平方根变换、平方根反正弦变换、倒数变换大全\n实用文档4.统计分析的步骤:正态性检验(第四章,若满足,继续下列操作;不满足,进行数据变换)→方差齐性检验(本章Bartlettχ2,Levene检验,若满足,继续下列操作;不满足,进行轶和检验或...)→分析数据类型,选择方差分析类型(单因素:完全随机设计;双因素:随机区组设计;析因分析:2个或2个以上因素,分析之间有无相互作用)→多个样本均数的两两比较二、完全随机设计的方差分析总变异与自由度的分解1.总变异:为全部测量值大小不同,既包含了处理的效应,又包含了随机误差。可以用离均差平方和(SS,即各测量值Xij与总均数差值的平方和,记为SS总)和总均方MS总表示。2.组间变异:为由于各处理组接受处理的水平不同,各组的样本均数也大小不等,其大小可用各组均数与总均数的离均差平方和表示,记为SS组间。大全\n实用文档1.组内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内,表示随机误差的影响。4.三种“变异”之间的关系:SS总=SS组间+SS组内,且V总=V组间+V组内5.F值:如果,则都为随机误差σ2的估计,F值应接近1。如果不全相等,F值将明显大于1。用F界值(单侧界值)确定P值。大全\n实用文档6.完全随机设计方差分析表:变异来源自由度SSMSF总变异N-1组间g-1组内N-g三、完全随机设计资料方差分析1.前提:单因素(单向)方差分析:同质的观察对象,不加任何条件限制,随机的分配到各处理组中去,每组接受一种处理方法只有一个处理因素,多个水平。2.分析步骤:2.1建立检验假设,确定检验水准α=0.05H0:多个总体均数全相等H1:各总体均数不等或不全相等2.2计算检验统计量:离均差平方和SS:总变异离均差平方和SS总、组间离均差平方和SS组间和组内离均差平方和SS组内;自由度ν:总自由度ν总、组间自由度ν组间和组内自由度ν组内;均方MS:组间均方MS组间和组内均方MS组内;检验统计量为F值。大全\n实用文档2.3确定P值,进行推断:计算出统计量F,求出对应的P值,与α进行比较,确定是否为小概率事件。如是小概率事件,则MS组间=MS组内的可能性不大,则说明组间因素有统计学意义。2.4.注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。若要分析哪些两组间有差别,可进行多个均数间的多重比较。当g=2时,完全随机设计方差分析与成组设计资料的t检验等价,有t=√F。3.应用实例:某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?分组测量值统计量n安慰剂组3.534.594.342.663.593.132.642.563.503.25303.43102.91367.853.304.043.533.563.854.073.523.934.192.961.373.932.332.984.003.552.964.34.162.59降血脂新药302.7281.46233.002.4g组2.423.364.322.342.682.951.563.111.811.771.982.632.862.932.172.722.652.222.902.972.362.562.522.272.983.722.803.574.022.314.8g组2.862.282.392.282.482.283.212.232.322.68302.7080.94225.542.662.322.613.642.583.652.663.682.653.023.482.422.412.663.292.703.042.811.971.687.2g组0.891.061.081.271.631.891.192.172.281.72301.9758.99132.131.981.742.163.372.971.690.942.112.812.52大全\n实用文档1.312.511.881.413.191.922.471.022.103.713.1建立检验假设,确定检验水准α=0.05H0:4个处理组患者的低密度脂蛋白含量总体平均水平相同H1:4个处理组患者的低密度脂蛋白含量总体平均水平不全相同3.2计算检验统计量:3.2.1,=120-1=119大全\n实用文档3.2.2完全随机设计方差分析表:变异来源自由度SSMSFP总变异11982.10组间332.1610.7224.93<0.01组内11649.940.433.3确定P值,进行推断:按α=0.05水准,拒绝H0,接受H1,认为4个试验组LDL-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差别。四、随机区组设计的方差分析总变异与自由度的分解1.总变异:所有观察值之间的变异SS总=SS处理+SS区组+SS误差Ν总=ν处理+ν区组+ν误差2.处理间变异:处理因素+随机效应3.区组间变异:区组因素+随机效应4.误差变异:随机效应五、随机区组设计的方差分析大全\n实用文档1.前提:又称为配伍组设计,是配对设计的扩展,也可看成是1:m匹配设计。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程、动物窝别等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。是双因素设计的方差分析。2.分析步骤:2.1建立检验假设,确定检验标准处理组间:H0:k个处理组总体均数相等H1:k个处理组总体均数不全相等α=0.05区组间:H0:b个区组总体均数相等H1:b个区组总体均数不全相等α=0.052.2计算检验统计量计算出离均差平方和、自由度ν、均方和F值。大全\n实用文档2.3用F值进行统计推断,得到P值2.4注意:当组数为2时,随机区组设计资料的方差分析与配对设计资料的t检验等价,有t=√F。1.应用实例:某厂10名氟作业工人24小时内不同时间尿氟排出如下表。试分析氟作业工人在工前、工中(上班第4小时)和工后(下班后第4小时)的尿氟排出量(ml/L)的差别有无统计学意义?工人编号工前工中工后11.722.701.6621.683.161.2631.423.211.3042.352.173.0051.952.753.7260.872.391.2371.412.633.85大全\n实用文档82.032.401.9391.672.302.07101.141.471.143.1建立检验假设,确定检验水准α=0.05H0:不同时间的尿氟排出量的均数相同。 H1:不同时间的尿氟排出量的均数不全相同。3.2计算检验统计量:3.2.1-130.54SS处理==134.55-130.54=4.01-130.54SS区组==6.19SS误差=SS总-SS处理-SS区组=17.75-4.01-6.19=7.55MS处理=4.01/2=2.005MS区组=6.19/9=0.688MS误差=7.55/18=0.419F1=2.005/0.419=4.785F2=0.688/0.419=1.642大全\n实用文档3.2.2随机区组设计方差分析表变异来源SSdfMSFP总变异17.7529处理组间变异4.0122.0054.7850.022区组间变异6.1990.6881.6420.177误差7.55180.4193.3用F值进行统计推断,得到P值查表,得F0.05(2,18)=3.55F0.01(2,18)=6.01F0.05(9,18)=2.46F0.01(9,18)=3.60处理组按α=0.05水准,拒绝H0,可以认为处理组间的变异有统计学意义,则3个总体均数中至少有两个不同。至于3个总体均数中哪些不同,需要用多个均数间的两两比较方法。区组不拒绝H0,既不能认为10个区组的总体均数不同。六、析因设计离均差平方和与自由度的分解1.表示符号:两个处理因素:A、BA、B因素各有a、b个水平,共有a×b种组合每一组合下有n个受试对象全部实验受试对象总数为a×b×ni(i=1,2…,α)表示因素A的水平号,j(j=1,2,…,b)表示因素B的水平号,k(k=1,2,…,n)表示在每一组合下的受试对象号大全\n实用文档2.总变异:3.处理因素A的变异4.处理因素B的变异5.A与B交互作用的变异6.误差变异六、析因设计1.前提:是将两个或多个实验因素的各水平进行全面组合,对各种组合都进行实验,从而探讨各实验因素的单独效应(simpleeffect)、主效应(maineffect)以及各因素间的交互效应(interactioneffect)。2.特点:2.1有2个或以上(处理)因素(factor)(分类变量)2.2每个因素有2个或以上水平(level)2.3每一组合涉及全部因素,每一因素只有一个水平参与2.4几个因素的组合中至少有2个或以上的观察值2.5观测值为定量数据(需满足随机、独立、正态、等ANOVA条件)3.分析步骤:3.1建立检验假设,确定检验水准α=0.05处理因素A的假设:处理因素B的假设:处理因素间交互作用的假设:3.2计算检验统计量F:离均差平方和与自由度3.3确定P值并作出推断大全\n实用文档3.应用实例:4.1建立检验假设,确定检验水准对于因素A:H0:不同保存时间对人血清皮质醇的测定值无影响H1:不同保存时间对人血清皮质醇的测定值有影响对于因素B:H0:不同温度对人血清皮质醇的测定值无影响H1:不同温度对人血清皮质醇的测定值有影响对于交互作用AB:H0:因素A和因素B无交互效应H1:因素A和因素B有交互效应4.2计算检验统计量F4.3确定P值,作出统计推断本例A因素主效应的P<0.01,拒绝H0,有统计学意义,可以认为不同保存时间对人血清皮质醇的测定结果有影响;B因素主效应的P<0.01,拒绝H0,有统计学意义,可以认为不同温度对测定结果有影响。A´B交互效应的P>0.05,按α=0.05水准,不拒绝H0,即不能认为两个因素间存在交互效应。大全\n实用文档八、多个样本均数的两两比较探索性:在研究设计阶段未预料到,经假设检验得出多个总体均数不全等的提示后才决定的多个均数的两两事后比较。往往涉及到每两个均数的比较。可采用SNK(Students-Newman-Keuls)法、bonfferonit检验验证性:在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较。常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较。可采用Dunnett-t检验、LSD-t检验,也可用bonfferonit检验。1.SNK-q检验:1.1计算公式:ν=ν误差式中,和,为两对比组的样本均数和样本例数1.2应用实例:大全\n实用文档某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物,以肉瘤的重量为指标,试验结果见表。问三种不同的药物的抑瘤效果有无差别?表不同药物作用后小白鼠肉瘤重量(g)区组A药B药C药10.820.650.511.9820.730.540.231.5030.430.340.281.0540.410.210.310.9350.680.430.241.353.072.171.576.810.6140.4340.3140.4542.02071.05870.54513.62451.2.1建立检验假设,确定检验水准α=0.05H0:μA=μB,即任两对比较组的总体均数相等H1:μA≠μB,即任两对比较组的总体均数不相等1.2.2将三个样本均数由小到大排列,并编组次:大全\n实用文档均数0.3140.4340.614组别C药B药A药组次123列出对比组,并计算两对比组的均数之差,写出两对比组包含的组数a。已知ν=8和a,查附表的q界值,得出相应的q界值。以实际的q值和相应的q界值作比较,确定对应的P值。例题中已求得=0.0096,。各组例数均为5,有1.2.3确定P值,作出统计推断:SNK检验计算表对比组次aP(1)(2)(3)(4)(5)(6)(7)1,20.1222.743.264.75>0.051,31.3036.854.045.64<0.012,30.1824.113.264.75<0.05结论:可认为A药和B药、C药的抑瘤效果有差别,还不能认为B药和C药的抑瘤效果有差别。1.Dunnett-t检验:适用于k-1个实验组与一个对照组均数差别的多重比较。大全\n实用文档1.Bonferroni法:对检验水准进行校正的方法,适用于所有的两两比较,例如:2.LSD-t检验:即最小显著差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间(组间)的比较。实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息。因此,它敏感度最高。5.注意:多重比较不能用两样本均数比较的t检验!若用两样本均数比较的t检验进行多重比较,将会加大犯Ⅰ类错误(把本无差别的两个总体均数判为有差别)的概率。九、方差齐性检验1.概述:方差分析的前提条件之一是各组总体方差相等(即方差齐)。因而在方差分析之前,需要进行方差齐性检验,通常采用Bartlett检验和Levene检验来进行多个总体的方差齐性检验。Bartlett检验对资料的正态性要求严格Levene检验适用于任意分布的两组或多组资料。2.Bartlett检验法:H0:各总体方差齐同,H1:各总体方差不齐。大全\n实用文档;式中k为组数,为各组例数,N为总例数,为各组方差。统计量服从以k-1为自由度的分布。若P值较小,则拒绝H0,尚不能认为方差满足齐同要求;可认为方差不齐。3.Levene检验法:将原样本观察值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其检验结果用于判断方差是否齐性。,,2因为levene检验对原数据是否为正态不灵敏,所以比较稳健。目前均推荐采用LEVENE方差齐性检验十、数据变换1.概述:对于明显偏离正态性或方差齐性条件的资料,通常有两种处理方式:一是通过某种形式的数据变换(datatransformations),二是改用秩变换(nonparametricstatistics)的非参数统计方法。数据变换应保证各组资料大全\n实用文档间的对比关系不变,而变换后的资料分布满足参数检验条件,其缺点是分析结果的解释欠直观。2.对数变换:适用于对数正态分布资料;标准差与均数成比例,或变异系数接近甚至等于某一常数的资料。3.平方根变换:适用于方差与均数成比例的资料,如泊松分布的计数资料。4.平方根反正弦变换:适用于百分比资料。5.倒数变换:适用于两端波动较大的资料。y=1/X十一、小结1.三个或三个以上均数间的比较可以采用方差分析,以检验多个平均值是否来自相同总体;其实也可用于两个均数间的比较,此时结果与t检验完全等价。2.方差分析的基本思想:即将处理间平均变异与误差平均变异比较。就完全随机设计的资料而言,将全部观测值总的离均差平方和及其自由度分解为组间变异和组内变异两个部分。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论处理因素对试验结果有无影响。3.注意:不可用多次比较的t检验取代方差分析的原因:3.1t检验仅用在单因素两水平设计的定量资料的均值检验场合.大全\n实用文档而方差分析可用在单因素k(k≥3)个水平和多因素设计的定量资料的均值检验场合。3.2用t检验与方差分析处理资料的区别比较内容t检验方差分析资料的利用率低:每次仅用两组高:每次要用全部数据对原实验设计的影响残:割裂了整体设计全:与原实验设计相呼应犯假阳性错误的概率大:1-(1-0.05)6=0.265小:0.05结论的可靠性低:统计量的自由度小高:统计量的自由度大3.3三组或三个组以上设计的完全随机设计均数进行比较时一定不可用t检验!大全

相关文档