- 34.50 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
一、统计表的结构与注意事项基本要求:简明扼要,重点突出,内容安排合理,主次分明,条理清楚,数据准确、可靠。基本结构:一般由标题、标目、线条、数字、备注5个部分组成。(1)标题:高度概括表的中心内容,列在表的上端中央;(2)标目:有单位的标目要注明单位,横标目在表左侧,“主语”,纵标目在表上端,“谓语”;(3)线条:三线格形式(顶线、底线及隔开纵标目与数字的横线),禁用斜线和竖线;(4)数字:使用阿拉伯数字,位数对齐,小数点位数一致,不要留空项,无数字用“—”表示,缺失数字用“¼”表示,数值为0者记为“0”;(5)备注:不列入表内,用“*”标出,写在统计表下方。二、二项分布应用条件(1)每次试验结果只能是两个互斥的结果之一,属于二项分类资料;(2)每次试验中,某事件发生的概率不变,均为π;(3)各次试验相互独立,即任何一个事件的是否出现不影响其他事件出现的概率。特征——图形特征以x为横坐标,P(x)为纵坐标,可绘出二项分布图形。二项分布的形状取决于π与n的大小。高峰在u=nπ处或附近;当π≈0.5时,分布是对称的;当π≠0.5时,分布是偏的,且对于同一n,π离0.5越远,对称性越差。对于同一π,随着π的增大,分布趋于对称。当n足够大,只要π或1-π不太小,[特别是当np且n(1-p)均大于5],二项分布趋于对称。三、Poisson分布特征——图形以X为横坐标,Poisson分布的概率P(X)为纵坐标,可绘出Poisson分布的图形。Poisson分布的形状取决于λ的大小,λ值愈小分布愈偏,随着λ的增大,分布愈趋于对称,当λ=20时,分布接近正态分布,当λ=50时,可认为Poisson分布呈正态分布N(λ,λ)。特征——均数与方差相等,λ=u=σ2,特征——可加性四、正态分布特征(1)曲线在x轴的上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=μ对称;(3)曲线在x=μ处达到峰值(最高点),f(x)取最大值;(4)正态分布的X取值范围理论上没有边界,X离μ越远,f(X)值越接近0,但不会等于0;(5)正态分布有两个参数:均数μ是位置参数,决定正态曲线的中心位置,σ是形状参数,决定正态曲线的陡峭或扁平程度,σ越大曲线越扁平,σ越小曲线越陡峭;(6)正态分布曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒等于1,对称区域面积相等。五、t分布性质(1)t分布曲线是一簇曲线。当自由度不同时,曲线的形状不同。(2)当ν→∞时,t分布趋近于标准正态分布;ν较小时,t分布与标准正态分布差异较大。(3)分布的高峰位置比u分布低,尾部高。用途总体均数的区间估计;⒉样本均数与总体均数的比较;两样本均数的比较。适用条件\n当样本含量较小时,要求样本取自正态分布总体;做两样本均数比较时,还要求两总体方差相等。一、假设检验的注意事项(1)保证组间的可比性:严密的实验设计,样本从同质总体中随机抽取;(2)根据研究目的、设计和资料类型选用恰当的检验方法;(3)正确理解差别有无统计学意义和实际意义的区别;(4)结论不能绝对化:当P接近检验水准a时,下结论要慎重(5)单侧和双侧检验选用单侧检验的条件是在研究开始之前,表明不会出现mm0)的情况。若没有这方面的依据,一般选用双侧检验。(6)u检验和t检验理论上要求样本来自正态分布总体,还要注意方差齐性。二、t检验三、应用:用于两均数比较的假设检验;资料要求:(1)资料随机取自正态总体;(2)两总体方差齐性(相等)。除上述条件外,u检验还要求:样本含量比较大(如n>100),或n虽小但σ已知。方差分析基本思想根据实验设计的类型及研究目的,将全部观察值之间所表现出来的总变异,分解为两个或多个部分。除随机误差/实验误差作用外,其余每个部分的变异均可由某个因素的作用加以解释。通过比较不同变异来源的均方(MS),借助F分布做出统计推断,从而推断研究因素对试验结果有无影响。应用条件独立正态性方差齐性各样本是相互独立的随机样本,且来自正态分布的总体;相互比较的各样本的总体方差相等,即具有方差齐性。优点不受比较组数的限制,可比较多组均数;可同时分析多个因素的作用;可分析因素间的交互作用。完全随机设计与随机区组设计的区别完全随机设计将全部试验对象按随机化的方法分配到各个处理组中;各组样本含量可以相等也可以不等;单因素方差分析,只有一个研究因素;总变异分解为组间变异(处理间变异)和组内变异(误差)。随机区组设计将受试对象按性质相同或相近者组成区组,每个区组的对象随机分配到各个处理组中;各处理组样本含量相等;两因素方差分析,指主要的研究因素和区组因素;总变异分解为处理间(因素)变异、区组间(配伍组)变异及误差三部分;总变异中分离出配伍组变异,考虑了个体变异的影响,使误差更能反映随机误差的大小,提高了研究效率。四、卡方检验的基本思想在假设H0(两或多样本频率分布相等)成立的条件下,用两或多样本的联合计算的频率分布作为总体分布的近似,以此计算出各组别的理论频数,如果H0成立,当观察个数较大时,样本观察频数与理论频数应该相差不大,χ2值即表示观察值与理论值之间的偏离程度。根据χ2分布可确定在H0成立的情况下获得当前统计量的概率P。如果P值很小,说明H0成立可能性小,应拒绝H0,表示比较资料之间有显穿差异;否则就不拒绝H0,尚不能认为校样所代表的实际情况和理论假如有差别。五、直线相关与回归区别:(1)直线相关的两个变量都需服从正态分布,而直线回归中Y必须服从正态分布,X不一定;(2)相关表示相互关系(双向),回归表示数量依存关系(单向)。联系(1)同一样本r与b的正负号是一致的;\n(2)同一样本r与b的假设检验是等价的;(3)相关回归可互相解释:r2决定系数。一、多重线性回归与logistic回归多重线性回归前提条件1.线性2.独立3.正态4.等方差性最小二乘法原理整个模型的检验-------方差分析;回归系数的检验-------t检验自变量筛选的常用方法:所有可能自变量子集选择;向前选择法;向后剔除法;逐步选择法检验统计量为:F统计量。logistic回归前提条件1.应变量为分类变量2.各观察对象间是相互独立的3.logitP与自变量的关系是线性关系最大似然法原理整个模型的检验-------似然比检验;回归系数的检验-------Wald检验自变量筛选的常用方法:前进法;后退法;逐步向前法;逐步向后法检验统计量为:似然比统计量G,Wald统计量等。二、应用相对数时的注意事项1.理解相对数的含义不可望文生义,特别注意区分频率型指标和强度型指标。2.计算相对数时,分母不宜过小,即应有足够例数。3.对观察单位数不等的几个率,不能直接相加求其平均率。4.资料的对比应注意可比性:即除了研究因素外,其余的重要影响因素应相同或相近。5.对比不同时期资料时,应注意客观条件是否有变化。6.对样本率(或构成比)的比较应遵循随机抽样,要做假设检验(统计推断)。三、假设检验基本思想利用小概率反证法思想,从问题的对立面(H0)A=B出发,间接判断要解决的问题(H1)A≠B是否成立。在H0成立的条件下计算检验统计量,最后获得P值来判断。当P≤α,是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果发生了,则有理由怀疑原假设H0,认为其对立面H1成立。一般步骤(1)建立假设,确定检验水准aH0:(无效假设)总体参数相等;H1:(备择假设)总体参数不等。通常a=0.05(2)选定检验方法和计算检验统计量如:u、t、F、X2等(3)确定P值,作出推断结论四、二类错误概率假设检验中P:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。I型错误,指拒绝了实际上成立的H0,这类“弃真”的错误称为~,其概率大小用α表示;II型错误,指接受了实际上不成立的H0,这类“存伪”的错误称为~,其概率大小用β表示。检验效能:1-β,它是指当两总体确有差别,按规定的检验水准所能发现该差异的能力。检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时,犯错误的概率称为~,记为α。五、非参数检验适用资料:1.总体分布为偏态或分布形式未知2.等级资料3.个别数据偏大或数据的某一端无确定的数值4.各总体方差不齐优点:不受总体分布的限定,适用范围广缺点:符合作参数检验的资料,如用非参数检验,检验效率低于参数检验。一般犯第二类错误概率β比参数检验大。六、相关分析的注意事项1.线性相关表示两个变量之间的关系是双向的,当散点图出现直线趋势时,再作分析。2.相关系数的计算只适用于两个变量都服从正态分布的资料。\n3.样本相关系数是总体相关系数的一个估计值,与ρ之间存在着抽样误差,必须作假设检验。4.相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系。5.出现异常值时慎用相关。6.分层资料盲目合并易出假象。一、直线回归的注意事项(1)作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种观象间的内在联系有所认识。(2)作回归分析时,一般以“因”的变量为X,以“果”的变量为Y。若变量之间无因果关系,则以容易测定、较稳定或变异较小者为X。(3)应变量是随机变量。自变量也是随机变量时,两者均应服从正态分布;自变量为给定的量时,与每个X取值相对应的变量Y必须服从正态分布。(4)回归方程只有经过检验拒绝了无效假设后才有意义。(5)回归方程的适用范围有其限度,一般仅适用于自变量X的原数据范围内,而不能任意外推。(6)在进行直线回归分析之前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作直线回归分析,如散点图明显呈曲线趋势,使之直线化再行分析。 应用:(1)描述两变量间的依存关系;(2)利用回归方程进行预测和统计控制。十八、制定医学参考值范围的基本原则:(1)抽取样本含量足够大的正常人;(2)对抽取的正常人进行准确统一的测定,控制测量误差;(3)判断是否需要分组指定参考值范围;(4)决定参考值范围的单侧或双侧界值;(5)选择适当的百分界值。(6)根据资料分布类型选择恰当方法估计参考值范围十九、生存分析中出现截尾值(产生删失数据)的原因:(1)失访;(2)到研究结束时终点事件仍未发生;(3)研究对象因研究以外的其他原因死亡,如车祸等意外或与研究无关的疾病等。二十、医学统计学方法的基本步骤:(1)设计:统计工作中最关键的一环。(2)收集资料:主要有四个来源:统计报表;登记和报告卡(单);日常医疗卫生工作记录;专题调查或实验。(3)整理资料(4)分析资料:统计描述;统计推断。二十一、标准误的应用:(1)反映样本均数的可靠性以及抽样误差的大小标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差;反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。(2)估计总体均数的置信区间;(3)用于均数的假设检验。二十二、率标准化的意义:采用统一的标准,对内部构成不同的各组频率进行调整和对比,消除资料内部构成不同的影响,使资料在统一标准下具有可比性,避免错误结论。二十三、生存分析中用到的统计量及其定义