- 250.46 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
医学统计学医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。样本:从总体中随机抽取部分个体的某个变量值的集合。总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。概率:频率所稳定的常数称为概率。统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。2.样本特点:足够的样本含量、可靠性、代表性。3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。包括二分类资料和多分类资料。二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。1精品学习资料可选择pdf第1页,共22页-----------------------\n医学统计学第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。4.实验设计方法有析因设计正交试验设计均匀试验设计交互作用两组:异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展多组:单因素多水平配伍组设计拉丁方设计(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计:用于三因素等水平无交互。第三章定量资料的统计描述、参考值范围1.频数表编制过程(了解)(1)找出样本数据的最大值和最小值,计算极差R;(2)分组:确定分组的组距d和组数k;一般n<50,5-6组;n在100左右,7-10组;n>100,10-15组(3)求频率密度:统计频数,算出频率、频率密度和累积频率;(4)画出直方图。2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。2精品学习资料可选择pdf第2页,共22页-----------------------\n医学统计学3.集中趋势、离散趋势的指标及适用范围(1)集中趋势:x,G,M,Px,M0算术均数:适用于对称分布;不适用于偏态分布和资料中出现极值的资料。几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。不适用与观察值中有0或正负数值同时出现的资料。中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;用于确定医学参考值范围(偏态或分布不明的资料)。众数:适用于大样本,较粗糙。(2)离散趋势:极差:优点:简单明了、容易使用。缺点:①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。②样本容量越大,极差可能越大。③极差的抽样误差大,不稳定。四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。缺点:类似于极差,利用度低。方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。变异系数:适用于:①适用于比较度量衡单位不同资料的变异度。②比较均数相差悬殊的资料的变异度。③衡量实验精密度和稳定性的常用指标。(3)频数分布特征高峰在中间,左右大致对称,称为对称分布。平均数=中位数=众数高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。平均数>中位数>众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。平均数<中位数<众数对称分布正(右)偏态分布负(左)偏态分布3精品学习资料可选择pdf第3页,共22页-----------------------\n医学统计学4.正态分布图形的特点及意义(1)特点:①f(x)关于x=μ对称②x=μ时取得最大值③在x=μ±σ处为拐点,且以x轴为水平渐近线④f(x)大于0⑤P(x=a)=0⑥若f(x)在点x处连续,则F′(x)=f(x)(2)意义:f(x)=1,f(x)在负无穷到正无穷的积分值为1,即曲线下方面积为1。25.μ和σ的意义μ:位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动。2σ:形状参数,当μ固定时,σ越大,曲线越矮胖;σ越小,曲线越高瘦。6.标准化变换xμ2z=x~N(μ,σ)z~N(0,1)σxμxμF(x)=Ф()=Ф(z)即P(X≤x)=Ф()=P(Z≤z)σσbμaμaμx-μbμaμbμP(azα)=222单侧界值:上限:下限:P(z>zα)=αP(z>z1-α)=1-αP(z50)z分布s单侧:xz即xzsxn(4)两要素:准确度:由1-α决定,1-α越大,准确度越高。精确度:由区间长度决定。99%置信区间准确度高于95%置信区间。95%置信区间精确度更高。3.抽样分布(1)t分布①定义:来自正态总体的一组样本,x和s分别是样本的均数和标准差。则t=x~s/nt分布,自由度df=n-1,极限分布是标准正态分布。②图形分布特征:以0为中心,左右对称的单峰分布。自由度越大,越高瘦6精品学习资料可选择pdf第6页,共22页-----------------------\n医学统计学③界值:双侧:αP(|t|≤tα)=1-αP(ttα)=222单侧:上限:下限:P(ttα)=αP(t>t1-α)=1-α2(2)χ分布①定义:若从均数为μ,标准差σ的正态总体中,每次抽取样本含量为n的样本,计算2222样本标准差s,则χ=(n-1)s/σ服从自由度df=n-1的χ分布。②图形分布特征:曲线偏向左边自由度越小曲线越偏③界值:双侧:222α2x1αP(x>xα)=P(x>2)=1-222222α2x1αP(xxα)=αP(x>x1-α)=1-α2222P(xFα)=P(F>F)=1-22122ααP(FFα)=αP(F>F1-α)=1-αP(Fα,则接受H0,拒绝H1;若P<α,则拒绝H0,接受H1。8精品学习资料可选择pdf第8页,共22页-----------------------\n医学统计学(3)检验方法:正态性检验、方差齐性检验、t检验(4)两类错误实际情况判断接受H0拒绝H0H0正确正确1-α第一类错误αH0不正确第二类错误β正确1-β①第一类错误又称弃真错误、假阳性错误,第二类错误又称取伪错误、假阴性错误。②P≤α时,拒绝H0,可能犯Ⅰ类错误(α)。此时,P值越小,犯Ⅰ类错误的概率越小,结论越可靠。③P>α时,接受H0,可能犯Ⅱ类错误(β)。此时,虽然β未知,但P值越大,犯Ⅱ类错误的概率越小,结论越可靠。④减少(增加)I型错误,将会增加(减少)II型错误⑤增大n,可以同时降低两类错误。第五章方差分析1.方差分析基本思想目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值间是否存在显著性差异。基本思想:根据离差来源的不同,将总离差平方和分解为两部分:由试验的随机因素(误差)引起的组内离差,由因素的作用(即处理水平不同)引起的组间离差。总离差平方和=组内离差平方和+组间离差平方和(SST=SSE+SSA)2.方差分析单因素方差分析、配伍组设计方差分析、析因设计方差分析拉丁方设计方差分析、正交设计方差分析交叉设计方差分析、组内分组设计方差分析9精品学习资料可选择pdf第9页,共22页-----------------------\n医学统计学第六章双变量相关与回归1.散点图特征正相关完全正相关负相关完全负相关不相关2.相关系数意义及分类(1)意义:①相关系数r的大小反映随机变量X和Y之间线性关系的密切程度:若r=0,则X与Y不相关;若|r|=1,则X与Y完全相关。②相关系数r的符号反映随机变量X和Y之间线性关系的相关方向:若0α,接受H0,服从正态;sig<α,接受H1,不服从正态。2.方差齐性检验(1)目的:利用样本信息推断总体方差是否相等(2)前提:正态分布(3)过程:2222①建立假设:假设H0:=即方差齐;H1:≠。α1212222/②计算统计量:Fs11=s1df2221=n1-1df2=n2-1/s22s2③P值:Fα,接受H0F>Fα(df1,df2)则P<α,拒绝H0(4)SPSS结果:sig>α,接受H0,满足方差齐性;sig<α,接受H1,不满足方差齐性。3.单样本t检验(1)目的:推断一组样本代表的总体均数与已知总体均数间的差异。(2)前提:①单组设计②计量资料(非分类)③资料服从正态分布(3)过程:①建立假设:假设H0:μ=μ0;H1:μ≠μ0。αxx②计算统计量:z或t=/ns/n③P值:zα,接受H0z>zαdf1,则P<α,拒绝H0(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。14精品学习资料可选择pdf第14页,共22页-----------------------\n医学统计学4.配对t检验(1)目的:推断两组样本代表的总体均数的差值是否为零。(2)前提:①配对设计②计量资料(非分类)③差值服从正态分布(3)过程:①建立假设:假设H0:μd=0;H1:μd≠0。αd②计算统计量:t=df=n-1s/nd③P值:tα,接受H0,t>tαdf1,则P<α,拒绝H0tα,接受H0,t>tdf1,则P<α,拒绝H022(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。5.成组t检验(1)目的:推断两组样本代表的总体均数是否有显著性差异。(2)前提:①完全随机成组设计;②计量资料(非分类);③独立性;④正态性;⑤方差齐性。(3)过程:①方差齐性检验②建立假设:假设H0:μ1=μ2;H1:μ1≠μ2(或μ1>μ2,μ1<μ2)。α③计算统计量:t或t′(方差不齐)df=n1+n2-2④P值:tα,接受H0,t>tα(df1,df2),则P<α,拒绝H0tα,接受H0,t>t(df1,df2),则P<α,拒绝H022(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。15精品学习资料可选择pdf第15页,共22页-----------------------\n医学统计学6.单因素方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:①完全随机多组设计;②计量资料(非分类);③独立性;④正态性;⑤方差齐性。(3)过程:①正态性检验和方差齐性检验②建立假设:假设H0:μ1=μ2=⋯=μn;H1:μ1、μ2、⋯、μn不全相等或全不相等。α③计算统计量:④P值:P>α,接受H0,P<α,拒绝H0(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。方差分析表:变异离差平自由度均方F值P值来源方和F>Fα组间SSAK-1MSA=SSA/(k-1)(k-1,N-k),F=MSA/MSE组内SSEN-kMSE=SSE/(N-k)P<α总和SSTN-1(5)注意:组内变异:随机误差组间变异:随机误差+处理因素若H0成立:组内变异≈组间变异若H1成立:组内变异<组间变异7.配伍设计的方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异。16精品学习资料可选择pdf第16页,共22页-----------------------\n医学统计学(2)前提:①完全随机多组设计;②计量资料(非分类);③独立性;④每个因素的各水平正态性;⑤每个因素的各水平方差齐性。(3)模型设计:双因素且无交互作用:处理因素——重要实验因素配伍因素——主要非处理因素SS总=SS处理+SS配伍+SS误差(3)过程:①正态性检验和方差齐性检验②建立假设:处理组:假设H0:μ1=μ2=⋯=μn;H1:μ1、μ2、⋯、μn不全相等或全不相等。配伍组:假设H0:μ1=μ2=⋯=μn;H1:μ1、μ2、⋯、μn不全相等或全不相等。α③计算统计量:④P值:P>α,接受H0,P<α,拒绝H0(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。方差分析表变异来离差自由度均方F值P值源平方和处理因FA=SSAK-1MSA=SSA/(k-1)素AMSA/MSE配伍因FB=SSBB-1MSB=SSB/(b-1)素BMSB/MSE误差SSE(k-1)(b-1)MSE=SSE/(k-1)(b-1)Fα(k-1,(k-1)(b-1))总和SSTKb-1Fα(b-1,(k-1)(b-1))17精品学习资料可选择pdf第17页,共22页-----------------------\n医学统计学8.析因设计的方差分析(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:①完全随机多组设计;②计量资料(非分类);③独立性;④每个因素的各水平正态性;⑤每个因素的各水平方差齐性。(3)过程:①正态性检验和方差齐性检验②建立假设:因素A:假设H0:μ1=μ2=⋯=μn;H1:μ1、μ2、⋯、μn不全相等或全不相等。因素B:假设H0:μ1=μ2=⋯=μn;H1:μ1、μ2、⋯、μn不全相等或全不相等。交互作用:假设H0:μ1=μ2=⋯=μn;H1:μ1、μ2、⋯、μn不全相等或全不相等。α③计算统计量:④P值:P>α,接受H0,P<α,拒绝H0(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。方差分析表离差变异来源自由度均方F值P值平方和因素ASSAR-1MSAFA因素BSSBS-1MSBFBABSSA×B(r-1)(s-1)MSA×BFA×B误差SSErs(l-1)MSEFα(r-1,rs(l-1))总和SSTRsl-1Fα(s-1,rs(l-1))Fα((r-1)(s-1),rs(l-1))18精品学习资料可选择pdf第18页,共22页-----------------------\n医学统计学9.线性相关分析(1)目的:分析两变量间是否有直线相关关系(2)前提:x、y必须都是随机变量(3)过程:①计算样本相关系数r的大小lxy(xx)(yy)xynxyr===df=n-222(xx)(yy)(n)1lxxlxysxsy将r与界值表界值比较:当|r|>rα时,P<α,拒绝H0,认为有直线相关关系。当|r|α,接受H0,认为没有直线相关关系。②根据r,df=n-2检验ρ是否为0假设H0:总体相关系数ρ=0,即无关系;H1:总体相关系数ρ≠0,即有关系。α③结合专业知识评价相关分析是否有价值P值:P>α,接受H0,P<α,拒绝H0,P<α,拒绝H0(4)SPSS结果:sig>α,接受H0,无直线相关关系;sig<α,接受H1,有直线相关关系。10.线性回归分析(1)目的:就是寻找出具有相关关系变量之间的函数关系,并进行统计推断。(2)前提:y必须是随机变量(3)过程:①计算反映两个变量依赖关系的直线回归方程,即计算方程的截距a,斜率b。y?abx意义:x每增加1,y增加a+bxn(xix)(yiy)?i1a?ybxbn2(xix)i1②根据截距a,斜率b,检验样本所抽自的总体截距α是否为0,总体斜率β是否为0。做法1:直接查相关系数的临界值表rn2做法2:费舍尔t检验法:tdf=n-221r19精品学习资料可选择pdf第19页,共22页-----------------------\n医学统计学做法3:F检验假设H0:β=0,即无回归关系;H1:β≠0,即有回归关系。αSS回/df回F=df=n-1SS剩/df剩③结合专业知识,评价此直线回归方程是否有实用价值。Fα,接受H0,无回归关系F>Fαdf,则P<α,拒绝H0,有回归关系(4)SPSS结果:sig>α,接受H0,无直线回归关系;sig<α,接受H1,有直线回归关系。211.列联表Χ检验(1)目的:①推断两个或多个总体率或构成比之间的差异;②分析行列两种属性或两个变量之间有无关联性(相关分析);③频数分布的拟合优度检验。(2)前提:小样本,非二项分布(3)过程:①建立假设:H0:总体率或构成比无显著性差异(行列变量独立或无相关性)H1:总体率或构成比有显著性差异(行列变量不独立或有相关性),α2②计算最小理论频数Tij,并计算Χ。22A一般公式:N()1df=(r-1)×(c-1)nrnc四格表公式:(最小理论频数:T)222n(adbc)基本公式:n≥40且T≥5(AT)/T(ab)(cd)(ac)(bd)n2n(|adbc|)222校正公式:n≥40且1≤T≤5(|AT|)5.0/T(ab)(cd)(ac)(bd)特殊公式:n<40,T<1四格表确切概率法(Fisher)2222③P值:若χα,接受H0,若χ>df则P<α,接受H1。(4)SPSS结果:先看最小理论频数值范围,再看sig,sig>α,接受H0,总体率或构成比无显著性差异;sig<α,接受H1,总体率或构成比有显著性差异。20精品学习资料可选择pdf第20页,共22页-----------------------\n医学统计学12.拉丁方设计方差分析三因素、等水平、无交互的设计。拉丁字母—处理因素,行、列—区组因素、序列因素。13.正交设计方差分析(1)正交性:设{A,B}分别是两个n阶拉丁方,记为{aij},{bij}(i,j=1,2,⋯,n)。2若n个有序对{(aij,bij)}都是不同的,则称拉丁方A与B是正交的。(2)特点:①均衡性:同一列中各水平的重复次数相同。②正交性:任两列之间各水平搭配均衡。(3)表头设计:4记号含义:以L9(3)为例:L:表示正交表9:表示行数,即试验次数3:表示因素的水平数;4:表示列数,即至多安排的因素个数。(4)一般步骤:①明确试验目的、选定试验指标②确定试验的因素、水平③选用适当的正交表、作表头设计④进行试验、取得数据⑤分析数据、得出结论14.McNemar检验与Kappa检验(1)适用范围:方表资料(由行列变量属性相同的配对设计得到的配对四格表)两组行列变量检测结果不一致时(副对角线,上下三角元素的差异)进行差异性检验,2选择McNemar检验或χ检验。两组行列变量检测结果一致时(主对角线元素差异)进行一致性检验,选择Kapp检验。(2)McNemar检验建立假设H0:Xij≈Xji,即来自同一试验总体(两法检验结果相同)H1:Xij≠Xji,即来自不同试验总体(两法检验结果不同)检验结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。21精品学习资料可选择pdf第21页,共22页-----------------------\n医学统计学(3)Kappa检验用于检验两因素评估结果的实际一致率与随机一致率(理论一致率)是否有差异。建立假设:H0:两结果检测不一致Kappa=0H1:两结果检测一致Kappa=1检验结果:Kappa越接近于1(大于0.75),一致度越好;越接近于0(小于0.4),一致度越差;Kappa为负,表示相反;等于-1,表示完全不一致。15.秩和检验(1)符号秩和检验:用于配对计量资料时,将配对差值的中位数与0比较。亦可用于样本中位数与总体中位数的比较。(2)成组秩和检验:基本思想:先假设样本含量分别为n1、n2的两样本来的总体位置相同,如H0成立,每个数据排在两个组内是随机的,较小样本含量组的秩和T与平均秩和【n1(N+1)/2】一般相差不大。若相差悬殊,表示取得的现在样本统计量T值的概率P很小,因而拒绝H0;反之,则不能拒绝H1。(3)多组秩和检验:常用于不满足参数检验条件的完全随机设计两样本或多样本比较,也可推断双向有序资料的相关性。(4)配伍秩和检验:常用于配伍设计连续型资料的比较。22精品学习资料可选择pdf第22页,共22页-----------------------