• 371.86 KB
  • 2022-09-01 发布

《医学统计学总结》ppt课件

  • 49页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
医学统计学总结\n统计学的任务结合专业知识和具体要求进行统计研究设计按照设计要求收集和整理资料对所收集的资料进行统计处理对统计处理的结果进行分析和解释\n统计结果是否可靠取决于 以下几个方面调查或实验设计是否周密完善,是否按设计要求实施所选用的指标是否特异性和客观性强,灵敏度和精确度高数据是否真实可靠,样本含量是否足够大所选用的统计方法是否妥当结果解释是否正确\n选择统计分析方法流程研究目的设计类型资料类型统计分析目的病例分析疗效分析寻找病因关系探讨调查研究:横断面研究回顾性研究前瞻性研究实验研究:完全随机设计随机区组设计定量资料定性资料等级资料统计描述:统计表统计图统计指标统计推断:参数估计假设检验\n统计分析方法运算报告见后手工运算统计软件:SASSPSS统计结论专业结论\n医学统计学学习要点统计学的基本概念和思维逻辑各种统计方法适用于什么资料,对于资料所要求的条件根据资料的性质和分析要求,应选用什么统计方法如何组织数据,输入数据,建立数据文件如何运用计算工具或软件进行统计计算如何阅读软件的输出结果,选择所需要的部分写入论文如何正确分析统计结论\n单变量定量资料统计描述频数表(n较大时)频数分布图(直方图)统计指标正态分布或近似正态分布资料:均数±标准差倍数资料;对数正态分布资料:几何均数±几何标准差偏态分布;分布未知;分布末端有不确定数据:中位数±四分位数间距度量衡单位不同或单位相同但均数相差悬殊的多组资料变异度比较:变异系数\n单变量定量资料统计推断—参数估计总体均数点估计:总体均数区间估计:n较小时:n较大时:注意可信区间和参考值范围的区别总体μ样本\n单变量定量资料统计推断—假设检验1.样本均数与总体均数比较样本来自正态分布或变换后为正态t检验Wilcoxon符号秩检验YN\n单变量定量资料统计推断—假设检验2.配对设计两均数比较差值正态或变换后正态配对t检验Wilcoxon符号秩检验YN\n单变量定量资料统计推断—假设检验3.完全随机设计两均数比较正态性方差齐性两样本t检验近似t检验Wilcoxon秩和检验反应变量为生存时间且含有截尾数据log-rank检验YN\n单变量定量资料统计推断—假设检验4.完全随机设计多均数比较正态性方差齐性完全随机设计方差分析Kruskal-Wallis秩和检验反应变量为生存时间且含有截尾数据log-rank检验YN\n单变量定量资料统计推断—假设检验5.随机区组设计多均数比较正态性方差齐性随机区组设计方差分析Friedman秩和检验YN\n单变量定量资料统计推断—假设检验6.多个样本均数的两两比较完全两两比较:SNK法部分两两比较:多个实验组与一个对照组比较LSD法;Duncan新法\n定量资料分析中常见的错误误将定量资料判为定性资料为探讨雌激素受体(ER)、孕激素受体(PR)在小儿皮肤血管瘤发生、发展中的意义,采用免疫组化方法对毛细血管瘤、海绵状血管瘤、淋巴管瘤及正常皮肤组织的ER、PR受体进行检测。全部标本经10%福尔马林固定,常规石蜡包埋。每例选一典型蜡块,4-6μm切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER、PR阳性细胞百分率,此阳性细胞百分率为定量资料而不是定性资料。\n定量资料分析中常见的错误忽视t检验、方差分析的前提条件直肠癌手术前后3项肿瘤标志检测结果不同时期CEACA19-9CA71-4术前(n=58)34.0±79.0209.0±739.07.2±4.8术后(n=30)2.0±1.211.0±10.94.3±2.8转移复发(n=19)88.0±107.0212.0±529.09.8±3.2此资料中若干个单元格中标准差的数值是均值的2倍以上,基本可以认为不服从正态分布,而且不同组间标准差也相差悬殊,也不满足方差齐性的要求,所以不宜采用方差分析。\n定量资料分析中常见的错误误用多次t检验进行多组均数之间的比较三菱莪术液抑癌实验的小鼠瘤重(g)组别均数±标准差对照组4.66±1.010.5ml2.50±0.931.0ml2.46±1.181.5ml1.87±1.16\n定量资料分析中常见的错误误将方差分析结论加以扩展方差分析结果P<0.05,只能认为多组均数总的说来有差别,并不能说明它们两两之间都有差别,须进一步作多组均数的两两比较。\n单变量定性资料统计描述常用的相对数:率,构成比,相对比相对数应用注意问题标准化法\n单变量定性资料统计推断—参数估计总体率的点估计:总体率的区间估计:查表法正态近似法:\n单变量定性资料统计推断—假设检验1.样本率与总体率比较n较小时,基于二项分布的精确概率法n较大时,单样本u检验2.配对设计两样本率比较配对卡方检验(McNemar检验)\n单变量定性资料假设检验3.完全随机设计两样本率比较u检验卡方检验Fisher精确概率法4.完全随机设计多个样本率或两个(多个)构成比的比较行×列表卡方检验\n单变量等级资料假设检验1.完全随机设计两组比较校正的Wilcoxon秩和检验2.完全随机设计多组比较校正的Kruskal-Wallis秩和检验\nR×C列联表资料的统计分析1.双向无序R×C表行变量、列变量皆为分类变量且属性不同目的:两分类变量有无相关关系方法:卡方检验;Fisher精确概率法\nABO血型MN血型MNMN合计O4314909021823A3884108001598B4955879502032AB137179325641合计1451166629776094两种血型系统之间互相独立,即具有ABO血型系统中某种血型的人,用MN血型系统来划分时,属于M、N、MN血型的可能性几乎相等,没有确定的倾向性。\n2.单向有序R×C表一个变量为分组变量,其效应变量为有序变量目的:不同处理因素效应(有序)有无差别方法:秩和检验3.双向有序且属性不同的R×C表行变量、列变量皆为有序变量且属性不同目的:①两变量有无相关关系(两变量地位平等);②两变量有无线性变化趋势(一为自变量,一为应变量);③多组间效应有无差别方法:①Spearman秩相关分析;②线性趋势检验;③秩和检验\n4.双向有序且属性相同的R×C表行变量、列变量皆为有序变量且属性相同目的:两种方法测定结果的一致性方法:Kappa检验(一致性检验)\n两法检查室壁收缩运动的符合情况对比法核素法测定结果测定结果正常减弱异常合计正常582363减弱142750异常891734合计675327147两法检查结果具有一致性\n定性资料分析中常见的错误值计算错误导致结论错误两种手术并发症的比较手术方式例数并发症例数并发症发生率手术I71(a)12(b)16.9%手术II57(c)18(d)31.6%\n定性资料分析中常见的错误误用检验取代Fisher精确概率法两种方法治疗急性湿疹病人结果分组有效数无效数合计有效率(%)试验组1211392.31对照组381127.27合计1592462.50\n定性资料分析中常见的错误对R×C表资料直接分割进行两两比较误用检验分析单向有序R×C表误用检验回答两有序变量的相关性误用检验分析双向有序且属性相同的R×C表\n双变量统计分析1.直线相关(线性关系)双变量正态分布Pearson积差相关分析Spearman秩相关分析YN\n双变量统计分析2.直线回归(线性关系)I型回归:Y服从正态分布X为控制变量II型回归:Y服从正态分布X为随机变量X、Y服从双变量正态分布\n双变量统计分析中常见的错误误对I型回归资料作相关分析“高效毛细管电泳法测定血浆中布比卡因的浓度”一文中,采用毛细管电泳法,于0.5ml空白血浆中分别加入0.05、0.1、0.2、0.3、0.4、0.5μg的布比卡因进行测定,作者以样品峰的峰面积与内标峰的峰面积之比(Y)对样品量(X)进行统计分析,线性关系良好(r>0.99)。本资料的自变量是人为选定的布比卡因的浓度,并不是随机变量,因而属于I型回归资料,并不适合作直线相关分析。可进行直线回归分析,求出回归方程,并进一步作假设检验,看两变量之间有无直线变化趋势。\n双变量统计分析中常见的错误散点图并不反映直线趋势,仍作直线相关分析“高脂餐后内皮依赖性血管舒张功能变化及其影响因素”一文中,作者对75名受试者测定了餐后2h血清甘油三酯(TG)浓度增高值与餐后内皮依赖性血管功能下降值(%),经相关分析,认为餐后2h血清TG浓度增高值与餐后内皮依赖性血管功能下降值显著正相关(r=0.459,P<0.01)。进行直线相关分析前,应绘制散点图。本资料散点图无明显的直线变化趋势,并不适合作直线相关分析。另外决定系数R2=0.4592=0.21,说明餐后2h血清TG浓度增高值可解释餐后内皮依赖性血管功能下降值变异的21%,即两变量之间的关系实际意义不大。\n多变量统计分析1.应变量Y为正态分布数值变量多重线性回归2.应变量Y为二分类(或多分类)定性变量或等级变量logistic回归3.应变量Y为二分类结局变量和生存时间Cox回归\n多变量统计分析用途:多因素分析平衡(调整)其它影响因素后的组间比较预测预报\n多变量统计分析中常见的错误用单因素分析取代多因素分析多变量筛选的策略错误多因素分析时,先进行单因素分析,再将有统计意义的变量进行多变量分析,这是一种错误的分析策略。单变量分析中表现的不仅是变量自身的作用,还可能有其它变量的混杂作用,其结果只起参考作用。在多元回归中每个自变量对应变量的贡献也与其它自变量是否被选入模型有关。正确的做法是考虑所有的变量,采用逐步回归方法,必要时多用几种筛选变量的技术,同时还要考虑因素之间的交互作用,综合分析,得出较为可靠的结果。\n多变量统计分析中常见的错误不会用多因素分析方法平衡混杂因素对结果的影响例:分析急性白血病患者具有某种不良染色体是否与其缓解有关,可采用logistic回归平衡混杂因素如年龄、性别、骨髓原幼细胞数、cd34表达等对缓解的影响。如同时考虑缓解时间,可采用Cox回归。\n医学论文统计表达的基本要求摘要引言材料与方法结果讨论\n一、摘要摘要是研究核心内容的浓缩,简述研究目的、方法、结果和结论。摘要中要有表示研究结果的重要统计指标(统计量)的数值、可信区间及假设检验结果(P值)。如处理组和对照组的均数(中位数)、标准差、率、P值或两组均数(率)之差、95%可信区间、OR(RR)值等。\n二、材料与方法除专业方面的描述外,统计学描述包括以下两个方面。1.清晰地描述研究设计的内容,包括研究类型、观察对象类型、入选和剔除标准、观察方法和测量技术以及实验、试验或调查资料的搜集过程等。尤其应具体地描述研究对象的来源和选择方法、包括观察对象的基本情况、有无随机分组(随机抽样)、样本含量及其估计的依据等。若进行了随机化分组,应说明具体的随机化方法。对于非随机化分组的观察性研究,除要明确说明观察对象的选择方法外,还应给出影响因素(如年龄、性别、病情)的均衡性分析结果。对临床试验,还需要特别说明诊断标准、疗效评价标准、病例入选标准、病例剔除标准、有无失访及失访的比例、有无“知情同意”、是否盲法观察等。\n2.说明所采用的统计分析方法与统计计算软件。数据处理用到的所有统计方法都要说明。如果用了几种统计方法,必须清楚地指出在何处用了何种方法。常用的统计方法简单说明即可,如t检验、单变量方差分析、卡方检验等,对一些特殊的统计方法,如生存分析、重复测量资料方差分析、协方差分析等,要同时给出相应的参考文献。统计计算软件一般给出名称即可,如SPSS、SAS等,但对于一些特殊的计算,要给出软件的过程名,如重复测量资料方差分析采用SPSS/GLM等。\n三、结果统计结果主要用统计指标(统计量)表示。统计指标比较多时,如分组比较,要借助统计表和统计图。假设检验的结果表达不能仅仅给出P值,还要求给出检验统计量的值,如t值等。由于统计软件的普及,提倡报告P的具体数值,如P=0.018或P=0.436等。\n四、讨论统计结果的解释主要集中在论文的“讨论”部分。作者往往要在“讨论”部分引用统计结果作为支持其新发现、新结果、新观点的统计学依据,对统计结果理解和解释上的偏差,可能导致结论上的错误。\n1.假设检验结果的解释即使疗效显著,当观察的数据很少时,也极有可能出现无统计学意义的结果;相反,疗效差别很小时(如新药比对照药有效率仅提高了0.1%),大样本数据也可能出现有统计学意义的结果。因此,有统计学意义并不等同于临床上的疗效显著。P值越小,不能说明比较的两均数(或率)之间差别越大;也不能说明两变量的关系越密切。\n2.关联与因果在观察性研究中,变量间的关联或组间差别可能是因果关系,也可能是偏倚,确定因果关系需要根据专业知识进行进一步的分析。在随机对照研究中,变量间的关联和组间差别可以解释为有概率保证的因果关系。当变量都随时间变化时,变量间很容易出现虚假的相关关系,必须特别加以小心。\n3.数字变化对于数字的增加可用倍数和百分数表示。如增加了2倍,即原来为5,现在为15;增加到2倍,即原来为5,现在为10;增加了20%,即原来为5,现在为6。对于数字的减少只能用百分数或分数表示。如降低了20%,即原来为5,现在为4;降低到20%,即原来为5,现在为1;减少了1/2,即原来为5,现在为2.5。\n4.缺陷或不足要指出在研究设计和实施过程中有哪些缺陷或不足。若发现缺陷或不足,则应考虑这些缺陷或不足对结果和解释可能产生的影响。不能对缺陷或不足视而不见,更不能寄希望于不被读者发现。

相关文档