• 409.00 KB
  • 2022-09-01 发布

制规划教材《医学统计学

  • 41页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第一章绪论7年制规划教材《医学统计学》主编:余松林宇传华(http://statdtedm.6to23.com)\n统计学(statistics)统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。第一节概述\n根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、医学统计、卫生统计……医学统计学(medicalstatistics):用统计学的原理和方法研究医学中的问题。卫生统计学(healthstatistics):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。\n1.采用统计学方法,发现不确定现象背后隐藏的规律。变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。为什么要学统计学?\n最大值=6.18,最小值=3.29,极差=2.89。算术均数=4.72,标准差=0.57。\n2.用统计学思维方式考虑有关医学研究中的问题“阳性”结果是否是虚假联系?某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?“阴性”结果是否是样本含量不足?有人曾对发表在Lancet,NEnglJMed,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇(93%)可能是由于样本含量不足造成的假阴性。\n3.保证你的研究论文能通过统计学审查据国外60~80年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。国内1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。\nJAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学要求。UniformRequirementsforManuscripts SubmittedtoBiomedicalJournals http://www.acponline.org\n4.获得循证医学证据的主要手段“良好愿望的医学”(well-meaningmedicine)转入“以证据为基础的医学”(evidence-basedmedicine,EBM)需要有统计学方法的支持。全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。\n第二节医学统计资料的来源与分类一、原始统计数据的来源常规保存数据医院信息系统(HIS)、统计报表等2.现场调查记录3.实验记录4.其他\n二、统计数据的分类只有认识了数据的特点,才能正确地选用统计分析方法按变量测量的精确程度由低到高,将数据分类为:名义数据(如性别、婚姻状况)、有序变量(如疗效,类别间差别大小难以度量)、区间变量(如摄氏体温,类别间差别有实际意义)、比变量(如身高,除具有区间变量的特征外,还具有真实意义的零点。摄氏温度的零点为水结冰时温度,并非绝对意义的零点,所以它不属于比变量)定量数据定性数据\n1、定性数据(qualitativedata)(二项与多项)分类数据(categoricaldata)计数数据(enumeration(counting)data)2、定量数据(quantitativedata)计量数据(measurementdata)区间数据(intervaldata)数值数据(numericaldata)3、等级资料(rankeddata)有序资料(ordinaldata)(一)定性与定量数据的别名\n(二)三类数据间的关系例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数<8低血压8正常血压12轻度高血压15中度高血压17重度高血压定量数据等级数据定性数据\n住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata定量资料Qualitativedata定性数据Units;elements\n(三)三类数据的编码与计算(1)例:一组2040岁成年人的血压以12kPa为界分为正常(=0)与异常(=1)两组,统计每组例数<8低血压418正常血压10212轻度高血压13315中度高血压16417重度高血压185定量数据等级数据定性数据\n(三)三类数据的编码与计算(2)1.定量数据:允许计算均数、标准差等(可采用t、F检验等,可当做有序或定性数据处理)2.定性数据:编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验等)调查14名男子的婚姻状况分类编码频数(frequency)单身13已婚25离异32分居443.有序数据:允许基于顺序的计算,如计算中位数、百分位数(可当做定性数据处理)\n第三节统计学常用的基本概念\n1、变量——可以测量的任何特征或属性Anycharacteristicorattributethatcanbemeasured。(不同个体结果可能不同)随机变量——在概率论中称变量为随机变量一、变量与随机变量Variableandrandomvariable根据观察数据之间有无缝隙(gap),常将数据分类为离散型(discrete)变量(有缝隙)与连续型(continuous)变量(无缝隙)两大类。\n\n对随机变量的取值过程为测量。取值所采用的标准为测量尺度。二、测量和测量尺度采用统一的标准化的尺度进行测量,其测量结果一般是稳定的和一致的,例如身高、胸围等形态指标的测量均采用统一的测量尺度(全国统一研制的身高计、胸围尺均以厘米为记录单位,体重以公斤为记录单位,肺活量以毫升为单位等)\n三、总体与样本populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分研究对象\n随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。\n\n四、参数与统计量parameterandstatistic参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数总体样本抽取部分观察单位统计量参数推断inference统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。\n样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。五、频率与概率frequencyandprobability\n必然事件P=1随机事件0