- 396.50 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
医学统计学(MedicalStatistics)\n第一讲基本概念\n统计学与医学统计学方法统计学是收集、分析、解释与表达数据资料的一门科学。Statistics:“asciencedealingwiththecollection,analysis,interpretationandpresentationofmassesofnumericaldata”----Webster国际大辞典\n统计工作的基本步骤1.统计设计:包括调查、实验设计。2.收集资料:取得准确可靠的原始资料3.整理资料:对资料进行清理、改错,数量化4.分析资料:统计描述、统计推断\n医学统计学用统计学原理和方法研究医学问题\n数据类型1.计量资料2.计数资料3.等级资料4.三类资料间关系\n住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata计量资料Qualitativedata计数资料Units;elements\n1.计量资料用仪器、工具等测量(measure)方法获得的数据,即为计量资料measurmentdata。也叫定量数据Quantitativedata特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)\n2.计数资料按某种属性分类,然后清点每类的数据,称计数资料(countdata)或enumerationdata。也叫定性数据Qualitativedata特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)\n3.等级资料Rankdata半定性或半定量的观察结果。有大小顺序,所以也叫有序分类资料(ordinalcategorydata)。①癌症分期:早、中、晚。②药物疗效:治愈、好转、无效、死亡。③尿蛋白:,,,++,+++及以上\n实例数据1\n实例数据2\n4.三类资料间关系例:一组2040岁成年人的血压(舒张压)以12kPa(90mmHg)为界分为正常与异常两组,统计每组例数。<8低血压8正常血压12轻度高血压15中度高血压17重度高血压计量资料等级资料计数资料\n统计学基本概念1.随机变量及其分类2.同质与变异3.总体与样本4.参数与统计量5.误差6.概率\n1.随机变量(randomvariable)简称变量(variable),统计上习惯用大写拉丁字母表示,如X、Y、Z、…。变量值习惯用小写拉丁字母表示,如性别x1=1(男)、x2=1(男)、x3=0(女)、…。编号(ID)性别(X)体重(kg)(Y)疗效(Z)张11660李21781王30572…………\n随机变量的分类离散型变量(discretevariable),主要是自然数,例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。连续型变量(continuousvariable),在一定区间内变量取值无限个,或数值无法一一列举出来。主要是定量测量结果,例如某地区男性健康成人的身高值、体重值,一批传染性肝炎患者的血清转氨酶测定值。\n2.同质与变异homogeneityandvariation同质:指事物的性质、影响条件或背景相同或非常相近。变异:指同质的个体之间的差异。\n同质与变异的例子例1调查2003年长沙市7岁男童的身高和体重同质:2003年、长沙市、7岁男童变异:身高和体重各不相同例2研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同\n表1-1120名正常成年男子红细胞计数值(1012/L)5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89算术均数=4.72,标准差=0.57\n\n3.总体与样本populationandsample总体:特定研究对象中所有观察单位的测量值。分有限总体与无限总体。样本:从总体中随机抽取的部分观察单位\n随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。\n对样本数据进行观察或计算统计指标,目的是推论总体。\n4.参数与统计量parameterandstatistic参数:总体的统计指标,如总体均数,采用希腊字母记为μ。固定的常数总体样本抽取部分观察单位μ?推断inference统计量:样本的统计指标,如样本均数,采用拉丁字母分别记为。统计量是参数附近波动的随机变量。\n5.误差error误差:实际观察值与客观真实值之差(1)系统误差(2)随机误差\n(1)系统误差systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值有系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。\n(2)随机误差randomerror排除上述误差后尚存的误差,受多种无法控制的因素的影响。特点:大小方向不一的随机变化。随机测量误差(randommeasurementerror)——提高操作者熟练程度可以减少这种误差随机抽样误差(randomsamplingerror):由抽样造成的样本统计量和总体参数间的差异。——不可避免,但有一定的分布规律,可估计。\n6.概率probability确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。\n必然事件P=1不可能事件P=0随机事件0