- 41.00 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
生物统计学复习纲领一填空(红色为重点)1统计资料一般分为计数资料、计量资料和等级资料三类。2各种抽样方法的抽样误差一般是:整群抽样≥单纯随机抽样≥系统抽样≥分层抽样。3处理因素、受试对象和实验效应是实验设计的三个基本要素4在实验设计中,应当严格遵守对照、随机、重复三个基本原则。5可信区间两个要素:(1)准确度:反映在可信度(1-α)的大小。1-α越接近1,越准确。如可信度99%比95%准确。(2)精确度:反映在区间范围宽窄。范围越摘越好。95%可信区间精度优于99%。在n确定的情况下,准确度↑,精确度↓;在兼顾准确度和精确度时,一般取95%可信区间;在可信度确定的情况下,增加样本例数,可提高精确度。6描述平均水平的指标:算数均数,几何均数,中位数,众数。7描述变异程度的指标:极差,四分位数间距,方差,标准差,变异系数8假设检验的功效为1-β,影响检验效能的主要因素:总体参数,个体差异,样本量,和检验水准α。当总体参数的差异越大,个体差异越小,样本量越大,检验水准越松,检验效能越大。9正态性检验的方法:图示法,分别为PP图法,QQ图;统计检验法:W检验,D检验。10非参数检验适合于分布类型未知、一端或两端无界、出现少量异常值的小样本数据、以及等级做记录的资料分析。11为了满足统计方法的应用条件有时需要对原始发量迚行一定形式的数据发换其目的是偏态正态化、曲线直线化、方差齐性。12反映原始测定数据对其均值离散程度的统计量用标准差,表达样本统计量对其参数随机偏离程度的统计量是标准误。\n13对一对同质的计量资料通常可以从集中趋势和离散程度两个方面来全面描述其数字特征。14对于一份统计资料通常从统计描述,统计推断两个方面进行分析其中统计推断包括参数估计和假设检验两个方面癿内容。15对计数资料进行统计描述通常采用相对数指标常用的相对数指标有率、构成比和相对比。16医学统计工作的内容是实验设计、收集资料、整理资料、分析资料。统计分析常分为统计描述与统计推断两个阶段。17常用的制定医学正常值范围(参考值范围)的方法有百分位数法和正态分布法两种。一般前者适用于偏态分布资料后者适用于正态分布资料。18计量资料作假设检验要求资料必须满足正态性和方差齐性如果数据不能满足方差齐性要求,一般可以通过t’检验数据变换和秩和检验三条途径来处理资料。19估计总体参数的方法有点估计和区间估计其中以区间估计最常用。20总体均数可信区间估计的理论基础是样本均数的抽样分布规律。21欲了解两个发量之间相互关系的密切程度和方向性一般常计算的统计量是相关系数r。22对于一组明显偏态的观察数据描述平均水平常用的指标为中位数标准差S反映一组实测数据的变异大小,标准误反映一个样本抽样误差的大小。23直线回归分析中的最小二乘法原理指散点到直线纵向距离的平方和达到最小。24统计假设检验的基本原理是小概率事件原理,其中拟定的假设检验概率水平P值癿含义是从原假设成立的总体随机抽样获得大于等于或小于等于现有样本信息统计量的概率。25变异系数常用于比较单位不同或均数相差较大情况下两组资料的变异度。26相关分析侧重于考察变量之间相关关系密切程度,回归分析则侧重于考察变量之间数量发化规律。27常用相对数有率、 构成比 和相对比。 28成组t检验的自由度为 ,χ2检验的自由度为(R-1)(C-1) 。\n29、随机区组设计的方差分析,可将总变异分解为。 30比较某地区某时期三种疾病的发病率在各年度的发展速度,应该绘制 半对数线图 。 31某地1980年~1990年结核病死亡率变动趋势应绘制___普通线图_,表示两种现象间的相关关系绘制__散点__图。 32±表示总体率的95%可信区间33两个样本均数比较的t检验,其应用条件为:两样本来自正态分布的总体、两总体方差相等或齐性。34相关系数r的假设检验,H0表示为35回归系数b的假设检验,H0表示为36t检验的应用条件随机性、正态性、方差齐性37对于多个样本的秩和检验,当R=3,ni>5时,应查____表。 38非参数检验较参数检验的检验效能___低___。符合参数检验条件的资料,如采用非参数检验方法,一般情况下,犯第__2___类错误的概率增大。二名词解释1总体(population):根据研究目的所确定的同质观察单位的全体。分为有限总体和无限总体。样本(sample):从总体中随机抽取的部分观察单位。2.频率(frequency)与概率(probability)频率:事件实际发生次数与可能发生次数的比率,设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。概率:度量随机事件发生可能性大小的一个数值,用大写的P表示;取值[0,1]。6单纯随机抽样(simplerandomsampling):将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。\n系统抽样(systematicsampling)又称机械抽样、等距抽样,即先将总体的观察单位按某一顺序号分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等间距,从每一部分各抽取一个观察单位组成样本。整群抽样(clustersampling)总体分群,再随机抽取几个群组成样本,群内全部调查。分层抽样(stratifiedsampling)先按对观察指标影响较大的某种特征,将总体分为若干个类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。有按比例分配和最优分配两种方案。8医学参考值范围:同质观察单位某项测定指标按一定标准确定的波动范围称参考值范围(rangeofreferencevalue)9区间估计(intervalestimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的区间,该范围即为总体参数的置信区间(confidentialinterval)10P值:在零假设成立的条件下,出现统计量目前只及更不利于零假设数值的概率。11均数的抽样误差(samplingerror)由于总体中存在个体变异,所以由抽样得到的样本均数与总体均数之间存在差异,这种差异称均数的抽样误差。标准误(standarderrorofmean):样本均数的标准差。意义:说明均数抽样误差大小的指标,用σx表示。σx越大,均数抽样误差越大;反之,σx越小,均数抽样误差越小。12随机区组设计(randomizedblockdesign)又称配伍组设计,通常是将受试对象按性质(如动物的窝别。体重等非实验因素)相同或相近者组成b个区组(配伍组)每个区组中的受试对象分别随机分配到k个处理组中。13参数检验(parametrictest):要求样本来自特定的总体分布,且对位置总体参数做推断的假设检验方法。\n14非参数检验(nonparametrictest):对总体分布不作严格假定,又称任意分布检验(distribution--freetest),即不必依赖专门的总体分布的统计方法,与参数无关,这时比较分布而不是比较参数,称为“非参数检验”。15秩和检验(ranksumtest)秩次:将各原始数据从小到大排列,分别给每个数据一个顺序号,也就是秩次。16相关系数(linearcorrelationcoefficient)又称积矩相关系数(coefficientofproduct-momentcorrelation),描述具有直线关系的两个变量之间相关关系的密切程度与相关方向的指标,以符号r表示样本相关系数。相关系数的计算公式相关系数没有单位,其值为-1≤r≤1。r值为正表示正相关(positivelinearcorrelation),r值为负表示负相关(negativelinearcorrelation);r的绝对值等于1为完全相关,r=1为完全正相关(perfectpositivecorrelation),r=-1为完全负相关(perfectnegativecorrelation);r=0,两变量间没有直线相关关系,称为零相关(zerocorrelation)。-1≤r≤1,|r|越大,线性相关越密切。17相关(correlation):两个随机变量X、Y之间呈线性趋势的关系为线性相关18决定系数(coefficientofdetermination):回归平方和与总离均差平方和之比。19偏相关系数(partialcorrelationcoefficient):扣除其他变量的影响后,变量Y与X的相关,称为Y与X的偏回归系数。20观察性研究(observationalstudy):是在不对研究对象事假任何干预措施的情况下,通过观察或访问的方法,客观的记录被研究食物的状况,由于没有干预措施,也被称为非实验研究。常见的观察性研究方法:队列研究,病例对照研究,横断面研究,生态学研究。21两种随机化分组的方法如何实施?22决定样本量大小的因素23生存资料\n常见删失原因生存率的估计方法两条生存曲线的比较