《药学统计学》ppt课件 46页

  • 386.37 KB
  • 2022-08-13 发布

《药学统计学》ppt课件

  • 46页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第十章药学统计学药学导论\n统计学(statistics):研究数据的收集、描述、分析、综合和解释,以获得新信息、作出新推断的学科。包括:(1)制定调查方案和设计科学实验(2)描述实验数据(3)进行假设检验(4)获知变量间的定量关系概述\n第一节几个基本统计学概念频率:概率:一、必然事件与随机事件必然事件:某条件实现后一定发生或一定不发生的事件随机事件:一定条件下,不一定发生的事件二、频率与概率\n1.总体与样本的关系样本参数用英文字母表示总体参数用希腊字母表示总体样本取样观测数据推断三、总体与样本\n2.取样的随机性随机性包括:①总体中个体的抽取必须是相互独立的;②总体中所有个体被抽取的机会相等。满足以上两个要求的取样,称为简单随机取样(SRS,simplerandomsampling)这样抽取的样本称为简单随机样本。\n四、观测值的特征——集中位置与离散程度量度集中位置的统计量(1)均值样本均值总体均值μ=E(X)=Σ取值·概率=ΣXiPi均值的重要性质:①观测值与均值之差(偏差)之和②偏差的平方和最小\n(2)众数频数最大的观测值叫众数,常用于表示离散型随机变量的集中位置。(3)中位数把变量的观测值按大小顺序排列,排在当中的一个观测值叫中位数。\n(1)极差(最大值和最小值之差)R=Xmax-Xmin(2)平均(绝对)偏差2.量度数据离散程度的统计量(3)方差式中n-1在统计学中叫自由度(degreeoffreedom),常用希腊字母ν表示\n五、两个典型的概率分布1.二项分布是典型的离散型概率分布(1)特点:二项分布是一种每次试验只有两种可能结果而不受以前实验影响的分布。在样本容量相对于总体很小时,取样试验后,返回不返回,对下一次试验的结果无影响。\n(2)二项分布的均值、方差、标准差均值=np方差=npq标准差=(3)二项分布的实际意义一些只有两个结果的互斥事件都与二项分布有关,在药学方面,可用于分析从制剂批抽出n个个体中不合格个体数的概率。\n2.正态分布是一种连续型概率分布,各种分布都以它为中心在一定条件下相互转化。设连续性随机变量X的概率密度为则称X服从参数为、(-∞<<+∞,>0)的正态分布,记为X~N(,)\n(1)特点:①极大值在μ;②以X=μ为对称轴;③X轴是渐进线;④拐点在X=μ±σ。\n(2)标准正态分布①一般的正态分布取决于均值和标准差②计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表\n任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布xms一般正态分布=1Z标准正态分布\n(3)标准正态分布表的使用①将一个一般的转换为标准正态分布计算概率时,查标准正态概率分布表②对于负的x,可由(-x)x得到③对于标准正态分布,即X~N(0,1),有P(aXb)baP(|X|a)2a1④对于一般正态分布,即X~N(,),有\n六、均值的分布和中心极限定理均值的分布如一个随机变量X呈总体均值为μ、总体方差为σ2的正态分布,则其容量为n的样本均值也呈正态分布,其总体均值仍为μ,但总体方差为σ2/n,即X\n2.中心极限定理设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布\n第二节取样按与调查目的有关的某个主要性标志将总体单位划分为若干层(也称类、组或子总体),然后从多层中按随机原则分别抽取一定数目的单位构成样本。一、随机取样与随机数表简单随机抽样是最基本的抽样组织方式。是对总体单位不进行任何划分或排队,完全随机地直接从总体中抽取样本单位,使每个总体单位都有完全均等的机会被抽中。二、分层取样\n在大规模生产中,表明供应方产品质量特征的随机变量应不超出某规定范围。三、系统取样常用于质量控制,每第n个个体选取一个,但最初选取的个体是随机的。四、验收取样\n第三节数据制图与统计方法有关的图解:①以传递信息为目的的图解:如直方图、条形图②在坐标中描述变量之间关系的图解一、引言\n在许多研究数据中,响应Y的对数而不是Y本身与独立变量X呈线性关系,这样就要进行半对数标绘,即变量X的坐标是自然数而响应(函数)Y的是它的对数logY。二、描述频数的图解直方图、条形图、扇形图三、描述变量关系的标绘图\n第四节统计估计和假设检验统计方法描述统计推断统计统计估计假设检验\n样本统计量均值和方差S2分别是其总体均值μ和总体方差σ2的最佳估计。置信区间(confidenceinterval):是我们相信统计量如总体均数所在的区间,由总体的性质、参数的样本估计值和想达到的置信度决定。以样本均值为对称中心的双侧置信区间:P%置信区间=X一、统计估计\n1.用t分布确定置信区间P%置信区间=2.几个不同置信区间的构造(1)σ未知,需要由样本估计(2)σ已知,直接代入公式(3)比率的置信区间一、统计估计\n二、假设检验1.引言(1)概念①事先对总体参数或分布形式作出某种假设②然后利用样本信息来判断原假设是否成立(2)类型①参数假设检验②非参数假设检验(3)特点采用逻辑上的反证法依据统计上的小概率原理\n零假设(nullhypothesis):关于两个总体在某一参数如均值上一致(实际上差异为零)的假设H0。如H0:μ1=μ2备择假设(alternativehypothesis):如果舍弃H0则接受Ha,Ha也可用H1表示。如Ha:μ1≠μ2\n例:表观测单一总体均值的实验示例同类药物的治愈率新药的治愈率值得临床研究重视得血压降低标准值临床前研究中n只大鼠血压降低均值药典片剂通则关于崩解时限的规定药片片剂平均崩解时限标示量药片片剂的平均含量假设值或标准值样本均值对此例中每一类问题的假设检验,可提出三个假设检验:①H0:μ=μ0,Ha:μ≠μ0②H0:μ=μ0,Ha:μ<μ0③H0:μ=μ0,Ha:μ>μ0\n2.检验假设的步骤(1)提出检验统计量T并进行实验(2)提出零假设H0和备择假设Ha(3)规定显著性水平α显著性水平:即根据统计检验的结果舍弃零假设H0(存在显著差异)而实际上不存在的概率。(4)计算检验统计量T并进行显著性检验\n3.几种具体的假设检验(1)σ已知的单样本双侧均值检验(2)σ已知的单样本单侧均值检验(3)σ未知的单样本双侧均值检验先求t值,再计算置信区间,进行t检验(4)独立样本方差S12和S22的比较:F检验\n1.什么是回归分析:①从一组样本数据出发,确定变量之间的数学关系式②对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著③利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度第五节回归分析\n2.回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归\n3.回归模型(1)回答“变量之间是什么样的关系?”(2)方程中运用①1个数字的因变量(响应变量)——被预测的变量②1个或多个数字的或分类的自变量(解释变量)——用于预测的变量(3)主要用于预测和估计\n概念要点(1)当只涉及一个自变量时称为一元回归,若因变量y与自变量x之间为线性关系时称为一元线性回归(2)对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系(3)描述因变量y如何依赖于自变量x的方程称为回归模型\n5.简单线性回归方程的形式如下Y=0+1x方程的图示是一条直线,因此也称为直线回归方程0是回归直线在y轴上的截距,是当x=0时y的期望值1是直线的斜率,称为回归系数,表示当x每变动一个单位时,y的平均变动值\n6.最小二乘法回归直线是对若干个数据对(X,Y)绘制的,但由于遵守正态分布的实验误差,数据对中两个以上的点,不能恰好在一条直线上,即恰好通过所有数据点的直线是找不到的,只能找到一条离所有点都近的直线,所用的客观方法叫最小二乘法(methodofleastsquares)。\n7.最小二乘线(1)定义给定n个数据对(X,Y),找到一条规定X,Y关系的直线,使所有数据对(X,Y)与拟规定的直线在Y轴方向的距离平方和最小——用数学语言表示就是最小,这样的一条直线就是描述X,Y间关系的最佳直线,称为最小二乘线。\n(2)图示xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^\n(3)和的计算公式\n二、回归分析在药物研究中的应用例:把6个浓度按两倍递增的纯青霉素溶液(1~32U/ml)置于进行生物测定的杯碟中。下表给出每一浓度以mm表示的抑菌圈直径,在这个长度的测量中发生较大的误差。如果对青霉素溶液的浓度C取以2为底的对数(笔,binit),则抑菌圈的直径与青霉素溶液的浓度成线性关系。试求Y在X上的回归直线方程。24.7723.1321.3519.5217.7815.87Y=抑菌圈直径/mm543210X=log2C32168421C/ml表青霉素溶液浓度的对数变换\n解进行Y在X上的回归计算ΣX=15n=6ΣY=122.42=2.50=20.40ΣX2=55ΣXY=337.24ΣY2=2553.3880于是Y在X上的回归直线方程是=15.94+1.782X\n第六节实验设计1.基本原理(1)对照:齐同可比(2)重复:①获得总体标准差的估计值②用大容量样本重复多次获得的均值,能把因素在实验中的效应估计得更精密。(3)随机:有助于把可能存在得外部因素效应平均化而减免。一、实验设计的基本原理\n2.步骤①确认并陈述问题②选择因素和水平③选择响应变量④选择实验设计⑤进行实验⑥分析数据⑦做结论并提建议\n二、方差分析(analysisofvariance,ANOVA)方差分析能确定引起生产和实验结果有差异的诸因素各自的单独作用和彼此的交互作用。变差的大小通常用变差平方和(简称平方和)表示平方和的加和性:总平方和等于各因素平方和与误差平方和之和,即SStot=SSA+SSB+···+SSe\n三、实验设计的分类1.两类基本的实验设计等级分类交叉分类2.两类不同性质的因素固定的随机的3.配置完整和不完整\n第七节几个现代统计方法1.概述蒙特卡洛方法根据模拟抽样的结果估算求解问题解X的近似值。这样的近似值通常是以一个数学期望等于X的统计量的样本均值给出。2.分类S→S,S→S’,S→M,M→S,S→M→S’3.一个例子——制剂含量均匀度计量型检查法的制定一、蒙特卡洛方法——随机现象的统计模拟\n二、模拟识别(patternrecognition)1.概述模式识别不需要数学模型,只需要找到互不相同的数据间的关系,可处理代表模式而维数大于三的数据。2.一般步骤和分类(1)步骤:①数据即观测值的收集、表示和预处理;②特征提取和选择;③分类、决策(2)分类:①非参数法;②参数(贝叶斯)法3.中药质量的化学模式识别

相关文档