- 360.50 KB
- 2022-08-12 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
正态分布\n正态分布的通俗概念:如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。正态分布的概念\n下面我们以第一节某地13岁女孩118人的身高(cm)资料,来说明身高变量服从正态分布。频数分布表:\n频数分布图一(又称直方图)从频数表及频数分布图上可得知:该数值变量资料频数分布呈现中间频数多,左右两侧基本对称的分布。所以我们通俗地认为该资料服从正态分布。\n频数分布图二\n频数分布图三\n正态分布图四\n正态分布的数理统计学概念:如果随机变量(X)的概率密度函数为:-∞<x<+∞则该随机变量服从正态分布。式中σ为总体标准差;μ为总体均数;π为圆周率,即3.14159···;e为自然对数的底,即2.71828···。\n若某一随机变量的概率密度函数(频率曲线方程)为上式,则称该变量X服从参数为μ和σ的正态分布,记为:X~N(μ,σ2)。函数方程中μ为位置参数,σ为形状参数。在σ不变的情况下,函数曲线形状不变,若μ变大时,曲线位置向右移;若μ变小时,曲线位置向左移。在μ不变的情况下,函数曲线位置不变,若σ变大时,曲线形状变的越来越“胖”和“矮”;若σ变小时,曲线形状变的越来越“瘦”和“高”。\n若某一随机变量X,其总体均数μ=0,总体标准差σ=1,即X~N(0,1),则称变量X服从标准正态分布。习惯把服从标准正态分布的变量用字母U或Z表示,此时,我们把U或Z称为标准正态变量。标准正态分布是正态分布中的一个典型分布,数理统计上证明:对一服从正态分布的随机变量(X),若进行特定的变量变换,可将任何一服从正态分布的随机变量(X)转变成服从标准正态分布的随机变量(U或Z),这种变量变换过程称为变量的标准化,也称为U或Z变换。式中符号意义如前述。\n正态分布的特征及其面积规律正态分布曲线位于横轴上方,呈钟形。正态分布曲线以均数所在处最高,且以均数为中心左右对称。\n正态分布曲线由两个参数决定,即总体均数μ和总体标准差σ。在σ不变的情况下,函数曲线形状不变,若μ变大时,曲线位置向右移;若变小时,曲线位置向左移,故称μ为位置参数。在μ不变的情况下,函数曲线位置不变,若σ变大时,曲线形状变的越来越“胖”和“矮”;若σ变小时,曲线形状变的越来越“瘦”和“高”,故称σ为形态参数或变异度参数。N(μ,0.52)、N(μ,12)、N(μ,22)N(μ1,σ2)、N(μ2,σ2)\n正态曲线下面积分布有一定的规律性。对于服从正态分布的随机变量(X),随机变量值出现在某一区间(x1,x2)的概率与正态分布概率密度曲线与横轴在该区间所围成的区域的面积大小相对应(相等)。正态分布概率密度曲线与横轴围成的区域的总面积恒等于1。正态分布概率密度曲线下横轴上一定区间的面积可应用数学知识求出。在实际应用中,由于所有正态分布都可以通过变量变换转变为标准正态分,为了省去积分计算不同正态分布曲线下横轴上一定区间面积的繁琐过程,所以数理统计学家专门编制了标准正态分布曲线下横轴上一定区间面积分布表,供查表求标准正态分布曲线下一定区间面积。\n标准正态分布标准正态分布曲线下对称于0的区间,面积相等,各占50%,即左右各为0.5。标准正态分布曲线的纵坐标与面积关系图即纵坐标从-∞移到u所对应区域的面积为上图红色区域面积的大小,这样一个区域的面积我们用Ф(u)表示,可通过查标准正态分布曲线面积分布表得到Ф(u)的大小。u值查表所对应的面积是区间(-∞,u)所对应的面积,即Ф(u)。若u=-1.96,那么Ф(-1.96)则表示从-∞移到-1.96所对应区域的面积,通过查标准正态分布曲线面积分布表得到Ф(-1.96)=0.025。\nuu指单侧U界值,也称随机变量U的上侧α分位数。其意义为:从到+∞这一侧的面积为α,也即在随机变量U的所有取值中,有100α的值比大,有100(1-α)的值比小。\nu/2\n\n\n\n当有一随机变量X服从正态分布N(μ,σ2),若要求某一区间(x1,x2)的曲线与横轴围成的面积时,无须运用积分学知识求从x1移到x2所对应区域的面积大小来得到这一区间所对应的面积。此时,我们可以通过变量变换,把X转变成u,即把一般的正态分布变换为标准正态分布,通过求标准正态分布区间(u1,u2)所对应的面积来间接求得一般正态分布区间(x1,x2)所对应的面积。当随机变量的参数μ和σ未知时,若来自该总体的样本含量n很大时,可分别用样本均数和样本标准差作为μ和σ的估计值来计算u值。\n\n\n\n\n正态分布的应用\n\n\n