心理统计学_ 概率基础 59页

  • 903.97 KB
  • 2022-08-24 发布

心理统计学_ 概率基础

  • 59页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
概率基础心理与教育统计学石岩\n扩展用概率判生死——法庭上的数学证据\nⅠ计数基本法则有两个试验,其中试验1有m种可能发生的结果,对应于试验1的每一个结果,试验2有n种可能发生的结果,则对这两个试验来说,一共有mn种可能结果。如果有r个试验,……,一共有n1·n2···nr种可能结果。\nⅡ排列方式假设有n个元素,按随意顺序来排列,则一共有n!种不同的排列方式。如a,b,c三个字母随机排列。则有:abc,acb,bac,bca,cab及cba六种。\nⅢ组合从n个元素中取r个,一共有多少种取法?例如,从1,2,3,4,5这5个元素中取3个组成一组。取第一个有5种可能,第二个有4种可能,第三个有3种可能。但如果考虑排列顺序呢?123,124,125,134,135,145,234,235,245,345r≦n时,\n练习A1.从20人中选择3人组成委员会,一共有多少种选法?2.有个12人组成的团体,其中5位女士,7位男士,现从中选取2位女士,3位男士组成一共委员会,问有多少种取法?另外,如果其中2位男士之间有矛盾,并且坚决拒绝一起工作,那又有多少种取法?\n\n\n1、确定现象2、随机现象表明随机事件出现可能性大小的客观指标就是概率(probability)一、概率的定义\n样本空间和事件假设某次试验的结果是不可预测、不可确定的。然而,尽管试验之前无法得知结果,但是假设所有可能的结果的集合是知道的。所有可能的结果构成的集合,称为该试验的样本空间。如,1.新生婴儿的性别集合={g,b}2.一共有7批马参加赛马比赛,分别是1,2,3,4,5,6,7号。其比赛结果的集合={(1,2,3,4,5,6,7)的所有7!种排列}事件——样本空间的任一子集称为事件。\n在掷骰子的试验中,我们可以定义许多事件,如:C1={出现1点};C2={出现2点};C3={出现3点};C4={出现4点};C5={出现5点};C6={出现6点};D1={出现的点数不大于1};D2={出现的点数大于3};D3={出现的点数小于5};E={出现的点数小于7};F={出现的点数大于6};G={出现的点数为偶数};H={出现的点数为奇数};……\n一般地,对于事件A与事件B,如果事件A发生,则事件B一定发生,这时称事件B包含事件A(或称事件A包含于事件B),记作。事件的关系和运算:BA如图:例.事件C1={出现1点}发生,则事件H={出现的点数为奇数}也一定会发生,所以.注:不可能事件记作,任何事件都包括不可能事件。(1)包含关系\n事件的关系和运算:(2)相等关系一般地,对事件A与事件B,若,那么称事件A与事件B相等,记作A=B。BA如图:例.事件C1={出现1点}发生,则事件D1={出现的点数不大于1}就一定会发生,反过来也一样,所以C1=D1。\n事件的关系和运算:(3)并事件(和事件)若某事件发生当且仅当事件A发生或事件B发生,则称此事件为事件A和事件B的并事件(或和事件),记作。BA如图:例.若事件J={出现1点或5点}发生,则事件C1={出现1点}与事件C5={出现5点}中至少有一个会发生,则.\n事件的关系和运算:(4)交事件(积事件)若某事件发生当且仅当事件A发生且事件B发生,则称此事件为事件A和事件B的交事件(或积事件),记作。BA如图:例.若事件M={出现1点且5点}发生,则事件C1={出现1点}与事件C5={出现5点}同时发生,则.\n事件的关系和运算:即书上说的互不相容事件若为不可能事件(),那么称事件A与事件B互斥,其含义是:事件A与事件B在任何一次试验中都不会同时发生。AB如图:例.因为事件C1={出现1点}与事件C2={出现2点}不可能同时发生,故这两个事件互斥。(5)互斥事件\n事件的关系和运算:(6)互为对立事件若为不可能事件,为必然事件,那么称事件A与事件B互为对立事件,其含义是:事件A与事件B在任何一次试验中有且仅有一个发生。AB如图:例.事件G={出现的点数为偶数}与事件H={出现的点数为奇数}即为互为对立事件。\n3、概率的统计定义例如:从一副扑克牌中抽出一张红桃K的概率是多少?\n硬币朝向试验试验者抛掷次数正面朝上次数正面朝上比率德摩根蒲丰皮尔逊皮尔逊20484040120002400010612048601912012.5181.5069.5016.5005\n4、概率的古典定义例如:一副扑克牌是54张不同的牌,即有54个基本事件,红桃k是其中一个基本事件,那么随机抽取抽中红桃k的概率就是1/54\n(二)概率的基本性质1、概率的公理系统2、概率的加法和乘法定理\n概率的加法(additionalrule)在一次试验中不可能同时出现的事件称为互不相容的事件。两个互不相容事件和的概率,等于这两个事件概率之和。用公式表示为:P(A+B)=P(A)+P(B)其推广形式是P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)\n概率的广义加法定理设A、B为任意两个随机事件,则它们的和的概率,等于事件A发生的概率加上事件B发生的概率再减去A、B同时发生的概率,即P(A∪B)=P(A)+P(B)-P(A∩B)\n例题一某大学有50%的学生喜欢看足球比赛,40%的喜欢看篮球比赛,30%两者都喜欢。问,从该校任意抽取一名学生,他爱看足球比赛或篮球比赛的概率是多少?\n例题一解答设喜欢看足球比赛学生比例为P(A);喜欢看篮球比赛学生的比例为P(B);则两者都喜欢的比例为P(A∩B)。爱看足球比赛或篮球比赛的比例为P(A∪B)。根据概率的广义加法定义P(A∪B)=P(A)+P(B)-P(A∩B)得到P(A∪B)=50%+40%-30%=60%\n概率的乘法(multiplicationrule)A事件出现的概率不影响B事件出现的概率,这两个事件为独立事件。两个独立事件积的概率,等于这两个事件概率的乘积。用公式表示为:P(A·B)=P(A)·P(B)其推广形式是P(A1·A2…An)=P(A1)·P(A2)…P(An)\n练习B1.某人度假时带了两本书。他喜欢第一本书的概率是0.5,喜欢第二本书的概率是0.4,两本书都喜欢的概率是0.2,问两本书都不喜欢的概率是多少?2.一个碗里有6个白球,5个黑球,随机地从里面取出3个球,问恰好有一个白球两个黑球的概率是多少?3.在一副牌中(去除joker),选取5张连续的,但却不是同一花色的牌组(顺子)的概率是多少?\n条件概率(conditionalprobability)如果A、B是一定条件组下的两个随机事件,且P(B)≠0,则称在B发生的前提下A发生的概率为条件概率\n例二老猫为选修法语课还是选修日语课这件事犹豫不决,他估计如果选修日语课,获得“A”等成绩的概率为1/2,而如果选修法语课,则获得“A”等成绩的概率为2/3.如果老猫通过掷硬币来做决定,问他将选修法语课,并获得“A”等成绩的概率是多大?\n练习某大学的女生占学生总数的70%,该校四年级女生占全校学生总数的10%。现在有一女生,问她是四年级的概率是多大?解:设随机事件A为“抽到四年级学生”随机事件B为“抽到女生”则A∩B表示“抽到四年级女生”,且P(A∩B)=0.10现在B已经发生,则此时事件A的条件概率为P(A│B)=P(A∩B)/P(B)=0.10/0.70=0.1429\n例题三在一个城市中,有两个出租车公司。甲公司车辆占85%,乙公司占15%。根据记录知道,两公司司机被投诉的比率分别为5%和4%,现任意抽取一名司机,问他被投诉过的概率是多少?\n例题三解答设事件B为司机被投诉事件A1为抽取的司机属于甲公司事件A2为抽取的司机属于乙公司P(B∩A1)=P(A1)·P(B|A1) =0.85×0.05=0.0425P(B∩A2)=P(A2)·P(B|A2) =0.15×0.04=0.0060P(B)=P(B∩A1)+P(B∩A2) =0.0425+0.0060=0.0485以上公式推广到一般情况,即全概率公式\n扩展全概率与贝叶斯公式\n练习有甲乙丙3名被试参加一个心理学测验,测验要求他们合作完成一项任务:制作一批纸品。结果,甲制作了所有纸品的35%,乙制作了40%,丙制作了25%。甲的次品率为1%,乙为1.5%,丙为1%。现在抽出一个纸品发现是次品,问这个次品分别是甲乙丙制作的概率是多少?\n扩展语音识别、机器翻译的实现我们可以用一个简单的统计模型来解决这个问题。如果S表示一连串特定顺序排列的词w1,w2,…,wn,换句话说,S可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子。现在,机器对语言的识别从某种角度来说,就是想知道S在文本中出现的可能性,也就是数学上所说的S的概率用P(S)来表示。利用条件概率的公式,S这个序列出现的概率等于每一个词出现的概率相乘,于是P(S)可展开为:P(S)=P(w1)P(w2|w1)P(w3|w1w2)…P(wn|w1w2…wn-1)其中P(w1)表示第一个词w1出现的概率;P(w2|w1)是在已知第一个词的前提下,第二个词出现的概率;以次类推。不难看出,到了词wn,它的出现概率取决于它前面所有词。\n从计算上来看,各种可能性太多,无法实现。因此我们假定任意一个词wi的出现概率只同它前面的词wi-1有关(即马尔可夫假设),于是问题就变得很简单了。现在,S出现的概率就变为:P(S)=P(w1)P(w2|w1)P(w3|w2)…P(wi|wi-1)…(当然,也可以假设一个词又前面N-1个词决定,模型稍微复杂些。)接下来的问题就是如何估计P(wi|wi-1)。现在有了大量机读文本后,这个问题变得很简单,只要数一数这对词(wi-1,wi)在统计的文本中出现了多少次,以及wi-1本身在同样的文本中前后相邻出现了多少次,然后用两个数一除就可了,P(wi|wi-1)=P(wi-1,wi)/P(wi-1)。\n(三)概率分布(probabilitydistribution是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。1、离散型随机变量2、连续型随机变量\n例4.1N=10,分数值为1,1,2,3,3,4,4,4,5,6如果你从中选择了一个n=1的随机分数,得到的分数大于4的概率是多少?用概率符号表示:p(X>4)=?\n二、二项分布(bionimaldistribution)二项分布是一种离散型随机变量的概率分布,是两个对立事件的概率分布。(一)二项实验第三个条件有时难以保证。\n(二)二项分布具体定义:设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率是q(等于1-p),则对于某事件出现k次(0,1,2,......,n)的概率分布为:这里为二项式系数,或记为\n图4.1九个二项分布B(5,p)(p=0.1到0.9)的概率分布图\n\n(三)二项分布的性质(四)二项分布的应用\n三、正态分布它是连续型随机变量中常见的一种概率分布形态,因此也称常态分布。在数理统计的理论与实际应用中占有最重要地位的一种理论分布。\n概率密度函数想象连续变量观测值的直方图;如果其纵坐标为相对频数,那么所有这些矩形条的高度和为1;完全可以重新设置量纲,使得这些矩形条的面积和为1。不断增加观测值及直方图的矩形条的数目,直方图就会越来越像一条光滑曲线,其下面的面积和为1。该曲线即所谓概率密度函数(probabilitydensityfunction,pdf),简称密度函数或密度。下图为这样形成的密度曲线。\n逐渐增加矩形条数目的直方图和一个形状类似的密度曲线。\n连续变量落入某个区间的概率就是概率密度函数的曲线在这个区间上所覆盖的面积;因此,理论上,这个概率就是密度函数在这个区间上的积分。对于连续变量,取某个特定值的概率都是零,而只有变量取值于某个(或若干个)区间的概率才可能大于0。连续变量密度函数曲线(这里用f表示)下面覆盖的总面积为1,即\n(一)正态分布密度函数(二)正态分布的特征1、对称。2、正态分布的中央点最高,然后逐渐向两侧下降——先向内弯,然后向外弯曲,拐点位于正负一个标准差处。曲线两端向靠近基线处无限延伸,但终不能与基线相交。3、正态曲线下的面积为1,左右各为0.5。正态曲线下的面积可视为概率。4、正态分布是一族分布。5、正态分布曲线下,标准差与概率(面积)有一定的数量关系。\n图1标准差不同的正态分布形式\n图2正态曲线下单位标准差面积比例\n当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线下面的面积。比如,标准正态分布变量落在区间(0.51,1.57)中的概率,就是在标准正态密度曲线下面在0.51和1.57之间的面积。很容易得到这个面积等于0.24682;也就是说,标准正态变量在区间(0.51,1.57)中的概率等于0.24682。如果密度函数为f(x),那么这个面积为积分\n标准正态变量在区间(0.51,1.57)中的概率\n(三)正态分布表正态分布密度函数公式\nNBA2008-2009赛季球员投篮命中率次数多边形图资料来源:SOHUNBA数据中心\n(四)正态分布理论在测验中的应用1、确定分数线2、确定能力分组或等级评定的人数3、等级评定数量化4、确定测验题目的难易度\n作业一一枚硬币投掷三次,问出现两次或两次以上正面的概率是多少?可能出现的结果是:正正正、正正反、正反正、反正正反反正、反正反、正反反、反反反每种结果可能出现的概率:两次或两次以上正面的概率是:\n作业二、三2、成人身高形成了一个正态分布,平均数为165cm,,标准差是15cm。随机从这个总体中选择一个个体,身高大于195cm的概率是多少?3、找到正态分布中于下列部分相应的比例:Z<+1.00Z>+0.80Z<-2.00Z>-0.33Z>-0.50\n作业4、1个硬币掷6次,3次正面向上的概率是多少?3次及3次以上正面向上的概率是多少?5、自一副洗好的纸牌中每次抽取一张,抽取下列纸牌的概率是多少?①一张K?②一张梅花?③一张红桃?④一张黑心?⑤一张不是J、Q、K的黑桃?\n作业6、在单位正态分布中,找出有下列个案百分数的标准测量Z的值。①85②55③35④42.3⑤9.4

相关文档