- 517.00 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学概念\n统计概念目的:复习基本的统计学概念。目标:解释以下基本统计概念。1.误差2.连续数据和离散数据3.平均值、方差、标准差4.正态曲线5.用Z值将数据标准化6.中心极限定理7.工序能力-使用Z值作为衡量工序能力的指标-通过改进关键值Xs来改进Y\n观测值变化当重复进行测量的时候,通常会得到不同的答案,这就是误差!系统误差预期的和可预测的测量结果之间的差异。举例:夏季和圣诞节假日的电灶销售量不同。随机误差不可预测的测量结果之间的差异。举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试…...可能得到两个不同的结果。1.2.\n观测值变化(续)我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。如果所有地区的电灶销售量是一样的,那么我们就会怀疑是数据库出了问题。.如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。这种变化使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而且非常注意如何选取这些样本,以减少偏差。偏差的产生是很自然的,意料之中的,是统计学的基础\n统计学的作用统计学用以下方法处理误差:(置信区间和假设检验)。统计描述用图表和几个总结性数字(均值、方差、标准差)描述一组数据。统计推理确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。收集并分析数据,以估算过程变化的影响。试验设计\n数据的两种类型连续(可变)数据使用一种度量单位,比如英寸或小时。离散(属性)数据是类别信息,比如““通过”或““未通过”。连续数据离散数据问题解决办法\n连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的特性。测量标准可以有意义地不断分割,使精确度提高。你能举出我们用来获得连续数据的三个器具例子吗?相对于仅仅知道部件是否合格而言,连续数据可以提供更多的信息。连续数据(也称为可变数据)\n离散数据不能更进一步精确地细分。离散数据是某件事发生或未发生的次数,以发生的频数来表示。离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。无罪或有罪离散数据(也称为属性或类别数据)烟火探测器地区\n离散数据一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获得更多的信息。如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出判断。.连续数据与离散数据进行比较的解释:离散数据举例:有凹痕的部件数量通过/未通过申诉决议产出生产线不合格品数量及时交货离散数据需要更多的数据点才能进行有效的分析\n请在下面的例子旁,写出它是“连续”还是“离散”1销售订单准确度2数据输入准确度3销售地区4使用“合格/不合格”测量仪器得到的孔径5孔径6应答中心对话时间7制冷氟利昂的重量(克)8每百万部件中有缺陷部件的数量9装配线缺陷(ALD)练习-应用你所学到的东西\n总体-全组数据,全部对象。-一个总体中的元素数量用N来表示样本-总体的一个子集-样本的元素数量用n来表示平均值-总体或样本的平均值-总体的平均值用来表示-样本的平均值用X或来表示方差-数据与其平均值之间差值的平方的平均值。(它代表该组数据的分散程度)-总体的方差用表示-样本的方差用s2或表示均方差是方差的(正)平方根。(它也代表该组数据的分散程度)。-总体的标准差用来表示-样本的标准差用s或表示统计学术语^^^^\n统计学术语和定义总体-全部对象.举例–1998年5月在Decatur生产的所有的16立方英尺冰箱样本-代表总体的一个子集数据。举例-1998年5月在Decatur生产的一百二十台十六立方英尺冰箱举例:这个矩阵代表25个X的总体。画上圆圈的那些是由总体中的六个X组成的样本。\n平均值-总体或样本的平均值。用x或来表示样本,用来表示总体。举例:给定一个样本:{1,3,5,4,7},平均值就是:统计学术语和定义x=xn在这里X1是样本的第一个点,Xn是样本的最后一个点。.i1nå,平均值的公式x=(1+3+5+4+7)=20=4.055样本的平均值等于4。^\n标准差-衡量数据分散程度的一个指标。一般用表示总体,用s或表示样本。=(Xi-)2i=1NN总体的公式方差-与平均值之差的平方的平均值。一般用s2或2来表示。=S=(Xi-X)2i=1nn-1样本的公式统计学术语和定义^^\n举例课堂举例:计算样本{2,6,4}的方差和标准差首先计算均值:(2+6+4)/3=12/3=4计算平均值、方差和标准差x=xnii=1ns2=n(Xi-X)2i=1n-1s=(Xi-X)2i=1nn-1平均值方差标准差方差(s2)=8/(3-1)=4标准差(s)=sqrt(4)=2ixi(xi-4)(xi-4)212-2426243400和1208\n课堂练习课堂举例:计算样本{1,3,5,4,7}的方差和标准差(使用下面的表作为向导。)首先计算平均值X:计算平均值、方差和标准差x=xni1ns2=n(Xi-X)2i=1n-1s=(Xi-X)2i=1nn-1均值方差标准差方差(s2)=标准差(s或)=^\n绘制直方图75706560151050高度频数59616363645962666565646065626468706563646866656667646658656571636963667064676466626464646164636564686667697168666563646468676564656470656865666966666563686662676566676660676360647390位女士的身高\n用直方图形成一个连续分布测定单位条形的中心点平滑的曲线连接每个条形的中心点许多(但非全部)数据符合“正态”分布,或钟形曲线。\n正态分布的标准差()拐点1USLp(d)上限(USL)下限(LSL)均值()标准差()3拐点与平均值之间的距离是一个标准差。如果三倍的标准差都落在目标值和规范的上下限内,我们就称这个过程具有“三个西格玛能力”平均值LSL曲线从较陡的状态变得越来越平坦\n面积和概率合格部件控制限曲线下的面积是1.0。我们可以计算规范上下限之外的面积,也就是出现缺陷的概率。一个缺陷部件的概率正态曲线与横轴之间的面积等于1,所以曲线下面的面积与缺陷发生的概率相关。正态分布可以用来将和转换为出现缺陷的百分比。\n规范上限出现缺陷的概率=.0643假设Z=1.52。1.52之外的正态曲线下部的面积就是出现缺陷的概率。Z值是工序能力的一种尺度,通常称为“工序的西格马”,不要与过程标准差混淆。Z曲线下的整个面积是1=0(在这里=1,=0)使用正态表Z=1.52下页上的表列出了Z值右边的面积。\n正态分布Z00.010.020.030.040.050.060.070.080.090.05.00E-014.96E-014.92E-014.88E-014.84E-014.80E-014.76E-014.72E-014.68E-014.64E-010.14.60E-014.56E-014.52E-014.48E-014.44E-014.40E-014.36E-014.33E-014.29E-014.25E-010.24.21E-014.17E-014.13E-014.09E-014.05E-014.01E-013.97E-013.94E-013.90E-013.86E-010.33.82E-013.78E-013.75E-013.71E-013.67E-013.63E-013.59E-013.56E-013.52E-013.48E-010.43.45E-013.41E-013.37E-013.34E-013.30E-013.26E-013.23E-013.19E-013.16E-013.12E-010.53.09E-013.05E-013.02E-012.98E-012.95E-012.91E-012.88E-012.84E-012.81E-012.78E-010.62.74E-012.71E-012.68E-012.64E-012.61E-012.58E-012.55E-012.51E-012.48E-012.45E-010.72.42E-012.39E-012.36E-012.33E-012.30E-012.27E-012.24E-012.21E-012.18E-012.15E-010.82.12E-012.09E-012.06E-012.03E-012.01E-011.98E-011.95E-011.92E-011.89E-011.87E-010.91.84E-011.81E-011.79E-011.76E-011.74E-011.71E-011.69E-011.66E-011.64E-011.61E-011.01.59E-011.56E-011.539E011.52E-011.49E-011.47E-011.45E-011.42E-011.40E-011.38E-011.11.36E-011.34E-011.31E-011.29E-011.27E-011.25E-011.23E-011.21E-011.19E-011.17E-011.21.15E-011.13E-011.11E-011.09E-011.08E-011.06E-011.04E-011.02E-011.00E-019.85E-021.39.68E-029.51E-029.34E-029.18E-029.01E-028.85E-028.69E-028.53E-028.38E-028.23E-021.48.08E-027.93E-027.78E-027.64E-027.49E-027.35E-027.21E-027.08E-026.94E-026.81E-021.56.68E-026.55E-026.43E-026.30E-026.18E-026.06E-025.94E-025.82E-025.71E-025.59E-021.65.48E-025.37E-025.26E-025.16E-025.05E-024.95E-024.85E-024.75E-024.65E-024.55E-021.74.46E-024.36E-024.27E-024.18E-024.09E-024.01E-023.92E-023.84E-023.75E-023.67E-021.83.59E-023.52E-023.44E-023.36E-023.29E-023.22E-023.14E-023.07E-023.01E-022.94E-021.92.87E-022.81E-022.74E-022.68E-022.62E-022.56E-022.50E-022.44E-022.39E-022.33E-022.02.28E-022.22E-022.17E-022.12E-022.07E-022.02E-021.97E-021.92E-021.88E-021.83E-022.11.79E-021.74E-021.70E-021.66E-021.62E-021.58E-021.54E-021.50E-021.46E-021.43E-022.21.39E-021.36E-021.32E-021.29E-021.26E-021.22E-021.19E-021.16E-021.13E-021.10E-022.31.07E-021.04E-021.02E-029.90E-039.64E-039.39E-039.14E-038.89E-038.66E-038.42E-032.48.20E-037.98E-037.76E-037.55E-037.34E-037.14E-036.95E-036.76E-036.57E-036.39E-032.56.21E-036.04E-035.87E-035.70E-035.54E-035.39E-035.23E-035.09E-034.94E-034.80E-032.64.66E-034.53E-034.40E-034.27E-034.15E-034.02E-033.91E-033.79E-033.68E-033.57E-032.73.47E-033.36E-033.26E-033.17E-033.07E-032.98E-032.89E-032.80E-032.72E-032.64E-032.82.56E-032.48E-032.40E-032.33E-032.26E-032.19E-032.12E-032.05E-031.99E-031.93E-032.91.87E-031.81E-031.75E-031.70E-031.64E-031.59E-031.54E-031.49E-031.44E-031.40E-033.01.35E-031.31E-031.26E-031.22E-031.18E-031.14E-031.11E-031.07E-031.04E-031.00E-033.19.68E-049.35E-049.04E-048.74E-048.45E-048.16E-047.89E-047.62E-047.36E-047.11E-043.26.87E-046.64E-046.41E-046.19E-045.98E-045.77E-045.57E-045.38E-045.19E-045.01E-043.34.84E-044.67E-044.50E-044.34E-044.19E-044.04E-043.90E-043.76E-043.63E-043.50E-043.43.37E-043.25E-043.13E-043.02E-042.91E-042.80E-042.70E-042.60E-042.51E-042.42E-043.52.33E-042.24E-042.16E-042.08E-042.00E-041.93E-041.86E-041.79E-041.72E-041.66E-043.61.59E-041.53E-041.47E-041.42E-041.36E-041.31E-041.26E-041.21E-041.17E-041.12E-043.71.08E-041.04E-049.97E-059.59E-059.21E-058.86E-058.51E-058.18E-057.85E-057.55E-053.87.25E-056.96E-056.69E-056.42E-056.17E-055.92E-055.68E-055.46E-055.24E-055.03E-053.94.82E-054.63E-054.44E-054.26E-054.09E-053.92E-053.76E-053.61E-053.46E-053.32E-054.03.18E-053.05E-052.92E-052.80E-052.68E-052.57E-052.47E-052.36E-052.26E-052.17E-054.12.08E-051.99E-051.91E-051.82E-051.75E-051.67E-051.60E-051.53E-051.47E-051.40E-054.21.34E-051.29E-051.23E-051.18E-051.13E-051.08E-051.03E-059.86E-069.43E-069.01E-064.38.62E-068.24E-067.88E-067.53E-067.20E-066.88E-066.57E-066.28E-066.00E-065.73E-064.45.48E-065.23E-065.00E-064.77E-064.56E-064.35E-064.16E-063.97E-063.79E-063.62E-064.53.45E-063.29E-063.14E-063.00E-062.86E-062.73E-062.60E-062.48E-062.37E-062.26E-064.62.15E-062.05E-061.96E-061.87E-061.78E-061.70E-061.62E-061.54E-061.47E-061.40E-064.71.33E-061.27E-061.21E-061.15E-061.10E-061.05E-069.96E-079.48E-079.03E-078.59E-074.88.18E-077.79E-077.41E-077.05E-076.71E-076.39E-076.08E-075.78E-075.50E-075.23E-074.94.98E-074.73E-074.50E-074.28E-074.07E-073.87E-073.68E-073.50E-073.32E-073.16E-07Z\n科学记数法科学记数法是将数字写成一个数字的10次幂的一种方法。我们来看一些用科学记数法表示的数字。6.43E-02是.0643的科学记数法格式。6.43E-02=6.42x10-2=.06426.43E-02实际数字科学记数法6.43代表基数将基数乘以10的幂:10-21271.27E+02224162.24E+040.06436.43E-020.0000565.60E-052.0512.05E+00如果“E”后面的数字是负的,那么就将数字的小数点的位置挪到左边。\nZ值–转化为“标准正态”我们需要利用正态分布的平均值和标准差将其转化为“标准正态”分布,以便使用标准正态分布表来获得概率。通过转换将变量(y)转换为标准正态分布。标准正态分布的平均值(=0,标准差()=1.规范上限(USL)规范上限Z值是平均值与规范的上下限之间所包含的标准差个数。出现一个缺陷部件的概率USL-Z=对于规范的上限:\n规范是1.030”+.030=(1.000,1.060)假设我们测量了30个部件,X=1.050,s=.015计算一下不符合规范的部件的比例1.0201.0351.0501.0651.080LSLUSL目标值正态分布举例从正态表可以看出,.2514或者(25%)不符合规范。USLZ.USL=USL-XS=1.060-1.050.015Z.USL=+.67XLSLZ.LSL=X-LSLS=1.050-1.000.015Z.LSL=3.33从正态表可以看出,.0004或者(.04%)不符合规范数据的实际分布\n现状分析报告中的Z值就是ZBench。ZBench的定义PUSL是相对USL而出现缺陷的概率。PLSL是相对LSL而出现缺陷的概率。PTOT是出现缺陷的总概率PTOT=PUSL+PLSLZBench是与出现缺陷的总概率相对应的Z值,可从正态表中查到。25.14%.04%ZLSL=3.33ZUSL=0.6725.18%ZBENCH=.67\n中心极限定理-为什么我们得到的通常是正态分布平均值分布–n个测量结果的平均值单个变量的分布图XX(总平均数)中心极限定理表明,如果n足够大,样本平均值(x)或其总和的分布,都近似于正态分布,无论单个变量是否服从正态分布。每个子群中有“n”个样本。-\n中心极限定理-为什么我们通常得到正态分布中心极限定理表明,如果n足够大,样本平均值(x)或其总和的分布,都近似于正态分布,无论单个变量是否服从正态分布。例1“总销量”是许多经销商的销售量的总和。一个经销商的销售量可能不是正态分布,但总销量很可能近似于正态分布。例2一堆部件的高度可能近似服从于正态分布,尽管个别部件的高度不是正态分布。注意:不是所有数据都符合正态分布。后面我们将讨论如何检验正态性,以及如何处理非正态分布数据。\nZ作为一种能力的尺度zUSLT+3能力Z=3123USL+6能力Z=6123456T随着偏差减小,出现缺陷的概率降低,所以,能力提高。我们希望:小z大\n提高工序能力Y=f(X)Y是因变量。X是独立变量。Y取决于X。改进X才能改进Y。独立变量(Xs)有时被称为“根本原因系统”。因变量(Y)有时被称为响应变量。Y取决于独立变量,或“X”变量。至关重要的少数变量也被称为“杠杆”变量,因为它们对因变量具有重大影响。\n统计学问题:是均值偏离、偏差过大,还是两者兼而有之控制平均值的杠杆变量控制标准差的杠杆变量变量YY=f(X1,...,XN)较差的工序能力LSLUSLLSLUSL出色的工序能力均值偏移过度分散能力改进的焦点\n这适用于所有过程—制造业和商业。稳定运行可以从过程中消除偏差,使结果更加稳定、提高可预测度。偏差是恶魔,发现它并且清除它!低劣表现出色表现客户:“我希望每天都这样”稳定的运行\n“坏日子”“一般的日子”“好日子”Q1平均值Q3产品产量的直方图根除坏日子,提高一致性,提高平均值。将坏日子变为好日子\n原来的行为增加平均值。偏差保持不变。依然存在着坏日子!稳定运行根除过程的“不稳定“部分(坏日子)。平均值也增加了!初始表现根除坏日子,改进一致性,提高平均值。平均值平均值平均值稳定的运行会降低偏差\nRawDataSortedQ3Q31Q3=23646Q1=12215原始数据分类后顶部25%底部25%1)测量您的工序每天的产量。2)将数据按从最好到最坏顺序排列。3)将数据四等分。Q1=1/4的日子较差。3/4的日子较好。Q3=3/4的日子较差。1/4的日子较好。4)计算稳定性因子(SF):SF=Q1/Q3=12215/23646=.52随着偏差的降低,稳定性因子越来越接近1.0。“稳定性因子”:Q1/Q3\n根除坏日子,提高一致性,提高平均值平均值初始表现Q1Q3稳定操作1.根除过程的“不稳定“部分(坏日子)。2.增加Q1.3.降低偏差。4.平均值也增加了!Q1稳定操作降低偏差\n偏差是恶魔。发现它,并且消除它!稳定运行带来的好处客户会看到更高的一致性和可靠性。过程的可预测性增加,更易于管理。平均值(能力)更高。利用“隐蔽的工厂”。低劣表现出色表现客户:“我每天都希望实现这个目标”\n稳定运行:如何实现1.在测量阶段,计算您的过程的稳定性因子。发现那些具有低稳定性因子的过程,那些具有最大改进机会的过程。2.使用分析方法筛选出可能导致坏日子的关键因素X。3.使用改进方法来确认将坏日子变成好日子的关键因素X。4.控制关键因素X,保持高稳定性。使用六个西格玛方法来实施稳定操作。\n关键概念统计学概念-1误差存在于所有过程。连续(可变)数据可以有意义地进一步分割,例如,长度,重量。离散数据是以类别形式存在的,不能进行分割。总体就是全部对象。样本就是总体的一个子集。平均值–分布的平均数。标准差–分布的分散程度。方差–标准差的平方。正态分布–对称分布于平均值两边的数据,钟形曲线。标准正态分布–具有平均值(m)=0和标准差(s)=1的正态分布。\n关键概念统计学概念-2中心极限定理表明,无论单个变量是不是服从正态分布,多个变量的平均值或总和通常近似于正态分布。Z值是平均值与规范的上下限之间所包含的标准差个数Y(‘响应变量’)-因变量X(‘因素’)-独立变量Y=f(X):Y取决于X。通过确定和改进关键的X变量来改进Y。工序能力–过程的偏差与其要求(规范)之间的比较。稳定运行-集中于降低偏差,使坏日子变成好日子。稳定性因子-Q1/Q3.第一个四等分/第三个四等分。