华为6Sigma培训教程概率与统计基础

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

SCMSixSigmaTeamHUAWEITECHNOLOGIESCo.,Ltd.内部公开供应链6SIGMA推行组供应链管理部SixSigmaGreenBeltTraining概率与统计基础供应链管理部供应链管理部SixSigmaGreenBeltTrainingSixSigmaGreenBeltTraining概率与统计基础概率与统计基础HUAWEITECHNOLOGIESCo.,Ltd.Page2HUAWEIConfidential66σσ学习目标•掌握概率与统计基本概念、随机变量分布基础知识。•应用概率统计方法处理业务数据,获取决策信息。•概率基本概念、数据类型、数据分布的统计特征•随机变量分布、常用的连续分布、常用的离散分布•中心极限定理•统计基本概念、统计方法•正态总体抽样分布、参数的点估计、参数的区间估计•应用案例交流内容HUAWEITECHNOLOGIESCo.,Ltd.Page3HUAWEIConfidential66σσ概率的基本概念—随机现象与概率随机现象:在一定条件下,并不总是出现相同结果的现象称为随机现象。特点:1)随机现象结果至少有两个;2)至于哪一个出现,人们事先并不知道。如:抛硬币、骰子,某单板缺陷数,包装破损,运输时间,订单处理时间.....概率:在一个随机现象中,用来表示任一个随机事件A发生可能性大小的实数(即比率)称为该事件的概率,记为P(A),并规定:非负性公理:对任一事件A,必有P(A)≥0;正则性公理:必然事件的概率P(Ω)=1;可加性公理:若A1与A2是两个互不相容事件(即A1A2=φ),则有P(A1∪A2)=P(A1)+P(A2)这就是概率的公理化定义,是概率论发展史上的一个里程碑。HUAWEITECHNOLOGIESCo.,Ltd.Page4HUAWEIConfidential66σσ概率的基本概念—概率计算演练:一批产品共10个,其中不合格品为3个,现从中随机抽取4个,问其中恰好有2个不合格品的概率?(不放回抽样)103)(4102723CCCCCCAPnNmnMNmMm思考:1.每人抛一枚硬币10次,记录正面、反面出现的次数情况如何?反复不停地抛,正面反面出现的次数如何?2.我们每天乘车上班,问:明天乘车所用时间将是多少?概率论所研究的就是大量随机现象的规律,概率论并不能确定一次试验下随机变量所取的值是多少,它所要研究的是随机变量所取之值的规律,即出现各种结果的可能性如何HUAWEITECHNOLOGIESCo.,Ltd.Page5HUAWEIConfidential66σσ概率的基本概念—性质概率的基本性质:性质一(非负性):对于任一事件,0≤P(A)≤1;P(φ)=0,P(Ω)=1。性质二:对任一事件,P(A)=1-P(A)。性质三:对于任意两个事件A、B,若A>B,则:P(A)≥P(B)P(A-B)=P(A)-P(B)性质四:对于任意两个事件A、B,有:P(A∪B)=P(A)+P(B)-P(AB)P(A∪B)≤P(A)+P(B)当A、B互不相容时,P(A∪B)=P(A)+P(B)性质五:对于多个互不相容事件,A1、A2、A3……,也有类似性质:P(A1∪A2∪A3∪……)=P(A1)+P(A2)+P(A3)+……HUAWEITECHNOLOGIESCo.,Ltd.Page6HUAWEIConfidential66σσ概率的基本概念—随机变量随机变量:一次试验的结果的数值性描述假如一个变量在数轴上的取值依赖于随机现象的基本结果,则称此变量为“随机变量”。常用大定字母X、Y、Z表示,其取值用小写字母x、y、z表示。随机变量的分类:离散型随机变量连续型随机变量X1x2x3x4x5ab离散型随机变量的可能取值连续型随机变量的可能取值HUAWEITECHNOLOGIESCo.,Ltd.Page7HUAWEIConfidential66σσ概率的基本概念—随机变量大家可否举些业务中例子:哪些随机变量是离散型随机变量,哪些随机变量是连续型随机变量?0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为1可能的取值取到次品的个数顾客数销售量顾客性别抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车随机变量试验X00X100X0可能的取值使用寿命(小时)半年后工程完成的百分比测量误差(cm)抽查一批电子元件新建一座住宅楼测量一个产品的长度随机变量试验离散型随机变量连续型随机变量HUAWEITECHNOLOGIESCo.,Ltd.Page8HUAWEIConfidential66σσ概率的基本概念—随机变量的分布函数直观地说,随机变量就是“随机取值的变量”,或者说“取值随机会而定的变量”。但要认识一个随机变量就不能仅停留在这种感觉上,还应认识以下二点:随机变量X可能取哪些值,或取值范围是什么?随机变量X取这些值的概率是多少?随机变量的分布函数:设X为一个随机变量,对任意实数x,事件X≤x的概率是x的函数,记为:F(x)=P(X≤x)这个函数称为X的累积概率分布函数,简分布函数。性质:0≤F(x)≤1;F(x)为非降函数,即x1≤x2,则F(x1)≤F(x2);F(-∞)=limF(x)=0;F(+∞)=limF(x)=1;X→-∞X→+∞HUAWEITECHNOLOGIESCo.,Ltd.Page9HUAWEIConfidential66σσ概率的基本概念—离散型随机变量的概率分布离散型随机变量的概率分布:设X是离散型随机变量,它的所有可能取值是x1、x2、……、xn、……,假如X取xi的概率为:P(X=xi)=p(xi)≥0,i=1、2、……、n、……且满足以下条件:Σp(xi)=1则称这组概率{p(xi)}为该随机变量X的分布列,或X的概率分布。若已知离散型随机变量的概率分布,容易写出X的分布函数:F(x)=Σp(xi)注:但对于离散型随机变量,使用分布列更为方便,故常用分布列表示离散型随机变量的概率分布,一般不用分布函数。HUAWEITECHNOLOGIESCo.,Ltd.Page10HUAWEIConfidential66σσ概率的基本概念—离散型随机变量的概率分布离散型随机变量的概率分布一般的表示方法(列表方式):XX1X2……Xn……Pp1p2……pn……其它的表示方法还有:线条图或概率直方图例:在R公司生产的高频电容器件中,按质量等级可分为五级,其中1级最差,5级最好。现统计了1月份生产的电容器件质量各种等级所占比率。X12345P0.10.20.30.30.1px123450.10.20.3分布列表示分布图表示HUAWEITECHNOLOGIESCo.,Ltd.Page11HUAWEIConfidential66σσ概率的基本概念—连续型随机变量的概率分布连续型随机变量的概率分布:设f(x)是定义在整个数轴上的一个函数,假如它满足如下两个条件:1)(非负)2)(f(x)与横轴所夹面积为1),则称p(x)为概率密度函数,有时还简称密度。3)对于任意两个实数a与b,其中a<b,且可为负无穷大,b可为正无穷大,X在区间[a,b]上取值的概率为曲线f(x)在该区间的曲边梯形的面积,即P(a≤X≤b)=则称密度函数f(x)为连续随机变量X的概率分布,或简称f(x)为X的密度函数。P(a<X<b)=阴影区域面积1)(dxxf0)(xfbadxxf)(abHUAWEITECHNOLOGIESCo.,Ltd.Page12HUAWEIConfidential66σσ随机变量的数据类型属性类数据离散型数据连续型数据Yes/No;Go/Nogo;Pass/Fail供应商1、供应商2、供应商3测试仪器1、测试仪器2、测试仪器3良品/缺陷品生产周期压力速度功率缺陷数、不合格品数质量问题数客户报怨数设备故障数注:属性类数据通常用百分比来表示。如某产品测试通过率为85%。HUAWEITECHNOLOGIESCo.,Ltd.Page13HUAWEIConfidential66σσ数据分布的特征集中趋势集中趋势((位置位置))离中趋势离中趋势((分散程度分散程度))偏态和峰度偏态和峰度(形状)(形状)HUAWEITECHNOLOGIESCo.,Ltd.Page14HUAWEIConfidential66σσ数据分布的统计特征1098765432120100DegreeofattributeFrequencyHistogramX=DegreeofattributeY=FrequencyofX数据分布向我们展示了数据统计上的关键特征。我们通常用两个特征量来衡量:集中程度、分散程度HUAWEITECHNOLOGIESCo.,Ltd.Page15HUAWEIConfidential66σσ数据分布的特征和测度数据的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状分布的形状集中趋势集中趋势集中趋势离散程度离散程度离散程度众众数数中位数中位数均均值值离散系数离散系数方差和标准差方差和标准差峰峰度度四分位差四分位差异众比率异众比率偏偏态态HUAWEITECHNOLOGIESCo.,Ltd.Page16HUAWEIConfidential66σσ平均数平均数标准偏差标准偏差比比例例参数参数统计量统计量xxsspp统计中的几个基本概念HUAWEITECHNOLOGIESCo.,Ltd.Page17HUAWEIConfidential66σσ数据的集中程度变量平均值(Mean)中位数(Median)众数(Mode)中心值—将数据进行排序,位置在中间的数据。n为奇数,中位数为x(n+1)/2n为偶数,中位数为1/2[xn/2+x(n/2+1)]数据中出现频率最高的数值,记为Mod。NXnii1nxxnii1问题一:分别是什么含义?问题二:下面数据的中位数:481263141416?iixXnNx/////HUAWEITECHNOLOGIESCo.,Ltd.Page18HUAWEIConfidential66σσ数据的离散程度变量极差(Range)方差(Variance)标准方差(Standarddeviation)问题:分别是什么含义?ss///22xn-x1有序样本NiiXXN12211niixxns12211112NXXNii112nxxsniiHUAWEITECHNOLOGIESCo.,Ltd.Page19HUAWEIConfidential66σσ自由度(degreeoffreedom)1.自由度是指附加给独立的观测值的约束或限制的个数2.从字面涵义来看,自由度是指一组数据中可以自由取值的个数3.当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值4.按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k1.样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值2.为什么样本方差的自由度是n-1呢?因为在计算偏差平方和时,必须先求出样本均值x,而x则是附加给偏差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个HUAWEITECHNOLOGIESCo.,Ltd.Page20HUAWEIConfidential66σσ数据的离散程度变量四分位数1.上四分位数与下四分位数之差QD=QU-QL2.反映了中间50%数据的离散程度3.不受极端值的影响最小值107最小值最小值107107最大值139最大值最大值139139中位数1

1 / 76
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功