統計1JasonLee2003/2/19單元(二)統計運用及品管實務工具資料數據基礎統計運用概念生產製造環境實用品質統計工具製程能力分析與SPC統計製程控制統計2JasonLee2003/2/19資料及數據統計3JasonLee2003/2/19你想瞭解什麽?資訊源:分組離散型名義型順序型間距型“資料本身並不能提供資訊——必須對資料加以處理以後才能得到資訊,而處理資料的工具就是統計學”.衡量連續型比率型●文字的(AtoZ)●圖示的●口頭的●數位的(0-9)數據統計4JasonLee2003/2/19FAILPASS計時器NO-GOGO數量單價說明總價1$10.00$10.003$1.50$4.5010$10.00$10.002$5.00$10.00裝貨單離散型資料和連續型資料電氣電路溫度溫度計連續型離散型卡尺錯誤統計5JasonLee2003/2/19•離散型資料(通常)•分組/分類•是/否,合格/不合格•不能計算•離散型資料•分級•很少用•很難加以計算•連續型資料•最常見的尺規•計算時要很小心•連續型資料•比例關係•可應用演算法的多數公式•分類•標簽•第一、第二、第三•相對高度•字母順序•1234•溫度計•刻度盤•速度=距離/時間•直尺衡量工具分類說明例子衡量工具分類名義型:不相關類,只代表符合條件或不符合條件個體數.順序型:順序類,但沒有各類間隔的資訊.間距型:順序類,兩類之間間隔相等,但沒有絕對零點.比例型:順序類,兩類之間間隔相等,同時存在絕對零點..離散型連續型統計6JasonLee2003/2/19$$連續資料的優勢連續的信息量少信息量多統計7JasonLee2003/2/19基礎統計運用概念統計8JasonLee2003/2/19變異(Variation)當我們從一過程中收集數據,會發現數據不會永遠相同,因為變異(Variation)在過程中隨時存在製造流程Step1Step2Step3ProcessOutputOutputofProcessStepEquipmentMaterialsEnvironmentPeopleMethodsInformation統計9JasonLee2003/2/19變異(Process)=變異(Step1)+變異(Step2)+變異(Step3)+...變異(ProcessStep)=變異(Methods)+變異(Materials)+變異(Environment)+變異(People)+變異(Equipment)+變異(Information)變異(Variation)我們觀察到的變異,是在過程中各種擾動累積起來的.統計10JasonLee2003/2/19變異(Variation)參數XXXXXXXXX量測值分佈多數在此少數在此Center均值Spread散佈雖然變異是隨機的,但他們的隨機性通常有模式存在,這種模式可用統計上的分佈(Distribution)來形容.如此變異加以統計分析,便可有某種程度的預測性存在並易於被理解或控制.統計11JasonLee2003/2/19變異(Variation)中心Center:數據最集中在何處?散佈Spread:數據變異程度及分散狀況如何?形狀Shape:分佈是否對稱?扁平?凹凸?是否有異常區描述分佈(Distribution)Shape形狀Center中心Spread散佈統計12JasonLee2003/2/19變異(Variation)變異可以是穩定(Stable)或不穩定(Unstable)的.-穩定變異:變化的分佈較具預測性及一致性,對時間而言具可預測性-不穩定變異:對時間而言不具可預測性PROCESS#1-StableVariation穩定PartThicknessPROCESS#2-UnstableVariation不穩定PartDistributionDistributionThickness統計13JasonLee2003/2/19變異(Variation)在製造過程中,有變異都是不好.問題是我們能容忍到何種範圍.我們能容忍的變異是具有以下兩項特徵:TimeParameterSTABLE(i.e.,consistentandpredictableovertime).CAPABLE(i.e.,smallvariationcomparedtotheproductspecifications.)ProductSpecificationsParameterDistribution穩定散佈小統計14JasonLee2003/2/19控制變異(Variation)1.Characterize2.Improve3.Control瞭解過程:使制程更好:保持穩定並維持高制程能力•過程由時間來看是否穩?•制程能力是否能滿足目標規格?•確認並除去不穩定原因•確認並降低變異程度使滿足規格•持續監視及控制過程的變異源特徵化改善控制統計15JasonLee2003/2/19因為用抽樣統計,其結果只是估計,和真實可能有差異.適當的抽樣可使統計分析更準確.Statistics分佈的數學描述與定義中心Center:數據最集中在何處?散佈Spread:數據變異程度及分散狀況如何?形狀Shape:分佈是否對稱?扁平?凹凸?是否有異常區統計16JasonLee2003/2/19樣本均值=X样本抽樣概念-母體參數和樣本統計量母體:包含所關心特性的已經製造或將要製造的物件的全體樣本:在統計研究中實際測量的物件組。樣本通常爲所關心母體的子集“母體參數”“樣本統計量”m=母體均值s=樣本標準偏差母體s=母體標準偏差~統計17JasonLee2003/2/19抽樣方法抽樣方法上面介紹了幾種從母體中抽樣的方式隨機性----從母體中抽取的樣本設計應使母體中每一個都有同等機會抽中.代表性----作為同一母體中其他樣本的實例.系統隨機抽樣分組抽樣每一小時在該點抽3個樣本隨機抽樣每個均有被選上的相等机會層別式抽樣母体被“層別”成几個組,在每個組內隨机選擇.行進中的過程每隔n個柚樣統計18JasonLee2003/2/19一般準則計數數據:50-100計量數據:每個分組最少是30統計19JasonLee2003/2/19•均值:一組值的算術平均均值:-反映所有值的影響-受極值影響嚴重•中位數:反應50%的序一組數排序後居中的數-在計算中不必包含所有值-相對於極值具有“可靠性”•眾數值:-在一組資料中最常發生的值nnnnxx1Median(Mean平均)(Median中數)眾數Center(中心)50%50%統計20JasonLee2003/2/191n)X(Xn1i2is1n)X(Xn1i2i2s全距:在一組資料中,最高值和最低值間的數值距離變異(s2):每個資料點與均值的平均平方偏差標準偏差(s):變異數的平方根.量化變動最常用的量全距=最大值-最小值Spread(散佈)6s統計21JasonLee2003/2/19ThesRulestateshowmandscanbeusedtodescribetheentiredistribution:·Roughly60-75%ofthedataarewithin1sofm.·Roughly90-98%ofthedataarewithin2sofm.·Roughly99-100%ofthedataarewithin3sofm.60-75%90-98%99-100%mm-sm-2sm+sm+2sm+3sm-3sSpread(散佈)統計22JasonLee2003/2/19Theshapeofadistributioncanbedescribedbyskewness歪斜(denotedby1)andbykurtosis凹凸平坦(denotedby2).101=010202=020歪斜凹凸平坦Shape(形狀)統計23JasonLee2003/2/19N)(Xn1i2i2msNX=1iNimnx=xn1=iiN)(X=N1=i2ims121nxxniis母體均值樣本均值母體標準偏差樣本標準偏差常用計算公式~母體變異樣本變異1n)X(Xn1i2i2s~統計24JasonLee2003/2/19ThemostimportantandusefuldistributionshapeiscalledtheNormaldistribution,whichissymmetric(對稱),uni-modal(單峰),andfreeofoutliers(沒有特異點):NormalDistribution常態分佈“常態”分佈是具有某些一致屬性的資料的分佈這些屬性對理解基礎過程(資料從該過程中收集)的特徵非常有用.大多數自然現象和人爲過程都符合常態分配,可以用常態分配表示,故大部份統計都假設是常態分佈。即使在資料不完全符合常態分配時,分析結果也很接近。特別不正常的分佈若假設為常態而去分析則有可能得到誤導結果。有數學技術可將其轉變成常態分佈來作分析。統計25JasonLee2003/2/19ANormalprobabilityplotisacumulativedistributionplotwheretheverticalscaleischangedinsuchawaythatdatafromaNormaldistributionwillformastraightline:HistogramCumulativeDistributionNormalProbabilityPlot常態概率圖NormalDistribution常態分佈統計26JasonLee2003/2/19第一個屬性:只要知道下面兩項就可以完全描述常態分配:均值標準差常態分配的好處-簡化第一個分佈第二個分佈第三個分佈這三個分佈有什麽不同?統計27JasonLee2003/2/19常態曲線和其概率43210-1-2-3-440%30%20%10%0%99.73%第二個屬性:曲線下方的面積可以用於估計某“事件”發生的累積概率95%68%樣本值的概率距離均值的標準偏差數得到兩值之間的值的累積概率統計28JasonLee2003/2/19常態概率圖130120110100908070603002001000C2常態概率圖頻率1101009080706050403020100500C1常態概率圖頻率807060504030201003002001000C3常態概率圖頻率13012011010090807060.999.99.95.80.50.20.05.01.001平均:70標準偏差:10資料個數:500Anderson-Darling常態測試A平方:46.447P-值:0.000正偏斜分佈概率正偏斜1069686766656463626.999.99.95.80.50.20.05.01.001常態分配常態概率平均值:70標準偏差:10資料個數:500Anderson-Darling常態測試A平方:0.418P-值:0.328我們可以用常態概率圖檢驗一組給定的資料是否可以描述爲“常態”如果一個分佈接近常態分配,則常態概率圖將爲一條直線。80706050403020100.999.99.95.80.50.20.05.01.001負偏斜分佈負偏斜平均:70標準偏差:10資料個數:500Anderson-Darling常態測試A平方:43.953P-值:0.000概率80706050403020100.999.99.95.80.50.20.05.01.00180706050403020100.999.99.95.80.50.20.05.01.001負偏斜分佈負偏斜平均:70標準偏差:10資料個數:500Anderson-Darling常態測試A平方:43.953P-值:0.000概率統計29JasonLee2003/2/19資料收集時的重點Howthedataarecollectedaffectsthesta