基础统计概念

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1基礎統計概念6Sigma企劃部3/13/20012機率的世界V.S.確定的世界百分之百確定的事?例子…..量子的世界─機率決定一切統計學家從不說100%確定。那麼有多確定…?95%確定;99%確定;99.99966%確定?3機率V.S.統計母體(分配)樣本(抽樣)機率統計Q1:隨機變數X為常態分配N(μ,σ2),請問的平均數、變異數、變異係數?Q2:自某一母體Y隨機抽樣50個樣本,得到樣本平均數為50,樣本標準差為5,請問此母體平均數是否為45(在95%顯著水準下)?x4統計學的種類敘述統計(DescriptiveStatistics)樣本平均數、中位數、四分位數、變異數、標準差……推論統計(DeductiveStatistics)信賴區間估計(ConfidenceInterval)、假設檢定(HypothesisTest)實驗設計回歸分析(Regression)、變異數分析(ANOVA,ANalysisOfVAriance)5敘述統計介紹─平均數、標準差(1)A說:昨天晚上我和3個平均年齡只有24歲的小姐約會。B說:哇!!茂死啊!茂死啊!A說:一點也不,年齡差距太大,一點也不起勁。B說:還好吧,你也才28歲而已!60歲6歲6歲只衡量數值集中的程度還不夠,還要衡量離散的程度!6敘述統計介紹─平均數、標準差(2)離散的程度:全距(Range)、標準差(StandardDeviation)全距=最大值-最小值樣本變異數Variance=,i=1,2,…..n其中樣本標準差s=三個樣本值分別為6,6,60→平均=24;全距=54,標準差s==31.17712)(nxxinxxi13224)-(60224)-(6224)-(6樣本變異數7敘述統計介紹─中位數、四分位數中位數:一群數值從小到大排列後,位於正中間的數。(若為偶數個數值,則取最中間兩數的平均)四分位數:在此數值之下,有1/4或3/4的數值分佈。例子1:10個樣本值,由小到大排列,如下:3,4,5,5,6,7,8,9,10,11求中位數?上四分位數(Q1)?下四分位數(Q3)?Ans:中位數(median)=6.5FirstQuartile(Q1)=5ThirdQuartile(Q3)=8.75→EXCEL、MINITAB都可以算出來;但Q1、Q3答案(公式)不一樣8311敘述統計介紹─箱型圖(BoxPlot)作法:把最小值,Q1,中位數(=Q2),Q3,最大值畫出來。功用:可看出一群數值大致的分佈。接前例56.58.75最小值Q1中位數Q3最大值9常見機率分配─常態分配(NormalDistribution)(1)μ2)(2121)(xexfσ常態分配特性:1.期望值E(x)=μ….又稱mean2.變異數V(x)=σ23.為左右對稱的分配,-∞x∞常記為X~N(μ,σ2)10常見機率分配─常態分配(NormalDistribution)(2)常態分配的機率分佈:μ±σ…………68.27%μ±1.645σ…………90%μ±1.96σ…………95%μ±2σ…………95.44%μ±3σ…………99.73%μ±6σ…………(1-3.4PPM)?μ2σ95.44%2σμ6σ6σ1.5σ3.4ppm1-0.002PPM11常見機率分配─常態分配(NormalDistribution)(3)若隨機變數X~N(μ,σ2),則1.若Y=ΣXi,i=1,2..,n;則Y~N(nμ,nσ2)2.若3.若;則Z~N(0,1)同理Z稱為標準常態分配!!nixx;則~N(μ,)xn2xz)1,0(~xNn12常見機率分配─卡方(Chi-square)分配(1)設(X1,….,Xn)為抽自N(μ,σ2)之一組隨機樣本,1.若Y=則Y為具有自由度n之卡方分配,記為Y~2.若母數μ未知,以統計量代之,則得2)x(1inix2)1(2221is)1()xx(nnin2)(n用來檢定母體變異數σ2自由度:n-113常見機率分配─卡方(Chi-square)分配(2)卡方分配特性:1.期望值E()=自由度2.變異數V()=2倍自由度3.為右偏的分配22)(2vα)P()(22v14常見機率分配─t分配(1)設Z與W為獨立的隨機變數,且Z~N(0,1),W~,又令:則稱隨機變數T的機率分配,是自由度為v的t分配,記為T~t(v)2)(vvWZT15常見機率分配─t分配(2)0t分配特性:1.期望值E(T)=02.變異數V(T)=v/(v-2),v23.為左右對稱的分配4.當v→∞,t分配近似於標準常態分配N(0,1)t(v)tα(v)α16常見機率分配─t分配(3)設(X1,….,Xn)為抽自常態母體N(μ,σ2)之一組隨機樣本,則:Proof:1)-(nt~/S-xn)1,0(~/xzNn2)1(22s)1(nn1)1(/WZT22nSnnXv用來檢定母體平均數μ17常見機率分配─F分配(1)設與為獨立隨機變數,且又令:則隨機變數F的機率分配是自由度v1與v2的F分配,記為F~F(v1,v2)222121Fvv2122)1(2~21v)2(2~22v18設(X1,….,Xn1)與(Y1,….,Yn2)為分別由常態母體N(μ1,σ12)與N(μ2,σ22)抽出的兩組獨立的隨機樣本,則:常見機率分配─F分配(2))1,1(F~2122222121nnSS用來檢定兩母體標準差是否相等(σ1=σ2)19設(X1,….,Xn)為由常態母體N(μ,σ2)抽出的一組獨立的隨機樣本。母體mean之信賴區間估計─Z分配(1))1,0(~NnxZ95.0)96.196.1(nxPRecall:Page1020母體mean之信賴區間估計─Z分配(2)95.0)96.196.1(nxnxP表示:有95%信心,母體的mean(μ)將在底下區間之內)96.1,96.1(nxnx如果要有99%信心的話呢?21母體mean之信賴區間估計─Z分配(3)定義:對於一常態分配母體的mean(μ),若已知其標準差為σ,則其100(1-α)%的信賴區間為:),(22nzxnzxExample:99%,Zα/2=2.575(查表可得,統計軟體會內建)0Zα/2(1-α)-Zα/2現實問題是:σ不知道。22母體mean之信賴區間估計─t分配(1)對於一常態分配母體的mean(μ),若其母體標準差未知,求其100(1-α)%的信賴區間→t分配Recall:1)-(nt~/S-xnT12)(nxxSi其中,i=1,2,…n23母體mean之信賴區間估計─t分配(2)1)()1,2()1,2(nntTtP0t(α/2,n-1)(1-α)-t(α/2,n-1)1)()1,2()1,2(nntnSXtP24母體mean之信賴區間估計─t分配(3)1)()1,2()1,2(nStXnStXPnn定義:對於一常態分配母體的mean(μ),若與S為其樣本平均值及樣本標準差,則其100(1-α)%的信賴區間為:x)()1,2()1,2(nStXnStXnn,查表得到或軟體內建25母體mean之信賴區間估計─t分配(4))()110,025.0()110,025.0(nStXnStX,例子:10,13,17,14,20,15,21,18,13,20為自一常態母體抽出的一組樣本。試求母體mean的95%信賴區間:,1.16x67.31102)(xxSi)1067.3*262.21.161067.3*262.21.16(,Ans:所以母體mean的95%信賴區間:)725.18475.13(,26假設檢定(HypothesisTest)─概論(1)動機:經由統計方法,拒絕一原始的假設。原始假設:虛無假設(NullHypothesis):希望被否定的統計假設,以H0表示之。另外假設:對立假設(AlternativeHypothesis):由於否定虛無假設而被認為對的統計假設,以H1或Ha表示之。H0:新藥不具療效H1:新藥具有療效→利用數據及統計方法去拒絕H0(接受H1)27假設檢定(HypothesisTest)─概論(2)檢定程序:1.決定檢定統計量2.決定拒絕域(rejectionregion):與顯著水準α有關當檢定統計量落入拒絕域,則拒絕H00Zα(1-α)αH1Z0Zα則拒絕H028假設檢定(HypothesisTest)─概論(3)另一種表示檢定結果的方法:P-Value1.以標準常態分配為例,P-Value=P(Z檢定統計量Z0)2.當P-Valueα,則拒絕H00Zα(1-α)Z0P29假設檢定(HypothesisTest)─概論(4)兩種檢定錯誤:1.typeIerror:當虛無假設H0為真時,但檢定結果卻拒絕H0(其機率值為下圖的α)2.typeIIerror:當虛無假設H0為假時,但檢定結果卻接受H0(其機率值為下圖的β)μ1Zαβμ2αH0H130假設檢定(HypothesisTest)─概論(5)檢定能力:Power=P(rejectH0|whenH1istrue)=1-βμ1Zαβμ2αH0H131假設檢定(HypothesesTest)─母體平均數mean(1)檢定母體的mean:H0:μ=μ0檢定統計量:Ha:拒絕域μμ0μμ0μ≠μ0或nSxt/-0)1,(ntt)1,(ntt)1,2(ntt)1,2(ntt右尾雙尾檢定左尾32假設檢定(HypothesesTest)─母體平均數mean(2)H0:μ=12Ha:μ≠12Ans:因為所以拒絕H0,表示母體均數μ≠12比較Page25之μ的信賴區間,1.16x67.3s262.254.310/67.321-6.11)110,025.0(tt例子:10,13,17,14,20,15,21,18,13,20為自一常態母體抽出的一組樣本。試檢定(顯著水準α=0.05):33假設檢定(HypothesesTest)─母體變異數(1)H0:檢定統計量Ha:拒絕域或檢定母體的變異數:2022022s)1(n202202202)1(22n)1(212n)1(222n)1(2212n)1(2nα)1(21n34例子:10,13,17,14,20,15,21,18,13,20為自一常態母體抽出的一組樣本。試檢定(顯著水準α=0.05):H0:σ2≦9Ha:σ2>9Ans:因為所以接受H0,表示母體變異數可能小於或等於9,1.16x43.132s假設檢定(HypothesesTest)─母體變異數(2)92.16)110(943.31)110(205.0235到目前為止:,t,F分配,其母體都是常態分配。如何確保樣本統計量為常態分配?母體常態性檢定:NormalProbabilityPlot、K-S檢定….中央極限定理:當樣本數n30,不管母體分配為何,趨近常態實用經驗:若樣本本身的分佈是鐘型曲線(Bell-shape),則樣本數n只要等於4或5,不管母體分配為何,趨近常態最後的問題─如何確保樣本統計量為常態分配?2xx36謝謝各位!恭喜各位已經學到統計的入門,請繼續加油!!

1 / 36
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功