CaseStudy探討顧客到達間隔時間是否為指數分配-以麥當勞為例-May16,20081摘要現實生活中,若顧客的到達時間是服從普瓦松過程(PoissonProcess),則顧客到達的間隔時間(Inter-arrivaltime)將會服從指數分配。然而此議題是非常有趣的,所以,本研究欲探討顧客到達的間隔時間是否為服從指數分配來進行分析,且以速食餐飲業中的麥當勞為例。之後,運用一些統計相關軟體去進行統計的分析與探討,如:Easy-Fit、Minitab等。此軟體的優點不但可以快速地將資料進行統計分析,也可以免去自行運算所需花費的時間。最後,將軟體所呈現之結果來推斷麥當勞的顧客到達的間隔時間是否為服從指數分配,以及分析一些有趣的統計推論結果和圖形。研究背景在餐飲業市場蓬勃發展的情況下,餐飲連鎖成為一種趨勢,其主要是由於周休二日的施行、消費者所得增加、上班族比率提高等因素,使得業者無法全面滿足消費者的大量需求,便促使連鎖店的形成,國內的速食產業在短時間內快速的成長,彼此的競爭更是激烈,這也代表著在速食業大量的成長環境下,必然會發生一些潛在的問題。因此此個案欲利用驗證的方法去分析,透過相關統計軟體的應用去了解顧客到達時間是否服從普瓦松過程,在進一步去探討顧客的間隔時間是否服從指數分配,這樣的應用其實在現今是非常熱門的議題,也是一個值得去探討的問題,因此本個案也選擇了速食餐飲業中,市場佔有率極高的麥當勞作為本實驗的受試對象,希望可以藉由此案例讓同學們更對統計軟體的應用更為了解。2實驗設計為得到有關顧客到達間隔時間之數據,本組選定中壢市環中東路上之麥當勞,作為受測對象。數據產生由第一位客人到達時間開始,間隔時間則是以第一位與第二位客人之間隔來計算,也就是說假如第一位客人於八點五十分到達,第二位客人於八點五十分三十秒到達,則間隔時間則是三十秒。本組於四月一日下午五點三十分開始,於下午十一點三十分結束,共計194名顧客。所得資料全以碼表測量,最小單位為秒數,收集到原始數據後,再加以排序,並利用軟體Minitab與Easy-Fit做出分析,原始數據資料與排序之資料,皆列於下列表1、2、3。背景資料表1:原始數據資料(客人到達間隔時間)單位:秒3表2:顧客到達間隔時間(未排序)單位:秒表3:顧客到達間隔時間(已排序)單位:秒4統計分析一、盒鬚圖所謂盒鬚圖是利用三個四分位數123QQQ、、與最小觀測值及最大觀測值等五個數值來描述資料分佈個概略情形,其繪製方法是由第一個四分位數至第三個四分位數畫一矩形,再將最小觀測値至第一個四分位數以及第三個四分位數至最大觀測値以一段線相互連接。因此,從下圖可以得知,其四分位數為何,以及最小觀測値為4,最大觀測値為503。C15004003002001000305369497475300503312340496496BoxplotofC1圖1:盒鬚圖練習題1.請問從這張圖中顯示,它的平均值是多少?(a)101.37(b)201.37(c)301.37(d)350.37(a)2.請問從這張圖中,它的1Q到3Q位在哪兩個數中間?(a)100-200(b)50-100(c)30-140(d)80-200(c)3.圖中的星星表示?(a)這個成績不列入計算中(b)這個成績不適合列在這個組別中(c)這個成績視為極端值(outlier)(c)5二、直方圖所謂「直方圖」是以矩形的面積大小,來表示次數分配表中落在各組內資料次數的ㄧ種統計圖,它是以各組的組下界與組上界為邊,各組的觀測次數為高,而在每一組的組距上繪製矩形,則這些並列且相互連接的矩形即為直方圖。直方圖主要是用來繪製連續資料。而從下列直方圖中可以得知,多數顧客到達時間,多為4-40秒內,因此,麥當勞的服務時間可依據此項數據來設定,以避免顧客等候時間太長,造成等候線擁擠。ProbabilityDensityFunctionHistogramx48044040036032028024020016012080400f(x)0.520.480.440.40.360.320.280.240.20.160.120.080.040練習題1.從上列圖表中可以得知,它的趨勢是?(a)左偏(b)右偏(c)對稱(b)2.從所學的機率分配中去判斷,可以得知此長條圖較接近何項分配?(a)常態分配(b)二項分配(c)指數分配(c)6三、圓餅圖所謂圓餅圖是利用扇形面積在圓形內所佔的比例或百分比值來表示每個類別(或項目)佔全部類別的百分比值。故凡欲表示各個類別(或項目)對全部的百分比值時,宜採用此種統計圖。可由下列圓餅圖中得知,到達時間1-100秒之比例為最多,在產品生產的標準時間,也可以依照此項數據來設立,以使得顧客在到達之時,能夠在一定時間內得到餐點,避免顧客抱怨。9,4.6%301-16,8.2%201-30045,23.2%101-200124,63.9%1-100Category1-100101-200201-300301-PieChartofC2vsC1練習題1.從圖表中可以得知,數據1-100所佔的比例為?(a)23.2%(b)63.9%(c)8.2%(b)2.自行操作將間隔時間區分為五部份:1-100、101-200、201-300、301-400、401-,並繪出圓餅圖以及計算400以上之比例。7四、枝葉圖顧名思義,所謂枝-葉圖,就是把數據分成幾“枝”,而每“枝”上面有幾片“葉子”,在此列出枝-葉圖的製作原則如下:a.針對數據,找出一位或多位在前靣之位數做為“枝”,再以接下來的後面位數做為“葉”。b.在一垂直行中列出所有可能的“枝”。c.對於所有的觀察值,先判定某所屬的“枝”,再把後面屬於“葉”的位數依序列在“枝”的右邊。d.在所畫好的“枝-葉”圖中的某一處註明“枝”和“葉”之位數。當畫好的“枝-葉”圖之後,再把各“枝”所含之“葉”的順序做調整,由小而大重新排列之,此時的“枝-葉”圖稱之為順序化的枝-葉圖。由下列枝-葉圖我們可以看出,它與直方圖最大的不同,即是枝-葉圖保留了數據的部份,我們亦可以由枝-葉圖中,得到其詳細的數據資料。1304555666778899311001233455555557888432000015555779553000134455678674011245556789885000222233455555788999976013334557977000014456778685589981903345789731000014555678886011127785512148521355594814011237941152353816168351725573118232919067262002521257222203519231182412415259142658122781228511295HI300,305,312,340,369,475,496,496,497,503練習題1.枝葉圖中的葉是以那一位數為單位?(a)百位數(b)個位數(c)十位數(b)2.枝葉圖中的枝是以那一位數為單位?(a)個位數(b)百位數(c)十位數(b)五、基本敘述統計利用軟體,我們可以輕易得求出各種統計資料,如平均數、標準差、中位數等等。可以省下許多運算時間,這也是我們為何要利用軟體,來幫助我們分析的原因。而Minitab這個軟體的基本敘述統計資料,就如下列所示:StatisticNMeanSEMeanStd.DeviationMinValue194X7.18Y4Statistic25%(1Q)50%(Median)75%(3Q)MaxValueZ68.5139.25503練習題請利用軟體,呈現出一般性的敘述統計,並填入空格。X=____(101.37)Y=____(100.08)Z=____(33.75)9五、GoodnessofFit從Easy-Fit的適合度檢定中,我們可以把其適合的機率分配,依序做出排比,以找出最合適之分配,如下表所示,利用K-S檢定對其做出排比,則可以發現指數分配為最合適之檢定。ProbabilityDensityFunctionHistogramUniformNormalExponential(2P)x48044040036032028024020016012080400f(x)0.520.480.440.40.360.320.280.240.20.160.120.080.040練習題1.由此圖形中,可以得知此統計量之最合適檢定為(a)常態(b)指數(c)伽碼(b)10備註(K-S檢定)KolmogorovSmirnovAndersonDarlingChi-Squared#DistributionStatisticRankStatisticRankStatisticRank8Exponential(2P)0.0343910.4366616.9249614Gamma(3P)0.0374524.240117N/A16Gen.Pareto0.0427434.241518N/A36Weibull0.0433140.6553735.8059413Gamma0.0440950.581924.91061K-S檢定之公式假設樣本分配函數為:(1)(1)()()0()1jjnjxxnnxxFxxxx+≤⎧⎪⎪=⎨⎪≥⎪⎩若若若假設檢定為:0111:,,:,,nnHxxFHxxF⎧⎨⎩LL資料取自分配函數的母體資料不是取自分配函數的母體Kolmogorov-Smirnov檢定統計量為:{}()()nxDMaxFxFx=-{}11()(),()()niiniiinDMaxFxFxFxFx-≤≤=--拒絕域為:,,nDccDa=11PDFProbabilityDensityFunctionExponential(0.01027;4)x5004003002001000f(x)0.010.0090.0080.0070.0060.0050.0040.0030.0020.0010由Easy-Fit中的StatAssist可以得知當154x=、2104x=時,1()0.4016Pxx=1()0Pxx==1()0.5984Pxx=12()0.24032Pxxx=2()0.64192Pxx=2()0Pxx==2()0.35808Pxx=如果是要自己計算的話,因為連續型隨機變數X之機率密度函數為-xXex0,0(x)={0otherwiseflll,所以若是要求1()Pxx,則-0.00986(4)54(54)0.00986xxPxed∞-=∫練習題1.當180x=時,1()______Pxx=。(a)0.54183(b)0.53232(c)0.56027(d)0.45817(a)2.當160x=、290x=時,12()______Pxxx=。(a)0.43736(b)0.56264(c)0.14919(d)0.41345(c)12CDF由Easy-Fit中的StatAssist可以得知當1x=未知,且要求1P(xx)=0.5時1x會等於71.493,同時也可由上圖(CDF)中看出它所在的位置。練習題1.當1P(xx)=0.6時,1x會等於______。(a)53.74(b)62.212(c)93.22(d)81.7527(c)13單一參數之區間估計一、母體平均數(populationmean),m²假設條件:設抽取一組隨機樣本Ø狀況A:母體變異數(2s)已知1.點估計:利用樣本平均數(X)估計母體平均數(m)2.樞紐量:由於)1,0(~NnXZsm-=3.信賴區間:⎥⎦⎤⎢⎣⎡≤≤-=-221aaazZzP=⎥⎦⎤⎢⎣⎡+-nzXnzXssaa22,為m之(a-1)100%信賴區間。4.範例:本案例於「環中東路麥當勞」測量194名顧客來店消費的間隔時間,如表1所示,已知標準差s=100.08,試求:(1)估計該店顧客來店消費的平均間隔時間為何?(2)試建立顧客來店消費的平均間隔時間之95%信賴區間?解:(1)計算194個樣本的樣本平均數X=101.