19第三章地理資訊的處理一、前言1.個體與群體的概念:(1)個體資料→地理資訊中個體泛指單一資料。(2)群體資料→將具有共同特性之資料集合在一起則稱為群體資料。2.地理資訊之統計特質:(1)差異特質→指地理資料中有時間、空間和數量的差異稱之。(2)相關特質→指的是兩個地理資料有一定程度的相關性。(3)均衡特質→又稱為適中特質。指的是某種地理資料維持在空間和時間上達到一個平衡的狀態。3.地理學計量分析目的:期望能藉此建立假說、模式、理論。4.計量分析方法:(1)______________分析→從資料群組中找出最能代表該組資料的中間值。(2)離散趨勢分析→指一組數值個體之間差異的程度,可以看出平均數可靠的程度。(3)指數分析→表示地理現象的平均或總和在某段時間的相對變動情形或空間分布特性。(4)相關分析→分析兩個地理現象間的相互關聯情形。(5)迴歸分析→可由一個地理現象預測另一地理現象。二、集中趨勢分析1.平均數:(1)意義:指的是一個地理資料中,各項資料的中心位置。(2)算術平均數:A.是各數值總和之平均值。B.公式:C.特色→每一觀察值均加以計算,且數值隨資料數據的更動而改變,故數字最精確,但數值最易受極端值的影響。D.例:利用下表求台北市民國87年底,12個行政區的平均人口數單位(千人)20(3)幾何平均數:A.用於計算幾何級數變化數列的平均數。B.公式:a.資料少時:b.資料多時:C.例:a.假設台北市民國60年的人口數是100萬人,民國80年的人口數是120萬人,則民國70年時的人口數是多少?◎因人口數隨著時間的延續而呈等比變化,因此應以幾何平均數的方法b.有研究者調查台灣民國85年與88年五種物價如下表,求該五種物價的平均變動率?2.中位數(1)意義:一群地理資料按其數值由大至小順序排列,其位置居中的一個數值即為該組地理資料的中位數。若數值個數為偶數,則居中間兩個數值的平均值即為中位數。(2)特色→每個數值與中位數差的絕對值最小。(3)用途→A.應用於地理中目的在求最短路徑。B.當樣本的數值差異很大,要取中間值時,採中位數較理想。(4)例:下圖有一條道路,共有八戶人家,擬在其中間開一家麵包店,若不考慮其他條件,應選址何處最佳?213.眾數(1)意義:指一群資料出現次數最多的數值。(2)特色→所得數值不易受極端值的影響。(3)應用→例如:要在釣客眾多的岩岸設置救生圈和警告標誌,但因為經費的限制,僅能尋找該海岸地區最可能出現大浪或瘋狗浪的地點來設置救生圈和警告標誌,就可以利用眾數的概念尋找最佳地點。三、離散趨勢分析1.離差:(1)意義→一群資料中除特殊情況下,其各變量間或多或少有些許的差異,此種差異在統計學上稱為離差。而表示一群變量離差的統計表徵數稱為差量。(2)應用層面:A.第一是以一個簡單的數值來表示一群資料中各變量的差異情況,以便比較分析。B.第二是用以區別平均數代表的大小,若一群資料的差量較大,則以平均數代表全體變量時,其代表性較低,反之較高。2.全距:(1)意義→一組數值中最大值和最小值間的差距。(2)應用→例:年溫差、歷年雨量差。3.平均差:(1)意義:測定一組數據的數值與算術平均離散程度。平均差愈大表離散程度愈高。(2)公式:(3)應用:平均差較易受到極端值的影響,且計算時採絕對值,有違數理原則,故遠不及標準差應用廣泛。地理上平均差應用較多者,是藉由它代表相對離散趨勢,目的是為了能夠真正代表相對離散趨勢,於是有計算平均差數與算術平均數的比率,稱為相對變率。氣候上常利用相對變率來觀察一地降水量是否穩定可靠。(4)例:224.四分位差:(1)意義:將數值由小而大依序排列再分成四等分,在四分之一的位址稱為第一四分位(Q1),餘此類推,則第三四分位與第一四分位數值差的一半,稱為四分位差。即是第一四分位數與第三四分位數差的平均值。用來量取分布在中間一半的平均數值。(2)公式→(3)特色→可避免部分極端值的影響。(4)應用→四分位差在地理中應用相當廣泛,舉凡所有可以量化的地理資料均可以使用四分位差來輔助分析。例如:氣溫、降水量、人口、交通流量等等。(5)例:5.標準差:(1)意義→指所有數值與算術平均數之差(離均差)平方總和的平均值,再計算平方根。標準差愈大,表離散程度愈大。是觀察地理數值資料的離散程度,應用最廣的一種方法。(2)公式→23(3)特色→在算術平均數後加和減若干個標準差,即可得知資料次數佔總資料次數之百分比。若群體呈常態分配時,其算術平均數、標準差及包含群體資料之總次數百分比三者關係如下表、下圖所示。(4)應用→由於標準差主要用於表示一群資料的分散程度,因此利用標準差可以分析該地許多地理資訊的差異狀況。例如:某一地區日均溫標準差極大,當人們到該地區從事戶外活動時就要特別注意日夜溫差的保暖問題。6.變異係數(相對離差)(1)意義→每單位平均數的標準差。(2)公式→(3)用途→用來比較兩組不同單位數值,離散程度的大小。(4)例:下表為高雄1961~1990年各月的平均氣溫與雨量資料,求何者的離散程度較大?◎不同單位的兩種數值,無法做標準差比較,但變異係數沒有單位不同的困擾,可彌補標準差的缺點。24牛刀小試:1.如下圖,一條街道有12戶人家,各戶人家距街道最左端距離標示於圖的下方,若要在這條街上選一個距各戶人家平均距離最短的點來開一家西藥房,則在幾公里處最恰當?(A)10.7(B)8.5(C)9(D)9.5(E)102.承上題,這項選擇最宜採(A)平均數(B)中位數(C)眾數(D)平均差(E)標準差3.年平均氣溫和年平均雨量最無法反映出下列那一型氣候的真實表現?(A)熱帶雨林(B)副熱帶季風(C)海洋性(D)溫帶沙漠(E)南極4.台北市民國61年至70年的年雨量的平均差總和2333.6㎜,而此十年間,每年的變異量平均為233.36㎜,這一數值為(A)標準差(B)變異係數(C)平均差(D)四分位差(E)十分位數5.平均差為各變量與其中位數之差取絕對值後的算術平均數,假設臺灣最長河流的前五名分別為濁水溪(186公里)、高屏溪(170.9公里)、淡水河(158公里)、大甲溪(140公里)、曾文溪(138公里)。請問臺灣這五條河流的平均差為何?(A)14.8(B)15.8(C)16.8(D)17.8(E)19.86.地理資料分析內容相當繁多,在統計資料中有所謂的眾數的分析,下列資料中何者屬於眾數?(A)12(B)14(C)25(D)35(E)5912、14、58、69、54、12、35、68、67、48、59、25、85、71、81、91、12、35、2、4、9、35、25、35、59◎下表為歐茲國十年來的年雨量記錄。請依表回答7~9題:7.該國十年來年雨量的算術平均數值為:(A)157(B)199(C)223(D)284(E)291。8.該記錄表內的中位數是:(A)157(B)175(C)223(D)248(E)291。9.該記錄表的算術平均數與中位數二數出現甚大差異,此與平均數的哪一項特性最具關聯性?(A)為最常用的中間值(B)為最精確的中間值(C)係採各數總和的平均值(D)用以測量數值的集中趨勢(E)為易受極端數值所影響的中間值。民國81828384858687888990年雨量(mm)24110211723336076845892340525四、指數分析1.意義→指數是用某一時間點(基期)為基準,來測量或說明事物一段時間內變動的情形,基期的指數為100,其他時間的數值除以基期的數值,再乘以100,就是該時間點的指數。2.公式→3.應用→在地理上,指數是一種度量變動和研究問題的重要工具。因為地理有時間和空間上變動,藉由指數可以比較不同時間和空間中各種地理現象的變動情形。4.交通網路指數→在交通網路中,若節點數為V;連線數為E;交通網路中所有的獨立部分數為P。則:(1)α指數(連環指數):A.意義→在現有節點數目下,現有環路與可能發展最多環路數目之比,因此其值在0~1.0之間。若一區域中,所有節點的連線均無環路,則α=0B.公式→α=(2)β指數(連結指數):A.意義→描述一個地方交通路線發展程度。B.公式→C.應用→a.表示一個地區的交通路線連接程度。b.β值愈大則交通路線的密度愈大,交通愈方便。c.β值1,表示該地區的路網已成環狀。d.缺點→交通網路線愈大時,β值亦大,它無法比較不同地區交通網線內部的便捷程度。e.僅適用於比較一個地區在不同時期。(3)γ指數(連線指數):A.意義→為實際連線數與最多可能連線之比。B.公式→26C.應用→a.量度γ指數的目的在了解該地區交通路線發展與最佳境界相距的程度,適用於單一時期或單一地區網路連結程度的探測。b.γ100%c.γ=100%表示該網路任兩節點之間都有直接交通線可往來,不須經過其他節點。亦即該網路的連結程度達到最完美的狀況。D.例→5.都市土地利用情形分析的指數:最常用來做界定中心商業區範圍的指標。(1)中心商業高度指數(CBHI):A.公式:◎進行交通網路分析前,須將圖形簡化成只保留各點正確順序的線圖,再利用線圖中的連線數與節點數進行分析◎牛刀小試:利用右圖進行分析網路的β指數及γ指數。27B.指的是經營中心性商業活動的垂直分布狀況。C.CBHI1表街廓的各建築物至少有一層樓以上從事中心性商業活動,反應地價高,使土地呈現垂直利用。D.在計算一地區的CBHI時,常以一個街廓為單位,其範圍如右圖。(2)中心商業強度指數(CBII):A.公式→B.是指經營中心性商業活動的密集程度。C.若CBII大於50%,則表示在此街廓內的建築物,至少有一半以上的樓地板面積在從事中心性商業活動。◎自都市中易達性最高的地點發展出來的商業區,就是該市的中心商業區。區內的商業活動,是都市商業活動最集中、規模最大,商品種類亦最多的地區。◎中心性商業活動是服務範圍廣及全市區的零售業或服務業,如:高級百貨公司。◎依西方標準,符合中心商業區街廓的條件是CBHI1且CBII50%,東方國家因住商混合程度高,使標準降低,如新竹市,CBHI0.5或CBII25%286.乾燥指數→氣候降水特性分析的指數(1)意義→一地降水量若大於蒸發量,該地氣候就溼潤,反之則屬於乾燥,而一地區乾燥程度指數最為常見,主要在計算某地在所需水量下缺水程度的比值。(2)應用→主要在分析各地區水量的豐缺狀況。可做為灌溉的根據,在農業上具應用價值。(3)分析方法→最常用的為美國氣候學者桑士偉提出的乾燥指數7.舒適度指數:(1)判斷氣候舒適與否所用的不舒適指度,即是採用_______和______兩項因子做為標準。(2)公式→D.I.=T-0.55(1-r)(T-58)T→氣溫(單位°F)r→相對溼度(%)(3)應用→D.I.70→舒服70D.I.75→少許人感到不舒服75D.I.80→有一半人會感到不舒服80D.I.85→大部分人感覺不舒服◎牛刀小試:右圖為某都市中心商業區的街廓圖,圖中甲、乙、丙、丁四街廓被建築物占滿,街廓內的數字分母與分子分別代表樓層總數與中心性商業活動的樓層數,請問下列1~3題:1.甲街廓的CBII為(A)33%(B)60%(C)20%(D)300%(E)10%2.丙街廓中心的CBHI為(A)0.63(B)1.6(C)2(D)5(E)83.按西方無住商混合的標準,那一街廓未達中心商業區的標準?(A)甲(B)乙(C)丙(D)丁(E)甲丁29D.I.85→所有人都會感覺不舒服◎台灣地區夏季每天的不舒服指數幾乎都大於85,因此常令人不舒服。五、相關分析1.意義→所謂相關係指一個應變量隨著另一個或一個以上的自變量而變化。若自變量數值增大(減少),應變量亦隨著增大(減少),即應變量與自變量的變化方向一致,這種相關稱為________;若方向相反,則稱為_________。若兩變量之間的變化無關,則稱為________。2.做法→將兩組地理現象對應的數值點,在座標中點出成為『散布圖』(如右圖)的X軸為自變數,Y軸為應變數。3.分析兩個地理現象間的關聯程度,稱為簡單相關。4.簡