




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
地理學中的第一條法則,任何事物都與其它事情相關,但是距離近的事物比距離遠的關系更大。WaldoTobler第八章空間分析導讀:空間分析源于60年代地理和區(qū)域科學的計量革命,在開始階段,主要是應用定量(主要是統(tǒng)計)分析手段用于分析點、線、面的空間分布模式。后來更多的是強調地理空間本身的特征、空間決策過程和復雜空間系統(tǒng)的時空演化過程分析。實際上自有地圖以來,人們就始終在自覺或不自覺地進行著各種類型的空間分析。如在地圖上量測地理要素之間的距離、方位、面積,乃至利用地圖進行戰(zhàn)術研究和戰(zhàn)略決策等,都是人們利用地圖進行空間分析的實例,而后者實質上已屬較高層次上的空間分析。地理信息系統(tǒng)集成了多學科的最新技術,如關系數(shù)據(jù)庫管理,高效圖形算法,插值,區(qū)劃和網(wǎng)絡分析,為空間分析提供了強大的工具,使得過去復雜困難的高級空間分析任務變得簡單易行。目前絕大多數(shù)地理信息系統(tǒng)軟件都有空間分析功能。空間分析早已成為地理信息系統(tǒng)的核心功能之一,它特有的對地理信息(特別是隱含信息)的提取、表現(xiàn)和傳輸功能,是地理信息系統(tǒng)區(qū)別于一般信息系統(tǒng)的主要功能特征??臻g分析是對分析空間數(shù)據(jù)有關技術的統(tǒng)稱。根據(jù)作用的數(shù)據(jù)性質不同,可以分為:(1)基于空間圖形數(shù)據(jù)的分析運算;(2)基于非空間屬性的數(shù)據(jù)運算;(3)空間和非空間數(shù)據(jù)的聯(lián)合運算。空間分析賴以進行的基礎是地理空間數(shù)據(jù)庫,其運用的手段包括各種幾何的邏輯運算、數(shù)理統(tǒng)計分析,代數(shù)運算等數(shù)學手段,最終的目的是解決人們所涉及到地理空間的實際問題,提取和傳輸?shù)乩砜臻g信息,特別是隱含信息,以輔助決策。本章介紹GIS中實現(xiàn)空間分析的基本功能,包括空間查詢與量算,緩沖區(qū)分析、疊加分析、路徑分析、空間插值、統(tǒng)計分類分析等,并描述了相關的算法,以及其中的計算公式。1.空間查詢與量算查詢和定位空間對象,并對空間對象進行量算是地理信息系統(tǒng)的基本功能之一,它是地理信息系統(tǒng)進行高層次分析的基礎。在地理信息系統(tǒng)中,為進行高層次分析,往往需要查詢定位空間對象,并用一些簡單的量測值對地理分布或現(xiàn)象進行描述,如長度,面積,距離,形狀等。實際上,空間分析首先始于空間查詢和量算,它是空間分析的定量基礎。1.1空間查詢圖形與屬性互查是最常用的查詢,主要有兩類:第一類是按屬性信息的要求來查詢定位空間位置,稱為“屬性查圖形”。如在中國行政區(qū)劃圖上查詢人口大于4000萬且城市人口大于1000萬的省有哪些,這和一般非空間的關系數(shù)據(jù)庫的SQL查詢沒有區(qū)別,查詢到結果后,再利用圖形和屬性的對應關系,進一步在圖上用指定的顯示方式將結果定位繪出。第二類是根據(jù)對象的空間位置查詢有關屬性信息,稱為“圖形查屬性”。如一般地理信息系統(tǒng)軟件都提供一個“INFO”工具,讓用戶利用光標,用點選、畫線、矩形、圓、不規(guī)則多邊形等工具選中地物,并顯示出所查詢對象的屬性列表,可進行有關統(tǒng)計分析。該查詢通常分為兩步,首先借助空間索引,在地理信息系統(tǒng)數(shù)據(jù)庫中快速檢索出被選空間實體,然后根據(jù)空間實體與屬性的連接關系即可得到所查詢空間實體的屬性列表。在大多數(shù)GIS中,提供的空間查詢方式有:1)基于空間關系查詢空間實體間存在著多種空間關系,包括拓撲、順序、距離、方位等關系。通過空間關系查詢和定位空間實體是地理信息系統(tǒng)不同于一般數(shù)據(jù)庫系統(tǒng)的功能之一。如查詢滿足下列條件的城市:在京滬線的東部距離京滬線不超過50公里城市人口大于100萬城市選擇區(qū)域是特定的多邊形;整個查詢計算涉及了空間順序方位關系(京滬線東部),空間距離關系(距離京滬線不超過50公里),空間拓撲關系(使選擇區(qū)域是特定的多邊形),甚至還有屬性信息查詢(城市人口大于100萬)。簡單的面、線、點相互關系的查詢包括:面面查詢,如與某個多邊形相鄰的多邊形有哪些。面線查詢,如某個多邊形的邊界有哪些線。面點查詢,如某個多邊形內有哪些點狀地物。線面查詢,如某條線經(jīng)過(穿過)的多邊形有哪些,某條鏈的左、右多邊形是哪些。線線查詢,如與某條河流相連的支流有哪些,某條道路跨過哪些河流。線點查詢,如某條道路上有哪些橋梁,某條輸電線上有哪些變電站。點面查詢,如某個點落在哪個多邊形內。點線查詢,如某個結點由哪些線相交而成。2)基于空間關系和屬性特征查詢傳統(tǒng)的關系數(shù)據(jù)庫的標準SQL并不能處理空間查詢,這是由于關系數(shù)據(jù)庫技術的弱點造成的,對于GIS而言,需要對SQL進行擴展。對于傳統(tǒng)的SQL,要實現(xiàn)空間操作,需要將SQL命令嵌入一種編程語言中,如C語言;而新的SQL允許用戶定義自己的操作,并嵌入到SQL命令中。3)地址匹配查詢根據(jù)街道的地址來查詢事物的空間位置和屬性信息是地理信息系統(tǒng)特有的一種查詢功能,這種查詢利用地理編碼,輸入街道的門牌號碼,就可知道大致的位置和所在的街區(qū)。它對空間分布的社會、經(jīng)濟調查和統(tǒng)計很有幫助,只要在調查表中添了地址,地理信息系統(tǒng)可以自動地從空間位置的角度來統(tǒng)計分析各種經(jīng)濟社會調查資料。另外這種查詢也經(jīng)常用于公用事業(yè)管理,事故分析等方面,如郵政、通訊、供水、供電、治安、消防、醫(yī)療等領域。1.2空間量算1.2.1幾何量算幾何量算對不同的點、線、面地物有不同的含義:點狀地物(0維):坐標;線狀地物(1維):長度,曲率,方向;面狀地物(2維):面積,周長,形狀,曲率等;體狀地物(3維):體積,表面積等。一般的GIS軟件都具有對點、線、面狀地物的幾何量算功能,或者是針對矢量數(shù)據(jù)結構,或者是針對柵格數(shù)據(jù)結構的空間數(shù)據(jù)。1)線的長度計算線狀地物對象最基本的形態(tài)參數(shù)之一是長度。在矢量數(shù)據(jù)結構下,線表示為點對坐標(X,Y)或(X,Y,Z)的序列,在不考慮比例尺情況下,線長度的計算公式為:對于復合線狀地物對象,則需要在對諸分支曲線求長度后,再求其長度總和。通過離散坐標點對串來表達線對象,選擇反映曲線形狀的選點方案非常重要,往往由于選點方案不同,會帶來長度計算的不同精度問題。為提高計算精度,增加點的數(shù)目,會對數(shù)據(jù)獲取、管理與分析帶來額外的負擔,折中的選點方案是在曲線的拐彎處加大點的數(shù)目,在平直段減少點數(shù),以達到計算允許精度要求。在柵格數(shù)據(jù)結構里,線狀地物的長度就是累加地物骨架線通過的格網(wǎng)數(shù)目,骨架線通常采用8方向連接,當連接方向為對角線方向時,還要乘上。2)面狀地物的面積面積是面狀地物最基本的參數(shù)。在矢量結構下,面狀地物以其輪廓邊界弧段構成的多邊形表示的。對于沒有空洞的簡單多邊形,假設有N個頂點,其面積計算公式為:所采用的是幾何交叉處理方法,即沿多邊形的每個頂點作垂直與X軸的垂線,然后計算每條邊、它的兩條垂線及這兩條垂線所截得X軸部分所包圍的面積,所求出的面積的代數(shù)和,即為多邊形面積。對于有孔或內島的多邊形,可分別計算外多邊形與內島面積,其差值為原多邊形面積。此方法亦適合于體積的計算。對于柵格結構,多邊形面積計算就是統(tǒng)計具有相同屬性值的格網(wǎng)數(shù)目。但對計算破碎多邊形的面積有些特殊,可能需要計算某一個特定多邊形的面積,必須進行再分類,將每個多邊形進行分割賦給單獨的屬性值,之后再進行統(tǒng)計。1.2.2形狀量算面狀地物形狀量測的兩個基本考慮:空間一致性問題,即有孔多邊形和破碎多邊形的處理;多邊形邊界特征描述問題。度量空間一致性最常用的指標是歐拉函數(shù),用來計算多邊形的破碎程度和孔的數(shù)目。歐拉函數(shù)的結果是一個數(shù),稱為歐拉數(shù)。歐拉函數(shù)的計算公式為:歐拉數(shù)=(孔數(shù))-(碎片數(shù)-1)圖8-1表示了多邊形的三種可能的情形。圖8-1:歐拉數(shù)對于圖(a),歐拉數(shù)=4-(1-1)=4或歐拉數(shù)=4-0=4;對于圖(b)歐拉數(shù)=4-(2-1)=3或歐拉數(shù)=4-1=3;圖(c)歐拉數(shù)=5-(3-1)=3。關于多邊形邊界描述的問題,由于面狀地物的外觀是復雜多變的,很難找到一個準確的指標進行描述。最常用的指標包括多邊形長、短軸之比,周長面積比,面積長度比等。其中絕大多數(shù)指標是基于面積和周長的。通常認為圓形地物既非緊湊型也非膨脹型,則可定義其形狀系數(shù)r為:其中P為地物周長,A為面積。如果r<1為緊湊型;r=1為標準圓;r>1為膨脹型。1.2.3質心量算質心是描述地理對象空間分布的一個重要指標。例如要得到一個全國的人口分布等值線圖,而人口數(shù)據(jù)只能到縣級,所以必須在每個縣域里定義一個點作為質心,代表該縣的數(shù)值,然后進行插值計算全國人口等值線。質心通常定義為一個多邊形或面的幾何中心,當多邊形比較簡單,比如矩形,計算很容易。但當多邊形形狀復雜時,計算也更加復雜。在某些情況下,質心描述的是分布中心,而不是絕對幾何中心。同樣以全國人口為例,當某個縣絕大部分人口明顯集中于一側時,可以把質心放在分布中心上,這種質心稱為平均中心或重心。如果考慮其它一些因素的話,可以賦予權重系數(shù),稱為加權平均中心。計算公式是:其中,Wi為第i個離散目標物權重,Xi,Yi為第i個離散目標物的坐標。質心量測經(jīng)常用于宏觀經(jīng)濟分析和市場區(qū)位選擇,還可以跟蹤某些地理分布的變化,如人口變遷,土地類型變化等。1.2.4距離量算“距離”是人們日常生活中經(jīng)常涉及到的概念,它描述了兩個事物或實體之間的遠近程度。最常用的距離概念是歐氏距離,無論是矢量結構,還是柵格結構都很容易實現(xiàn)。在GIS中,距離通常是兩個地點之間的計算,但有時人們想知道一個地點到所有其它地點的距離,這時得到的距離是一個距離表面。如果一區(qū)域中所有的性質與方向無關,則稱為各向同性區(qū)域。以旅行時間為例,如果從某一點出發(fā),到另一點的所耗費的時間只與兩點之間的歐氏距離成正比,則從一固定點出發(fā),旅行特定時間后所能達到的點必然組成一個等時圓。而現(xiàn)實生活中,旅行所耗費的時間不只與歐氏距離成正比,還與路況、運輸工具性能等有關,從固定點出發(fā),旅行特定時間后所能到達的點則在各個方向上是不同距離的,形成各向異性距離表面。(圖8-2)圖8-2:各向同性和各向異性的距離表面考慮到阻力影響,計算的距離稱為耗費距離。物質在空間中移動總要花費一些代價,如資金、時間等。阻力越大耗費也越大。相應的通過耗費距離得到的距離表面稱為阻力表面或耗費表面,其屬性值代表一耗費或阻力大小??梢愿鶕?jù)阻力表面計算最小耗費距離。對于描述點、線、面坐標的矢量結構,也有一系列的不同于歐氏距離的概念。歐氏距離通常用于計算兩點的直線距離:當有障礙或阻力存在時,兩點之間的距離就不能用直線距離,計算非標準歐氏距離的一般公式為:當k=2時,就是歐氏距離計算公式。當k=1時,得到的距離稱為曼哈頓距離。歐氏距離、曼哈頓距離和非歐氏距離的計算如圖8-3所示。圖8-3:歐氏距離、曼哈頓距離和一種非歐氏距離2.空間變換地理信息系統(tǒng)通常是按有一定意義的圖層和相應的屬性建立空間數(shù)據(jù)庫的。為了滿足特定空間分析的需要,需對原始圖層及其屬性進行一系列的邏輯或代數(shù)運算,以產(chǎn)生新的具有特殊意義的地理圖層及其屬性,這個過程稱為空間變換??臻g變換可以基于單個圖層進行,也可以對多個圖層,本章將空間變換僅限于對單個圖層的操作或計算,基于多圖層的操作,將在疊加分析里講述。地理信息系統(tǒng)中空間數(shù)據(jù)可分為矢量和柵格兩種數(shù)據(jù)結構。由于矢量結構中包含了大量的拓撲信息,數(shù)據(jù)組織復雜,使得空間變換十分繁瑣。而柵格結構簡單規(guī)則,空間變換比較容易。另外基于矢量結構的空間變換,對于單個圖層意義不大,生成新圖層時往往需要多個圖層的信息,在多圖層疊加分析中意義很大?;跂鸥窠Y構的空間變換可分為三種方式:(1)單點變換;(2)鄰域變換;(3)區(qū)域變換。單點變換只考慮單個點的屬性值進行運算,假定獨立單元的變換不依賴于其鄰點上屬性的影響,也不受區(qū)域內一般特征的影響。單點變換最常見的函數(shù)有加、減、乘、除等代數(shù)運算;與、并、非、異或等邏輯運算;大于、小于等比較運算;指數(shù)函數(shù),對數(shù)函數(shù)、三角函數(shù)等。其得到的新圖層可與原圖層屬性意義完全不同。鄰域變換是指在計算新圖層圖元值時,不僅考慮原始圖層上相應圖元本身的值,而且還要考慮與該圖元有鄰域關聯(lián)的其它圖元值的影響。這種關聯(lián)可以是直接的幾何關聯(lián),也可能是間接的幾何關聯(lián)。常見的函數(shù)有平滑、離散點搜索、連續(xù)表面描述(坡度、坡向、可視域分析)、點在多邊形中的判斷等。區(qū)域變換是指在計算新圖層屬性值時,要考慮整個區(qū)域的屬性值,即通過一個函數(shù)對某一區(qū)域內的所有值進行綜合,然后計算新屬性值。常見的函數(shù)有求區(qū)域平均值、眾數(shù),極值、求和、歸組、整體插值等方法。3.再分類通過分類找出隱藏信息是地理信息系統(tǒng)的重要功能之一。與傳統(tǒng)地圖相比,地圖上所載負的數(shù)據(jù)是經(jīng)過專門分類和處理過的,而地理信息系統(tǒng)存儲的數(shù)據(jù)則具有原始數(shù)據(jù)的性質,所以可以根據(jù)不同的需要對數(shù)據(jù)再進行分類和提取。由于這種分類是對原始數(shù)據(jù)進行的再次分類組織,因此稱為再分類(Reclassification)。地理信息系統(tǒng)區(qū)別于其它信息系統(tǒng)的方面是其對空間信息的處理功能,同時也提供了對非空間屬性的處理功能,盡管比較簡單,但它在實際應用中有著重要的作用。根據(jù)地理信息的非空間屬性,如材料、價值、使用性質等,進行再分類,這種純粹基于非空間屬性的分類,與其它信息系統(tǒng)對簡單結構化的數(shù)據(jù)進行分類的方法是一樣的,可以使用經(jīng)典的數(shù)理統(tǒng)計方法,如主成分分析、層次分析、聚類分析、判別分析等等。這種分類屬于普通的分類,它不改變地物已有的屬性值,而只是根據(jù)地物的屬性,將它們劃分到相應的類別中。本章主要論述GIS中通過地物屬性信息,經(jīng)過分類組織產(chǎn)生新地物特征的再分類。點、線狀地物的再分類,對于矢量數(shù)據(jù)結構可以通過簡單的修改屬性表中的數(shù)值來實現(xiàn),對于柵格數(shù)據(jù)結構也可以通過修改屬性值來獲得新的點、線地物。面狀地物的再分類,對于柵格數(shù)據(jù)結構則和點、線分類一樣,簡單的改變屬性數(shù)值并改變圖例表現(xiàn)這一變化。例如有一個柵格圖,屬性值從1到15分別代表一種農(nóng)作物,如果1到5及13為糧食作物,其它代表經(jīng)濟作物,可將1到5和13重新賦值1,其它數(shù)賦值2,則可得到只有糧食作物和經(jīng)濟作物兩類地物的柵格圖,并改變圖例體現(xiàn)這一變化。對于矢量數(shù)據(jù)結構的面狀地物再分類,則需要同時改變實體的幾何形狀和屬性。首要的任務是去掉將要合并的多邊形之間的分界線(LineDissolve),再把這兩個多邊形的屬性值變?yōu)橥粚傩浴H鐖D8-4所示:圖8-4:多邊形的合并因為對面狀地物的再分類得到的新圖層的類別比原圖層少,稱為歸組(Group),它是最常用和最簡單的再分類。如果想把面狀地物進一步分解成不同類別的地物,就不能用此方法,因為不能知道界線的位置,可使用另一個圖層,通過多邊形疊加方法來實現(xiàn)**關于多邊形疊加將在下面章節(jié)論述。上面講的再分類方法,都是只根據(jù)面狀地物本身的屬性,通過重新改變屬性值而實現(xiàn)分類的目的,當然也可以結合鄰域范圍的屬性值進行再分類。如坡度計算,緩沖區(qū)計算。再分類還可以綜合多個圖層的屬性信息,如圖8-5所示。圖8-5:多個屬性的再分類4.緩沖區(qū)分析鄰近度(Proximity)描述了地理空間中兩個地物距離相近的程度,其確定是空間分析的一個重要手段。交通沿線或河流沿線的地物有其獨特的重要性,公共設施(商場,郵局,銀行,醫(yī)院,車站,學校等)的服務半徑,大型水庫建設引起的搬遷,鐵路,公路以及航運河道對其所穿過區(qū)域經(jīng)濟發(fā)展的重要性等,均是一個鄰近度問題。緩沖區(qū)分析是解決鄰近度問題的空間分析工具之一。所謂緩沖區(qū)就是地理空間目標的一種影響范圍或服務范圍。從數(shù)學的角度看,緩沖區(qū)分析的基本思想是給定一個空間對象或集合,確定它們的鄰域,鄰域的大小由鄰域半徑R決定。因此對象Oi的緩沖區(qū)定義為:即對象Oi的半徑為R的緩沖區(qū)為距Oi的距離d小于R的全部點的集合。d一般是最小歐氏距離,但也可是其它定義的距離。對于對象集合其半徑為R的緩沖區(qū)是各個對象緩沖區(qū)的并,即:圖8-6為點對象、線對象、面對象及對象集合的緩沖區(qū)示例。圖8-6:點、線、多邊形的緩沖區(qū)另外還有一些特殊形態(tài)的緩沖區(qū),如點對象有三角形,矩形和圈形等,對于線對象有雙側對稱,雙側不對稱或單側緩沖區(qū),對于面對象有內側和外側緩沖區(qū)。這些適合不同應用要求的緩沖區(qū),盡管形態(tài)特殊,但基本原理是一致的。緩沖區(qū)計算的基本問題是雙線問題。雙線問題有很多另外的名稱,如圖形加粗,加寬線,中心線擴張等,它們指的都是相同的操作。1)角分線法雙線問題最簡單的方法是角分線法(簡單平行線法)。算法是在軸線首尾點處,作軸線的垂線并按緩沖區(qū)半徑R截出左右邊線的起止點;在軸線的其它轉折點上,用與該線所關聯(lián)的前后兩鄰邊距軸線的距離為R的兩平行線的交點來生成緩沖區(qū)對應頂點。如圖8-7所示。圖8-7:角平分線法角分線法的缺點是難以最大限度保證雙線的等寬性,尤其是在凸側角點在進一步變銳時,將遠離軸線頂點。根據(jù)上圖,遠離情況可由下式表示:當緩沖區(qū)半徑不變時,d隨張角B的減小而增大,結果在尖角處雙線之間的寬度遭到破壞。因此,為克服角分線法的缺點,要有相應的補充判別方案,用于校正所出現(xiàn)的異常情況。但由于異常情況不勝枚舉,導致校正措施繁雜。2)凸角圓弧法在軸線首尾點處,作軸線的垂線并按雙線和緩沖區(qū)半徑截出左右邊線起止點;在軸線其它轉折點處,首先判斷該點的凸凹性,在凸側用圓弧彌合,在凹側則用前后兩鄰邊平行線的交點生成對應頂點。這樣外角以圓弧連接,內角直接連接,線段端點以半圓封閉。如圖8-8所示。圖8-8:凸角圓弧法在凹側平行邊線相交在角分線上。交點距對應頂點的距離與角分線法類似公式:該方法最大限度的保證了平行曲線的等寬性,避免了角分線法的眾多異常情況。該算法非常重要的一環(huán)是折點凸凹性的自動判斷。此問題可轉化為兩個矢量的叉積:把相鄰兩個線段看成兩個矢量,其方向取坐標點序方向。若前一個矢量以最小角度掃向第二個矢量時呈逆時針方向,則為凸頂點,反之為凹頂點。具體算法過程如下: 由矢量代數(shù)可知,矢量AB,BC可用其端點坐標差表示(9-9):圖8-9:采用向量叉乘判斷向量排列 矢量代數(shù)叉積遵循右手法則,即當ABC呈逆時針方向時,S為正,否則為負。若S>0,則ABC呈逆時針,頂點為凸;若S<0,則ABC呈順時針,頂點為凹;若S=0,則ABC三點共線。對于簡單情形,緩沖區(qū)是一個簡單多邊形,但當計算形狀比較復雜的對象或多個對象集合的緩沖區(qū)時,就復雜得多。為使緩沖區(qū)算法適應更為普遍的情況,就不得不處理邊線自相交的情況。當軸線的彎曲空間不容許雙線的邊線無壓蓋地通過時,就會產(chǎn)生若干個自相交多邊形。圖8-10給出一個緩沖區(qū)邊線自相交的例子。圖8-10:緩沖區(qū)邊界相交的情況自相交多邊形分為兩種情況:島嶼多邊形和重疊多邊形。島嶼多邊形是緩沖區(qū)邊線的有效組成部分;重疊多邊形不是緩沖區(qū)邊線的有效組成,不參與緩沖區(qū)邊線的最終重構。對于島嶼多邊形和重疊多邊形的自動判別方法,首先定義軸線坐標點序為其方向,緩沖區(qū)雙線分成左右邊線,左右邊線自相交多邊形的判別情形恰好對稱。對于左邊線,島嶼自相交多邊形呈逆時針方向,重疊自相交多邊形呈順時針方向;對于右邊線,島嶼多邊形呈順時針方向,重疊多邊形呈逆時針方向。當存在島嶼和重疊自相交多邊形時,最終計算的邊線被分為外部邊線和若干島嶼。對于緩沖區(qū)邊線繪制,只要把外圍邊線和島嶼輪廓繪出即可。對于緩沖區(qū)檢索,在外邊線所形成的多邊形檢索后,要再扣除所有島嶼多邊形的檢索結果。基于柵格結構也可以作緩沖區(qū)分析,通常稱為推移或擴散(Spread)。推移或擴散實際上是模擬主體對鄰近對象的作用過程,物體在主體的作用下在一阻力表面移動,離主體越遠作用力越弱。例如可以將地形、障礙物和空氣作為阻力表面,噪聲源為主體,用推移或擴散的方法計算噪聲離開主體后在阻力表面上的移動,得到一定范圍內每個柵格單元的噪聲強度。5.疊加分析大部分GIS軟件是以分層的方式組織地理景觀,將地理景觀按主題分層提取,同一地區(qū)的整個數(shù)據(jù)層集表達了該地區(qū)地理景觀的內容。每個主題層,可以叫做一個數(shù)據(jù)層面。數(shù)據(jù)層面既可以用矢量結構的點、線、面圖層文件方式表達,也可以用柵格結構的圖層文件格式進行表達。疊加分析是地理信息系統(tǒng)最常用的提取空間隱含信息的手段之一。該方法源于傳統(tǒng)的透明材料疊加,即將來自不同的數(shù)據(jù)源的圖紙繪于透明紙上,在透光桌上將其疊放在一起,然后用筆勾出感興趣的部分—提取出感興趣的信息。地理信息系統(tǒng)的疊加分析是將有關主題層組成的數(shù)據(jù)層面,進行疊加產(chǎn)生一個新數(shù)據(jù)層面的操作,其結果綜合了原來兩層或多層要素所具有的屬性。疊加分析不僅包含空間關系的比較,還包含屬性關系的比較。地理信息系統(tǒng)疊加分析可以分為以下幾類:視覺信息疊加、點與多邊形疊加、線與多邊形疊加、多邊形疊加、柵格圖層疊加。5.1視覺信息疊加視覺信息疊加是將不同側面的信息內容疊加顯示在結果圖件或屏幕上,以便研究者判斷其相互空間關系,獲得更為豐富的空間信息。地理信息系統(tǒng)中視覺信息疊加包括以下幾類:點狀圖,線狀圖和面狀圖之間的疊加顯示。面狀圖區(qū)域邊界之間或一個面狀圖與其他專題區(qū)域邊界之間的疊加。遙感影象與專題地圖的疊加。專題地圖與數(shù)字高程模型(DEM)疊加顯示立體專題圖。視覺信息疊加不產(chǎn)生新的數(shù)據(jù)層面,只是將多層信息復合顯示,便于分析。5.2點與多邊形疊加點與多邊形疊加,實際上是計算多邊形對點的包含關系。矢量結構的GIS能夠通過計算每個點相對于多邊形線段的位置,進行點是否在一個多邊形中的空間關系判斷。在完成點與多邊形的幾何關系計算后,還要進行屬性信息處理。最簡單的方式是將多邊形屬性信息疊加到其中的點上。當然也可以將點的屬性疊加到多邊形上,用于標識該多邊形,如果有多個點分布在一個多邊形內的情形時,則要采用一些特殊規(guī)則,如將點的數(shù)目或各點屬性的總和等信息疊加到多邊形上。通過點與多邊形疊加,可以計算出每個多邊形類型里有多少個點,不但要區(qū)分點是否在多邊形內,還要描述在多邊形內部的點的屬性信息。通常不直接產(chǎn)生新數(shù)據(jù)層面,只是把屬性信息疊加到原圖層中,然后通過屬性查詢間接獲得點與多邊形疊加的需要信息。例如一個中國政區(qū)圖(多邊形)和一個全國礦產(chǎn)分布圖(點),二者經(jīng)疊加分析后,并且將政區(qū)圖多邊形有關的屬性信息加到礦產(chǎn)的屬性數(shù)據(jù)表中,然后通過屬性查詢,可以查詢指定省有多少種礦產(chǎn),產(chǎn)量有多少;而且可以查詢,指定類型的礦產(chǎn)在哪些省里有分布等信息。5.3線與多邊形疊加線與多邊形的疊加,是比較線上坐標與多邊形坐標的關系,判斷線是否落在多邊形內。計算過程通常是計算線與多邊形的交點,只要相交,就產(chǎn)生一個結點,將原線打斷成一條條弧段,并將原線和多邊形的屬性信息一起賦給新弧段。疊加的結果產(chǎn)生了一個新的數(shù)據(jù)層面,每條線被它穿過的多邊形打斷成新弧段圖層,同時產(chǎn)生一個相應的屬性數(shù)據(jù)表記錄原線和多邊形的屬性信息。根據(jù)疊加的結果可以確定每條弧段落在哪個多邊形內,可以查詢指定多邊形內指定線穿過的長度。如果線狀圖層為河流,疊加的結果是多邊形將穿過它的所有河流打斷成弧段,可以查詢任意多邊形內的河流長度,進而計算它的河流密度等;如果線狀圖層為道路網(wǎng),疊加的結果可以得到每個多邊形內的道路網(wǎng)密度,內部的交通流量,進入、離開各個多邊形的交通量,相鄰多邊形之間的相互交通量。5.4多邊形疊加多邊形疊加是GIS最常用的功能之一。多邊形疊加將兩個或多個多邊形圖層進行疊加產(chǎn)生一個新多邊形圖層的操作,其結果將原來多邊形要素分割成新要素,新要素綜合了原來兩層或多層的屬性。如圖8-11所示:圖8-11:多邊形疊加分析進行多個多邊形的疊加運算,在參與運算多邊形所構成的屬性空間(就圖10而言,為宗地ID,宗地號,土壤ID,穩(wěn)定性)內,每個結果多邊形內部的屬性值是一致的,可以稱為最小 公共地理單元(LeastCommonGeographicUnit,LCGU)。疊加過程可分為幾何求交過程和屬性分配過程兩步。幾何求交過程首先求出所有多邊形邊界線的交點,再根據(jù)這些交點重新進行多邊形拓撲運算,對新生成的拓撲多邊形圖層的每個對象賦一多邊形唯一標識碼,同時生成一個與新多邊形對象一一對應的屬性表。由于矢量結構的有限精度原因,幾何對象不可能完全匹配,疊加結果可能會出現(xiàn)一些碎屑多邊形(SilverPolygon),如圖8-12所示。通??梢栽O定一模糊容限以消除它。圖8-12:多邊形疊加產(chǎn)生碎屑多邊形多邊形疊加結果通常把一個多邊形分割成多個多邊形,屬性分配過程最典型的方法是將輸入圖層對象的屬性拷貝到新對象的屬性表中,或把輸入圖層對象的標識作為外鍵,直接關聯(lián)到輸入圖層的屬性表。這種屬性分配方法的理論假設是多邊形對象內屬性是均質的,將它們分割后,屬性不變。也可以結合多種統(tǒng)計方法為新多邊形賦屬性值。多邊形疊加完成后,根據(jù)新圖層的屬性表可以查詢原圖層的屬性信息,新生成的圖層和其它圖層一樣可以進行各種空間分析和查詢操作。根據(jù)疊加結果最后欲保留空間特征的不同要求,一般的GIS軟件都提供了三種類型的多邊形疊加操作,如圖8-13所示:圖8-13:多邊形的不同疊加方式5.5柵格圖層疊加柵格數(shù)據(jù)結構空間信息隱含屬性信息明顯的特點,可以看作是最典型的數(shù)據(jù)層面,通過數(shù)學關系建立不同數(shù)據(jù)層面之間的聯(lián)系是GIS提供的典型功能。空間模擬尤其需要通過各種各樣的方程將不同數(shù)據(jù)層面進行疊加運算,以揭示某種空間現(xiàn)象或空間過程。例如土壤侵蝕強度與土壤可蝕性,坡度,降雨侵蝕力等因素有關,可以根據(jù)多年統(tǒng)計的經(jīng)驗方程,把土壤可蝕性、坡度、降雨侵蝕力作為數(shù)據(jù)層面輸入,通過數(shù)學運算得到土壤侵蝕強度分布圖。這種作用于不同數(shù)據(jù)層面上的基于數(shù)學運算的疊加運算,在地理信息系統(tǒng)中稱為地圖代數(shù)。地圖代數(shù)功能有三種不同的類型:基于常數(shù)對數(shù)據(jù)層面進行的代數(shù)運算;基于數(shù)學變換對數(shù)據(jù)層面進行的數(shù)學變換(指數(shù)、對數(shù)、三角變換等);多個數(shù)據(jù)層面的代數(shù)運算(加、減、乘、除、乘方等)和邏輯運算(與、或、非、異或等)。下面給出一個地圖代數(shù)的典型例子。有一個森林地區(qū)融雪經(jīng)驗模型:M=(0.19T+0.17D)式中,M是融雪速度(厘米/天),T是空氣溫度,D是露點溫度。根據(jù)此方程,使用該地區(qū)的氣溫和露點溫度分布圖層,就能計算該地區(qū)融雪速率分布圖。計算過程是先分別把溫度分布圖乘以0.19和露點溫度分布圖乘以0.17,再把得到的結果相加。需要說明的是地圖代數(shù)在形式和概念上都比較簡單,使用起來方便靈活,但把圖層作為代數(shù)公式的變量進行計算,在實現(xiàn)的技術上難度較大。柵格圖層疊加的另一形式是二值邏輯疊加,常作為柵格結構的數(shù)據(jù)庫查詢工具。數(shù)據(jù)庫查詢就是查找數(shù)據(jù)庫中已有的信息,例如:基于位置信息查詢如已知地點的土地類型,以及基于屬性信息的查詢如地價最高的位置;比較復雜的查詢涉及多種復合條件,如查詢所有的面積大于10公頃且鄰近工業(yè)區(qū)的全部濕地。這種數(shù)據(jù)庫查詢通常分為兩步,首先進行再分類(見第三節(jié))操作,為每個條件創(chuàng)建一個新圖層,通常是二值圖層,1代表符合條件,0表示所有不符合條件。第二步進行二值邏輯疊加操作得到想查詢的結果。邏輯操作類型包括與、或、非、異或。6.網(wǎng)絡分析對地理網(wǎng)絡(如交通網(wǎng)絡)、城市基礎設施網(wǎng)絡(如各種網(wǎng)線、電力線、電話線、供排水管線等)進行地理分析和模型化,是地理信息系統(tǒng)中網(wǎng)絡分析功能的主要目的。網(wǎng)絡分析是運籌學模型中的一個基本模型,它的根本目的是研究、籌劃一項網(wǎng)絡工程如何安排,并使其運行效果最好,如一定資源的最佳分配,從一地到另一地的運輸費用最低等。其基本思想則在于人類活動總是趨于按一定目標選擇達到最佳效果的空間位置。這類問題在社會經(jīng)濟活動中不勝枚舉,因此在地理信息系統(tǒng)中此類問題的研究具有重要意義。6.1網(wǎng)絡數(shù)據(jù)結構網(wǎng)絡數(shù)據(jù)結構的基本組成部分和屬性如下:1)鏈(Link)網(wǎng)絡中流動的管線,如街道、河流、水管等,其狀態(tài)屬性包括阻力和需求。2)結點(Node)**在圖數(shù)據(jù)結構中稱為“弧”。網(wǎng)絡中鏈的結點,如港口、車站、電站等,其狀態(tài)屬性包括阻力和需求等。結點中又有下面幾種特殊的類型。障礙(Barrier),禁止網(wǎng)絡中鏈上流動的點。拐點(Turn),出現(xiàn)在網(wǎng)絡鏈中的分割結點上,狀態(tài)屬性有阻力,如拐彎的時間和限制(如在8:00到18:00不允許左拐)。中心(Center),是接受或分配資源的位置,如水庫、商業(yè)中心、電站等,其狀態(tài)屬性包括資源容量(如總量),阻力限額(中心到鏈的最大距離或時間限制)。站點(Stop),在路徑選擇中資源增減的結點,如庫房、車站等,其狀態(tài)屬性有資源需求,如產(chǎn)品數(shù)量。除了基本的組成部分外,有時還要增加一些特殊結構,如鄰接點鏈表用來輔助進行路徑分析。6.2主要網(wǎng)絡分析功能6.2.1路徑分析1)靜態(tài)求最佳路徑:在給定每條鏈上的屬性后,求最佳路徑。2)N條最佳路徑分析:確定起點或終點,求代價最小的N條路徑,因為在實踐中最佳路徑的選擇只是理想情況,由于種種因素而要選擇近似最優(yōu)路徑。3)最短路徑或最低耗費路徑:確定起點、終點和要經(jīng)過的中間點、中間連線,求最短路徑或最小耗費路徑。4)動態(tài)最佳路徑分析:實際網(wǎng)絡中權值是隨權值關系式變化的,可能還會臨時出現(xiàn)一些障礙點,需要動態(tài)的計算最佳路徑。6.2.2計算最短路徑的Dijkstra算法為了進行網(wǎng)絡最短路徑分析,需要將網(wǎng)絡轉換成有向圖。無論是計算最短路徑還是最佳路徑,其算法都是一致的,不同之處在于有向圖中每條弧的權值設置。如果要計算最短路徑,則權重設置為兩個節(jié)點的實際距離;而要計算最佳路徑,則可以將權值設置為從起點到終點的時間或費用。Dijkstra算法可以用于計算從有向圖中任意一個節(jié)點到其它節(jié)點的最短路徑。下面是該算法的描述。1)用帶權的鄰接矩陣Cost來表示帶權的n個節(jié)點的有向圖,Cost[i,j]表示弧<vi,vj>的權值,如果從vi到vj不連通,則Cost[i,j]=∞。圖8-14表示了一個帶權有向圖以及其鄰接矩陣。圖8-14:帶權的有向圖和鄰接矩陣然后,引進一個輔助向量Dist,每個分量Dist[i]表示從起始點到每個終點vi的最短路徑長度。假定起始點在有向圖中的序號為i0,并設定該向量的初始值為:Dist[i]=Cost[i0,i] vi∈V。令S為已經(jīng)找到的從起點出發(fā)的最短路徑的終點的集合。 2)選擇Vj,使得Dist[j]=Min{Dist[i]|Vi∈V-S}vi∈Vvj就是當前求得的一條從vi0出發(fā)的最短路徑的終點,令S=S∪{vj}3)修改從vi0出發(fā)到集合V-S中任意一頂點vk的最短路徑長度。如果Dist[j]+Cost[j,k]<Dist[k]則修改Dist[k]為: Dist[k]=Dist[j]+Cost[j,k] 4)重復第2、3步操作共n-1次,由此求得從vi0出發(fā)的到圖上各個頂點的最短路徑是依路徑長度遞增的序列。表8-1是圖8-14根據(jù)Dijkstra計算的結果。表8-1:用Dijkstra計算的結果終點從v0到其它各個節(jié)點的最短路徑v1∞∞∞∞∞無v210(v0,v2)v3∞60(v0,v2,v3)50(v0,v4,v3)v430(v0,v4)30(v0,v4)v5100(v0,v5)100(v0,v5)90(v0,v4,v5)60(v0,v4,v3,v5)vjv2v4v3v5在實際應用中,采用Dijkstra算法計算兩點之間的最短路徑和求從一點到其它所有點的最短路徑所需要的時間是一樣的,算法時間復雜度為O(n2)。6.2.3資源分配資源分配網(wǎng)絡模型由中心點(分配中心或收集中心)及其屬性和網(wǎng)絡組成。分配有兩種形式,一種是由分配中心向四周分配,另一種是由四周向收集中心分配。資源分配的應用包括消防站點分布和求援區(qū)劃分、學校選址、垃圾收集站點分布,停水停電對區(qū)域的社會、經(jīng)濟影響估計等。1)負荷設計負荷設計可用于估計排水系統(tǒng)在暴雨期間是否溢流,輸電系統(tǒng)是否超載等。2)時間和距離估算時間和距離估算除用于交通時間和交通距離分析外,還可模擬水、電等資源或能量在網(wǎng)絡上的距離損耗。網(wǎng)絡分析的具體門類、對象、要求變化非常多,一般的GIS軟件往往只能提供一些常用的分析方法、或提供描述網(wǎng)絡的數(shù)據(jù)模型和存儲信息的數(shù)據(jù)庫。其中最常用的方法是線性阻抗法,即資源在網(wǎng)絡上的運輸與所受的阻力和距離(或時間)成線性正比關系,在這基礎上選擇路徑,估計負荷,分配資源,計算時間和距離等。對于特殊的、精度要求極高的、非線性阻抗的網(wǎng)絡,則需要特殊的算法分析。7.空間插值7.1空間插值的概念和理論空間插值常用于將離散點的測量數(shù)據(jù)轉換為連續(xù)的數(shù)據(jù)曲面,以便與其它空間現(xiàn)象的分布模式進行比較,它包括了空間內插和外推兩種算法??臻g內插算法是一種通過已知點的數(shù)據(jù)推求同一區(qū)域其它未知點數(shù)據(jù)的計算方法;空間外推算法則是通過已知區(qū)域的數(shù)據(jù),推求其它區(qū)域數(shù)據(jù)的方法。在以下幾種情況下必須作空間插值:1)現(xiàn)有的離散曲面的分辨率,象元大小或方向與所要求的不符,需要重新插值。例如將一個掃描影象(航空像片、遙感影象)從一種分辨率或方向轉換到另一種分辨率或方向的影象。2)現(xiàn)有的連續(xù)曲面的數(shù)據(jù)模型與所需的數(shù)據(jù)模型不符,需要重新插值。如將一個連續(xù)的曲面從一種空間切分方式變?yōu)榱硪环N空間切分方式,從TIN到柵格、柵格到TIN或矢量多邊形到柵格。3)現(xiàn)有的數(shù)據(jù)不能完全覆蓋所要求的區(qū)域范圍,需要插值。如將離散的采樣點數(shù)據(jù)內插為連續(xù)的數(shù)據(jù)表面。 空間插值的理論假設是空間位置上越靠近的點,越可能具有相似的特征值;而距離越遠的點,其特征值相似的可能性越小。然而,還有另外一種特殊的插值方法——分類,它不考慮不同類別測量值之間的空間聯(lián)系,只考慮分類意義上的平均值或中值,為同類地物賦屬性值。它主要用于地質、土壤、植被或土地利用的等值區(qū)域圖或專題地圖的處理,在“景觀單元”或圖斑內部是均勻和同質的,通常被賦給一個均一的屬性值,變化發(fā)生在邊界上。7.2空間插值的數(shù)據(jù)源連續(xù)表面空間插值的數(shù)據(jù)源包括:攝影測量得到的正射航片或衛(wèi)星影象;衛(wèi)星或航天飛機的掃描影象;野外測量采樣數(shù)據(jù),采樣點隨機分布或有規(guī)律的線性分布(沿剖面線或沿等高線);數(shù)字化的多邊形圖、等值線圖;空間插值的數(shù)據(jù)通常是復雜空間變化有限的采樣點的測量數(shù)據(jù),這些已知的測量數(shù)據(jù)稱為“硬數(shù)據(jù)”。如果采樣點數(shù)據(jù)比較少的情況下,可以根據(jù)已知的導致某種空間變化的自然過程或現(xiàn)象的信息機理,輔助進行空間插值,這種已知的信息機理,稱為“軟信息”。但通常情況下,由于不清楚這種自然過程機理,往往不得不對該問題的屬性在空間的變化作一些假設,例如假設采樣點之間的數(shù)據(jù)變化是平滑變化,并假設服從某種分布概率和統(tǒng)計穩(wěn)定性關系。采樣點的空間位置對空間插值的結果影響很大,理想的情況是在研究區(qū)內均勻布點。然而當區(qū)域景觀大量存在有規(guī)律的空間分布模式時,如有規(guī)律間隔的數(shù)或溝渠,用完全規(guī)則的采樣網(wǎng)絡則顯然會得到片面的結果,正是這個原因,統(tǒng)計學家希望通過一些隨機的采樣來計算無偏的均值和方差。但是完全隨機的采樣同樣存在缺陷,首先隨機的采樣點的分布位置是不相關的,而規(guī)則采樣點的分布則只需要一個起點位置,方向和固定大小的間隔,尤其是在復雜的山地和林地里比較容易。其次完全隨機采樣,會導致采樣點的分布不均,一些點的數(shù)據(jù)密集,另一些點的數(shù)據(jù)缺少。圖8-15列出空間采樣點分布的幾種選擇。圖8-15:各種不同的采樣方式規(guī)則采樣和隨機采樣好的結合方法是成層隨機采樣,即單個的點隨機的分布于規(guī)則的格網(wǎng)內。聚集采樣可用于分析不同尺度的空間變化。規(guī)則斷面采樣常用于河流、山坡剖面的測量。等值線采樣是數(shù)字化等高線圖插值數(shù)字高程模型最常用的方法。術語:是一個數(shù)據(jù)點的屬性值,其中是所有測量點中的一個。是一個點x0插值后的數(shù)值。如果一種插值方法計算的數(shù)據(jù),其中采樣點的計算數(shù)據(jù)等于已知的采樣數(shù)據(jù),稱這種插值方法是精確插值方法;所有的其它插值方法為近似插值方法。統(tǒng)計計算值和測量值之間的差異(絕對值和平方差),-,是評價不精確插值方法質量常用的指標。7.3空間插值方法空間插值方法可以分為整體插值和局部插值方法兩類。整體插值方法用研究區(qū)所有采樣點的數(shù)據(jù)進行全區(qū)特征擬合;局部插值方法是僅僅用鄰近的數(shù)據(jù)點來估計未知點的值。整體插值方法通常不直接用于空間插值,而是用來檢測不同于總趨勢的最大偏離部分,在去除了宏觀地物特征后,可用剩余殘差來進行局部插值。由于整體插值方法將短尺度的、局部的變化看作隨機的和非結構的噪聲,從而丟失了這一部分信息。局部插值方法恰好能彌補整體插值方法的缺陷,可用于局部異常值,而且不受插值表面上其它點的內插值影響。7.3.1整體插值方法1)邊界內插方法邊界內插方法假設任何重要的變化發(fā)生在邊界上,邊界內的變化是均勻的,同質的,即在各方向都是相同的。這種概念模型經(jīng)常用于土壤和景觀制圖,可以通過定義“均質的”土壤單元、景觀圖斑,來表達其它的土壤、景觀特征屬性。邊界內插方法最簡單的統(tǒng)計模型是標準方差分析(ANOVAR)模型:式中,z是在x0位置的屬性值,μ是總體平均值,αk是k類平均值與μ的差,ε為類間平均誤差(噪聲)。該模型假設每一類別k的屬性值是正態(tài)分布;每類k的平均值(μ+αk)由一個獨立樣品集估計,并假設它們是與空間無關的;類間平均誤差ε假設所有類間都是相同的。評價分類效果的指標是,為類間方差,為總體方差,比值越小分類效果越好。分類效果的顯著性檢驗可以用F檢驗。實質上,邊界內插方法的理論假設是:屬性值z在“圖斑”或景觀單元內是隨機變化的,不是有規(guī)律的;同一類別的所有“圖斑”存在同樣的類方差(噪聲);所有的屬性值都呈正態(tài)分布;所有的空間變化發(fā)生在邊界上,是突變而不是漸變。在使用邊界內插時,應仔細考慮數(shù)據(jù)源是否符合這些理論假設。2)趨勢面分析某種地理屬性在空間的連續(xù)變化,可以用一個平滑的數(shù)學平面加以描述。思路是先用已知采樣點數(shù)據(jù)擬合出一個平滑的數(shù)學平面方程,再根據(jù)該方程計算無測量值的點上的數(shù)據(jù)。這種只根據(jù)采樣點的屬性數(shù)據(jù)與地理坐標的關系,進行多元回歸分析得到平滑數(shù)學平面方程的方法,稱為趨勢面分析。它的理論假設是地理坐標(x,y)是獨立變量,屬性值Z也是獨立變量且是正態(tài)分布的,同樣回歸誤差也是與位置無關的獨立變量。多項式回歸分析是描述長距離漸變特征的最簡單方法。多項式回歸的基本思想是用多項式表示線、面,按最小二乘法原理對數(shù)據(jù)點進行擬合。線或面多項式的選擇取決于數(shù)據(jù)是一維的還是二維的。用一個簡單的示例來說明,地理或環(huán)境調查中特征值z沿一個斷面在x1,x2…xn處采樣,若z值隨x值增加而線性增大,則該特征值的長期變化可以用下面一個回歸方程進行計算:其中,b0,b1為回歸系數(shù),ε為獨立于x的正態(tài)分布殘差(噪聲)。然而許多情況下,不是以線性函數(shù),而是以更為復雜的方式變化,則需用二次多項式進行擬合:對于二維的情況,XY坐標的多元回歸分析得到的曲面多項式,形式如下:前三種形式分別是:平面斜平面二次曲面其中,p是趨勢面方程的次數(shù)。是趨勢面多項式正常情況下的最少項數(shù)個數(shù)。零次多項式是平面,有1個項數(shù);一次多項式是斜平面,有3個項數(shù);二次曲面有6個項數(shù),三次趨勢面有10個項數(shù)。計算系數(shù)bi是一個標準的多元回歸問題。趨勢面分析的優(yōu)點是非常容易理解,至少是在計算方面。另外大多數(shù)情況下可用低次多項式進行擬合,但給復雜的多項式賦與明確的物理意義比較困難。趨勢面是個平滑函數(shù),很難正好通過原始數(shù)據(jù)點,除非是數(shù)據(jù)點少且趨勢面次數(shù)高才能是曲面正好通過原始數(shù)據(jù)點,所以趨勢面分析是一個近似插值方法。實際上趨勢面最有成效的應用是揭示區(qū)域中不同于總趨勢的最大偏離部分,所以趨勢面分析的主要用途是,在使用某種局部插值方法之前,可用趨勢面分析從數(shù)據(jù)中去掉一些宏觀特征,不直接用它進行空間插值。趨勢面擬合程度的檢驗,同多元回歸分析一樣,可用F分布進行檢驗,其檢驗統(tǒng)計量為:其中,U為回歸平方和,Q為殘差平方和(剩余平方和),p為多項式項數(shù)(不包括常數(shù)項b0),n為使用數(shù)據(jù)點數(shù)目。當F>Fa時,趨勢面顯著,否則不顯著。3)變換函數(shù)插值根據(jù)一個或多個空間參量的經(jīng)驗方程進行整體空間插值,也是經(jīng)常使用的空間插值方法,這種經(jīng)驗方程稱為變換函數(shù)。下面以一個研究實例進行說明。沖積平原的土壤重金屬污染與幾個重要因子有關,其中距污染源(河流)的距離,和高程兩個因子最重要。一般情況,攜帶重金屬的粗粒泥沙沉積在河灘上,攜帶重金屬的細粒泥沙沉淀在低洼的在洪水期容易被淹沒的地方,而那些洪水頻率低的地方,由于攜帶重金屬污染泥沙顆粒比較少,受到污染輕。由于距河流的距離和高程是比較容易得到的空間變量,可以用各種重金屬含量與它們的經(jīng)驗方程進行空間插值,以改進對重金屬污染的預測。本例回歸方程的形式如下:式中是z(x)某種重金屬含量(ppm),b0…bn是回歸系數(shù),p1…pn是獨立空間變量,本例p1是距河流的距離因子,p2是高程因子。這種回歸模型通常叫做轉換函數(shù),大多數(shù)GIS軟件都可以計算。轉換函數(shù)可以應用于其他獨立變量,如溫度、高程、降雨量和距海、植被的距離關系可以組合為一個超剩含水量的函數(shù)。地理位置及其屬性可以盡可能多的信息組合成需要的回歸模型,然后進行空間插值。但應該注意的一點是,必須清楚回歸模型的物理意義。還要指出的是所有的回歸轉換函數(shù)都屬于近似的空間插值。整體插值方法通常使用方差分析和回歸方程等標準的統(tǒng)計方法,計算比較簡單。其它的許多方法也可用于整體空間插值,如傅立葉級數(shù)和小波變換,特別是遙感影象分析方面,但它們需要的數(shù)據(jù)量大。7.3.2局部插值方法局部插值方法只使用鄰近的數(shù)據(jù)點來估計未知點的值,包括幾個步驟:1)定義一個鄰域或搜索范圍;2)搜索落在此鄰域范圍的數(shù)據(jù)點;3)選擇表達這有限個點的空間變化的數(shù)學函數(shù);4)為落在規(guī)則格網(wǎng)單元上的數(shù)據(jù)點賦值。重復這個步驟直到格網(wǎng)上的所有點賦值完畢。使用局部插值方法需要注意的幾個方面是:所使用的插值函數(shù);鄰域的大小、形狀和方向;數(shù)據(jù)點的個數(shù);數(shù)據(jù)點的分布方式是規(guī)則的還是不規(guī)則的。1)最近鄰點法:泰森多邊形方法泰森多邊形(Thiessen,又叫Dirichlet或Voronoi多邊形)采用了一種極端的邊界內插方法,只用最近的單個點進行區(qū)域插值。泰森多邊形按數(shù)據(jù)點位置將區(qū)域分割成子區(qū)域,每個子區(qū)域包含一個數(shù)據(jù)點,各子區(qū)域到其內數(shù)據(jù)點的距離小于任何到其它數(shù)據(jù)點的距離,并用其內數(shù)據(jù)點進行賦值。連接所有數(shù)據(jù)點的連線形成Delaunay三角形,與不規(guī)則三角網(wǎng)TIN具有相同的拓撲結構。GIS和地理分析中經(jīng)常采用泰森多邊形進行快速的賦值,實際上泰森多邊形的一個隱含的假設是任何地點的氣象數(shù)據(jù)均使用距它最近的氣象站的數(shù)據(jù)。而實際上,除非是有足夠多的氣象站,否則這個假設是不恰當?shù)?,因為降水、氣壓、溫度等現(xiàn)象是連續(xù)變化的,用泰森多邊形插值方法得到的結果圖變化只發(fā)生在邊界上,在邊界內都是均質的和無變化的。2)移動平均插值方法:距離倒數(shù)插值距離倒數(shù)插值方法綜合了泰森多邊形的鄰近點方法和趨勢面分析的漸變方法的長處,它假設未知點x0處屬性值是在局部鄰域內中所有數(shù)據(jù)點的距離加權平均值。距離倒數(shù)插值方法是加權移動平均方法的一種。加權移動平均方法的計算公式如下:式中,權重系數(shù)由函數(shù)計算,要求當時,一般取倒數(shù)或負指數(shù)形式。其中最常見的形式是距離倒數(shù)加權函數(shù),形式如下:式中,xj為未知點,xi為已知數(shù)據(jù)點。 加權移動平均公式最簡單的形式稱為線性插值,公式如下:距離倒數(shù)插值方法是GIS軟件根據(jù)點數(shù)據(jù)生成柵格圖層的最常見方法。距離倒數(shù)法計算值易受數(shù)據(jù)點集群的影響,計算結果經(jīng)常出現(xiàn)一種孤立點數(shù)據(jù)明顯高于周圍數(shù)據(jù)點的“鴨蛋”分布模式,可以在插值過程中通過動態(tài)修改搜索準則進行一定程度的改進。3)樣條函數(shù)插值方法在計算機用于曲線與數(shù)據(jù)點擬合以前,繪圖員是使用一種靈活的曲線規(guī)逐段的擬合出平滑的曲線。這種靈活的曲線規(guī)繪出的分段曲線稱為樣條。與樣條匹配的那些數(shù)據(jù)點稱為樁點,繪制曲線時樁點控制曲線的位置。曲線規(guī)繪出的曲線在數(shù)學上用分段的三次多項式函數(shù)來描述這種曲線,其連接處有連續(xù)的一階和二階連續(xù)導數(shù)。樣條函數(shù)是數(shù)學上與靈活曲線規(guī)對等的一個數(shù)學等式,是一個分段函數(shù),進行一次擬合只有與少數(shù)點擬合,同時保證曲線段連接處連續(xù)。這就意味著樣條函數(shù)可以修改少數(shù)數(shù)據(jù)點配準而不必重新計算整條曲線,趨勢面分析方法做不到這一點,(圖16)。圖8-16:樣條函數(shù)的局部特征(a:當二次樣條曲線的一個點位置變化時,只需要重新計算四段曲線;b:而一次樣條曲線的一個點位置變化時,只需要重新計算兩段曲線)一般的分段多項式p(x)定義為:p(x)=pi(x)xi<x<xi+1(i=1,2,3…,k-1)(j=0,1,2,...,r-1;i=1,2,...,k-1)x1,...,xk-1將區(qū)間x0,xk分成k個子區(qū)間,這些分割點稱“斷點”,曲線上具有這些x值的點稱為“節(jié)”。函數(shù)pi(x)為小于等于m次的多項式。r項用來表示樣條函數(shù)的約束條件:r=0,無約束;r=1,函數(shù)連續(xù)且對它的導數(shù)無任何約束;r=m-1,區(qū)間[x0xk]可用一個多項式表示;r=m,約束條件最多。m=1,2,3時的樣條分別為一次、二次、三次樣條函數(shù),其導數(shù)分別是0階、1階、2階導數(shù),二次樣條函數(shù)的每個節(jié)點處必須有一階連續(xù)導數(shù),三次樣條函數(shù)的每個節(jié)點初必須有二階連續(xù)導數(shù)。r=m的簡單樣條只有k+m個自由度,r=m=3有著特殊的意義,因為它是三次多項式,該函數(shù)首次被人們稱為樣條函數(shù)。術語“三次樣條”用于三維情況,此時進行曲面內插,而不是曲線內插。由于離散子區(qū)間的范圍較寬,可能是一條數(shù)字化的曲線,在這個范圍內計算簡單樣條會引起一定的數(shù)學問題,因此在實際應用中都用B樣條—一種特殊的樣條函數(shù)。B樣條是感興趣區(qū)間以外均為零的其它樣條的和,因此可按簡單的方法用低次多項式進行局部擬合。B樣條經(jīng)常用于數(shù)字化的線劃在顯示之前進行平滑處理,例如土壤、地質圖上的各種邊界,傳統(tǒng)的制圖總希望繪出較平滑的曲線。但是用B樣條做多邊形邊界平滑也存在一些問題,特別是多邊形面積和周長的計算,結果會與平滑前的不同。綜上所述,樣條函數(shù)是分段函數(shù),每次只用少量數(shù)據(jù)點,故插值速度快。樣條函數(shù)與趨勢面分析和移動平均方法相比,它保留了局部的變化特征。線性和曲面樣條函數(shù)都在視覺上上得到了令人滿意的結果。樣條函數(shù)的一些缺點是:樣條內插的誤差不能直接估算,同時在實踐中要解決的問題是樣條塊的定義以及如何在三維空間中將這些“塊”拼成復雜曲面,又不引入原始曲面中所沒有的異?,F(xiàn)象等問題。4)空間自協(xié)方差最佳插值方法:克里金插值前面介紹的幾個插值方法對影響插值效果的一些敏感性問題仍沒有得到很好的解決,例如趨勢面分析的控制參數(shù)和距離倒數(shù)插值方法的權重對結果影響很大,這些問題包括:需要計算平均值數(shù)據(jù)點的數(shù)目;搜索數(shù)據(jù)點的鄰域大小、方向和形狀如何確定;有沒有比計算簡單距離函數(shù)更好的估計權重系數(shù)的方法;與插值有關的誤差問題。為解決這些問題,法國地理數(shù)學學家GeorgesMatheron和南非礦山工程師D.G.Krige研究了一種優(yōu)化插值方法,用于礦山勘探。這個方法被廣泛地應用于地下水模擬、土壤制圖等領域,成為GIS軟件地理統(tǒng)計插值的重要組成部分。這種方法充分吸收了地理統(tǒng)計的思想,認為任何在空間連續(xù)性變化的屬性是非常不規(guī)則的,不能用簡單的平滑數(shù)學函數(shù)進行模擬,可以用隨機表面給予較恰當?shù)拿枋?。這種連續(xù)性變化的空間屬性稱為“區(qū)域性變量”,可以描述象氣壓、高程及其它連續(xù)性變化的描述指標變量。這種應用地理統(tǒng)計方法進行空間插值的方法,被稱為克里金(Kriging)插值。地理統(tǒng)計方法為空間插值提供了一種優(yōu)化策略,即在插值過程中根據(jù)某種優(yōu)化準則函數(shù)動態(tài)的決定變量的數(shù)值。Matheron,Krige等人研究的插值方法著重于權重系數(shù)的確定,從而使內插函數(shù)處于最佳狀態(tài),即對給定點上的變量值提供最好的線性無偏估計??死锝鸩逯捣椒ǖ膮^(qū)域性變量理論假設任何變量的空間變化都可以表示為下述三個主要成分的和(圖8-17):1)與恒定均值或趨勢有關的結構性成分;2)與空間變化有關的隨機變量,即區(qū)域性變量;3)與空間無關的隨機噪聲項或剩余誤差項。圖8-17:區(qū)域變量理論將復雜的空間變化分為三個部分(i)地形的平均特性;(ii)空間相關的不規(guī)則變化;(iii)隨機的、局部的變化另x為一維、二維或三維空間中的某一個位置,變量z在x處的值可又下式計算:式中,m(x)是描述z(x)的結構性成分的確定性函數(shù);是與空間變化有關的隨機變化項,即區(qū)域性變量;是剩余誤差項,空間上具有零平均值、與空間無關的高斯噪聲項??死锝鸱椒ǖ牡谝徊绞谴_定適當?shù)膍(x)函數(shù),最簡單的情況是m(x)等于采樣區(qū)的平均值,距離矢量h分離的兩點x,x+h之間的數(shù)學期望等于零:式中z(x),z(x+h)是隨機變量z在x,x+h處的值,同時還假設兩點之間的方差只與距離h有關,于是:式中,是一種函數(shù),稱為半方差函數(shù)。區(qū)域性變量理論的兩個內在假設條件是差異的穩(wěn)定性和可變性,一旦結構性成分確定后,剩余的差異變化屬于同質變化,不同位置之間的差異僅是距離的函數(shù)。這樣,區(qū)域性變量計算公式可以寫成下式的形式:半方差的估算公式如下:式中,n為距離為h的采樣點對的數(shù)目(n對點),采樣間隔h也叫延遲。對應于h的的圖被稱為“半方差圖”。圖8-18表示一個典型的半方差圖。半方差是定量描述區(qū)域性變化的第一步,它為空間插值、優(yōu)化采樣方案提供了有益的信息。為了求得半方差圖,必須先得到擬合半方差的理論模型,在半方差理論模型中:1)延遲h的值較大的部分曲線呈水平方向。曲線的水平部分成為“梁(Sill)”。說明在延遲的這個范圍內數(shù)據(jù)點沒有空間相關性,因為所有的方差不隨距離增減而變化。2)曲線從的低值升到梁為止的延遲范圍,稱為“變程(Range)”。變程是半方差圖最重要的部分,因為它描述了與空間有關的差異怎樣隨距離變化的。在變程范圍內距離越近的點具有更相近的特征。變程給移動加權平均方法提供了一個確定窗口大小的方法。很顯然,數(shù)據(jù)點和未知點之間的距離大于變程范圍,表明該數(shù)據(jù)點與未知點距離太遠,對插值沒有作用。3)圖中的擬合模型沒有通過原點,而是在的正方向與坐標軸相截。圖8-18:半方差圖按半方差計算公式,當h=0時,必須為零。模型中出現(xiàn)的正值是剩余誤差的估計值,它是與空間無關的噪聲。稱為“核(Nugget)”方差,是觀測誤差的和距離間隔很小的情況下的空間變化的組合。當存在明顯的變程和梁,同時核方差也很重要但數(shù)值不太大的情況下,可用球面模型進行半方差擬合(圖8-19-1)。公式是:0<h<ah>=a h=0式中,a是變程,h是延遲,c0+c1為梁。一般情況下用球面模型擬合效果比較理想。如果存在明顯的核方差和梁,而沒有漸變的變程,則可用指數(shù)模型(圖8-19-2)進行擬合:如果核方差相對于與空間變化有關的隨機變化很小的情況下,最好使用比較彎曲的曲線,如高斯曲線:(圖8-19-4)如果空間變化隨變程漸變,但沒有梁,則可用線性模型(圖8-19-3)進行擬合:式中,b為線的斜率。當變程的大小遠超過人們希望的插值范圍時,也用線性模型。前面的討論都假設地表特征在各個方向都是相同的,然而許多情況下空間變化中的都具有明顯的方向性,這是就要用不同參數(shù)的模型來擬合半方差圖。圖8-19:各種不同的變方差圖擬合后的半方差圖重要的用途是確定局部內插需要的權重因子。確定的過程與加權移動插值方法類似,但不是按一種固定的函數(shù)計算,而是按采樣點數(shù)據(jù)的半方差圖的統(tǒng)計分析原理計算。即: 權重的選擇應使是無偏估計,且估計的方差小于觀測值的其它線性組合產(chǎn)生的方差。的最小方差為:只有下式成立時,才可獲得的最小方差:式中,是z在采樣點xi,xj之間的半方差;是采樣點xj和未知點x0之間的半方差,這兩個量均可從已擬合模型的半方差圖上得到。量計算最小方差需要的拉格朗日算子。這個方法叫常規(guī)克里金插值。它是一個精確插值模型,內插值或最佳局部均值與數(shù)據(jù)點上的值一致。制圖中常用比采樣間隔更細的規(guī)則格網(wǎng)進行插值,內插值又可用前邊提到的方法轉換成等值線圖。與此類似,估計的誤差,又叫克里金方差,可以用來制圖以反映在整個研究區(qū)內插值結果的可靠性。一個克里金插值的示例:(圖8-20)圖8-20:克里金插值的示例計算圖中(x=5,y=5)處未知點I0的克里金方法的權重,使用球面模型對半方差進行擬和,參數(shù)c0=2.5,c1=7.5;變程a=10.0。這5個采樣點的數(shù)據(jù)分別是:IxyzI1223I2374I3992I4654I5 536解法過程用矩陣的表示如下:其中,A為數(shù)據(jù)點之間的半方差矩陣,b是每個數(shù)據(jù)點與未知點之間的半方差向量,λ為要計算的權重系數(shù)向量,Φ為解方程的拉格郎日算子。首先計算這5個數(shù)據(jù)點之間的距離矩陣:I 1 2 3 4 5I1 0.0 5.099 9.899 5.000 3.162I2 5.099 0.0 6.325 3.606 4.472I3 9.899 6.325 0.0 5.0 7.211I4 5.0 3.606 5.0 0.0 2.236I5 3.162 4.472 7.211 2.236 0.0 和它們與未知點之間的距離向量:I I0I1 4.243I2 2.808 I3 5.657 I4 1.0I52.0將上述數(shù)值帶入球面模型,得到相應的半方差(矩陣A,b):A= I1 2 3 4 5 61 2.500 7.739 9.999 7.656 5.939 1.0002 7.739 2.500 8.677 6.381 7.196 1.0003 9.999 8.677 2.500 7.656 9.206 1.0004 7.656 6.381 7.656 2.500 4.936 1.0005 5.939 7.196 9.206 4.936 2.500 1.0006 1.000 1.000 1.000 1.000 1.000 0.000b=I 0 1 7.1512 5.5973 8.8154 3.6215 4.72061.000注意額外的第6行和第6列,是為了保證權重之和為1。計算A的逆矩陣,得:A-1=I 1 2 3 4 5 61 -0.172 0.050 0.022 -0.026 0.126 0.2732 0.050 -0.167 0.032 0.077 0.007 0.2073 0.022 0.032 -0.111 0.066 -0.010 0.3574 -0.026 0.077 0.066 -0.307 0.190 0.0305 0.126 0.007 -0.010 0.190 -0.313 0.1346 0.273 0.207 0.357 0.003 0.134 -6.873于是,權重λ為:I權重系數(shù) 距離 1 0.0175 4.423 2 0.2281 2.828 3 -0.0891 ∑=1 5.657 4 0.6437 1.000 5 0.1998 2.000 6 0.1182 φ得未知點插值后得數(shù)值為:z(I0)=0.0175*3+0.2281*4-0.0891*2+0.6437*4+0.1998*6 = 4.566估計方差為:σe2=[0.0175*7.151+0.2281*5.597-0.0891*8.815+0.6437*3.621+.1998*4.720]+φ=3.890+0.1182 =4.008克里金插值方法的目的是提供確定權重系數(shù)最優(yōu)的方法和并能描述誤差信息。由于克里金點模型(常規(guī)克里金模型)的內插值與原始樣本的容量有關,當樣本少的情況下,采用簡單的點常規(guī)克里金插值的內插結果圖會出現(xiàn)明顯的凹凸現(xiàn)象??梢酝ㄟ^修改克里金方程以估計子塊B內的平均值來克服這一缺點。該方法叫塊克里金插值,該方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 陜西環(huán)保面試題及答案
- 醫(yī)療配合:溝通技巧大全
- 如何提升禮儀魅力
- 骨科面試題題庫及答案
- 山鷹紙業(yè)培訓考試試題及答案
- 武術基本常識考試試題及答案
- 如何培養(yǎng)孩子的閱讀習慣
- 特崗教師考試試題及答案
- 保密能力面試題及答案
- java內存區(qū)域面試題及答案
- 電線電纜產(chǎn)品工藝流程圖和結構示意圖
- 智慧交通大腦一體化管理平臺建設方案
- 2023年北京郵電大學招聘筆試真題
- xx公路與天然氣管道交叉方案安全專項評價報告
- 藥店員工培訓與考核制度
- RPA財務機器人開發(fā)與應用 課件 6.1 RPA網(wǎng)銀付款機器人
- 征信理論與實務第二章-征信數(shù)據(jù)庫
- 2021年深圳實驗學校初中部七年級入學分班考試數(shù)學試卷及答案解析
- 平凡的世界(閱讀任務二 人物形象分析)公開課一等獎創(chuàng)新教學設計-【中職專用】高一語文(高教版2023-2024基礎模塊上冊)
- JT-T-496-2018公路地下通信管道高密度聚乙烯硅芯塑料管
- 機電安裝工程施工現(xiàn)場安全管理臺賬
評論
0/150
提交評論