1眾源地理數(shù)據(jù)的特點(diǎn)
眾源地理數(shù)據(jù)具有以下10個(gè)特點(diǎn):1)現(xiàn)勢(shì)性高。眾源地理數(shù)據(jù)具有明顯的實(shí)時(shí)更新特點(diǎn),現(xiàn)勢(shì)性高。例如,堵在路上的行車者往往會(huì)將道路擁堵信息發(fā)布于Twitter、微博、Wikiloc、GPSies等網(wǎng)站。2)傳播快。眾源地理數(shù)據(jù)大多來自于互聯(lián)網(wǎng),借助社交網(wǎng)站和當(dāng)?shù)匦侣劦葌髅较到y(tǒng)的傳播能力,進(jìn)行快速傳播和擴(kuò)散。例如,美國(guó)加州2009年5月的Jesusita火災(zāi)期間,通過建立地圖式火災(zāi)監(jiān)視網(wǎng)站,迅速整合、發(fā)布了來自各種VGI和當(dāng)?shù)毓俜降膶?shí)時(shí)火災(zāi)信息[7]。3)信息豐富。眾源地理數(shù)據(jù)與人類活動(dòng)及社會(huì)發(fā)展緊密相關(guān),具有豐富的社會(huì)化屬性、語(yǔ)義信息和時(shí)序信息。其參與創(chuàng)建的廣泛性又使得眾源地理數(shù)據(jù)能從更多角度,更多方面對(duì)地理要素進(jìn)行描述。4)成本低。眾源地理數(shù)據(jù)大多來自網(wǎng)民自發(fā)或無意采集的地理數(shù)據(jù),其采集和處理的成本很低,極大地降低了地理信息獲取和使用的成本,將更有效地促進(jìn)地理信息技術(shù)的推廣應(yīng)用。5)數(shù)據(jù)量大。眾源地理數(shù)據(jù)大多來自互聯(lián)網(wǎng)用戶有意或無意提交的地理數(shù)據(jù),互聯(lián)網(wǎng)用戶群的迅速發(fā)展帶來了眾源地理數(shù)據(jù)的激增。無論是像OSM這樣的共享網(wǎng)站,還是具體的眾源地理數(shù)據(jù)使用者,均需面對(duì)海量眾源地理數(shù)據(jù)的高效存儲(chǔ)以及網(wǎng)絡(luò)共享中的快速傳輸?shù)葐栴}。6)質(zhì)量各異。眾源地理數(shù)據(jù)主要由民眾提供,其提供過程非常自由,參與人群非常廣泛,所采用的數(shù)據(jù)采集設(shè)備精度不一,創(chuàng)建編輯過程中所用比例尺、采樣精度不一,使得眾源地理數(shù)據(jù)質(zhì)量存在較大差異,甚至混雜著錯(cuò)誤或惡意扭曲的成分。7)冗余而又不完整。眾源地理數(shù)據(jù)主要由非專業(yè)人員創(chuàng)建,缺乏數(shù)據(jù)完整性,難以滿足一些專業(yè)的地理數(shù)據(jù)要求,同時(shí)經(jīng)過多人多次提交或多次編輯的眾源地理數(shù)據(jù)存在著大量冗余。8)覆蓋不均勻。眾源地理數(shù)據(jù)雖然來源廣泛,但是區(qū)域覆蓋極其不均勻。例如OSM數(shù)據(jù)在英國(guó)倫敦的數(shù)據(jù)覆蓋率明顯高于中國(guó)湖北省的覆蓋率。9)缺少統(tǒng)一規(guī)范。眾源地理數(shù)據(jù)來源廣泛,數(shù)據(jù)格式各異,不同數(shù)據(jù)的內(nèi)容不同,數(shù)據(jù)組織和存儲(chǔ)方式也千差萬別。10)隱私與安全難以控制。自由創(chuàng)建和分享的眾源地理數(shù)據(jù)有時(shí)會(huì)對(duì)他人及一些組織的隱私和安全問題產(chǎn)生影響。
2眾源地理數(shù)據(jù)的來源與獲取方法
2.1眾源地理數(shù)據(jù)的來源
眾源地理數(shù)據(jù)的來源主要包括:1)公共版權(quán)數(shù)據(jù)。這一類數(shù)據(jù)多由政府部門、企業(yè)、公益組織以網(wǎng)站或網(wǎng)絡(luò)服務(wù)的形式發(fā)布,例如GoogleMap網(wǎng)站提供的正射影像,OpenStreetMap網(wǎng)站提供的交通路網(wǎng)等。也有一些部門和企業(yè)免費(fèi)贈(zèng)送的地理數(shù)據(jù),例如Open-StreetMap上部分國(guó)家的主干交通數(shù)據(jù)由汽車導(dǎo)航數(shù)據(jù)公司AND(AutomotiveNavigationData)贈(zèng)送[13]。2)GPS接收機(jī)數(shù)據(jù)。主要包括三類:①應(yīng)某些組織和項(xiàng)目請(qǐng)求而特意收集GPS數(shù)據(jù)的志愿者;②共享自己擁有的有價(jià)值的GPS數(shù)據(jù)的普通人或組織;③相對(duì)被動(dòng)、無意識(shí)上傳GPS數(shù)據(jù)的網(wǎng)民,如“街旁網(wǎng)”用戶的手機(jī)“簽到”會(huì)上傳GPS定位數(shù)據(jù)。3)網(wǎng)民自發(fā)創(chuàng)建的地理數(shù)據(jù)。OpenStreet-Map、Wikimapia等網(wǎng)站向用戶提供了創(chuàng)建地理對(duì)象的功能。部分網(wǎng)民出于自我滿足、利他主義、興趣或是描述周圍環(huán)境等目的[14],主動(dòng)地在這些網(wǎng)站上創(chuàng)建、編輯、描述各種地理對(duì)象。GoogleEarth甚至允許用戶對(duì)感興趣的地物進(jìn)行三維建模。4)Web2.0催生的其他地理數(shù)據(jù)。Web2.0簡(jiǎn)化了客戶交互過程,出于信息共享和社交目的,部分民眾積極地將自己的信息發(fā)布到網(wǎng)上,這些信息可能包含了地理數(shù)據(jù)。例如Flickr提供了上傳照片并在地圖上關(guān)聯(lián)實(shí)際地理位置的功能。類似的數(shù)據(jù)源使得眾源地理數(shù)據(jù)的種類更多樣化、更完整。
2.2眾源地理數(shù)據(jù)的獲取方法
眾源地理數(shù)據(jù)的獲取一般包括以下環(huán)節(jié):1)下載初始化設(shè)置。包括設(shè)定下載API和登錄信息,選定數(shù)據(jù)范圍(包括空間范圍和時(shí)間范圍等)。根據(jù)研究目標(biāo),指定行政區(qū)劃或區(qū)域邊界坐標(biāo),或指定用戶某時(shí)間段所發(fā)布的數(shù)據(jù)等,作為待獲取數(shù)據(jù)的區(qū)域或范圍。2)數(shù)據(jù)獲取。利用開放的眾源地理數(shù)據(jù)網(wǎng)站所提供的API接口,如GoogleMapAPI,GoogleEarthAPI,街旁O(shè)penAPI,FacebookAPI等,在網(wǎng)站所提供權(quán)限范圍內(nèi),實(shí)現(xiàn)所選區(qū)域數(shù)據(jù)的直接讀取。也可以利用網(wǎng)絡(luò)爬蟲技術(shù)設(shè)計(jì)專用的網(wǎng)頁(yè)分析算法,從互聯(lián)網(wǎng)上搜索并下載GPS路線數(shù)據(jù)、矢量地圖數(shù)據(jù)等。3)數(shù)據(jù)規(guī)范化分析與轉(zhuǎn)換。眾源地理數(shù)據(jù)具有多源異構(gòu)性,其存儲(chǔ)格式多樣、時(shí)間版本不一、坐標(biāo)體系相異。合理有效地利用眾源地理數(shù)據(jù)需要對(duì)其數(shù)據(jù)格式進(jìn)行分析,利用文本解析、空間數(shù)據(jù)引擎等技術(shù)將眾源地理數(shù)據(jù)轉(zhuǎn)換為在統(tǒng)一存儲(chǔ)格式、坐標(biāo)體系及概念體系下表達(dá)的空間數(shù)據(jù),并建立相應(yīng)的眾源地理數(shù)據(jù)表達(dá)規(guī)范。4)數(shù)據(jù)入庫(kù)。將眾源地理數(shù)據(jù)按統(tǒng)一規(guī)范轉(zhuǎn)換后,將其導(dǎo)入到空間數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和管理。
3眾源地理數(shù)據(jù)處理與分析的關(guān)鍵技術(shù)
3.1眾源地理數(shù)據(jù)的質(zhì)量評(píng)價(jià)方法
眾源地理數(shù)據(jù)一般由缺乏足夠地理信息知識(shí)和專業(yè)訓(xùn)練的非專業(yè)人員提供,因此存在數(shù)據(jù)質(zhì)量問題,使用時(shí)需考慮其冗余性,有效性,完整性和精確性等。如何對(duì)眾源地理數(shù)據(jù)的質(zhì)量進(jìn)行分析和評(píng)價(jià)是需要研究的首要問題[4,15]。眾源地理數(shù)據(jù)的質(zhì)量是影響眾源地理數(shù)據(jù)廣泛應(yīng)用的重要因素。Oort(2006)總結(jié)了空間數(shù)據(jù)質(zhì)量需要考慮的11個(gè)指標(biāo):數(shù)據(jù)來源、空間精度、時(shí)間精度、屬性精度、邏輯連貫性、數(shù)據(jù)完整性、語(yǔ)義準(zhǔn)確率、元數(shù)據(jù)質(zhì)量、分辨率、數(shù)據(jù)使用目的和質(zhì)量變化等。眾源地理數(shù)據(jù)的質(zhì)量分析在用以上全部或部分指標(biāo)作為評(píng)價(jià)標(biāo)準(zhǔn)的同時(shí),還應(yīng)加入對(duì)數(shù)據(jù)提供者的質(zhì)量評(píng)價(jià),充分考慮人為因素對(duì)數(shù)據(jù)質(zhì)量的影響,建立更加有效的質(zhì)量分析和評(píng)價(jià)模型,從而保證眾源地理數(shù)據(jù)的有效性和可用性。影響眾源地理數(shù)據(jù)質(zhì)量的因素主要包括三個(gè)方面:①數(shù)據(jù)的采集或地圖的繪制由非專業(yè)人員提供,可能存在一定的人為誤差;②數(shù)據(jù)可能來自不同的數(shù)據(jù)源,具有不同等級(jí)的精度;③不同采集者使用不同精度的GPS,采集的數(shù)據(jù)精度存在差異。眾源地理數(shù)據(jù)的精度不能依靠常規(guī)的地圖精度評(píng)定方法評(píng)估,需要選擇合適的質(zhì)量要素建立質(zhì)量分析模型,依據(jù)質(zhì)量分析模型與精度更高的數(shù)據(jù)進(jìn)行分析對(duì)比來評(píng)估其數(shù)據(jù)質(zhì)量。目前,國(guó)外專家已經(jīng)對(duì)歐洲地區(qū)的OSM數(shù)據(jù)質(zhì)量問題進(jìn)行了研究。如對(duì)英國(guó)地區(qū)的OSM數(shù)據(jù)質(zhì)量進(jìn)行分析,從定位精度和數(shù)據(jù)完整度兩個(gè)方面建立OSM數(shù)據(jù)的質(zhì)量評(píng)估模型;在評(píng)估希臘首都雅典的OSM數(shù)據(jù)質(zhì)量時(shí),將數(shù)據(jù)質(zhì)量評(píng)估模型擴(kuò)展到長(zhǎng)度完整度、名稱完整度、類型精度、名稱精度和定位精度等方面。從OSM數(shù)據(jù)的完整度、專題精度、定位精度三個(gè)方面對(duì)OSM數(shù)據(jù)質(zhì)量進(jìn)行了分析研究[16-18]。數(shù)據(jù)提供者的非專業(yè)性是眾源地理數(shù)據(jù)質(zhì)量不確定性的重要原因,Grira等人指出眾源地理數(shù)據(jù)的使用者和提供者在眾源數(shù)據(jù)上下文中具有認(rèn)知區(qū)別[19],有必要建立針對(duì)數(shù)據(jù)提供者的評(píng)價(jià)模型。Exel等人提出在眾源地理數(shù)據(jù)的質(zhì)量控制指標(biāo)中增加用戶指標(biāo)[20],如用戶的數(shù)據(jù)上傳次數(shù)、修改次數(shù)、反饋意見等,從而建立用戶質(zhì)量測(cè)度模型,實(shí)現(xiàn)眾源地理數(shù)據(jù)的質(zhì)量控制。
3.2眾源地理數(shù)據(jù)的信息提取與更新方法
眾源地理數(shù)據(jù)的信息提取與更新是以眾源地理數(shù)據(jù)作為數(shù)據(jù)源,以其低成本和高時(shí)效的優(yōu)勢(shì)實(shí)現(xiàn)地理信息的快速提取和及時(shí)更新。它是傳統(tǒng)地理信息更新方法的重要補(bǔ)充,在特定情況下可以發(fā)揮不可替代的作用。如Goodchild指出,在面對(duì)印度洋海嘯等嚴(yán)重自然災(zāi)害時(shí),從傳統(tǒng)的遙感影像上獲取道路因影像有云或濃煙遮蔽受限制時(shí),利用當(dāng)?shù)乇娫从脩粼贕oogleEarth上及時(shí)標(biāo)識(shí)的地物信息來補(bǔ)充數(shù)據(jù)庫(kù)就更加高效[4]。近年來國(guó)內(nèi)外開展了一些利用眾源數(shù)據(jù)進(jìn)行地理信息提取和更新的方法和應(yīng)用研究。在災(zāi)害快速響應(yīng)方面,眾源地理數(shù)據(jù)發(fā)揮了重大作用。美國(guó)圣巴巴拉市的4次大型火災(zāi)案例研究表明,盡快建立新的道路數(shù)據(jù)庫(kù)可以提供有效的逃生路線[7]。海地大地震后,大眾在OpenStreetMap上協(xié)作完成道路、房屋和其他地物的重新編輯以建立震后地理數(shù)據(jù)庫(kù),利用常規(guī)測(cè)繪方式需花費(fèi)上萬英鎊,同時(shí)耗時(shí)幾年,而利用眾源地理數(shù)據(jù)僅用了三個(gè)星期[8]。眾源地理數(shù)據(jù)用于城市道路設(shè)計(jì)能較大提高人們的滿意度,Seeger指出眾源地理數(shù)據(jù)在良好引導(dǎo)和補(bǔ)充城市規(guī)劃道路數(shù)據(jù)庫(kù)更新和重構(gòu)中將發(fā)揮積極作用[15]。Steffen在Geo-Wiki項(xiàng)目中利用眾源用戶對(duì)數(shù)據(jù)庫(kù)中地物屬性信息進(jìn)行補(bǔ)充和修改[6],能明顯提高效率及可靠性。眾源地理數(shù)據(jù)提供的紋理和三維信息,被O-ver等結(jié)合DEM經(jīng)綜合生成了三維可視化數(shù)據(jù)庫(kù)模型[21]。Zhang等利用眾源GPS軌跡數(shù)據(jù),在行進(jìn)方向的法線上進(jìn)行模糊C-均值聚類,將相鄰車道分開,建立了幾何精度較好的道路數(shù)據(jù)庫(kù),可用于數(shù)據(jù)庫(kù)更新[22]。
Mondzech與Sester指出眾源地理數(shù)據(jù)應(yīng)用于行人導(dǎo)航比現(xiàn)存地形圖數(shù)據(jù)庫(kù)更有優(yōu)勢(shì),因?yàn)樗驴烨姨峁┝舜罅空鎸?shí)的快捷路徑,眾源地理數(shù)據(jù)可對(duì)傳統(tǒng)數(shù)據(jù)庫(kù)進(jìn)行很好的補(bǔ)充[23]。眾源地理數(shù)據(jù)為建立和更新地理數(shù)據(jù)庫(kù)提供了一種不同于傳統(tǒng)測(cè)繪方式的新途徑。它不僅能有效地提取道路等地物和標(biāo)注屬性信息,而且能用于導(dǎo)航數(shù)據(jù)庫(kù)的更新。但是由于眾源地理數(shù)據(jù)來源眾多且缺少統(tǒng)一規(guī)范,存在不足,目前尚未能廣泛應(yīng)用于大區(qū)域范圍內(nèi)高精度的數(shù)據(jù)庫(kù)更新中。綜合以上分析,眾源地理數(shù)據(jù)信息提取與更新的研究思路為:以建立眾源數(shù)據(jù)的質(zhì)量模型和多源數(shù)據(jù)配準(zhǔn)和變化檢測(cè)為核心,研究眾源地理數(shù)據(jù)的信息提取與更新的協(xié)作機(jī)制和方法。主要研究方向包括:①研究實(shí)現(xiàn)眾源地理數(shù)據(jù)的高覆蓋率和高完整性。眾源地理數(shù)據(jù)雖然來源廣泛,但是在單一的某個(gè)平臺(tái)上部分區(qū)域的覆蓋率存在較大的局限性。需要從現(xiàn)有的眾源地理數(shù)據(jù)平臺(tái)(Wikimapia、BingMap、GoogleMap等)中獲取盡可能多的數(shù)據(jù)以提高區(qū)域覆蓋率和屬性信息完整性。同時(shí)應(yīng)研究將不同區(qū)域的更多用戶參與到眾源地理數(shù)據(jù)的協(xié)作機(jī)制。②建立規(guī)范合理的質(zhì)量模型。為來源廣泛、質(zhì)量各異的眾源地理數(shù)據(jù)建立有效的綜合取舍和聚類機(jī)制,以及快速處理算法。需要研究數(shù)據(jù)量和來源控制的范圍,從而最有效地得到能滿足數(shù)據(jù)庫(kù)更新這一應(yīng)用的數(shù)據(jù)覆蓋率、完整性和幾何精度。③提高眾源地理數(shù)據(jù)庫(kù)的幾何精度?山Y(jié)合高分辨率遙感影像、全景影像、Lidar數(shù)據(jù)等對(duì)初始建立的數(shù)據(jù)庫(kù)的幾何位置進(jìn)行精糾正,對(duì)不同數(shù)據(jù)的配準(zhǔn)和修正位置精度的算法進(jìn)行研究。④基于眾源地理數(shù)據(jù)建立地理數(shù)據(jù)庫(kù)并進(jìn)行更新。研究?jī)煞N不同規(guī)范的數(shù)據(jù)庫(kù)的配準(zhǔn),對(duì)不同時(shí)間數(shù)據(jù)庫(kù)的幾何與屬性信息進(jìn)行比較,發(fā)現(xiàn)減少或新增部分,并用判別規(guī)則合并兩套數(shù)據(jù)庫(kù)的信息以實(shí)現(xiàn)數(shù)據(jù)庫(kù)更新。
3.3眾源地理數(shù)據(jù)的分析與挖掘方法
眾源地理數(shù)據(jù)作為一種由大眾采集并向大眾提供的開放地理數(shù)據(jù),蘊(yùn)含著豐富的空間信息和規(guī)律性知識(shí)。利用空間數(shù)據(jù)分析與挖掘方法可以從中提取信息、挖掘知識(shí),從而為具體應(yīng)用提供服務(wù)。
1)眾源地理數(shù)據(jù)拓?fù)浞治。大部分眾源地理?shù)據(jù)的描述采用的是一種包含拓?fù)湫再|(zhì)的數(shù)據(jù)結(jié)構(gòu)。如OSM數(shù)據(jù)中的點(diǎn)、線、面等幾何要素及其關(guān)系是通過頂點(diǎn)、路線和關(guān)系等來描述的。通過對(duì)某區(qū)域內(nèi)的要素進(jìn)行拓?fù)浞治?能發(fā)現(xiàn)點(diǎn)、線、面的分布規(guī)律,挖掘該區(qū)域的空間結(jié)構(gòu)和模式。例如,利用瑞典的OSM數(shù)據(jù)進(jìn)行自然道路網(wǎng)絡(luò)的提取與拓?fù)浞治?發(fā)現(xiàn)自然道路網(wǎng)絡(luò)存在無標(biāo)度特性[24];利用香港的街道網(wǎng)絡(luò)數(shù)據(jù)和年度平均的每天交通流量數(shù)據(jù),通過街道網(wǎng)絡(luò)的拓?fù)浔硎竞头治?從而進(jìn)行交通流量預(yù)測(cè)[25]。進(jìn)行拓?fù)浞治鰰r(shí)經(jīng)常用到平均度、平均路徑長(zhǎng)度和聚類系數(shù)等統(tǒng)計(jì)指標(biāo),結(jié)合空間統(tǒng)計(jì)方法可以探索地理要素的分布結(jié)構(gòu)和模式。在利用眾源地理數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)拓?fù)浞治鰰r(shí),可考慮與其他地理數(shù)據(jù)源集成和綜合分析。
2)利用眾源數(shù)據(jù)探索地理空間的無標(biāo)度特性。無標(biāo)度從數(shù)學(xué)意義上講就是某種現(xiàn)象的大小分布服從冪律分布。傳統(tǒng)的地理學(xué)研究認(rèn)為地理空間存在高斯分布的特性,而最近基于大量的地理數(shù)據(jù)的實(shí)證研究發(fā)現(xiàn)地理空間存在無標(biāo)度的特性。例如,利用美國(guó)的OSM數(shù)據(jù)進(jìn)行自然城市的提取與統(tǒng)計(jì)分析,發(fā)現(xiàn)美國(guó)的城市大小(無論是人口還是道路節(jié)點(diǎn)的個(gè)數(shù))滿足齊普夫定律[26];利用歐洲三個(gè)國(guó)家(英國(guó),德國(guó)和法國(guó))的OSM數(shù)據(jù)進(jìn)行街區(qū)多邊形提取與統(tǒng)計(jì)分析,發(fā)現(xiàn)所有這些街區(qū)大小服從Lognormal分布[27];利用TeleAtlasMultiNet地理數(shù)據(jù)庫(kù)對(duì)德國(guó)20個(gè)城市的道路網(wǎng)進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)所有道路上的行車時(shí)間服從冪律分布,也就是具有無標(biāo)度特性[28]。
3)利用眾源地理數(shù)據(jù)進(jìn)行導(dǎo)航分析,為人們出行提供幫助。例如,綜合應(yīng)用OSM地圖與航空影像研制協(xié)作導(dǎo)航系統(tǒng),結(jié)合A*算法和用戶評(píng)價(jià)在交通網(wǎng)絡(luò)上進(jìn)行路線計(jì)算和搜索,為行動(dòng)不便以及有個(gè)人偏好的行人提供路線設(shè)計(jì)[29];對(duì)OSM的一些城市道路網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析,計(jì)算轉(zhuǎn)彎最少、路徑最短的導(dǎo)航路線[30]。
4)眾源交通數(shù)據(jù)挖掘。眾源交通數(shù)據(jù)中隱含著規(guī)律性的交通知識(shí)。利用空間數(shù)據(jù)挖掘方法可以挖掘出對(duì)交通管理和大眾出行具有指導(dǎo)意義的規(guī)律性知識(shí)。例如,利用倫敦個(gè)人摩托車的GPS移動(dòng)路線研究人們選擇路線的偏好,發(fā)現(xiàn)路線選擇時(shí)更多考慮的是角距離而非街區(qū)距離,即人們?cè)诔鲂袝r(shí)往往會(huì)選擇轉(zhuǎn)彎較少的方案[11];利用OSM的大范圍道路數(shù)據(jù)對(duì)人們的出行進(jìn)行模擬研究,認(rèn)為人們的出行模式主要受路網(wǎng)結(jié)構(gòu)的影響,由此為出行行為和路徑優(yōu)化研究提供了新的視角[31];對(duì)基于用戶軌跡挖掘的智能位置服務(wù)進(jìn)行研究,探討了基于個(gè)人歷史軌跡、多人軌跡數(shù)據(jù)的大眾旅游推薦、個(gè)性化朋友和地點(diǎn)推薦等[32]。利用志愿者采集的GPS數(shù)據(jù),基于歷史位置對(duì)用戶出行的相似性進(jìn)行分析和挖掘,有助于探測(cè)用戶之間的關(guān)系以及地理位置的相關(guān)性[33];利用志愿者采集的GPS數(shù)據(jù)研究志愿者的空間移動(dòng)規(guī)律特性,指出該出行距離具有較強(qiáng)的Levy移動(dòng)特點(diǎn),并通過基于代理的模型進(jìn)行了驗(yàn)證,有助于人類動(dòng)力學(xué)的實(shí)證與機(jī)制研究[34]。綜合以上分析,眾源地理數(shù)據(jù)分析與挖掘的研究思路為:利用網(wǎng)絡(luò)拓?fù)浞治、空間數(shù)據(jù)統(tǒng)計(jì)建模、地理模擬、時(shí)空數(shù)據(jù)挖掘、統(tǒng)計(jì)物理學(xué)等方法對(duì)眾源地理數(shù)據(jù)進(jìn)行分析和挖掘,從中提取空間信息,挖掘空間知識(shí)。主要研究方向包括:
①眾源地理數(shù)據(jù)的拓?fù)浞治觥@猛負(fù)浞治龇椒ㄑ芯坎?gòu)建眾源地理數(shù)據(jù)的網(wǎng)絡(luò)拓?fù)潢P(guān)系。
②地理空間的無標(biāo)度分析。利用空間數(shù)據(jù)統(tǒng)計(jì)建模方法研究地理現(xiàn)象的冪律分布。
③導(dǎo)航分析:通過眾源地理數(shù)據(jù)的交通流量分析和最優(yōu)路徑分析,為人們的出行提供導(dǎo)航服務(wù)。
④眾源地理數(shù)據(jù)統(tǒng)計(jì)建模:對(duì)眾源地理數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行探索性分析,構(gòu)建統(tǒng)計(jì)模型并分析其統(tǒng)計(jì)規(guī)律。
⑤出行行為規(guī)律分析:利用空間聚類、頻繁模式挖掘等空間數(shù)據(jù)挖掘方法從眾源地理數(shù)據(jù)中挖掘出規(guī)律性知識(shí),分析人們的出行規(guī)律,從而為大眾旅游推薦、個(gè)性化朋友和地點(diǎn)推薦等提供基礎(chǔ)。
⑥人類動(dòng)力學(xué)研究:利用統(tǒng)計(jì)物理學(xué)方法和地理模擬方法,研究出行距離分布,構(gòu)建動(dòng)力學(xué)模型,為交通規(guī)劃設(shè)計(jì)、傳染病控制和無線網(wǎng)絡(luò)協(xié)議設(shè)計(jì)等提供支持。
4總結(jié)與展望
眾源地理數(shù)據(jù)處理與分析是近年來國(guó)際地理信息學(xué)科研究和應(yīng)用的新熱點(diǎn)。眾源地理數(shù)據(jù)是一種有別于傳統(tǒng)測(cè)繪的新型地理數(shù)據(jù)源,將深刻影響現(xiàn)有地理信息科學(xué)的發(fā)展方向和產(chǎn)業(yè)化模式。眾源地理數(shù)據(jù)可以應(yīng)用于應(yīng)急制圖、早期預(yù)警、地圖更新、犯罪分析、疾病傳播等地理信息服務(wù)領(lǐng)域。眾源地理數(shù)據(jù)處理與分析的研究才剛剛開始。隨著地理信息科學(xué)與Web2.0技術(shù)的進(jìn)一步發(fā)展,作為專業(yè)測(cè)繪領(lǐng)域有效補(bǔ)充的眾源地理數(shù)據(jù)的處理、分析、應(yīng)用和服務(wù)是未來發(fā)展的重要趨勢(shì)。眾源地理數(shù)據(jù)處理與分析需要完備的技術(shù)體系、深厚的理論方法為其提供支撐,需要對(duì)眾源地理數(shù)據(jù)源及其特點(diǎn)進(jìn)行分析和研究,需要研究眾源地理數(shù)據(jù)的質(zhì)量分析與評(píng)價(jià)方法、眾源地理數(shù)據(jù)的信息提取與更新方法、眾源地理數(shù)據(jù)的分析與挖掘方法等關(guān)鍵技術(shù),并研究眾源地理數(shù)據(jù)在相關(guān)領(lǐng)域的應(yīng)用,不斷擴(kuò)大其應(yīng)用領(lǐng)域,從而促進(jìn)眾源地理數(shù)據(jù)處理、分析與應(yīng)用服務(wù)這一新興研究方向的發(fā)展
本文來自:逍遙右腦記憶 http://www.yy-art.cn/chuzhong/545297.html
相關(guān)閱讀:記憶地圖四法