paper笔记 | 城市计算概述(郑宇)
1 城市計(jì)算的概念和框架
1.1 城市計(jì)算的定義
城市計(jì)算是一個(gè)通過(guò)不斷獲取、整合和分析城市中多種異構(gòu)大數(shù)據(jù)來(lái)解決城市所面臨的挑戰(zhàn)(如環(huán)境惡化、交通擁堵、能耗增加、規(guī)劃落后等)的過(guò)程。
1.2 城市計(jì)算的框架
基本框架包括 城市感知和數(shù)據(jù)獲取——城市數(shù)據(jù)管理——城市數(shù)據(jù)分析——服務(wù)提供 四個(gè)環(huán)節(jié)
城市計(jì)算是一個(gè)多數(shù)據(jù)多任務(wù)的系統(tǒng)。
1.3 城市計(jì)算的核心問(wèn)題
1)城市感知(計(jì)算)。利用城市中現(xiàn)有的資源不斷自動(dòng)感知城市的韻律。人作為傳感器參與到城市感知過(guò)程(亦稱為群體感知)。城市感知不再只是感知的過(guò)程,也包含能夠從復(fù)雜、隱晦、缺失和非均勻分布的數(shù)據(jù)中獲取有效知識(shí)的計(jì)算環(huán)節(jié)。
2)海量異構(gòu)數(shù)據(jù)的管理。如何管理和整合大規(guī)模的異構(gòu)數(shù)據(jù)是一大難題。尤其是在一個(gè)應(yīng)用中使用多種數(shù)據(jù)時(shí),只有提前建立起不同數(shù)據(jù)之間的關(guān)聯(lián),才能讓后面的分析和挖掘過(guò)程變得高效、可行。
3)異構(gòu)數(shù)據(jù)的協(xié)同計(jì)算
傳統(tǒng)的機(jī)器學(xué)習(xí)往往只能基于單一數(shù)據(jù)。在城市計(jì)算的很多應(yīng)用中效果并不理想。在保證知識(shí)提取深度的同時(shí),如何提高對(duì)大數(shù)據(jù)的分析效率,以滿足城市計(jì)算中眾多實(shí)時(shí)性要求較高的應(yīng)用也是一個(gè)難題。數(shù)據(jù)維度的增加也容易導(dǎo)致數(shù)據(jù)稀疏性問(wèn)題。
4)虛實(shí)結(jié)合的混合式模式。比如云加端模式。
1.4 城市計(jì)算的應(yīng)用分類
城市計(jì)算主要涉及但不限于的7類應(yīng)用:城市規(guī)劃、智能交通、城市環(huán)境、城市能耗、城市經(jīng)濟(jì)、社交和娛樂(lè)、城市安全。
2 城市計(jì)算的主要技術(shù)
2.1 傳感器技術(shù)
1)傳感器網(wǎng)絡(luò)技術(shù),實(shí)現(xiàn)現(xiàn)有專業(yè)傳感器之間的互聯(lián)互通,完成數(shù)據(jù)的快速收集。
2)主動(dòng)參與式感知技術(shù)。用戶主動(dòng)分享自己獲取的數(shù)據(jù)來(lái)共同完成一個(gè)復(fù)雜的任務(wù)。
3)被動(dòng)群體感知。利用非專門為城市計(jì)算設(shè)立的基礎(chǔ)設(shè)施收集用戶在使用時(shí)產(chǎn)生的數(shù)據(jù),將這些數(shù)據(jù)融合到一起就能很好地反映城市的規(guī)律。特點(diǎn)是,被動(dòng)式群體感知中的用戶并不知道自己的數(shù)據(jù)將作何使用,甚至不知道自己在產(chǎn)生數(shù)據(jù)。
2.2 數(shù)據(jù)管理技術(shù)
1)流數(shù)據(jù)管理技術(shù)。大量的傳感器數(shù)據(jù)都以流的形式輸入。
2)軌跡管理技術(shù)。交通流、人的移動(dòng)、以及帶位置標(biāo)簽的社交媒體都可以表示為軌跡數(shù)據(jù)(即帶有時(shí)間戳并按時(shí)間排序的點(diǎn)序列)。常用的對(duì)軌跡的處理技術(shù)包括:地圖匹配算法、軌跡壓縮、軌跡搜索、軌跡頻繁模式挖掘等。
3)圖數(shù)據(jù)管理技術(shù)。社交網(wǎng)絡(luò)中人的關(guān)系、不同地區(qū)之間的人口流動(dòng)、道路上的交通流等都可表達(dá)為圖模型。城市計(jì)算中常用帶有時(shí)空屬性的圖模型,即每個(gè)節(jié)點(diǎn)都有空間坐標(biāo)信息,圖中邊和點(diǎn)的屬性(甚至圖結(jié)構(gòu))會(huì)隨時(shí)間而變化。
4)時(shí)空索引技術(shù)。有效的索引可以大大提高數(shù)據(jù)提取的效率,利用時(shí)空索引技術(shù)將不同種類的數(shù)據(jù)(如文本、車流量)關(guān)聯(lián)和組織起來(lái),為之后的高效數(shù)據(jù)挖掘和分析做好準(zhǔn)備。
3.3 數(shù)據(jù)挖掘技術(shù)
選擇可以應(yīng)用到城市計(jì)算中的模式發(fā)現(xiàn)、統(tǒng)計(jì)學(xué)習(xí)和人工智能方法等需要重點(diǎn)考慮以下兩個(gè)因素。
1)從異構(gòu)數(shù)據(jù)中學(xué)習(xí)到相互增強(qiáng)的知識(shí)
方法一:分別從不同的數(shù)據(jù)中提取特征,然后簡(jiǎn)單地將這些特征直接拼接并歸一化到一個(gè)特征向量里,輸入到機(jī)器學(xué)習(xí)模型。但由于不區(qū)分不同數(shù)據(jù)的特性,實(shí)踐證明這種方法并不是最有效的。
方法二:在計(jì)算模型的不同階段先后使用不同數(shù)據(jù)。
方法三:將不同的數(shù)據(jù)分別輸入到同一個(gè)計(jì)算模型的不同部分。
2)應(yīng)對(duì)數(shù)據(jù)的稀疏性
應(yīng)對(duì)數(shù)據(jù)的稀疏性通常可采用以下三種方法:
①采用矩陣(或張量)分解算法和協(xié)同過(guò)濾,數(shù)據(jù)融合方法的一種。
②使用半監(jiān)督學(xué)習(xí)算法或轉(zhuǎn)移學(xué)習(xí)算法。半監(jiān)督學(xué)習(xí)算法從具有不同分布的其他數(shù)據(jù)源中獲取知識(shí),從而解決一個(gè)機(jī)器學(xué)習(xí)任務(wù)中訓(xùn)練樣本不足的問(wèn)題。
③基于相似性的聚類算法。
3.4 優(yōu)化技術(shù)
時(shí)空搜索技術(shù)和路勁優(yōu)化相結(jié)合、線性規(guī)劃、動(dòng)態(tài)優(yōu)化
3.5 混合數(shù)據(jù)的可視化技術(shù)
可視化以直觀的方式幫助我們理解獲取的知識(shí)和模式。與單一數(shù)據(jù)不同,城市計(jì)算中的可視化技術(shù)需要同時(shí)考慮多個(gè)維度,其中,空間和時(shí)間是兩個(gè)至關(guān)重要的維度。
總結(jié)
以上是生活随笔為你收集整理的paper笔记 | 城市计算概述(郑宇)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 软件工程期末复习8-软件体系结构与设计模
- 下一篇: 计算机箱图和结构,机箱结构设计