共治共创视角下的开放数据发展:趋势、挑战和反思
按:本文修改版刊發于《大數據》期刊,2016, Vol. 2(2)
1.? 前言
開放數據運動的興起,一般來說,被認為起始于2009年data.gov的啟動。作為政府透明化工作的重要一步,奧巴馬政府大力推進政府數據的開放,以此來推動政府內外人士對政府運作過程,特別是政府財政預算與開支的監管。也因此,開放數據在發展伊始,常常被認為是政府透明化工作的一環,是政府信息公開工作的自然延伸,通過提供可實際獲取并易于使用的數據而非紙面或PDF文本信息,來加強公眾對政府公信力的監管[1]。
?
而在各國不斷接納開放數據思維,推動本地政府數據開放的同時,我們也不難觀察到,開放數據所扮演的角色正在悄悄發生變化。2013年麥肯錫研究院的報告[2]揭示,開放數據能夠帶來3-5萬億美元的經濟價值,首次讓人們把視線從政府透明化轉向了開放數據的經濟價值。透過美國紐約的BigApps大賽,英國開放數據研究院與Nesta的開放數據競賽(Open Data Challenge)等政府牽頭的共創平臺,大量基于開放數據的創新應用得以被開發,并進一步得到資助、孵化,從而得以真正落地“政府即平臺”[3]的理念,為社會提供基于數據的創新解決方案。而在中國,上海市經濟和信息化委員會和交通委聯合主辦的上海市開放數據創新應用大賽也秉承著這一思路,通過開放1T的交通數據,激發社會創新力量,最終誕生了橫跨“新能源車”、“交通保險”、“定制公交”等不同應用主題的優秀作品。
?
在這一系列以開放數據作為基礎的共創活動中,開放數據所扮演的角色不僅僅是為共創提供了必要的數據資源,其本身也重塑了政府與公眾間的交互關系,以數據為紐帶,形成了共同協作的機制,一同解決社會問題。而在這個過程中,我們也觀察到共治共創的實際需求,也在重新定義開放數據本身的運作機制和形式。政府在思考數據開放時,從原本“我有什么就開放什么”逐步過渡到“公眾需要什么我先去開放什么”并進一步朝著“我和公眾期望共同解決什么問題,我就先開放什么”的開放思路所演變。
?
而實際上,這場由政府所率先主導推動的開放數據運動,也慢慢影響著社會各界接納開放數據作為跨界協商合作的渠道。共享經濟的典型代表企業Airbnb,就在2015年底主動對外開展有限的數據開放[4],以期換來社會各界特別是政府對其共享經濟模式的理解,并協商討論可能的創新監管模式。無獨有偶,專車模式的鼻祖Uber也采取相同的策略,主要面向政府做數據開放,以此來換取政府接納專車模式,不再限制非經營性車輛的介入,并尋求協同治理專車的新模式。
?
面對這一系列的新變革,開放數據已然不再簡單作為透明化的工具,更不僅僅是政府一端的事務,其正逐步成為21世紀社會協同治理和協同創新的基石,需要社會各界多元的參與及貢獻。而在這個過程中,作為開放數據的實踐者和研究者,我們也需要重新反思開放數據的定位、機制與形式,并探討開放數據如何更好地服務于社會的共治共創。
2.? 政府即平臺:可讀可寫的開放數據接口
“政府即平臺”并不是一個新鮮的概念,Tim O’Reilly提出政府即平臺的概念是基于其對互聯網的深入理解,從互聯網角度來講,即是政府應當成為社會運作的基礎技術設施,對外暴露其讀寫接口,允許第三方基于接口獲取政府基本服務,從而加值利用,建立起更為用戶導向的對外服務。
?
而從這一點來看,實際上我們可以認為政府運作開放數據本身就是一個對外提供“讀”接口的過程,雖然這個接口可能有的時候僅是一個數據下載而非真正的API接口。而基于開放數據平臺所提供的數據,我們已經無數優秀的應用得以被開發為市民提供服務。最為人熟悉的當然莫過于交通類的應用,倫敦交通局在開放其交通數據后,有超過5000名開發者注冊獲取數據,有超過300多個交通應用幫助人們了解車輛的實時到站情況,超過4百萬人每天在上下班時使用這些應用,規劃自己的出行,無形中這為人們節省的時間可以換算為2千萬到6千萬英鎊[5]。
?
然而,對于任何一個所謂的“平臺”而言,絕不會僅僅讓人“讀”,而不能“寫“。事實上,政府在現實治理過程中有大量面向公眾的服務,這些服務過程從數據角度來看即是由公眾向政府提供數據的過程。比如市民投訴熱線12345服務,是政府接受公眾對非緊急事務投訴的服務,公眾投訴內容即是一種由公眾向政府提供的數據,其包括了投訴內容、投訴針對地點、投訴種類等等,而這樣的服務過程實際也可以接口化,面向開發者提供一個“寫”API,使得數據可以通過API由公眾端流向政府端。這一類型的政府服務數據接口化中,最為著名的就是美國Open311接口,它是一個由民間組織OpenPlans所制定并實現的接口標準,起初是為華盛頓311熱線專門定制的一個API,幫助其拓展數據流入的渠道,并標準化數據流入標準。而之后,這個接口得到了不同州、市政府的歡迎,甚至開始有歐洲城市也加入使用該接口標準去實現自己政府的311接口。而311接口的實現,使得政府在接受市民投訴的過程中不再局限于電話熱線,而是可以通過由市民自己選定的應用、社較媒體來獲取詳細的數據,不但包括更為精準的經緯度座標,還能獲得額外的多媒體信息。這些都是原本電話熱線時代所不具備的。
?
如果說,政府將數據通過接口方式提供給公眾使用是開啟了數據多元化呈現的大門,那么政府提供一個“寫”接口,則是大大豐富了其數據獲取的渠道,雙向的數據接口開放,將政府真正的變成了可讀可寫的平臺。
?
3.? 加速“數據”到“服務”的轉化:開放數據的標準化和互通性
對于開發者而言,開放數據雖然幫助他們獲取了原先封閉的數據,并且確保了數據是提供在可機讀格式下而非PDF或這Word格式下,但在面對不同地方所釋放的同類數據采用完全不同的數據范式時,也是非常的頭疼。
?
針對此,于2015年9月正式啟動的國際開放數據憲章[6]就提出了開放數據必須保證互通性的倡議,其提出對于擁抱國際開放數據憲章的國家、地區、城市,都將努力“制定并實現統一、開放的數據標準,從而確保數據的格式、結構和通用標識符都具備互通性”[6]。而這一倡議,實際上是對于政府開展開放數據提出了更高的要求,不再是簡單要求確保可機讀格式,而是要求特定的數據能夠滿足特定的標準,從而保證其能夠和其他數據發布者所發布的同類數據互通。
?
事實上,對于數據標準的探索美國政府和民間機構已經嘗試了很久。其中最為經典的一個案例就是Yelp和舊金山政府共同合作的LIVES標準。這一標準的誕生起源于2013年初,Yelp和舊金山市開展的一項合作:由舊金山市政府向Yelp直接提供餐廳衛生檢查結果數據,從而Yelp可以在其網站上展現餐廳的衛生情況,幫助消費者找到衛生健康的餐廳就餐。
?
這可能看上去僅是個簡單的數據共享合作,但實際Yelp和舊金山市想的更遠:如何讓更多城市的衛生檢查結果得以展示在Yelp上,以及其他的應用中?雖然在2013年不少美國的城市已經開展了開放數據的工作,餐廳衛生檢查的數據也大多數已經開放在本地的開放數據門戶之上,但若仔細檢視各地的數據,就會發現數據的利用者,例如Yelp,想要直接使用各地發布的形式各異的數據是十分困難的,因為不同地方的數據中,所包含的信息并不一致,例如波士頓提供的數據中提供了對餐廳違例的具體說明、狀態、等級,而其他地方并不提供這一信息。而即使多個地方都提供同一信息,其在數據庫中的表示也會不同,比如同樣是提供餐廳地理位置,有的地方僅提供其文字地址,而有的地方又是以經緯度表示的。
?
為此,舊金山市的科技部門聯合Yelp和紐約市的科技部門一起提出了LIVES(“Local Inspector Value-entrySpecification”)數據標準,該標準對餐廳衛生檢查結果數據應當包含的字段內容和字段要求標準化,其規定將原本復雜的餐廳衛生檢查結果拆分成數張表,包括了餐廳信息的business表,檢查結果的inspections表,檢查違例詳情的violation表。同時,其也要求各個提供該信息的城市同時提供數據源說明表feed,以及數值范圍表legend。對于上述任意一個表內的信息,比如,檢查結果inspections,LIVES都基于不同州市當前的數據采集標準和記錄方式設定了標準化的字段(見下圖)。
? ? ? ? ? ? ? ? ? ? ? ? ? ?
圖 1 LIVES標準示例——Inspection表
?
同時,為了使得各城市能夠以最低的成本,無論從時間上而言還是從財政上而言,完成工作并快速接納LIVES標準,數據的提供方式上并未要求使用API,而是簡單要求各城市能夠按照標準要求將所有數據表打包入一個zip文件,以最簡單的文件替換更新形式來完成數據更新。這樣做的一個好處是,其操作方式簡單,各地方僅需將數據按照要求制作成對應的數據表,而無需擔心自己是否有能力去開發一個API,或者是否有足夠人力去維護后續的接口更新。目前,已經有多達11個地方按照LIVES提供了數據,使得Yelp可以快速將衛生評價引入自身的平臺。而在開放數據平臺解決方案提供商Socrata的幫助下,LIVES將會接下來在一個州內的50個郡進一步推廣,同期也將在英國食品標準署推廣從而在多達英國350個地方被使用。
?
LIVES無疑是一個成功的數據標準,而在它的發展過程中,不難看出政府作為數據發布者、企業作為數據消費者都扮演著極為重要的角色,在標準的制定、推廣、采納、使用的生命周期中充分參與和積極反饋,才最終使得LIVES能夠被迅速接納。而LIVES之外,我們也看到了其他不同類型的數據標準(見表格1)通過類似的方式被制定、推廣、接納、消費,通過標準的制定,數據提供方和數據消費者之間終于說上了一樣的語言。
?
表格 1各類開放數據標準示例
標準名 | 主題 | 說明 | 提出者 |
GTFS (General Transit Feed Specification) | 交通 | 標準化的公共交通時刻表及相關信息。GTFS-realtime版本則標準化交通實時信息 | Google與波特蘭交通部門提出 |
Open311 | 投訴舉報 | 標準化的居民投訴舉報性數據及標準接口 | OpenPlans提出 |
LIVES(Local Inspector Value Entry ?Specification) | 餐飲 | 標準化的餐廳衛生檢查結果數據 | Yelp聯同舊金山和紐約市技術部門 |
House Facts ?Standard | 住房 | 標準化的居住性用房檢查結果數據 | 舊金山市、Accela、Code for America 等多元群體志愿性參與 |
Open Contracting | 合約 | 標準化合約數據,特別是公共招標結果合約、基金會資助項目合約的數據 | Open Contracting ?Partnership,由基金會資助形成的非官方標準聯盟 |
BLDS (Building & Land Development ?Standard) | 建設項目 | 標準化建筑項目許可和土地開發項目許可數據 | Zillow, Socrata, Accela 等多家企業、機構、政府單位合作提出 |
?
4.? 清晰開放數據的目標:為應用成效而開放
2015年底,普華永道受雇于開放數據研究院和Nesta針對開放數據競賽進行了影響力的評估。結果顯示,在2013-2015年的3年間,由7個不同主題組成的競賽成功孵化了21家游戲的創業企業,而大賽所投入的每一英鎊都將收獲5-10倍的回報[7]。同時,較之經濟受益更令人振奮的是,競賽完全達到了原有的應用成效的預期,通過競賽成功吸引了社會力量,利用開放數據,為社會緊要問題提供了可能的解決思路。
?
回顧英國開放數據競賽的組織,不得不提到的是其對應用成效的注重(見表格2),所謂應用成效即所期望開放數據能夠被運用于解決何種問題,并能夠取得怎樣的對應成效,這個成效應當是一個可以量化評估的具體目標。而事實上,這一思路不僅適用于競賽的組織,更應當被實際運用于政府規劃數據開放優先級的策略之中。
?
表格2英國開放數據競賽系列主題及對應挑戰問題
主題 | 挑戰問題 |
治安和司法 | 開放數據如何能夠提升群眾在社會治安司法系統建設中的參與度,如何進一步為服刑人員有效改造教育提供指導,以及如何降低個人犯罪率。 |
教育 | 開放數據如何幫助家長為孩子的教育需要作出高效決策:包含如何高效擇校、如何選擇合適專業、如何參與孩子學習過程 |
能源和環境 | 開放數據如何幫助人們制定團購能源的策略從而節省開支、如何指導面向社區的節能項目,以及如何幫助人們自行生產能源 |
住房 | 開放數據如何幫助人們租借到最理想的房屋,這不僅針對在市場上租借市場房屋的人們,也包括向政府租借廉租屋的人群。 |
食品 | 如何利用開放數據幫助人們吃的更健康,更為可持續化/以及有更安全的食品供應鏈 |
文遺與文化產業 | 開放數據如何幫助我們吸引更多的不同背景的人來關注文化遺產和文化產業 |
就業 | 開放數據如何幫助人們找到更好工作或者幫助創造更多就業機會,這包括:幫助人們找到合適崗位或開始自己創業,協助職業晉升或改善工作環境,以及使人才市場運作更有效率 |
?
美國新墨西哥州阿爾布開克市的開放數據領導者Mark Leech近日也撰文[8]提倡在思考該開放什么數據時,除了應當思考人們需要什么,也同時必須清晰作為政府期望數據釋放后能夠帶來怎樣的可能成效。以應用成效為導向思考開放數據的釋放規劃有著三點好處:
?
第一,? 作為數據的擁有者,政府部門可以更容易建立起數據開放和自身部門的利益聯系。
事實上,一直以來開放數據推進過程中如何獲取相關政府部門支持是一件很令人頭疼的事情。擁有數據的政府部門通常并不認為開放數據是他們需要做的事情,至少聽上去這更多是某一個主管開放數據的部門的主要任務而非他們的。但如果能夠優先思考數據的應用成效,幫助部門從自身角度思考哪些問題期望得到解決,而釋放數據可能可以找到合適的解決方案,那么這將不失為一個極大的推動力,去推動相關部門釋放數據。
第二,? 這使得數據將更具備故事背景,從而和不同數據更自然地聚類在一起。現有的開放數據門戶通常通過數據發布機構、或者內容主題來分類數據,但事實上這樣的分類方式往往會將解決同一問題的數據再次打散,增加了數據利用者尋找數據的難度,并且也同時丟失了一個絕佳的機會去啟發開發者,如何將一些數據組合起來去解決一個具體的問題。如果能夠提前思考數據的可能應用成效,然后根據應用成效將相關的數據組合歸類,并提供相應的問題背景,那么數據的利用率將會大幅增加。
第三,? 這將幫助政府更好的規劃數據從釋放到應用到真正落地發揮成效的路徑和所需支持。數據從釋放到被開發者加值利用并非是故事的結束,事實上,很多開發者并沒有足夠的能力去推廣應用,或者使得應用真正的以被使用,特別是當一個應用是針對社會公共問題或者服務于政府部門的。為了使得應用能夠真正落地,政府部門還是需要采用諸如PPP模式等方法協助應用落地,發揮真正的作用,才能達成預期的成效。若相關的部門從未在數據釋放前對此有足夠的認識和預期,那么自然不會去思考如何幫助開發者落地應用,這也正是問題的癥結所在。也因此,我們應當鼓勵數據發布的機構,去真正思考數據的應用成效,對其有所預期,并規劃可能的支持,來實現相應的效果。
?
5.? 以開放為核心的基礎架構:展望多元數據開放與匯流
在前言中,我們回顧到,開放數據最初的主要定位是作為政府透明化工作的一環,作為政府信息公開工作的自然延伸而存在。而如今,開放數據則更多被視作是政府大數據戰略的一部分,其主要目的是釋放政府數據潛力,供公眾特別是專業機構和企業加以利用創造價值。在這一過程中,開放數據的定位則更多是被視作是對當前大數據市場的數據資源補充。然而,開放數據不應當被狹隘的理解為僅僅是一種數據供應的手段,而更應當被視作是一種社會協作治理和創新的基礎體系,其提供的不僅是數據資源,更是一種新的協作模式。
?
實際上,如若思考當前社會治理范式的革新,我們不難發現,當前的社會治理,因為大量新技術的應用和模式的創新,已經邁入了算法管控(algorithmic regulation)[9]逐步代替人工管控,多權力中心逐步代替單權力中心的新形態。共享經濟的治理問題即是一個典型的代表,無論是Airbnb還是Uber,實質都已經摒棄了原本先準入后監管的傳統治理模式,共享經濟平臺以數據為基礎,構建信譽度算法,來實時監管評價并且獎懲進入平臺的經營者。而這一過程,實際上也就演變為了由共享經濟平臺取代政府作為監管者對經營者做到了更為細致和實時的監管。這一根本性的變化實際反應了當前社會治理過程中,政府無法再壟斷所有社會治理相關數據,而改由不同具備技術能力的企業和機構來分化這樣的權力,使得原本的單權力中心演變為了多權力中心。
?
面對這樣的變革,我們見證到是在過去的幾年中不同國家的政府都試圖去把共享經濟平臺重新納入現有的治理體系,試圖通過法令將非經營性的車輛、房屋重新排除在市場之外,從而使得監管問題重新回到既有的規則體系里。但實際這是錯誤鎖定了問題點,問題的根本并不在非經營性車輛、房屋是否可以進入市場,而是政府如何能夠像共享經濟平臺一樣,監管好這些在既有政府監管體系之外的經營主體,而這也就直指問題的癥結:如何確保不同利益相關體(政府、企業、第三部門等)對已經分散的經營主體監管數據擁有訪問和利用的權限,從而可以基于數據去完成必要的監管。
?
為解決這一問題,政府需要做的不是試圖去要求完全掌握企業數據或取代企業去采集相應數據,而是應當作為協調者去搭建一個用于社會治理的數據基礎服務架構,使得各方的數據得以匯流,而在這個過程中,為了保障各方的均等參與和信任,開放應當是最為核心的理念,即各不同利益相關體應當將數據開放,使得任何第三方能夠訪問和利用數據。
?
在這一過程中,一個重要的問題是我們如何擴展和界定哪類數據應當予以開放匯流。現有的開放數據定義往往將開放的范圍限定在開放公共數據,即由公共資金投入所產生的數據。而實際上,當前的社會運作過程中已不再僅僅是公機構掌握著社會治理的關鍵數據,我們應當拓展和延伸原有的定義,將事關公共利益和社會基本運作的數據納入開放的范疇,界定哪些數據是社會運作過程中,最為基礎的、關鍵的數據,其就應當予以開放,并納入數據基礎服務架構的體系中。特別的,當當前政府積極推進PPP模式吸引社會資本代替原有公機構提供公共服務時,我們要確保開放的理念予以貫徹,確保相應的數據能夠得到及時的開放,從而確保政府本身能夠有相應的數據做進一步的決策監管,同時也確保公眾、第三部門等利益相關體能夠在過程中掌握有關鍵的數據進行監督。
?
6.? 結束語
隨著社會多元主體積極投身于社會治理和創新中,數據開放的進化發展將是一個迫在眉睫的問題。本文中所提及的開放數據的雙向接口化,數據標準化,應用成效導向規劃數據開放,以及數據開放作為社會治理基礎體系都是如今各國正在摸索中的新趨勢。作為一個正在追趕西方各國的發展中國家,中國如何在這一過程中摸索出自己的路則是一個需要政府與企業、第三部門、公眾共同努力的事情。
?
參考文獻:
?
1.高豐,開放數據:概念、現狀與機遇,大數據,2015(2)
2.McKinsey GlobalInstitute. Open Data: Unlocking Innovation and Performance with LiquidInformation.
3.O’Reilly? Tim, Government as a Platform, OpenGovernment
4.Issac Mike, AirbnbReleases Trove of New York City Home-Sharing Data, New York Times, Dec 1 2015
5.Hogge Becky, OpenData Six Stories About Impact in the UK
6.International OpenData Charter, http://opendatacharter.org
7.PwC, Open DataChallenge Series Final Report
8.Leech Mark, Whyyou should consider ROI when releasing open data, SunlightFoundation OpenGovVoices, Nov 30 2015.
9. O’Reilly? Tim, Open Data and Algorithmic Regulation,Beyond Transparency
?
總結
以上是生活随笔為你收集整理的共治共创视角下的开放数据发展:趋势、挑战和反思的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [原创]同一页面无法多次使用XmlHtt
- 下一篇: 让delphi2010操作界面回到del