《大数据》第1期“论坛”——对大数据国家战略的几点考虑
對大數據國家戰略的幾點考慮
魏 凱
中國信息通信研究院 北京 100191
摘要:大數據是國家發展的重要資源。對大數據資源的掌控與分析能力將成為未來國家競爭力的基礎。我國大數據的發展及研究已有了良好開端,但也存在大數據資源活性不足、行業應用有待深化、關鍵核心技術亟待突破、產業基礎薄弱、網絡信息安全存在潛在隱患等問題。當前,制定國家大數據戰略成為各界人士的共同呼聲。國家層面的大數據戰略究竟應該堅持什么思路,有哪些要素需要考慮,成為產業界和政府部門熱議的話題。基于此,結合國外實踐和國內問題,提出一些初步思考。
關鍵詞:大數據;國家戰略;法律規范
Some Considerations on the China
National Big Data Strategy
Wei Kai
China Academy of Information and Communications Technology, Beijing 100191, China
Abstract: Big data is a kind of critical development resources. The ability of control and analysis on big data become the foundation of a country’s competitiveness in future. Although China's big data development has a good start, there are a couple of challenges ahead, e.g., the open government and public data are insufficient, big data application is not widespread, core technologies R&D still need to be strengthened, privacy and information security are facing new risks. Currently, developing a national big data strategy is approaching a common agreement. While how to develop the strategy and what should to be considered are hot topics among the industry and government experts. Therefore, some considerations were proposed based on both other countries practice and domestic research.
Key words: big data, national strategy, law and regulation
1 對大數據內涵的認識:新資源、新工具和新理念的綜合體
大數據(big data)一詞最早由美國航空航天局研究人員在1997年提出,直到2011年麥肯錫公司發布報告《大數據:創新、競爭和生產力的下一個前沿》,才開始引起社會各界的廣泛關注。
到目前為止,大數據仍然沒有權威統一的定義,筆者認為需要從狹義和廣義兩個尺度認識大數據。狹義理解:大數據就是在數據采集技術快速提升、成本急劇下降的背景下,在互聯網和各種信息系統上形成的體量大、格式多、速度快的數據資源,即“數據大”。廣義理解:大數據不僅是“數據大”,還代表了一種新的認識世界的工具,更重要的是蘊含了一種“數據化”思維方式的變革。通過對大數據的分析,可以從中獲得對現實世界的立體化的認識,這給人類提供了全新的工具,影響廣泛而深遠,因此有人也把大數據與火、電、計算機、互聯網等并列,稱為“通用目的技術”。筆者認為,當前大數據熱的興起,最重要的成果是一場“用數據說話”的思維洗禮。
就技術和應用而言,大數據是在互聯網快速發展中誕生的。這個起點可追溯到2000年前后。隨著全球網頁規模的暴增,推動搜索引擎背后的存儲和分析技術出現突變,一系列分布式技術隨之出現,是今天大數據技術的源頭。隨后幾年,海量數據驅動的業務模式及技術深入互聯網營銷、廣告、電商等核心應用,取得巨大的商業成功,引發全社會對大數據的空前重視。
當前,大數據的技術、工具和思維理念正在從互聯網向各個領域快速擴散。Gartner的調查顯示,業界對大數據技術的投資不斷擴大,73%的受訪者已經投資或者計劃在未來24個月內投資大數據。綜合IDC、Wikibon等公司的報告,僅大數據相關的數據存儲、處理、分析相關的軟硬件和服務,2013年產值就已達150~180百億美元量級,未來3年還將維持30%~50%的增長。在直接的產業規模之外,大家更看中大數據給各個行業帶來的間接價值。大數據技術幾乎可以應用到各個行業的價值創造和分配的全過程,通過降低交易成本,提高市場透明度,精確細分客戶群,優化決策機制,催生新產品、新服務和新產業等方式間接創造價值巨大。大數據不光有經濟價值,還塑造了新的“數據空間”,已經成為繼陸權、海權、空權、天權安全之后,另一個國家主權不可分割的組成部分[1]。
2 各國政府積極推動大數據發展
2.1 美國在推動大數據發展上最為積極,力圖確立領先地位
美國依托其互聯網和IT產業的領先地位,占據大數據技術發展先機,已形成明顯的先發優勢。Google、Facebook、Yahoo等公司的超大規模數據存儲、分布式計算、深度機器學習等多項大數據關鍵技術已領先其他同類技術平均5~6年。這種技術領先優勢借助開源模式向外擴散,帶動Splunk、Tableau、Cloudera和HortonWorks等一大批專業化的大數據技術和服務公司不斷涌現。大數據技術不僅在美國互聯網搜索、廣告、電子商務、社交網絡等得到廣泛應用,7成以上傳統行業企業也不同程度地應用了大數據技術,特別是銀行、保險、制造零售等領域已經有不少案例,國家安全、醫療、教育、科研等領域的大數據應用也在快速深化。依靠機器、算法和大數據提供某種程度的智能,從而取得新的增長,正成為美國各行業信息化演變的主要方向,“第二次機器時代”的轉折點正在來臨。
然而即便在領先的美國,大數據的發展初期,很多問題仍無法完全依靠市場自發解決,突出表現在以下幾點:首先是技術問題,數據的采集、高效存儲、深度分析等基礎技術還不能適應發展需求,醫療、國防、交通、科研等方面的大數據技術水平仍然薄弱;其次是數據,商業機構往往面臨數據短缺,而美國政府掌握的數據僅次于制造業,商業化利用價值非常高,但缺較少開放;再次是法律制度,美國一些隱私保護組織呼吁加強保護,但以互聯網公司為代表的商業機構則主張寬松對待,雙方在收緊與放松之間展開拉鋸戰;最后是人才,麥肯錫的一份報告預計:到2018年,美國在“具備深入分析能力”的大數據專業人才缺口將達到14萬~18萬人。
美國政府意識到必須有所作為,于是2012年在全球率先推出“大數據行動計劃(bigdata initiative)”,強化頂層設計,統籌推進技術研發、數據開放、率先應用和負面問題應對。
● 加大技術研究:資助DARPA、NSF、NASA、NIH等機構開展核心技術研究。例如,在大數據計劃資助下,加州大學伯克利分校開發的開源軟件平臺“伯克利數據分析軟件棧(Berkeleydata analytics stack),其中的內存計算軟件Spark性能比大名鼎鼎的Hadoop提高近百倍,有望取代后者,成為大數據技術平臺的主力。
● 數據開放方面:在全球較早建立了統一的數據門戶(data.gov),已開放37萬個數據集和1209個數據工具。奧巴馬在2013年5月進一步要求,政府必須實現新增和經處理數據的開放和機器可讀,激發大數據創新活力。
● 政府應用方面:美國政府是大數據的積極使用者。2013年曝光的“棱鏡門事件”顯示出美國國家安全部門大數據應用的強大實力,其應用范圍之廣、水平之高、規模之大都遠遠超過人們的想象。2012-2013年,美國國家安全局(NSA)、聯邦調查局(FBI)及中央情報局(CIA)等聯邦政府機構還大量采購亞馬遜的云服務,以支撐其大數據應用。
● 關注負面影響:隨著應用的深入,美國政府對大數據帶來的負面影響也更加重視,美國白宮2014年5月發布的《大數據:抓住機遇,守護價值》報告中提醒,在發揮正面價值的同時,應該警惕大數據應用對隱私、公平等長遠價值帶來的負面影響。
2.2 英、日、澳、新等國家迅速跟進,努力縮小差距
英國將大數據列為戰略性技術,給予高度關注。英國政府緊隨美國之后,推出一系列支持大數據發展舉措。首先是給予研發資金支持。2013年1月,英國政府向航天、醫藥等8類高新技術領域注資6億英鎊研發,其中大數據技術獲得1.89億英鎊的資金,是獲得資金最多的領域。其次是促進政府和公共領域的大數據應用。據測算,通過合理、高效使用大數據技術,英國政府每年可節省約330億英鎊,相當于英國每人每年節省約500英鎊。為了在醫療領域更好地應用大數據,2013年5月,英國政府和李嘉誠基金會聯合投資設立全球首個綜合運用大數據技術的醫藥衛生科研機構,將透過高通量生物數據,與業界共同界定藥物標靶,處理目前在新藥開發過程中關鍵的瓶頸,之后還將匯集遺傳學、流行病學、臨床、化學和計算機科學等領域的頂尖人才,集中分析龐大的醫療數據。
日本政府把大數據作為提升日本競爭力的關鍵。日本政府認為,提升日本競爭力,大數據應用不可或缺。日本在新一輪IT振興計劃中把發展大數據作為國家戰略的重要內容,新的ICT戰略重點關注大數據應用技術。日本總務省2012年7月推出了新的綜合戰略“活力ICT日本”,將重點關注大數據應用,并將其作為2013年6個主要任務之一,聚焦大數據應用所需的社會化媒體等智能技術開發以及在新醫療技術開發、緩解交通擁堵等公共領域的應用。
此外,澳大利亞、新加坡等國也非常重視大數據發展。2013年8月初,澳大利亞出臺公共服務大數據政策,提出了大數據分析的實踐指南,希望通過大數據分析系統提升公共服務質量,增加服務種類,為公共服務提供更好的政策指導。在新加坡,多個國際領先企業在該國設立大數據技術研發中心,加速數據分析技術的商業應用。2014年初,新加坡資訊通信發展管理局(IDA)還聘請了首任首席數據科學家,專門推進政府數據的開放和價值開發。
3 我國大數據發展面臨的突出問題
我國各界高度關注大數據的發展,積極推進相關技術研發和應用。目前,百度、騰訊、阿里巴巴等骨干互聯網企業已建立了世界上規模最大的大數據平臺,單集群規模達到上萬臺,在分布式系統、超大規模數據倉庫、深度學習等關鍵技術上有所突破。大數據驅動的互聯網、金融、流通、新媒體等跨界業務創新加速發展。但相對而言,我國大數據發展的信息化基礎薄弱,大數據前沿技術原創能力不足,關鍵產品和服務的供應較為落后,大數據技術應用的擴散速度較慢,急需推動促進發展。
對我國來說,數據資源不豐富、技術差距大和法律法規不完善是當前大數據發展面臨的主要問題[2]。
一是我國數據源不夠豐富,數據開放程度較低。豐富的高質量數據資源是大數據產業發展的前提。近幾年在互聯網產業及金融、電信信息化快速發展的帶動下,我國數據資源總量有了快速增長,已達到全球的13%,但其他行業受信息化水平制約,數據儲量仍不豐富。已有數據資源還存在標準化、準確性、完整性低,利用價值不高的情況。同時,我國政府、企業和行業信息化系統建設中受到各種因素制約,形成了眾多“信息孤島”。再加上體制機制、利益關系等還沒有理順,數據開放程度嚴重滯后于大數據發展需求。
二是我國大數據技術存在水平不高、技術擴散不暢的問題。我國大數據技術的發展模式也與全球類似,互聯網企業具備快速將國際先進的開源大數據技術整合到自身系統中的能力,并構建了單集群上萬節點的大型系統,但仍缺乏原創技術,對開源社區的貢獻不足,進而對前沿技術路線的影響比較微弱。同時,由于本土開源社區等產業組織發育滯后,國內領先企業在大數據方面的技術創新也難以向社會擴散。以往我國在數據庫技術上的相對落后局面仍然沒有根本改變,商用大數據產品供給能力還比較薄弱,使得依賴供應商的傳統行業大數據應用水平受到限制。
三是大數據相關的法律法規有待進一步完善。隨著大數據挖掘分析越來越精準、應用領域不斷擴展,個人隱私保護和數據安全變得非常緊迫。在隱私保護方面,現有的法律體系面臨著兩個方面的挑戰:一是法律保護的個人隱私,主要體現為個人可識別信息(personallyidentifiable information,PII),但隨著技術的推進,以往并非PII的數據也可能會成為PII,使得保護范圍變得模糊;二是以往建立在“目的明確、事先同意、使用限制”等原則之上的個人信息保護制度,在大數據場景下變得越來越難以操作。而我國個人信息保護、數據跨境流動等方面的法律法規尚不健全,這成為制約大數據產業健康發展的重要原因之一。需要結合我國法治建設的實際情況,探索通過行業自律等方式彌補法律體系不完善的弊端。
4 對我國大數據國家戰略的思考
針對大數據發展面臨的問題,需要加強統籌規劃,圍繞經濟社會發展的實際需求,以市場為導向、以企業為主體、以加強公共數據資源開放共享和推動政府和公共服務領域的大數據應用為抓手,保障大數據安全,營造發展環境,引領大數據在關鍵行業應用,以突破關鍵技術為核心,拉動培育自主可控產業體系,推動大數據為經濟社會可持續發展做出積極貢獻。本著這樣的思路,建議國家大數據戰略需要考慮數據資源、行業應用、技術產品、法律法規和安全保障5個要素。
4.1 促進大數據資源開放與流通
首先是加快推動公共數據向社會開放。堅持分級、分類、分階段開放的原則,著力推進地理、人口、法人、金融、稅收、醫療、社保、農業、交通、統計等公共數據對外開放力度,提升公共數據再利用水平。推進政府數據建設,健全政府數據管理制度,規范數據采集,保證信息數據質量。引導企業應用公共數據,加大對民生類公共數據應用的政策傾斜和支持力度。鼓勵有條件的地區開展試點建設,探索開放模式,形成示范效應。加強安全保障,保守國家秘密,維護社會倫理,保護個人隱私和商業秘密。
其次是促進商業化數據流通交易。支持企業間點對點數據交換與共享,探索建立大數據交易市場,開展大數據交易試點,支持各行業數據的匯聚與交易,通過市場化機制促進數據資源的有效流通。依托數據流通與交易實踐,引導形成數據流通交易規則體系,建立數據流通交易中的安全與隱私保護標準,確保數據資源的有序流通。
4.2 深化行業大數據應用
在應用方面,政府首當其沖,應該帶頭利用大數據技術提升政府治理與社會服務能力。要培育政府部門應用大數據提升政府治理能力的理念,重點推動政府在國家統計、市場監管、輿情監測、環境保護、公共安全、國家安全等方面的大數據應用,鼓勵政府以外包服務方式采購大數據分析基礎設施和服務。支持醫療衛生、食品安全、教育科研、城市交通、社會保障等眾多公共領域的企事業單位開展大數據應用,推進各公共服務領域的大數據應用示范建設,鼓勵公共領域機構開展大數據創新,以提升公共服務能力并惠及民眾生活。
而在商業化應用方面,政府應該退后一步,把工作重點放在完善制度、創造環境方面,支持互聯網、電信等數據資源豐富、IT能力較強的企業深化內部應用,穩妥有序地將自身數據資源和服務能力對外開放。一是鼓勵互聯網企業建設大數據分析平臺,支撐內部應用,并將大數據能力向其他行業進行輻射,推動互聯網企業以在線云服務方式向傳統行業企業開放大數據分析平臺能力。二是支持電信企業在保障數據安全和個人隱私的前提下,充分利用電信行業豐富的數據資源,提升電信運營企業在客戶管理、市場營銷、產品開發、網絡優化等方面的大數據應用水平,鼓勵電信企業對外提供數據資源與分析能力,為各類企業、行業單位和政府部門提供大數據服務,促進社會化大數據產業生態快速、有序發展。
4.3 突破大數據關鍵技術產品
首先,要攻克大數據核心關鍵技術。搭建國際化的學術交流和人才流動平臺,產、學、研、用聯合開展大數據理論研究。攻克面向EB級超大規模數據集的新型數據存儲、表示、管理和查詢關鍵技術;面向文本、圖像、視頻大數據和物聯網感知數據,研發自然語言分析、信息提取、知識表現、自動化推理、機器學習等核心技術,突破基于超大規模深度神經網絡的深度學習相關理論與技術,研發數據安全與隱私保護理論與技術。
其次,要大力培育自主可控的大數據產品與服務。整合國內互聯網、制造企業和科研機構力量,共同研發支持超大吞吐量的新一代融合并行分布式計算平臺、支持結構化和非結構化數據的大規模數據倉庫、基于深度神經網絡的超大規模數據分析引擎等平臺級軟件,培育自主開源軟件社區,構造生態鏈。大力發展面向垂直領域的數據分析、數據資產管理、商業智能應用軟件和在線服務。
4.4 完善大數據法律法規
在個人隱私保護方面,要嚴格保護大數據應用中的個人信息。落實全國人民代表大會常務委員會關于加強網絡信息保護的決定,探索制定大數據環境下數據收集、開放、交換、應用等環節的個人信息保護指南,明確大數據應用相關各方的個人信息保護義務和責任。
在個人和企業數據資產保護方面,要探索建立數據產權保護制度。探索制定信息資產管理制度,建立信息資源基本權利體系,明確各類市場主體所積累的信息資產所有權歸屬,建立規范化管理和使用機制,保護信息所有者、信息主體及公眾合法利益。
在國家數據主權方面,要建立數據跨境流動管理制度。制定跨境數據流動分級分類管理制度,涉及國家秘密、國家安全以及經濟安全的數據嚴格禁止跨境,對政府和公共部門數據跨境流動,實施安全風險評估機制。建立外資安全審查機制,強化對外資的數據跨境流動管理。
4.5 保障大數據安全
首先,要構建大數據安全管理制度體系。加強大數據安全頂層設計,積極推動數據信息保護立法,加快大數據安全人才隊伍建設。探索建立面向政府信息采集和管控、敏感數據管理、數據交換標準和規則、個人隱私等領域的大數據安全保障制度,明確數據采集、使用、開放等環節涉及信息安全的范圍、要求和責任,確保國家利益、社會安全、商業秘密、個人隱私等信息不受侵犯。
其次,加強大數據安全保障能力建設。加強大數據安全基礎設施和軟硬件建設,改變傳統的端級防護、單點布防的安全解決方案,提高針對大數據網絡攻擊、數據存儲應用系統漏洞等安全防護能力。加強數據匿名保護、數據水印、數據溯源、角色挖掘、風險自適應的訪問控制等大數據安全保護關鍵技術研究,從技術角度降低大數據泄露、濫用的風險,保障大數據信息的合法、合理利用。
5 總結與展望
大數據的發展涉及資源、技術、產業、政策和法律等方方面面,不能完全依靠市場,需要政府統籌謀劃,協同推動。無論是從美、日、歐等國家和地區的政策實踐看,還是從國內發展需求看,各方都認為有必要盡快出臺我國的大數據國家戰略。
種種跡象表明,大數據戰略的出臺日益臨近。在2014年《政府工作報告》中就提出“設立新興產業創業創新平臺,在新一代移動通信、集成電路、大數據、先進制造、新能源、新材料等方面趕超先進,引領未來產業發展”。2015年《政府工作報告》又提出了“推動移動互聯網、云計算、大數據、物聯網等與現代制造業結合”。工業和信息化部2015年工作重點中提出,要推動出臺大數據應用與發展指導性文件,并制定工業大數據創新發展指導意見。2015年國家發展和改革委員會在高技術工作年度工作會議上,進一步明確提出要啟動“國家大數據戰略及行動計劃”。相信隨著相關政策的出臺和落地,數據割據、技術薄弱、法規缺失等問題將得到改善,大數據在我國的應用發展也將邁上新的臺階。
參考文獻
[1] 沈國麟. 大數據時代的數據主權和國家數據戰略. 南京社會科學, 2014(6): 113~119
ShenG L. Data sovereignty and national strategy in big data era. Nanjing Journal ofSocial Sciences, 2014(6): 113~119
[2] 工業和信息化部電信研究院. 大數據白皮書(2014). http://www.catr.cn/kxyj/qwfb/bps/201405/t20140512_1017466.html,2014
China Academy of TelecommunicationResearch of MIIT. Big data white paper (2014).http://www.catr.cn/kxyj/qwfb/bps/201405/t20140512_1017466.html, 2014
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎
總結
以上是生活随笔為你收集整理的《大数据》第1期“论坛”——对大数据国家战略的几点考虑的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: delphi virtual dynam
- 下一篇: 数聚新动能 数创大未来——2016中国国