【2017年第4期】ISO/IEC JTC1/WG9大数据国际标准研究及对中国大数据标准化的影响...
光亮1,張群2
1.華為技術有限公司,北京 100085;2. 中國電子技術標準化研究院,北京 100007
摘要:ISO/IEC JTC1/WG9是制定大數據基礎性國際標準的官方組織,WG9在研的大數據術語和參考架構等國際標準和相關技術報告對中國的大數據標準有重要的指導和借鑒意義。簡要介紹了WG9工作組的構成、在研的國際標準和技術報告項目,闡述了WG9標準在大數據國際標準體系中的地基性位置。對比了WG9國際標準和中國大數據標準體系的關系,論述了WG9國際標準對中國大數據標準工作的意義和價值。給出了參與WG9標準工作組的建議。
關鍵詞:大數據標準 ; 國際標準 ; 大數據參考架構
中圖分類號:TP399 ? ? ? ?文獻標識碼:A
doi:10.11959/j.issn.2096-0271.2017038
ISO/IEC JTC1/WG9 big data international standards and the impact on Chinese domestic standards
GUANG Liang1, ZHANG Qun2
Abstract: ISO/IEC JTC1/WG9 is dedicated to the development of foundational big data standards.The on-going standardization works on vocabulary and big data reference architecture have great value and impact on the Chinese domestic standards.The structure and current projects of WG9,and the foundational status of its standards in international big data standards system were presented.In addition,the standards work in the WG9 and the Chinese domestic standards system were compared,and the values of participating in and contributing to WG9 standards were discussed.At last,suggestions on how to get involve in and contribute to WG9 were given.
Key words: big data standard, international standard, big data reference architecture
論文引用格式:光亮, 張群. ISO/IEC JTC1/WG9大數據國際標準研究及對中國大數據標準化的影響[J]. 大數據, 2017, 3(4): 20-28.
GUANG L, ZHANG Q. ISO/IEC JTC1/WG9 big data international standards and the impact on Chinese domestic standards[J]. Big Data Research, 2017, 3(4): 20-28.
1 引言
ISO/IEC JTC1/WG9大數據工作組(以下簡稱WG9)是由國際標準化組織/國際電工委員會的第一聯合技術委員會(ISO/IEC JTC1,以下簡稱JTC1)直接領導、致力于大數據基礎性國際標準的專門工作組,不隸屬于任何一個分委會(sub committee,SC)。WG9編制的基礎性國際標準對于各國大數據標準和行業標準都有重要參考和借鑒意義。隨著中國大數據產業的高速發展以及中國大數據標準化工作的全面展開,向ISO國際標準學習和借鑒,有助于快速吸收國際標準的成功經驗,并在術語和參考架構等基礎性標準上和國際標準、規范保持一致。同時,將中國大數據產業的優勢貢獻到WG9國際標準,將提升中國大數據標準的國際影響力。
2 WG9簡介
WG9成立于2014年11月,屬于JTC1比較年輕的工作組(與物聯網工作組同時成立)。WG9的主要任務是制定大數據地基性(foundational)的國際標準,作為整個JTC1大數據標準工作的基礎和參照,具體任務包括:
● 制定大數據基本性的標準,例如參考架構和術語;
● 在其他工作組不能覆蓋的情況下,制定相關大數據國際標準;
● 識別大數據標準化中的缺失;
● 和JTC1內外的標準組織合作,分析正在進行的標準項目或探索新的標準項目,推動大數據標準化進程。
2.1 WG9構成
如圖1所示,WG9由一名召集人(來自美國國家標準與技術研究院的Wo Chang)、24個國家代表團的157名專家組成(截至2016年底)。除了在研2項國際標準和3項技術報告外,還成立了3個特設組對特定標準問題進行深入研究。為了加強與其他標準組織的標準合作,WG9與多個國際標準和產業組織建立了聯絡函機制。
圖1 ?WG9構成與主要工作內容
2.2 國際標準和技術報告項目
WG9目前在研的有兩項國際標準和3項技術報告,見表1。
表1 ??ISO/IEC JTC1/WG9 正在制定的標準 / 技術報告項目
在研的兩項國際標準如下。
● ISO/IEC 20546:大數據—概述和術語。作為大數據官方標準,WG9制定的ISO/IEC 20546《大數據—概述和術語》為目前蓬勃發展的大數據技術和標準提供了權威的概念說明和術語解釋。這對于統一產業和用戶對大數據的認識、一致化技術和標準詞匯都有重要意義。目前標準草案正在充分地研討和修改中,除了對大數據的4個核心V——大量(volume)、高速(velocity)、多樣(variety)、變化(variability)給出權威的標準解釋,也對大數據技術和系統(如數據存儲、計算模型等)以及相關技術(如云計算、集群計算等)涉及的常見術語給出標準定義。
● ISO/IEC 20547-3:大數據參考架構—第三部分:參考架構。ISO/IEC 20547-3《大數據參考架構—第三部分:參考架構》是WG9正在編制的重要標準。由于大數據架構的紛繁多樣,各種商業、開源版本共存,由WG9定義一個通用、標準并作為各種實現共同的基礎架構,對提高各版本之間的兼容性(compatibility)、功能模塊的互操作性(interoperability)以及上層應用的移植(portability)有重要意義。目前這個標準正在充分研討和制定中,主要是從用戶視圖(不同角色、子角色和各種活動之間的關系)和功能視圖(分層架構、功能模塊以及模塊之間的接口)兩個角度來定義大數據參考架構。
在研的3項技術報告如下。
● ISO/IEC 20547-1:大數據參考架構—第一部分:框架和應用過程。ISO/IEC 20547-1《大數據參考架構—第一部分:框架和應用過程》主要介紹大數據參考架構的整體框架以及基于大數據參考架構進行系統設計的應用過程。
● ISO/IEC 20547-2:大數據參考架構—第二部分:用例和導出要求。ISO/IEC 20547-2《大數據參考架構—第二部分:用例和導出要求》從政務、商務、防御、醫療與生命科學、深度學習與社交媒體、科研生態圈、天文和物理學、地球環境及極地科學、能源九大領域選取眾多大數據的典型用例,描述每個用例的引用場景、當前的解決方案、下一代的解決方案要具備什么特性及突破什么瓶頸。從這些用例中分析總結出下一代大數據系統和架構的共性要求,作為制定大數據標準的依據。
● ISO/IEC 20547-5:大數據參考架構—第五部分:標準路標。ISO/IEC 20547-5《大數據參考架構—第五部分:標準路標》主要調研了JTC1和ISO內外的相關大數據國際標準以及這些標準和大數據參考架構之間的對應關系,從中識別出大數據標準化的主要缺失。
2.3 特設組
為了對特定議題進行深入的分析和討論,WG9設立了多個特設組,當前有3個特設組:宣傳和推廣(awareness and engagement)特設組、大數據治理(big data governance)特設組、大數據參考架構接口(big data reference architecture interface)特設組。
其中,大數據參考架構接口特設組研究的是大數據功能模塊相互之間接口的標準。例如大數據平臺和應用之間的接口、數據分析層和計算及存儲資源之間的接口以及功能模塊的管理接口等。大數據功能模塊眾多,不同廠商的功能模塊由于架構及接口的異構,容易造成系統不兼容、模塊間不能互操作的情況。因此,在參考架構中定義統一、標準的接口能力,對功能模塊的接口方式進行規范,能提高互操作性和兼容性,避免廠商鎖定(vendor lockin)。大數據參考架構接口已經成為ISO/IEC 20547-3《大數據參考架構—第三部分:參考架構》的重要章節,今后也可作為單獨的技術報告,對模塊間的接口能力和實現方式進一步規范、細化。中國代表團專家目前是特設組的主席。美國、印度、韓國等代表團的專家也在積極參與。
2.4 和其他標準組織的合作
為了推進大數據國際標準體系的發展,WG9與數據管理與交換(JTC1/SC32)、IT安全技術(JTC1/SC27)、云計算和分布式平臺(JTC1/SC38)、統計方法的應用(ISO/TC69)、運動圖像和音頻編碼(SC29/WG11)、智能型運輸系統(TC204)、國際電聯電信標準化部門第13研究組(ITU-T SG13)、工業互聯網聯盟(IIC)、開放地理空間協會(OGC)等多個標準及產業組織建立了聯絡函機制,互派聯絡員跟蹤和對齊標準的進展。
與這些組織的合作(例如共同制定相關的大數據國際標準)有助于大數據標準體系的整體發展,推動構建一個統一、端到端的大數據系統架構,支撐越來越豐富的應用場景(例如工業互聯網、下一代智能交通系統)等。
2.5 WG9主要職位情況
由于WG9標準在大數據國際標準中的重要位置,美國、德國、日本等發達國家在WG9中都爭取了重要職位,包括2個標準項目和3個技術報告的首席編輯。隨著中國代表團在WG 9中的持續貢獻,來自華為技術有限公司、中電長城網際系統應用有限公司等單位的專家獲得了兩個標準項目(ISO/IEC 20546、ISO/IEC 20547-3)的聯合編輯職位、特設組的主席以及與其他標準組織的聯絡代表等職位(見表2)。
表2 ?中國代表團在WG9獲得的主要職位
2.6 評價
作為專門針對大數據這個新興領域的工作組,WG9側重編制對統一大數據的認知、規范大數據平臺架構有重要價值的基礎性標準,符合大數據產業對國際標準的訴求。WG9工作組匯聚了美國、德國、中國、日本、印度等技術領先或是市場廣大的國家和地區,吸收了他們在大數據標準上的經驗和成果。同時,近幾次WG9會議均同時召開大數據標準論壇,吸引當地的廠商、本地標準機構,特別是用戶參與標準的討論和制定。
除了組內的工作,WG9積極和JTC1內、外的標準和產業組織合作,將大數據標準和上層應用標準結合,這對于推動標準落地以及大數據生態的發展意義重大,例如與工業互聯網聯盟和智能型運輸系統的標準合作。
作為JTC1較新成立的工作組,WG9還有很大的發展空間。目前WG9的標準和技術報告大多是理論性的方法描述,或是參考框架。大數據用戶需要更加詳細地了解大數據平臺應該具備的能力、特性,甚至適合的接口方式,才能支撐特定的大數據應用。WG9可以在這一方面擴展和深入,例如以優秀實踐、參考案例的方式為用戶提供更有可操作性、更具參考價值的標準或技術報告。
3 WG9和其他國際大數據標準
除了WG9之外,還有不少國際標準組織、產業聯盟在制定大數據相關的國際標準(見表3),包括JTC1內的其他分委員會(例如IT安全技術、數據管理和交換等)、行業標準組織(例如國際電聯電信標準化部門第13研究組)、其他標準和產業聯盟等(例如W3C萬維網聯盟、開放地理空間信息聯盟等)。這些標準組織側重定義具體場景(例如地理信息系統、萬維網)、特定接口(例如數據訪問的SQL接口)或者具體特性(例如大數據安全)的國際標準。
表3 ?相關標準組織及其大數據標準工作
WG9的國際標準在大數據國際標準體系中起到地基性的作用,是其他大數據相關標準和規范的基礎和參照(如圖2所示)。
圖2 ?WG9標準在大數據國際標準體系中的地基性位置
● 為國家標準和行業標準針對本地市場、行業訴求的定制及細化提供統一術語解釋和參考架構。
● 為各標準組織制定的具體特性(如安全)、特定模塊(如管理模塊)、接口標準(如SQL接口)提供統一的參考框架和基本能力要求,推動這些擴展的模塊適配、系統兼容。
● 為上層應用(工業物聯網、地理信息系統、智能交通系統等)提供統一的大數據基礎平臺,推動上層應用向大數據平臺移植和部署,形成端到端的標準架構(體系)。
4 WG9標準對我國大數據標準的價值
隨著我國大數據產業的高速發展,國內的大數據標準也在持續發展和制定中,特別是由全國信息安全標準化技術委員會大數據標準工作組牽頭研制的大數據標準,包括《信息技術大數據技術參考模型》《信息技術大數據術語》《信息技術通用數據導入接口規范》在內的10多項國家標準。國內標準如何吸收和借鑒國際標準,特別是WG9大數據標準,并在此基礎上擴展,滿足國內產業訴求,值得深入分析和討論。
4.1 WG9標準和中國大數據標準的對比
中國的大數據標準相比WG9在研的標準,是一個更加廣泛和深入的體系(如圖3所示),包含7個方面。
● 基礎:主要包括術語和參考架構,基于WG9的術語和參考架構標準。
● 數據:重點是數據資源的開放共享(例如開放數據的格式和開放的層級)和數據交換。
● 技術:包含數據生命周期管理、互操作技術等。
● 平臺和工具:包括平臺基礎設施、平臺管理工具、數據庫產品等方面的標準。
● 管理:包括數據本身的管理及平臺的運維管理和評估等。
● 安全和隱私:這一部分主要參考ISO/IEC JTC1/SC27。WG9不再做安全相關的大數據標準。
● 行業應用:針對具體行業(例如工業大數據、健康大數據等)定制和細化。
對比WG9的標準項目和中國大數據標準體系,除了基礎部分基于WG9的兩項國際標準,其余國內標準都是針對中國產業訴求做的標準細化和擴展。WG9的3項技術報告——框架與應用過程、用例和導出要求、標準路標可以作為標準研究的參考。國內的大數據標準側重數據開放共享、大數據平臺各項能力要求及行業標準等。這些標準體現了中國本地市場對大數據平臺的訴求(如龐大的用戶數和豐富的業務類型對多租戶能力、可靠性的要求)、特定行業(比如公共安全、工業制造等)對大數據技術的迫切訴求以及國家對數據開放、安全隱私的法規和要求。這些內容都超出了國際標準的一般范疇,卻對中國大數據產業發展有重要意義。
4.2 WG9標準對中國大數據標準的價值
WG9的工作對應中國大數據標準體系的基礎部分。這些基礎性的標準對國內的大數據標準建設有重要的指導和借鑒意義。
第一,基礎性國際標準可以供國內標準引用和參照。例如在制定中的國家標準《信息技術 大數據 技術參考模型》就借鑒了ISO/IEC 20547-3 《參考架構》中的分層架構和角色、活動、功能模塊定義等。借鑒國際標準的定義、描述和要求是為了基于本地訴求進行擴展和細化。例如大數據參考架構中提及的功能組件和能力,可以作為國內大數據系統的基礎要求,再基于國內用戶訴求進行擴展,比如集群管理的要求、可靠性的要求等。
第二,通過參與、貢獻WG9國際標準可以提升中國大數據產業、大數據標準的國際影響力。WG9工作組內,中國代表團已經獲得了多個重要職位,包括兩個標準項目(ISO/IEC 20546、ISO/IEC 20547-3)的聯合編輯。這對于提升中國大數據標準的國際影響力以及中國標準在JTC1的整體影響力有著積極的推動意義。
第三,國內大數據廠商可以通過貢獻WG9標準,推動我國大數據產品特性、產業訴求埋入國際標準,并通過國際標準的影響力提升在國際市場的競爭力。尤其是通過ISO/IEC 20547-3《大數據參考架構—第三部分:參考架構》將國內大數據廠商的優勢和能力埋入大數據系統通用的參考架構中,在國際標準中體現我國的技術優勢,提高市場競爭力。
第四,通過WG9與其他標準組織的合作,可以融入大數據產業的國際生態圈,推動我國大數據產業的整體發展和相關工業領域的信息化水平。WG9和其他國際標準組織的合作有助于行業應用向大數據時代轉型。應該借助WG9和這些標準組織的合作,將中國的大數據標準融入國際大數據標準和產業的生態圈,推動國內的行業應用符合國際標準,與大數據平臺無縫兼容,充分發揮大數據系統在提升工業生產力方面的潛能。
5 參與WG9標準的建議
由于對WG9國際標準的持續貢獻,中國的大數據標準工作已經在WG9獲得了一定的影響力。參與、貢獻WG9的方式主要有提交修改意見、擔任標準職務、申請新立項3種。
● 提交修改意見。針對當前標準或技術報告草案提出修改意見,包括對文字、圖例進行修正,刪減草案內容,增加新章節等。
● 擔任標準職務。包括標準或技術報告的聯合編輯甚至首席編輯、與其他標準工作組的聯絡代表、特設組主席等。尤其是大數據參考架構接口特設組,目前接口相關標準已經成為WG9的重要討論內容和下一步細化工作的主要方向之一,也是國內接口標準的重要依據。我國參與和貢獻這一特設組,可以主導大數據參考架構接口標準的制定,推動國內產品的接口特性埋入國際標準,獲得競爭優勢。
● 新的立項申請(new work item proposal,NWIP)。如果所提內容符合WG9的工作范圍,又尚未包含在當前標準或技術報告項目內,可以通過中國代表團提交新立項(標準或是技術報告)申請。
在全國信息安全標準化技術委員會大數據標準工作組,特別是國際專題組的組織下,國內專家向WG9提交了多份高質量的提案,涉及術語、參考架構、接口規范等各方面內容,獲得了WG9的高度肯定,并擔任編輯、特設組主席等多項職位。但是相比美國、德國、日本等發達國家,我國參與大數據國際標準的時間還不長,工作上也存在不足。特別是當前我國參與WG9的工作側重提升影響力,真正的技術貢獻不足。WG9還沒有中國立項的標準或技術報告項目。當前項目的首席編輯也是由外國專家擔任的。雖然我國有一定數量的提案,但技術層面的貢獻和亮點有限,不能充分體現我國大數據產品的特性和優勢。建議在爭取話語權和領導力的基礎上,提交更有廣度和深度的技術提案,更加體現出中國大數據產品的優勢和競爭力。
6 結束語
本文介紹了ISO/IEC JTC1/WG9大數據工作組以及在研的大數據國際標準和技術報告。通過調研相關大數據國際標準的內容和側重,分析了WG9標準在大數據國際標準體系中的基礎性作用。WG9的大數據國際標準為各種上層應用、特定行業標準、不同功能模塊/接口標準等提供了統一、通用的參考架構和基礎平臺,推動行業應用向大數據平臺移植和部署,提升系統兼容性。
同時,本文對比了WG9國際標準和中國大數據標準體系,討論了參與、貢獻WG9國際標準對中國大數據標準化的價值。中國大數據標準的基礎部分(術語和參考架構)引用和吸收了WG9的相關國際標準,并基于本國的產業和市場訴求進行多方面的擴展和細化。這些進展和成果可以貢獻、反哺到WG9國際標準中,埋入中國的產業訴求、產品優勢,并借助WG9和其他標準組織的合作融入國際大數據標準生態圈。最后也給出了參與WG9國際標準的多種方式和建議。
光亮(1982-),男,博士,華為技術有限公司高級標準經理,主要研究方向為云計算和大數據相關標準、國際標準。ISO/IEC 20547-3 《大數據參考架構—第三部分:參考架構》標準的聯合編輯,大數據參考架構接口特設組主席,ISO/IEC 29075 《SQL對流數據的支持》技術報告的聯合編輯。
張群(1988-),女,博士,中國電子技術標準化研究院設備與數據研究室副主任。從事信息技術相關標準的制訂、修訂及研究工作,ISO/IEC JTC1/WG9大數據工作組專家,主要研究方向為大數據領域相關技術及標準。
總結
以上是生活随笔為你收集整理的【2017年第4期】ISO/IEC JTC1/WG9大数据国际标准研究及对中国大数据标准化的影响...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: .compute() 函数
- 下一篇: 作者:胡青青(1984-),女,现就职于