计量科学大数据分级分类
計量科學大數據分級分類
智峰, 田鋒, 趙若凡
中國計量科學研究院國家計量科學數據中心,北京 100029
?摘要:基于我國數據共享開放的發展趨勢以及科研數據安全管理的相關政策,對我國計量行業數據分級分類的現存方案進行研究。對國內20個國家級數據共享平臺以及美國的相關數據分級分類方法展開調研,討論了我國計量科研數據分級分類方法的不足,并從數據安全以及數據管理的角度提出了計量數據安全等級劃分模型以及計量數據分級分類編碼方法。
關鍵詞:計量學 ; 分級分類 ; 數據安全 ; 開放共享 ; 數據管理
論文引用格式:
智峰, 田鋒, 趙若凡. 計量科學大數據分級分類[J]. 大數據, 2022, 8(1): 60-72.
ZHI F, TIAN F,ZHAO R F. Classification of big data in metrology[J]. Big Data Research, 2022, 8(1): 60-72.
0 引言
隨著信息技術的發展,數字化的發展模式幾乎遍布各行各業,由此也帶來了數據管理以及數據安全等相關問題。2020年4月9日,中共中央、國務院發布了《關于構建更加完善的要素市場化配置體制機制的意見》,該意見將數據要素與土地要素、勞動力要素、資本要素等傳統生產要素一并列為完善要素市場化配置的關鍵因素。該意見所倡導的“推進政府數據開放共享”與“加強數據資源整合和安全保護”揭示了數據開放共享與數據安全對推動數字化發展的重要性?!吨腥A人民共和國數據安全法》于2021年9月1日起施行,其進一步強調了數據安全對國家安全與經濟發展的重要性。該法案第二十一條提出的“建立數據分類分級保護制度”,指出了開展數據分級分類對維護數據安全的必要性,為未來各行各業的信息安全工作提出了寶貴的指導意見。
對于科學研究和創新發展而言,科學數據是一種基礎性的戰略資源。而科學數據的分級分類則是維護數據安全、實現數據開放共享的必要方法。在計量領域,隨著計量單位制的量子化和量值傳遞扁平化的變革,以及隨之而來的計量基準、標準和標準物質的數字化等變革,以設備數字圖譜、電子原始記錄、數字證書為基礎的扁平化量傳體系,以及以區塊鏈為主要技術的法制計量大數據聯盟鏈機制將成為未來計量行業的發展趨勢。計量行業數字化的發展趨勢將會導致數據產出量和積累量迅速上升。同時,由于計量學涉及的領域十分廣泛且數據量龐大,對計量數據進行合理的分級分類對于實現計量數據的收集、存儲、分析、共享以及安全維護是十分必要的。
1 國內關于數據分類的相關政策
科學數據主要指在自然科學、工程技術等領域通過基礎研究、應用研究、試驗開發產生的數據,以及通過觀測監測、考察調查、檢驗檢測等方式取得并可用于科學研究活動的原始數據及其衍生數據。隨著信息技術的發展,科學數據對科研工作的推進作用愈發重要,科學數據已然成為一種重要的科學基礎資源。針對這一發展趨勢,自21世紀以來,我國陸續發布多條相關政策,以加強對科學數據的管理,并逐步形成以行業機構 、領域數據中心和國家層面的科學數據中心為主體的科學數據政策體系。
2015年,國務院印發《促進大數據發展行動綱要》,明確部署了與發展科學大數據、知識服務大數據應用有關的戰略決策,提出了“構建科學大數據國家重大基礎設施,實現對國家重要科技數據的權威匯集、長期保存、集成管理和全面共享”以及“對各領域知識進行大規模整合,搭建層次清晰、覆蓋全面、內容準確的知識資源庫群,建立國家知識服務平臺與知識資源服務中心,形成以國家平臺為樞紐、行業平臺為支撐,覆蓋國民經濟主要領域,分布合理、互聯互通的國家知識服務體系,為生產生活提供精準、高水平的知識服務”等主要任務。
2018年,國務院辦公廳發布的《科學數據管理辦法》成為我國首個國家層面的科學數據管理辦法。該辦法進一步針對目前我國科學數據管理中的工作人員職責,數據的采集、匯交與保存,數據的共享與利用以及數據的保密與安全等工作進行系統部署。其中第二十條明確要求“法人單位要對科學數據進行分級分類,明確科學數據的密級和保密期限、開放條件、開放對象和審核程序等,按要求公布科學數據開放目錄,通過在線下載、離線共享或定制服務等方式向社會開放共享”。該辦法首次將數據分級分類作為保障數據安全的主要手段,旨在在保障數據安全的前提下,實現以“開放為常態、不開放為例外”為原則的數據管理環境。
2021年6月10日,第十三屆全國人民代表大會常務委員會第二十九次會議通過《中華人民共和國數據安全法》,該法案將數據安全提升至國家安全層面。除了在數據安全與發展、數據安全保護義務、政務數據安全與開放以及數據安全的相關法律責任方面做出詳細規定,該法案第三章“數據安全制度”的首條規定特別強調了數據分級分類保護制度對維護國家核心數據安全的重要性。其中,第二十一條指出“各地區、各部門應當按照數據分類分級保護制度,確定本地區、本部門以及相關行業、領域的重要數據具體目錄,對列入目錄的數據進行重點保護”。該條款明確指出,以數據分級分類為主要方法的數據安全管理是各行各業有關單位必須重視的核心工作,同時也是數據安全建設得以實施的基礎。
從近幾年我國有關科學數據分級分類的管理辦法以及《中華人民共和國數據安全法》中不難看出,在以大數據為技術基礎的數字化發展背景下,數據安全方面的治理刻不容緩。在“開放為常態、不開放為例外”的原則下,數據安全是實現數據安全共享的前提。由于不同行業領域中數據的類型及特點具有一定差異,針對計量學制定的數據分級分類方法則需要依據計量學的特點進行研究。
2 計量科學大數據的分級分類
2.1 計量數據分級分類的必要性
計量學涉及的領域十分廣泛且數據分類方法多種多樣,制定統一而合理的數據分類規則是實現計量數據資源有效利用的基礎。根據《通用計量術語及定義》(JJF1001—2011),計量學是“測量及其應用的科學”,這樣的定義意味著計量學涵蓋了各個學科領域中與測量的理論和應用有關的各個方面。按社會服務功能劃分,計量學可分為法制計量、科學計量和工業計量。按專業領域劃分,可分為幾何量計量、熱學計量、電磁學計量等十大類。而在國家計量科學數據中心的數據共享平臺,計量學則被分為標準參數數據、計量科研數據 、計量基標準數據、計量檢測數據和計量信息數據五大類。由此可見,計量數據根據分類視角的不同會產生不同的分類方法,而目前國內計量科學領域對元數據的分類標準尚未統一。同時,移動互聯時代的大數據與PC時代數據的本質區別在于其量大、多維且格式多樣。在沒有充分挖掘之前,大量孤立的原始計量數據價值不高,而經過采集、加工后形成的衍生數據以及數據挖掘產出的分析結果則會價值倍增。隨著數據利用率的提高,對計量科學數據依照統一且合理的規則進行分類,更有利于科研工作者從種類繁多、分散在各個研究機構且數量龐大的原始計量數據中選取有效數據進行分析,為之后的數據挖掘工作提供便利。
安全的數據環境是保證數據交換和數據挖掘的基礎,而數據的分級分類則是維護數據安全的有效方法。計量學與國家法律法規以及行政管理有著緊密的聯系,這在其他學科是少有的。計量學的特性使得計量科學數據多數被國家和地方的計量研究院所掌控且部分數據關乎某些個人或組織的合法權益,重要數據的泄露甚至會危害國家安全以及公共利益。與此同時,在數字化的發展背景下,計量數據的開放共享是必然的趨勢,它對推動計量學的進步也是至關重要的。在這樣的發展趨勢下,要求計量數據的管理者能兼顧數據的安全性和開放性。由此可見,數據管理和保護能力是開展計量科學研究工作的基礎。而只有做好數據分級分類,才能將需要保護的重要數據分離出來,將可以共享的數據分享到大數據平臺,以供各行各業充分利用。
由此可見,對于存儲著重要計量數據的各研究機構而言,以數據分級分類為核心內容的數據安全管理是各單位必須重視的核心工作。
2.2 我國計量數據分級分類的現狀
正如前文提到的,對于計量科研數據而言,無論是按照社會服務功能將數據分為法制計量、科學計量和工業計量這三大類,按照專業將其分為幾何量計量等十大類,還是如國家計量科學數據中心的數據共享平臺將數據分為標準參數數據、計量科研數據、計量基標準數據、計量檢測數據和計量信息數據,目前的分類方法都是從不同的角度根據數據種類進行劃分的,且分類方法缺乏統一性。這樣缺乏統一性的分類方法會給科研工作者以及其他行業中對計量數據有使用需求的工作人員帶來不便。而在全國范圍內施行統一的數據分類標準則會大大提高計量數據的共享及利用效率,減少相關工作人員在數據檢索時的負擔。
《中華人民共和國數據安全法》第二十一條明確指出,為了加強對重要數據的保護,有關機構應依據數據的重要程度以及出現意外事件后其后果的嚴重程度,通過分級分類的方法對數據進行保護。對于涉及多個領域且關乎眾多行業發展的計量學,其科研相關數據中很大一部分屬于“關系國家安全、國民經濟命脈、重要民生、重大公共利益”的國家核心數據,按規定應受到更高程度的重視。在數據驅動發展的背景下,數據的共享開放是必然的趨勢,而數據安全則是保證發展可持續性的前提。由此可見,為了維護數據安全,推進計量數據共享開放,計量行業需要盡快針對數據的安全性制定統一的分級分類標準。
雖然在全國范圍內并未實現計量數據分類標準的統一,但作為國家級的計量數據中心——國家計量科學數據中心在《中華人民共和國數據安全法》正式實施以前就制定了比較詳細的數據分級分類方案。在2020年11月發布的《國家計量科學數據中心數據分級分類管理辦法》(以下簡稱《計量分類》)中,國家計量科學數據中心根據數據的內容和形式,按照層次分類法將計量科學數據分為兩級并對其編碼,具體見表1。
同時,國家計量科學數據中心基于數據安全和利用價值將數據分為公開數據、內部數據、受保護數據3類,并對其采取不同的保存策略和共享方式,具體見表2。
同時,國家計量科學數據中心也公布了各類數據的界定標準,具體如下。
● 完全開放共享數據:提供給國家計量科學數據中心且無附加共享利用條件約束的科學數據資源。
● 協議共享數據:按約定的協議條件共享利用的科學數據資源。
● 不予共享數據:不宜共享利用的科學數據資源。
從國家計量科學數據中心制定的分級分類標準可以看出,當前國家計量科學數據中心施行的分級分類方法既依據數據類型對數據進行了分類編碼,也從數據的安全性角度考慮將數據分為三大類以對特定數據進行分級保護,其分級分類標準已經初見雛形并形成系統。為了進一步改善現有的分級分類標準,本文將參考國內外其他領域的數據分級分類方法,擇其善者而從之,其不善者而改之。
3 國內其他領域數據分級分類的現狀
從2018年發布的《科學數據管理辦法》第十九條中提到的“開放為常態、不開放為例外”的原則,以及持續推進國家數據交換平臺建設的發展趨勢中不難看出,近年來我國越來越重視科學數據共享。自2004年科學技術部啟動國家科技基礎條件平臺建設工作到2011年首批23個國家科技基礎條件平臺獲批并公布,我國在科研領域的數字化發展一直沒有停止前進的腳步。為了響應《科學數據管理辦法》和《國家科技資源共享服務平臺管理辦法》,除了在計量領域于2019年成立了國家計量科學數據中心,在農業科學、地球科學和氣象科學等19個領域也成立了相應的國家科學數據中心。通過對19個其他領域數據中心的數據分級分類方法進行調研,可以為計量領域的數據分級分類提供參考。筆者在調研后發現了如下現象。
(1)計量行業缺乏詳細的元數據分類標準
在對其他數據中心進行調研的過程中,筆者發現部分中心制定的數據分級分類方法更詳細具體,值得計量行業效仿。例如在國家林業和草原科學數據中心發布的《林業科學數據分類與編碼(V1.0)》中,林業科學數據依據數據性質被分為三大門類。在每個門類中,數據根據其學科領域以及其子學科的數據內容被分為一級分類和二級分類。其中,一級分類共36項,二級分類共116項。相比之下,國家計量科學數據中心制定的分級分類方法并沒有針對具體學科領域以及相應子學科對元數據進行分類。對于涉及較多學科領域的計量學,制定更詳細的元數據分類標準不僅有利于數據的匯交和管理,更有利于提高數據搜索效率。
(2)計量數據安全分類缺乏量化的分類標準
隨著對數據安全需求的提高,國內已經有學者以ISO27001體系為基礎提出了數據資產分級模型。ISO27001體系將數據安全性拆分為 保密性(confidentiality)、完整性(integrity)、可用性(availability)(簡稱CIA)。陳馳等人以CIA為基礎,建立了數學模型:
其中,V代表數據資產價值;Conf、Int、Ava分別代表數據在保密性、完整性、可用性3個方面具有的資產價值;A代表保密性的權值,B代表完整性的權值,C代表可用性的權值,具體數值可依據其應用的行業特征進行調整。此表達式通過對CIA三方面的資產價值進行冪運算,并乘以相應權值之后再進行對數運算(lb代表以2為底的對數),最終得出數據資產價值的估值, Round1表示保留1位小數。該表達式反映了數據的業務價值,進而可以結合數據的涉密性完成對數據保密等級的劃分,數字資產價值與數據資產保密等級的關系見表3。
數據資產分級模型與表2的計量科學數據安全分級方法均依據數據安全等級對數據進行分級劃分。相比之下,數據資產分級模型通過數學模型量化了數據資產的價值,并依據量化結果對數據的安全等級進行劃分。相比《計量分類》中描述性的分級標準,數據資產分級模型對安全等級的評估更為明確且精準,而且便于數據工作人員操作。計量數據分級也可以參照數據資產模型,根據不同計量領域的學科特點制定公式化的分級標準,以提高分級的精確性。
(3)部分數據平臺的數據組織規范性不足
部分平臺存在同一平臺出現多種分類方式的現象,容易降低數據搜索效率。例如國家氣象科學數據中心官網首頁的“數據分類體系”中將數據分為地面氣象資料、高空氣象資料、衛星探測資料、天氣雷達探測資料以及數值預報模式產品這五大類,而在“數據服務”這一欄目中則將數據分為共享目錄、地面資料、高空資料、數值預報、雷達資料、衛星資料和專題服務七大類。兩種分類方式存在一定重疊但又有所區別,這樣的分類方法并不是必需的,且會給瀏覽網站的人員造成數據檢索困難。
(4)部分數據平臺元數據分類不嚴謹在國家地球系統科學數據中心的共享平臺中,多數降水數據被歸入一級類目“大氣圈”下的二級類目“降水”中。這使得大量本應該在“陸地水圈”中存儲的陸地降水數據被歸入“大氣圈”。由于數據分類存在概念重疊,對陸地水循環有研究需求的用戶無法在“陸地水圈”找到足夠的降水數據,給相關工作人員的數據檢索工作造成了較大困難。在對其他共享平臺的調研中發現的上述問題可以為國家計量科學數據中心之后制定更詳細的計量數據分級分類方案起到警示作用。
4 國外數據分級分類的現狀
和國內相比,美國在數據共享、數據管理以及數據安全方面的工作開展得更早。早在1991年,白宮科技政策辦公室就發布了關于研究數據管理的政策聲明,要求對全球變化研究項目所產生的科研數據實行以“完全與開放”(full and open)為原則的開放共享政策,如今已建立了比較完善的科學數據管理體系,十分值得我國從事數據管理的相關工作人員借鑒。根據《聯邦信息安全管理法案》(Federal Information Security Management Act,FISMA),美國聯邦政府將信息系統分為聯邦信息系統和國家安全系統兩類,并分別針對這兩類信息系統制定了《聯邦信息和信息系統安全分類》(FIPS 199)與《國家安全系統的安全分類和控制選擇》(CNSSI 1253)。這兩套數據分級分類體系有相似之處,但因適用領域不同而又有所區別,對這兩套美國經典的信息安全體系進行調研有助于幫助我國完善計量領域的數據分級分類方法。
4.1 FIPS 199與CNSSI 1253的誕生
在2002年美國國會會議上由總統簽署頒布的電子政務法案(公共法令107-347)明確了信息安全對美國國家安全的重要性。該法案第三章“聯邦信息安全管理法案(FISMA)”成為美國信息安全發展的基石。為了實現信息安全發展,FISMA將實施步驟分為開發標準和指南、形成安全能力、運用自動化工具3個階段。由美國國家標準與技術研究院(National Institute of Standards and Technology,NIST)制定的FIPS 199完成了FISMA的第一個目標:為所有聯邦機構(除國家安全系統外)提供對信息和信息系統進行分級分類的標準,并與之后推出的《將各類信息和信息系統映射到安全類別的指南》(SP 800-60)配合使用,為聯邦信息系統的數據安全管理提供了基本依據。
與《計量分類》不同的一點是,FIPS 199的分級分類標準是完全針對數據的安全性進行評級,并沒有根據數據的形式、類別或學科進行分類。FIPS 199從保密性、完整性以及可用性3個維度對信息的安全性進行評級,并針對每一個維度均賦予了發生意外事件的負面影響程度的評級,分別為低、中、高或不可用。每種信息類型以及整個信息系統均可以通過安全分級SC的通用表達式進行描述:
在FIPS 199的綜合評估過程中,需要依照“就高不就低”的原則依次對每個信息類型以及整個信息系統的安全性進行評級。為了配合FIPS 199的實施,美國國家標準與技術研究院后續推出的SP 800-60詳細介紹了聯邦信息系統中可能運行的所有信息類型,針對每一種信息類型介紹了如何選擇影響級別的標準,并給出了推薦采用的級別。
在FIPS 199的基礎上,美國國家安全系統委員會于2012年出臺了《國家安全系統的安全分類和控制選擇》,對國家安全系統的信息分類和相應的技術防護要求做出了規定。其分級方法以聯邦信息系統的分級原則為基礎,定級程序也與FIPS 199相似。CNSSI 1253與聯邦信息系統不同的兩點分別如下。
(1)系統安全級別矢量化
CNSSI 1253沒有把系統的安全性簡單劃分為高、中、低3個級別,而是分別考慮了系統的保密性、完整性、可用性。其安全級別體現為一個具有3個元素的矢量,分為{(保密性, 高), (完整性, 高), (可用性,高)}、{(保密性, 中), (完整性, 高), (可用性, 高)}、{保密性, 低), (完整性, 高), (可用性, 高)}等27個類別。
(2)保密性分級精細化
對于保密性分級,CNSSI 1253提出了更細致的要求,不僅要依據信息本身的保密性,還要根據系統的使用環境、相關人員等因素對保密性級別進行調整。
4.2 FIPS 199與CNSSI 1253對計量數據分級分類的啟示
FIPS 199對數據安全性的衡量有更豐富的維度和更具體的標準。與《計量分類》相比,這種更加具體的分級分類方法更有利于相關工作人員開展針對數據安全層面的分級分類工作且分類的標準更加統一,值得我國計量行業借鑒。
通過對比FIPS 199和《計量分類》可以發現,二者均根據數據安全等級將數據分為3個安全等級,然而FIPS 199在得出最終等級判定之前,從保密性、完整性以及可用性3個維度依次對每個信息類型以及整個信息系統進行了判定,多維度、多步驟的分類過程有利于增加數據分級的準確性。相比之下,《計量分類》中的分級標準則比較模糊,過于粗略,在數據分類的過程中主觀性較強。同時,SP 800-60對FIPS 199起到了補充說明的作用,針對各種信息類型分別提出了安全等級劃分的建議。對于擁有龐大數據種類的計量學,數據工作人員往往很難準確地把握每種信息類型的安全性分級,因此針對計量學制定類似SP 800-60的數據分級分類指南是十分必要的。
相比之下,采取了安全級別矢量劃分并對保密性分級更加精細的CNSSI 1253在安全等級分類方面精確度更高,適用于對數據安全性要求較高的領域。對于可能涉及重大財產損失以及國家安全機密的計量學數據,可以考慮采取類似的分級方式。同時可以考慮針對不同學科領域的特點以及數據存儲環境等因素的差異對保密性的評估進行調整。
5 對我國計量數據分級分類方法改進方案的建議
5.1 計量數據安全等級劃分
通過前文對國內外數據分級分類方法的調研與分析可以看出,對數據安全級別進行失量化分析可以提高分級分類的準確性,數學模型的建立可以降低人為賦值的主觀性。同時,可以創建類似于陳馳等人提出的數據資產量化模型,通過數學表達式計算出精確的數據資產價值,并結合數據可能承受的威脅等級對安全分級進行綜合考量。數據安全等級的分類分為以下3步。
(1)數據資產價值的計算
正如前文提到的,ISO27001中規定數據資產具有保密性、完整性和可用性3個安全屬性。同時也可以將其理解為,資產價值是由數據在這3個安全屬性未達成時所造成的影響程度決定的。因此,筆者參考式(1)提出了用于計算計量數據資產價值的數學模型,并實現了對式(1)的簡化:
其中,V(A)代表特定數據種類A的資產價值;Wc、Wi、Wa分別代表保密性、完整性、可用性對資產價值重要性所占權重,Wc、Wi、Wa的和為1;Vc、Vi、Va分別代表數據在保密性、完整性、可用性這三方面具備的資產價值。其中資產的價值并不以資產的經濟價值為衡量標準,而是取決于其對關鍵業務的開展以及對實現目標的重要程度。對于計量學的不同學科而言,資產價值權重及Vc、Vi、Va的賦值均有所不同,應由相應領域的數據工作人員依據學科特點及數據類型進行調整,最終形成涵蓋整個計量學的資產價值評估體系,并以SP 800-60為模板編撰相應的資產價值評估指南。
(2)數據威脅等級的計算
同時,在對數據進行安全等級的分類時應該考慮數據的威脅等級,即安全事件發生的可能性及后果的嚴重性。威脅等級的劃分同樣依照FIPS 199與CNSSI 1253的分類方法,分別從保密性、完整性、可用性這3個維度進行分析。同時,除了考慮數據在以上三方面出現威脅的嚴重程度,還應考慮威脅可能出現的頻率。綜合以上因素,得出威脅等級的數學模型:
其中,T(A)代表數據類別A的數據威脅等級;Fc、Fi、Fa分別代表保密性、完整性、可用性三方面威脅發生的頻率,取值為1~5的整數;而Tc、Ti、Ta分別代表該數據類型在保密性、完整性、可用性三方面可能出現的威脅強度,即安全事件的嚴重程度,取值同樣為1~5的整數。與數據資產價值的計算過程類似,式(4)中的變量也應由相關領域數據的工作人員進行調整并形成威脅等級評估指南,以提高評估標準的一致性。
(3)數據風險值的計算及安全等級的劃分
完成對V(A)與T(A)的計算后,可以得出數據的風險值:
R(A)的計算綜合考慮了數據的威脅等級和資產價值。對T(A)及V(A)的計算是基于數據在保密性、完整性、可用性三方面具有的資產價值及潛在安全威脅的估算。相比《計量分類》中由主觀判定一次性得出分類結果的方法,風險值R(A)的推導經歷了3次計算,精確度更高且受主觀因素影響較小。在得出風險值之后,數據工作人員可以依據表4中的分類方法以風險值為依據對數據進行安全等級劃分。其中, X、Y、Z的取值將由各學科的數據工作人員在協商后確定。
5.2 計量數據分級分類編碼
為了更合理地組織計量數據資源,實現對數據的科學管理和高效檢索利用,構建計量學的數據資源編碼體系是十分必要的?!队嬃糠诸悺分幸呀洺醪綐嫿艘詳祿媚繕撕蛿祿袷綖榉诸悩藴实膬杉壏诸惙椒?#xff0c;并對不同的數據類別進行了編碼。然而由于計量學涉及的學科比較廣泛,目前的分類方法依然比較簡略,不利于針對學科進行管理和檢索利用。同時,對計量數據的編碼同樣應考慮數據安全等級的劃分。因此,在參考劉召棟等人[35]提出的數據分類編碼方法后,筆者建議在《計量分類》提出的二級分類法的基礎上,將學科及安全等級劃入數據編碼體系,進而形成如下編碼方法:
數據風險等級-學科代碼+原一級分類編碼+原二級分類編碼
示例:H-C21000。其中,H代表數據風險等級高,數據風險等級中、低分別為M、L;C代表學科;2100則代表《計量分類》中的一、二級編碼方式及分類標準。
6 結束語
在我國大力推進數據安全工作的背景下,通過數據分級分類的方法提升數據安全、促進數據共享將是計量行業數據人員的工作重點。通過對比計量行業目前的數據分級分類方案、國內其他領域數據中心的數據分級分類方法以及美國的FIPS 199可以看出,目前國內計量行業的數據分級分類方法尚未統一且仍需繼續完善。
計量學作為一個應用廣泛且數據量龐大的學科,其科研數據對于我國科研、工業以及教育等多個領域而言都是重要的基礎性戰略資源。隨著計量領域數字化的變革,數據分級分類對數據的管理及應用至關重要。制定統一、明確、高效的計量數據分級分類方法不僅有利于數據的檢索且有助于提升數據的安全性,而數據安全則是實現數據共享開放的前提。對比國內其他19個國家級數據中心的數據分類方法可以發現,計量學缺乏更詳細的元數據分類標準,不利于相關工作人員對數據開展搜索、管理、審核以及分析等工作。同時,在對其他數據中心的調研過程中,筆者發現了部分數據平臺存在數據組織規范性不足以及數據分類不嚴謹的現象,在今后計量行業數據分級分類標準的完善工作中需要避免出現類似情況。在數據安全分類方面,美國制定的FIPS 199以及其補充方案SP 800-60相比《計量分類》而言更加詳細且具體。在未來的工作中,計量行業相關人員可以嘗試參照FIPS 199與CNSSI 1253,從多個角度對數據的安全性進行分析定位,并制定公式化的安全分類數學模型。
作者簡介
智峰(1978-),男,中國計量科學研究院國家計量科學數據中心高級工程師,主要研究方向為大數據、云計算、數據安全等。
田鋒(1973-),男,中國計量科學研究院國家計量科學數據中心高級工程師,主要研究方向為大數據管理、數據安全等。
趙若凡(1993-),男,中國計量科學研究院國家計量科學數據中心助理工程師,主要研究方向為大數據、數據挖掘分析等。
聯系我們:
Tel:010-81055448
? ? ? ?010-81055490
? ? ? ?010-81055534
E-mail:bdr@bjxintong.com.cn?
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
轉載、合作:010-81055307
大數據期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的期刊,已成功入選中國科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊,以及信息通信領域高質量科技期刊分級目錄、計算領域高質量科技期刊分級目錄,并多次被評為國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的计量科学大数据分级分类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: idea怎么搜索文件——search e
- 下一篇: SpringBoot测试时出现White