数据治理与企业数字化转型
數字化轉型本質是一種企業戰略,并非僅限于大數據、人工智能、物聯網等新型基礎設施建設,而是根據企業自身實際情況,以業務為導向、數據為基礎與傳統生產要素相結合,利用新一代數字技術反向賦能業務、驅動業務與服務創新。
2020年是“十三五”規劃的收官之年、也是“十四五”規劃的謀劃之年,各行業紛紛圍繞“新基建”、“數字化轉型”進行全方位、戰略性布局。2020年8月,國務院國資委在《關于加快推進國有企業數字化轉型工作的通知》中提出,要加速傳統企業全方位、全角度、全鏈條的數字化轉型,將數字化轉型作為改造提升傳統動能、培育發展新動能的重要手段。因此,傳統企業如何有效利用新技術驅動業務創新,提升企業核心競爭力,是擺在企業面前的一道生存題,也是企業數字化轉型的戰略目標。
1、數字化轉型內涵及發展路徑
數字化轉型本質是一種企業戰略,并非僅限于大數據、人工智能、物聯網等新型基礎設施建設,而是根據企業自身實際情況,以業務為導向、數據為基礎與傳統生產要素相結合,利用新一代數字技術反向賦能業務、驅動業務與服務創新。
在數字化轉型過程中,數據是基礎。2020年4月《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》中,首次將數據作為新型生產要素,與土地、資本、勞動力、技術等傳統要素一起,被納入到市場化配置的生產要素之中。
但數據要充當數字經濟關鍵的基礎性要素,需經過數據價值化的轉換過程,在這一關鍵轉化過程中,數據治理是基礎,只有通過數據治理,打通企業內部不同層級、不同系統之間的數據壁壘,全面提升數據質量,實現對內支撐業務應用和管理決策、對外加強數據服務能力輸出,從而提升數據潛在價值向實際業務價值的轉化率。數字化轉型分為信息化、數字化和智能化三個階段逐步實現。
01、信息化 :信息化的核心是以業務流程的優化和重構為基礎,通過數據反映和記錄企業運營管理全過程,將企業的實際業務過程固化到信息系統,實現線下業務線上化,從而提高工作效率。在信息化實現過程中,現實世界發生的業務活動被抽象為各種對象、概念和事件的特征信息,主要以結構化數據的形式被創建、記錄下來,實現了業務數據化。
02、數字化:在數字化階段,實現了人與人、人與機器、機器與機器之間的互聯互通,從而形成一個全感知、全聯接的數字世界,其實質是對信息化階段構建的信息技術基礎設施進行技術升級,將原來的系統跟系統之間的互聯互通,升級為人、機器之間的互聯互通,實現萬物互聯,并產生海量的半結構化、非結構化以及機器數據,呈現了典型的大數據“4V”特性(規模性(Volume)、高速性(Velocity)、多樣性(Variety)、價值性(Value))。
03、智能化:在“智能化”階段,將決策的主體由人逐漸向機器轉變,通過數據驅動、數據賦能實現由“人”決策,向戰術級決策部分自動化、戰略級決策部分自動化逐漸演進,自動化決策能力向一線業務人員、一線小團隊覆蓋,形成“大平臺、小前端、富生態”組織模式,真正實現“用數據決策、用數據創新”。
2、數據治理為數字化轉型提供基礎支撐
在數字化轉型過程中,數據治理提供基礎性支撐,本文重點闡述數據治理對于數據湖、人工智能等數字化轉型兩個關鍵建設場景的支撐作用。
1、數據治理是數據湖避免成為“數據沼澤”的關鍵
2010年,James Dixon提出數據湖(Data Lake)的概念。2011年Dan Woods在福布斯發表“大數據需要更大的新架構”(Big Data Requires a Big New Architecture),數據湖開始廣為傳播。
數據湖(Data Lake)是數據集合而并非數據平臺,在這一數據集合基礎之上,采用Hadoop大數據技術生態體系以構建大數據平臺,實現對多源異構數據的統一匯聚,并采用典型的數據驅動型設計模式—ELT架構模式,大規模捕獲各種新舊類型的多源異構原始數據,并按需進行數據轉換,形成多樣化應用。
但是,數據湖的完美理念卻面臨著諸多問題,當越來越多的多源異構數據接入數據湖中,如果缺少有效的方法跟蹤這些多源異構數據并對低質量數據進行有效治理,則企業花費巨資構建的數據湖極有可能成為“數據沼澤”,數據無法訪問、難以檢索,成為只進不出的“數據黑洞”。為避免數據湖淪為“數據沼澤”,須實現數據目錄、標準、質量、安全、共享的統一管理,開展相關的數據治理活動:
構建數據資源目錄:基于元數據信息,為數據湖構建企業級數據資源目錄,對入湖數據進行編目分類、建立索引,以便迅速查找、定位、獲取所需數據資源;
數據全鏈分析:基于元數據信息,進行數據血緣分析和影響分析,構建數據全維關系圖譜,對數據流向從源頭到目的地之間追蹤信息的可視化表示,實現對數據資源流轉的清晰掌握和數據流通全流程的監控;
建立數據標準:建立數據分類標準及數據標準定義規范,明確數據標準的適用范圍;面向湖內全量數據,建立企業統一業務術語庫;
提升數據質量:根據業務規則設計數據質量規則,通過質量工具配置規則進行數據質量定期排查、清洗,以發現數據質量問題、提升數據質量;并建立面向企業內部單位、源系統項目組的數據質量閉環管理機制;
數據安全保障:基于數據資源目錄,劃分數據安全等級和共享類型,以此為基礎進行用戶角色的訪問控制、身份驗證、授權,數據脫敏規則設計以及靜態和動態數據加密,以提高數據湖的安全與隱私性。
2、數據治理是人工智能的基石
人工智能分為基礎資源支撐、人工智能技術和人工智能應用三個層面:基礎資源支撐層主要解決“算力”和數據“底座”問題;人工智能技術實現主要分為感知智能和認知智能兩個階段,在感知智能階段,主要通過傳感器、探測儀等獲取視頻、語音、圖像等數據資源,基于感知器獲取的數據資源、結合深度學習算法訓練出感知模型,如人臉識別技術;在認知智能階段,主要通過自然語言處理NPL、知識圖譜等技術,挖掘出數據所隱含的關聯關系、業務邏輯、規律等認知知識,為人工智能應用場景奠定知識基礎。人工智能應用場景是以AI應用需求為驅動、選擇適當的AI技術進行落地實現,通過滿足應用需求直接產生業務價值。
在AI時代,數據不再是程序代碼的附屬品,數據已本質上成為構建算法的源代碼,以及產生算法結果的核心驅動,基于大量數據、通過“自適應、自學習”算法“訓練”出算法,因此,數據質量“好壞”,決定了算法的優劣性和健壯性;此外,數據共享、數據安全等也是在開展人工智能工作時需要考慮的因素。數據治理在人工智能工作中能夠發揮以下關鍵作用:
制度流程保證:在人工智能開展過程中,聯合數據治理組織制定、發布,配合人工智能技術研發開展的制度、流程和規范,明確企業內部各部門、各項目組(AI項目組、數據治理項目、數據平臺項目組及業務系統項目組等)的責任分工;
資源協調:通過數據治理團隊協助協調數據資源,數據治理團隊清晰地掌握數據資源的存儲位置、歸口管理部門,并能夠推動企業內部數據資源共享,協助人工智能團隊快速獲取所需的基礎數據資源;
高質量數據輸入:數據治理團隊按照AI團隊的數據質量需要及業務規則,對輸入的數據資源進行數據質量檢測,按需出具數據質量評估報告,給出數據質量健康度得分,發現數據質量問題,并快速制定數據質量改進方案:
保障數據安全:人工智能工作開展過程中,需采取一系列的數據安全防護手段,如隱私數據的合規性確認與檢查、敏感數據的脫敏處理、安全訪問控制、防泄露等措施。為AI應用成果的數據安全性、合規性奠定基礎。
3、企業級數據治理整體解決方案
安永推出了企業級數據治理整體解決方案,開展“一站式”全局數據治理,從數據資源盤點、目錄構建、標準制定、質量提升、安全管理到數據共享、應用,覆蓋數據治理各個職能域,協助搭建數據治理體系,指導企業范圍內各專項治理活動。
01.數據治理專業能力建設:數據治理專業能力是企業級數據治理解決方案的核心要素,涵蓋數據資源目錄、數據架構管理、數據標準管理、數據質量管理、數據安全管理、數據共享與應用管理等多個能力維度。應用知識圖譜、微服務、元數據采集、自然語言處理、大數據等技術,智能化梳理企業數據資產,規范系統數據模型,支撐數據標準構建,實現數據協同變更,控制細粒度敏感信息,為全企業提供深層數據價值。
02.數據治理平臺建設:安永已形成一整套從數據治理咨詢、需求轉換、原型設計到平臺實施的建設方法,將企業按需定制構建的數據治理專業能力快速轉換為平臺建設需求,并將數據治理過程中產生的治理成果通過平臺進行統一承載和管理,實現數據資源的全景化、可視化展示,同時為用戶提供數據質量評估、數據架構評估、數據能力評估、智能檢索等多樣化服務。
03.數據治理工作機制建設:數據治理工作需要企業各部門共同參與,統籌協調各方資源。首先,需要建立常態化的數據治理組織機構,共同推進數據治理工作。其次,需要建立數據認責機制,解決普遍存在的“橫向不到邊、縱向不到底”的突出問題。同時,高效率的管理流程也是企業治理強有力的推動因素。最后,需要建立數據運營機制,以保證數據治理各項工作有效開展。
參考資料
http://digitalization.infosws.cn/20201203/42848.html
總結
以上是生活随笔為你收集整理的数据治理与企业数字化转型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AIgorand区块链中VRF随机函数的
- 下一篇: C++ Map简单介绍 ,比如添加元素、