数据元定义和应用
1、數據元:
? ? ? 數據元( Data Element),也稱為數據元素,是用一組屬性描述其定義、標識、表示和允許值的數據單元,在一定語境下,通常用于構建一個語義正確、獨立且無歧義的特定概念語義的信息單元。
? ? ?數據元可以理解為數據的基本單元,將若干具有相關性的數據元按一定的次序組成一個整體結構即為數據模型
? ? 數據元一般由對象類、特性和表示3部分組成:?
? ? ? ? (1)對象類(Object Class)。是現實世界或抽象概念中事物的集合,有清楚的邊界和含義,并且特性和其行為遵循同樣的規則而能夠加以標識。
? ? ? ? (2)特性(Property)。是對象類的所有個體所共有的某種性質,是對象有別于其他成員的依據。
? ? ? ? (3)表示(Representation)。是值域、數據類型、表示方式的組合,必要時也包括計量單位、字符集等信息
基本屬性
? ? ? ?根據包磊,黃亮,羅兵等編著.作戰數據管理:國防工業出版社,把數據元的基本屬性做如下描述:
1)標識類屬性:適用于數據元標識的屬性。包括中文名稱、英文名稱、中文全拼、內部標識符、版本、注冊機構、同義名稱、語境。?
(2)定義類屬性:描述數據元語義方面的屬性。包括定義、對象類詞、特性詞、應用約束。
(3)關系類屬性:描述各數據元之間相互關聯和(或)數據元與模式、數據元概念、對象、實體之間關聯的屬性。包括分類方案、分類方案值、關系。
(4)表示類屬性:描述數據元表示方面的屬性。包括表示詞、數據類型、數據格式、值域、計量單位。
(5)管理類屬性:描述數據元管理與控制方面的屬性。包括狀態、提交機構、批準日期、備注。
數據元分類:按不同的分類方式
1、按照應用范圍:分為通用數據元、應用數據元(或稱“領域數據元”)和專用數據元
2、按照數據類型:文字型數據元、數值型數據元
3、按照數據項:簡單數據元和復合數據元
數據元命名規則
? ? ? ? 數據元的名稱是為了方便人們的使用和理解而賦予數據元的語義的、自然語言的標記。
? ? ? ?根據張宏軍,郝文寧,陳剛,靳大尉,張睿,劉斌,趙成,宋金玉,淦文燕,程愷編著.作戰仿真數據工程:國防工業出版社,2014.09對數據元的表述,主要包括如下內容:
? ? ? ? 一個數據元是由對象類、特性、表示3個部分組成的,相應地,一個數據元的名稱是由對象類術語、特性術語、表示術語和一些描述性限定術語組成的,數據元的命名規則主要對各術語成分的含義、約束、組合方式等進行規范。?
數據元的命名規則主要包括以下內容。?
1)語義規則:規定數據元名稱的組成成分,使名稱的含義能夠準確的傳達。
(1)對象類術語表示作戰仿真領域內的事物或概念,在數據元中占有支配地位。
(2)專用數據元的名稱中必須有且僅有一個對象類術語。
(3)特性術語用來描述數據元的特性部分,表示對象類的顯著的、有區別的特征。
(4)數據元名稱中必須有且僅有一個特性術語。?
(5)表示術語用來概括的描述數據元的表示成分。
(6)數據元名稱需要有且僅有一個表示術語。
(7)限定術語是為了使一個數據元名稱在特定的相關環境中具有唯一性而添加的限定性描述。限定術語是可選的。對象類術語、特性術語和表示術語都可以用限定術語進行描述。
2)句法規則:規定數據元名稱各組成成分的組合方式。?
(1)對象類術語應處于名稱的第1(最左)位置。?
(2)特性術語應處于第2位置。
(3)表示術語應處于最后位置。當表示術語與特性術語有重復或部分重復時,在不妨礙語義精確理解的前提下,可以省略表示術語。?
(4)限定術語應位于被限定成分的前面。?
3)唯一性規則:防止出現同名異義現象。
在同一個相關環境中所有數據元名稱應是唯一的。為規范數據元的命名,除了需要遵守上述的命名規則外,還需要對數據元名稱各成分的術語作統一的規范。數據元名稱中的術語應采用仿真領域標準、公認的術語,在數據元注冊系統中可以構建一個仿真領域的術語字典,作為數據元命名時各術語成分的統一來源。
數據元提取
? ? 自上而下提取法
? ? ? ? 對于新建系統的數據元提取,一般適用這種“自上而下”的提取法?;静襟E是,在流程和功能分析的基礎上,通過建模分析,確立關心的“對象”。在概念數據模型和邏輯數據模型的基礎上,分析提取數據元及其屬性。具體標識如下信息:
- (1)確定數據元的來源和上下文;
- (2)標識數據元概念所基于的對象和特性,形成數據元概念;?
- (3)定義并標識包含數據值的數據元;?
- (4)標識數據值所表示的值域和允許的值;
- (5)對數據元進行分類等。?
自下而上提取法
? ? 自下而上提取法也稱逆向工程,對于已建系統的數據元提取,一般適用這種“自下而上”提取法。在這種情況下,數據元直接來自各個信息系統。數據元創建者依據數據元標準化方法,對信息系統及相關資源的數據,在分析、梳理的基礎上,歸納整理出數據元;根據數據元的實際應用,闡明并寫出相關數據元在采集、存儲和交換過程中各個屬性以及屬性的約束要求;描述和定義各個屬性所需要的屬性描述符及其約束要求;
根據給定的命名、定義、標識規則和表示規范,形成數據元。具體的步驟如下:
(1)理解數據元,自下而上提取法的第1步就是獲取對數據元的理解:?
- ①與該數據元有關的有哪些數據??
- ②是否有數據值得定義或描述?
- ③有沒有允許值或者實例??
- ④數據值是通過算術公式計算還是統計得出的??
(2)內容研究,在研究數據元的基本屬性之前,應對下列問題做出研究:?
- ①該數據元是否在國際、國內或者其他組織標準中進行了定義?
- ②該數據元是否已經存在于注冊系統中,有沒有重新應用的潛力?
- (3)根據應用場景或上下文,確定數據元的定義。
- (4)根據應用場景或上下文,確定數據元的允許值和值域。
- (5)根據應用場景或上下文,確定數據元的表示詞類。
- (6)根據應用場景或上下文,確定數據元的名稱和標識符。
- (7)根據應用場景或上下文,確定數據元的其他屬性
?應用范圍
? ? ?數據元早期在金融、醫療等應用非常廣泛,國家相關單位也出具了對于數據元管理的一系列技術標準和行業標準等
例如:
GB/T 18391.1 信息技術 數據元的規范和標準化;
CFDAB-T-0301.1-2014 食品藥品監管信息基礎數據元
應用舉例
CFDAB-T-0301.3-2014(食品藥品監管信息基礎數據元 )
?
總結
- 上一篇: 关于数据元、元数据、主数据、交易数据、主
- 下一篇: 翻译润色、论文英语修改、语法建议、3个软