本体开发方法——the Method of Ontology Development
???? 原文摘自:http://blog.csdn.net/MinistoneNap/archive/2006/12/29/1467947.aspx
?
???? 筆者在本體開發(fā)導論和?本體開發(fā)的有關問題和命名規(guī)范這兩篇文章中,已經初步論述了本體的相關概念、本體開發(fā)的基本內容、本體開發(fā)的過程及本體開發(fā)的常見問題和概念命名規(guī)范,掌握了這些,我們能對本體及其構建有一個初步的認識。現在,我們便可以根據這些已經掌握了的知識來構建自己的本體了。
??????? 起初,在我利用相關工具構建完成了領域本體之后,打算寫一個如何建本體的詳細教程,以使初學這能快速入門,掌握如何利用工具編輯本體的技巧.但是,我現在又覺得沒有這個必要.由于目前的本體編輯工具并不成熟,并且也在快速發(fā)展和變化之中,此刻的編輯技術可能過了一兩個月就不適用了,所以針對某個工具的教程并沒有多大價值。對于需要學習和使用本體的單位和個人,一般本身就屬于高端人員(指技術和知識水平),國外的一些相關教程應當都能看懂,所以也沒有必要做一個簡單的翻版。本人的學習經驗告訴我,在解決一個問題時,方法論更重要,因此,我更希望與人交流我的學習方法和學習過程,以及學習之后的經驗所得,而不希望停留在技術本身。故,本文將對本體開發(fā)方法做宏觀層面的論述,而不拘泥于技術細節(jié)。
1 本體概念及層次的設計
????? ?在本體開發(fā)導論中,筆者說明,在開發(fā)過程中,我們首先需要列出所有的有可能要用到的詞匯,并根據應用的需要,構建類及類之間的層次結構,并在本體開發(fā)的有關問題和命名規(guī)范一文中提出了本體開發(fā)過程中的一些不成文的非強制的概念命名規(guī)范。但,現在的問題是:詞匯到底從哪來,是憑空設想?還是根據事物的特性自行歸納?顯然,這兩種方法都是可行的,也都不違背本體的基本原理和構建的理念。但是,它們僅僅是可行的,而不一定是最有效的。因為,憑空想象的或自行定義的概念及層次結構主觀性太強,有可能只能自己才能理解,別人的理解肯定會產生偏差。而采用本體的目的是為了是信息在人與人、人與機器、機器與機器之間進行良好的交互,自定義的本體難以進行更廣泛的應用(除非這種自定義的本體已經形成了行業(yè)的默認規(guī)范),也不便于后期的維護和更新。那到底該如何解決這個問題呢?傳統(tǒng)的信息和知識組織方法這時能夠發(fā)揮很大的作用。
???? ? 傳統(tǒng)的信息、知識組織方法有許多種,并且在很多領域有著廣泛的應用。這些方法經過長時間的積累,已經形成了一個比較完善并且得到公眾的認可的概念體系,里面的詞匯及層次結構是我們構建本體時的重要參考。本節(jié)簡要介紹分類法和主題法兩種信息、知識組織方法,在具體使用時,讀者需要找到相應的資源參考,這里僅提供一個思路。??
1.1 分類法
??? ? 分類法是一種用分類號來表達文獻的主題概念,并按學科性質分門別類的將文獻資源組織起來的信息組織方法。它運用到邏輯分類原理,以科學分類為基礎,以文獻內容的科學性質為對象,從一般到具體,從簡單到復雜,進行層層劃分,每劃分一次,便產生若干類目。逐級劃分,就產生了不同等級的類目,這些類目層層隸屬,形成一個嚴格有序的等級體系。分類法的典型代表是:《中國圖書館分類法》、科圖法,以及國外一些著名的分類法,如杜威十進制分類法等。這些分類法的最大可取之處是其對知識的科學分類,對本體的構建具有重要的借鑒意義,可以用于形成領域本體的頂層本體。
1.2 主題法
????? 主題法從內容角度標引和檢索信息資源,通過主題概念來集中文獻資源。它一般以主題詞為標引和檢索標識,以字順為主要檢索途徑。主題詞之間有著固定的語義關系,可以直接用來表達、描述文獻內容特征,是規(guī)范化的名詞術語。并以規(guī)范化為基礎,通過概念組配可以表達任何專指概念,便于特性組配檢索。
???? ?主題法包括標題法、元詞法、敘詞法、關鍵詞法四種類型。每種類型各有其特點,并且有不同程度的應用。讀者可以查閱相關資料了解其具體情況。
1.3 分類法、主題法對于本體構建參考的適應性分析
? ???? 通過上面的分析,我們已經可以看出,分類法和主題法對于本體的構建是有很大的作用的。具體來說,這主要是由于它們和本體論之間存在著諸多聯系。
????? ?三者都通過對信息進行表示、序化和組織來構造概念模型,描述概念及其之間的關系;它們均由一個概念集合和概念間關系集合組成,每個集合中包含了特定社會、組織公認的概念及概念間的關系;它們所使用的詞匯相近,并對概念間的關系進行了描述和揭示。
????? 這樣,一個成熟的分類表可以幫助我們在構建本體時選擇概念及表述概念之間的關系,并判斷概念之間、信息資源之間的相關性。因此,傳統(tǒng)的信息、知識組織方法,一方面可以直接用來構成頂層本體,然后在詞基礎上進行加工、添加屬性等,另一方面,又可以在構建本體時提供了詞匯及概念之間的關系的參考。這將大大縮短我們本體的開發(fā)時間、提高效率。同時,由于使用了公認的、規(guī)范的術語,使得本體的擴展性和可維護性大大提高,也便于發(fā)布和共享。
????? 當然,若無這些東西可參考,那就只有自行進行設計了。不過也還是最好參照相關領域的傳統(tǒng)知識組織方法或已有的領域本體,最大限度的降低本體開發(fā)的難度和提高效率。
2?本體具體開發(fā)
????? 本體開發(fā)的工具較多,如美國斯坦福大學的protege和onmlingua、德國的kaon和ontoedit、英國的webonto、西班牙的webode等,這些工具各有其特點。不過到目前為止,在國內最為流行的是protege,很多研究人員都在使用這個工具構建用于研究的本體。讀者可以到其官方網站上下載該工具。對于使用該工具,有一套配套的教程OWL本體開發(fā)實踐指南,讀者可以按照此教程學習如何使用protege開發(fā)本體。由于這套教程的描述非常清晰和詳細,思路也符合常規(guī)習慣,所以只要能看懂英文,很快便可以學完這套教程,故筆者也不再在此論述具體如何使用該工具開發(fā)本體了。
???? ?值得說明的是,人們往往有一個誤區(qū),認為本體開發(fā)非得要用工具才能進行。其實并非這樣,本體本身作為一種知識組織與表示的方法論,有著許多種表現形式。只是為了使其能在計算機中實現,人們開發(fā)了各種各樣的本體語言,如目前最為有效、最為流行的OWL語言。也就是說,如果一個人很熟悉OWL語言,那么他完全是可以用手+記事本的方式實現計算機可讀的本體的。只不過用工具開發(fā)起來更高效、更形象,也比較容易維護而已。使用工具開發(fā)本體僅僅是本題開發(fā)過程中的一小步而已,并不占主要位置,關鍵還是前期的應用調查、概念及概念層次結構、屬性等的設計。
?3?參考文獻
[1]A Practical Guide To Building OWL Ontologies Using The. Protege-OWL Plugin and CO-ODE Tools. Edition 1.0. Matthew Horridge. 1. ,. Holger Knublauch. 2. , Alan Rector. 1. , Robert Stevens ..
[2]周寧.信息組織.武漢:武漢大學出版社,2004.11.
總結
以上是生活随笔為你收集整理的本体开发方法——the Method of Ontology Development的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于webservice的经典理解
- 下一篇: jena 学习思路(转)