中文词语概念上下位图谱项目
HyponymyExtraction
項目地址:https://github.com/liuhuanyong/HyponymyExtraction
HyponymyExtraction and Graph based on KB Schema, Baike-kb and online text extract, 基于知識概念體系,百科知識庫,以及在線搜索結構化方式的詞語上下位抽取.
項目介紹
上下位關系是語言學概念。概括性較強的單詞叫做特定性較強的單詞的上位詞(hypernym),特定性較強的單詞叫做概括性較強的單詞的下位詞(hyponym)。比如我們說,蘋果是一種水果,蘋果就是水果的一個下位詞,也可以稱為一個實例,而水果則是蘋果的一個上位詞,也可以稱為一個類.
上下位這種語義關系是整個詞匯語義關系中的一個重要內容,通過上下位關系,可以將世間萬物進行組織和練聯系起來,對于增進人們對某一實體或概念的認知上具有重要幫助
自然語言文本中存儲著大量的上下位關系知識,如經過語言專家編輯整理形成的概念語義詞典,如同義詞詞林,中文主題概念詞典,hownet等,也存在開放百科知識平臺當中,有效地利用這些信息,能夠支持多項應用,如:
本項目主要解決第一個問題,本項目的應用場景是:用戶輸入一個需要了解的詞語,后臺通過查詢既定知識庫,從百百科知識庫,在線非結構化文本中進行抽取,形成關于該詞語的上下位詞語網絡,并以圖譜這一清晰明了的方式展示出來.
本項目將采用三種方式來完成這一目標
1)基于既定知識庫的直接查詢,對應extract_kb
2)基于在線百科知識庫的抽取,對應extract_baike
3)基于在線文本的結構化抽取,對應extract_text
項目分解
1)基于既定知識庫的直接查詢
使用方式:進入extract_kb, 設定需要查詢的詞word,指定python kb_search.py, 會生成相應的html文件,為最終展示結果
結果展示
蘋果上下位
長江上下位
孔子上下位
2)基于在線百科的概念抽取
使用方式:進入extract_baike要查詢的詞word,指定python Baike_search.py, 會生成相應的html文件,為最終展示結果
結果展示
蘋果上下位
小米上下位
姚明上下位
If any question about the project or me ,see https://liuhuanyong.github.io/
項目地址:https://github.com/liuhuanyong/HyponymyExtraction
總結
以上是生活随笔為你收集整理的中文词语概念上下位图谱项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 德勤发布《 2020 亚太四大半导体市场
- 下一篇: 一步步手动实现热修复(一)-dex文件的