知识图谱学习笔记-知识图谱介绍
一、什么是知識圖譜?
解釋1:? 知識圖譜本質(zhì)上是語義網(wǎng)絡(luò) (本體論是語義網(wǎng)落的重要因素)
解釋2: 知識圖譜也叫做多關(guān)系圖,由多種類型的節(jié)點(diǎn)和多種類型的邊組成
?
構(gòu)建知識圖譜系統(tǒng)中所涉及到的技術(shù)
數(shù)據(jù)獲取:數(shù)據(jù)爬蟲、數(shù)據(jù)庫讀取
數(shù)據(jù)預(yù)處理:數(shù)據(jù)清洗、知識抽取、信息抽取、消歧分析等
導(dǎo)入到知識圖譜:數(shù)據(jù)篩選、知識圖譜設(shè)計(jì)、批量導(dǎo)入、增量導(dǎo)入
應(yīng)用層搭建:各類模型搭建、GraphX分布式處理、微服務(wù)
?
二、知識圖譜的應(yīng)用場景
風(fēng)控知識圖譜、證券知識圖譜(買股票一個事件發(fā)生、哪些上漲、下降)、教育知識圖譜(知識點(diǎn)之間的相關(guān)關(guān)系)、搜索、聊天機(jī)器人、醫(yī)療..
三、知識圖譜架構(gòu)圖
授權(quán)數(shù)據(jù)(用戶允許抓取的數(shù)據(jù))? ??公開數(shù)據(jù)(網(wǎng)上披露黑名單)? ? ?三方數(shù)據(jù)? ? ?業(yè)務(wù)數(shù)據(jù)(系統(tǒng)數(shù)據(jù)、身份證號等)
四、Neo4j與APOC組件介紹
圖數(shù)據(jù)庫的數(shù)據(jù)存儲形式
圖數(shù)據(jù)庫存儲的特點(diǎn)總結(jié):
1、包含節(jié)點(diǎn)和關(guān)系? ? ?
2、節(jié)點(diǎn)可以有屬性(key-value形式存儲)
3、節(jié)點(diǎn)可以有一個或者多個標(biāo)簽(類別)
4、關(guān)系有名字和方向,并總是有一個開始節(jié)點(diǎn)和一個結(jié)束節(jié)點(diǎn)
?
五、Neo4j獲取和部署
參考帖子:https://blog.csdn.net/u014032819/article/details/78506606
六、APOC
安裝APOC ,下載apoc-3.4.0.3-all.jar和mysql-connector-java-5.1.21.jar兩個jar包,放到neo4j的plugins目錄下,找到自己對應(yīng)的版本即可
APOC功能
1、文本和索引查找:提供索引查詢、管理、全文圖標(biāo)和搜索等功能
2、實(shí)用函數(shù):域名提取時間和日期、數(shù)字格式轉(zhuǎn)換等功能
3、圖算法:社區(qū)檢測、PageRank、中心算法等
4、空間函數(shù):地理編碼、位置計(jì)算、空間與時間搜索等
5、數(shù)據(jù)集成:JSON、JDBC、csv等格式數(shù)據(jù)加載
6、圖形重構(gòu):節(jié)點(diǎn)合并、屬性規(guī)范化與分類等
7、虛擬節(jié)點(diǎn)/關(guān)系:提供虛擬圖的創(chuàng)建
8、Cypher操作:單個和多個Cypher語句運(yùn)行和腳本運(yùn)行
9、觸發(fā)器:與關(guān)系型數(shù)據(jù)庫的觸發(fā)器的理解方式一樣
......
七、JDBC
APOC數(shù)據(jù)集成-JDBC(Java Databases connect)
apoc.load.jdbc:可以訪問提供JDBC驅(qū)動程序的數(shù)據(jù)庫,并執(zhí)行查詢。其將結(jié)果變成以一行數(shù)據(jù)為單位的數(shù)據(jù)流,然后可以使用這些行來更新或者創(chuàng)建圖形數(shù)據(jù)結(jié)構(gòu)
APOC JDBC語法:
call
apoc.load.jdbc("jdbc:mysql://{IP}:{PORT}/{DBNAME}?user={USERNAME}&password={PASSWORD}","{TABLENAME}") yield row
以行的方式讀取數(shù)據(jù)表
create
(b:Black{number:row.black_id,type:row.type})
?
?
?
總結(jié)
以上是生活随笔為你收集整理的知识图谱学习笔记-知识图谱介绍的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 风控特征学习笔记
- 下一篇: 知识图谱学习笔记-Cypher语句使用