javascript
Spring Boot中对自然语言处理工具包hanlp的调用详解
2019獨角獸企業重金招聘Python工程師標準>>>
概?述
?
HanLP?是基于?Java開發的?NLP工具包,由一系列模型與算法組成,目標是普及自然語言處理在生產環境中的應用。而且?HanLP具備功能完善、性能高效、架構清晰、語料時新、可自定義的特點,因此十分好上手,本文就結合?Spring Boot來將?HanLP用起來!
下載?HanLP數據和程序
由于?HanLP庫將數據與代碼分離,因此我們需要分別下載所需數據和?jar包:
(1)所需?data數據包下載地址為?data.zip
(2)所需?jar包下載地址為?hanlp-release.zip
工程搭建
(1)創建一個普通的?Spring Boot工程,不贅述
(2)引入?HanLP數據 和 配置
下載完成以后,首先解壓?hanlp-release.zip壓縮包,然后將解壓出的?HanLP的?jar包引入?Spring Boot工程,然后需要來放置?HanLP所需配置和數據:
(1)將解壓后?hanlp-release.zip壓縮包中的?hanlp.properties配置文件置于項目的?resources資源目錄下
(2)然后解壓?data.zip壓縮包,將解壓出的?data目錄同樣至于?resources目錄下(?data?中的數據包很重要,是?HanLP工作所需的詞典和模型 )
創建?IO適配器
HanLP?提供了IO適配器,用戶可以實現其提供的?com.hankcs.hanlp.corpus.io.IIOAdapter?接口以在不同的平臺(HDFS、Redis等)上運行HanLP,默認的?IO適配器?IOAdapter = com.hankcs.hanlp.corpus.io.FileIOAdapter?是基于普通文件系統的。
接下來我們重寫一下?IOAdapter類,使用讀寫靜態資源文件的方法來讀取HanLP所需的詞典和模型數據( 即resources目錄下剛放置的?data目錄 )
轉載于:https://my.oschina.net/u/3611008/blog/2906994
總結
以上是生活随笔為你收集整理的Spring Boot中对自然语言处理工具包hanlp的调用详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: error: index-pack di
- 下一篇: NumberOf1Bits(leetco