nltk安装punkt等语料库时报SSL错误完美解决方案及离线安装方法
nltk是NLP領(lǐng)域中一個比較通用的國際分詞工具,但是使用時往往依賴語料庫數(shù)據(jù)包,需要安裝到本地,以下介紹在線安裝和離線安裝兩種方式:
(ps:對NLP感興趣的朋友可以相互學(xué)習(xí),我的微信號:Joney-Joney,請備注:NLP博客)
?
1.在線安裝punkt等數(shù)據(jù)包:
1.1 在線安裝時往往會報SSL等安全連接驗證錯誤,可通過python的ssl模塊中啟用無驗證的網(wǎng)絡(luò)連接方式,代碼如下:
import nltk import ssl try:_create_unverified_https_context = ssl._create_unverified_context except AttributeError:pass else:ssl._create_default_https_context = _create_unverified_https_context nltk.download()1.2 運行后就會彈出python解釋器后自動打開nltk下載器的界面如下,按圖示操作即可:
1.3 單個包都比較小,下載完后打開上圖中自行指定的nltk_data目錄可看到punkt目錄結(jié)構(gòu)如下:
1.4 恭喜您,現(xiàn)在可以正確運行你的代碼啦(報錯日志中依賴什么包就安裝對應(yīng)的包)
?
2 離線安裝方式:
2.1 先到官網(wǎng)NLTK Corpora(如下圖)下載zip包:
2.2 新建一個nltk_data文件夾(僅第一次安裝時)放到任意路徑下(如:我放在Python.framework/Versions/3.7/share/中);
2.3 把下載好的語料包punkt.zip解壓到nltk_data/tokenizers/中(因為punkt屬于tokenizers所以需要新建tokenizers文件夾);
2.4 最后把nltk_data目錄以代碼的形式添加到nltk的數(shù)據(jù)文件路徑中(只需要在第一次安裝時添加,添加的代碼如下)。
import nltk nltk.data.path.append('xxxx/nltk_data') # 參數(shù)為你放置的nltk_data文件夾的絕對路徑?
3.安裝nltk其它的語料庫同理,個人推薦在線安裝的方式,比較方便~~
?
?
總結(jié)
以上是生活随笔為你收集整理的nltk安装punkt等语料库时报SSL错误完美解决方案及离线安装方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 今年第一批储蓄国债就要来了,数量不多,要
- 下一篇: lmgrd.exe是什么进程 有什么用