python文本分词_【Python】使用jieba对文本进行分词
【參考】
#-*- coding:utf-8 -*-
importjiebaimportsys
reload(sys)
sys.setdefaultencoding('utf8')
char_x2="考勤機分兩大類:第一類是簡單打印類,打卡時,原始記錄數(shù)據(jù)通過考勤機直接打印在卡片上,卡片上的記錄時間即為原始的考勤信息,對初次使用者無需做任何事先的培訓即可立即使用;第二類是存儲類,打卡時,原始記錄數(shù)據(jù)直接存儲在考勤機內,然后通過計算機采集匯總,再通過軟件處理,最后形成所需的考勤信息或查詢或打印,其考勤信息靈活豐富,對初次使用者需做一些事先培訓才能逐漸掌握其全部使用功能。"test1= jieba.cut(char_x2, cut_all=True)print("全模式:" + "|".join(test1))
test2= jieba.cut(char_x2, cut_all=False)print("精確模式:" + "|".join(test2))
test3=jieba.cut_for_search(char_x2)print("搜索引擎模式:" + "|".join(test3))
【打印結果】
全模式: 考勤| 考勤機| 分| 兩大類| 大類| | | 第一| 第一類| 一類| 是| 簡單| 單打| 打印| 類| | | 打卡| 時| | | 原始| 原始記錄| 記錄| 數(shù)據(jù)| 數(shù)據(jù)通| 通過| 考勤| 考勤機| 直接| 打印| 在| 卡片| 上| | | 卡片| 上| 的| 記錄| 記錄時間| 時間| 即為| 原始| 的| 考勤| 信息| | | 對| 初次| 使用| 使用者| 用者| 無需| 做| 任何| 何事| 事先| 的| 培訓| 即可| 立即| 即使| 使用| | | 第二| 第二類| 二類| 是| 存儲| 類| | | 打卡| 時| | | 原始| 原始記錄| 記錄| 數(shù)據(jù)| 直接| 存儲| 在| 考勤| 考勤機| 機內| | | 然后| 通過| 計算| 計算機| 算機| 采集| 匯總| | | 再| 通過| 軟件| 處理| | | 最后| 形成| 所需| 的| 考勤| 信息| 或| 查詢| 或| 打印| | | 其| 考勤| 信息| 靈活| 豐富| | | 對| 初次| 使用| 使用者| 用者| 需| 做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 用功| 功能| |精確模式: 考勤機| 分| 兩大類| :| 第一類| 是| 簡單| 打印| 類| ,| 打卡| 時| ,| 原始記錄| 數(shù)據(jù)| 通過| 考勤機| 直接| 打印| 在| 卡片| 上| ,| 卡片| 上| 的| 記錄時間| 即| 為| 原始| 的| 考勤| 信息| ,| 對| 初次| 使用者| 無需| 做| 任何| 事先| 的| 培訓| 即可| 立即| 使用| ;| 第二類| 是| 存儲| 類| ,| 打卡| 時| ,| 原始記錄| 數(shù)據(jù)| 直接| 存儲| 在| 考勤機| 內| ,| 然后| 通過| 計算機| 采集| 匯總| ,| 再| 通過| 軟件| 處理| ,| 最后| 形成| 所| 需| 的| 考勤| 信息| 或| 查詢| 或| 打印| ,| 其| 考勤| 信息| 靈活| 豐富| ,| 對| 初次| 使用者| 需做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 功能|。
搜索引擎模式:考勤| 考勤機| 分| 大類| 兩大類| :| 第一| 一類| 第一類| 是| 簡單| 打印| 類| ,| 打卡| 時| ,| 原始| 記錄| 原始記錄| 數(shù)據(jù)| 通過| 考勤| 考勤機| 直接| 打印| 在| 卡片| 上| ,| 卡片| 上| 的| 記錄| 時間| 記錄時間| 即| 為| 原始| 的| 考勤| 信息| ,| 對| 初次| 使用| 用者| 使用者| 無需| 做| 任何| 事先| 的| 培訓| 即可| 立即| 使用| ;| 第二| 二類| 第二類| 是| 存儲| 類| ,| 打卡| 時| ,| 原始| 記錄| 原始記錄| 數(shù)據(jù)| 直接| 存儲| 在| 考勤| 考勤機| 內| ,| 然后| 通過| 計算| 算機| 計算機| 采集| 匯總| ,| 再| 通過| 軟件| 處理| ,| 最后| 形成| 所| 需| 的| 考勤| 信息| 或| 查詢| 或| 打印| ,| 其| 考勤| 信息| 靈活| 豐富| ,| 對| 初次| 使用| 用者| 使用者| 需做| 一些| 事先| 培訓| 才能| 逐漸| 掌握| 其| 全部| 使用| 功能| 。
【待補充】
總結
以上是生活随笔為你收集整理的python文本分词_【Python】使用jieba对文本进行分词的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为啥我的页面模板的from提交不了数据_
- 下一篇: nacos 本地测试_Nacos注册中心