tf_text
文字預處理
在文字的建模實踐中,一般需要把原始文字拆解成單字、單詞或者詞組,然后將這些拆分的要素進行索引,標記化供機器學習算法使用。這種預處理叫做標注(Tokenize)。雖然這些功能都可以用python實現,但是Keras提供了現成的方法。
對于keras全部封裝在text中
分詞器
Tokenizer
keras.preprocessing.text.Tokenizer(num_words=None, filters='!"#$%&()*+,-.總結
- 上一篇: 微粒贷多久调一次额度
- 下一篇: 商业保险的意外险的保障范围