文本分类实战(中)
之前用了詞袋,邏輯回歸,keras的詞嵌入都不怎么行,都出現了過擬合
怎么解決過擬合
- Dropout抑制過擬合
- 正則化抑制過擬合
- 數據增強
之前的模型
model = Sequential() model.add(layers.Embedding(input_dim=vocab_size, # 2575output_dim=embedding_dim, # 50input_length=maxlen)) #5000 model.add(layers.Flatten()) model.add(layers.Dense(10, activation='relu')) model.add(layers.Dense(1, activation='sigmoid')) model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy']) model.summary()還是對數據進行詞嵌入,再pooling特征壓縮
沒錯添加model.add(layers.GlobalMaxPool1D())
from keras.models import Sequential from keras import layersembedding_dim = 50model = Sequential() model.add(layers.Embedding(input_dim=vocab_size,總結
- 上一篇: 文本分类实战(上)
- 下一篇: 电脑怎么进高级模式 如何进入电脑的高级模