當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

lstm 变长序列_keras在构建LSTM模型时对变长序列的处理操作

發布時間：2024/10/14 编程问答 126 豆豆

生活随笔收集整理的這篇文章主要介紹了 lstm 变长序列_keras在构建LSTM模型时对变长序列的处理操作小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我就廢話不多說了，大家還是直接看代碼吧~

print(np.shape(X))#(1920, 45, 20)

X=sequence.pad_sequences(X, maxlen=100, padding='post')

print(np.shape(X))#(1920, 100, 20)

model = Sequential()

model.add(Masking(mask_value=0,input_shape=(100,20)))

model.add(LSTM(128,dropout_W=0.5,dropout_U=0.5))

model.add(Dense(13,activation='softmax'))

model.compile(loss='categorical_crossentropy',

optimizer='adam',

metrics=['accuracy'])

# 用于保存驗證集誤差最小的參數，當驗證集誤差減少時，保存下來

checkpointer = ModelCheckpoint(filepath="keras_rnn.hdf5", verbose=1, save_best_only=True, )

history = LossHistory()

result = model.fit(X, Y, batch_size=10,

nb_epoch=500, verbose=1, validation_data=(testX, testY),

callbacks=[checkpointer, history])

model.save('keras_rnn_epochend.hdf5')

補充知識：RNN(LSTM)數據形式及Padding操作處理變長時序序列dynamic_rnn

Summary

RNN

樣本一樣，計算的狀態值和輸出結構一致，也即是說只要當前時刻的輸入值也前一狀態值一樣，那么其當前狀態值和當前輸出結果一致，因為在當前這一輪訓練中權重參數和偏置均未更新

RNN的最終狀態值與最后一個時刻的輸出值一致

輸入數據要求格式為，shape=(batch_size, step_time_size, input_size),那么，state的shape=(batch_size, state_size);output的shape=(batch_size, step_time_size, state_size),并且最后一個有效輸出(有效序列長度，不包括padding的部分)與狀態值會一樣

LSTM

LSTM與RNN基本一致，不同在于其狀態有兩個c_state和h_state，它們的shape一樣，輸出值output的最后一個有效輸出與h_state一致

用變長RNN訓練，要求其輸入格式仍然要求為shape=(batch_size, step_time_size, input_size)，但可指定每一個批次中各個樣本的有效序列長度，這樣在有效長度內其狀態值和輸出值原理不變，但超過有效長度的部分的狀態值將不會發生改變，而輸出值都將是shape=(state_size,)的零向量(注：RNN也是這個原理)

需要說明的是，不是因為無效序列長度部分全padding為0而引起輸出全為0，狀態不變，因為輸出值和狀態值得計算不僅依賴當前時刻的輸入值，也依賴于上一時刻的狀態值。其內部原理是利用一個mask matrix矩陣標記有效部分和無效部分，這樣在無效部分就不用計算了，也就是說，這一部分不會造成反向傳播時對參數的更新。當然，如果padding不是零，那么padding的這部分輸出和狀態同樣與padding為零的結果是一樣的

'''

#樣本數據為(batch_size，time_step_size, input_size[embedding_size])的形式，其中samples=4，timesteps=3，features=3,其中第二個、第四個樣本是只有一個時間步長和二個時間步長的，這里自動補零

'''

import pandas as pd

import numpy as np

import tensorflow as tf

train_X = np.array([[[0, 1, 2], [9, 8, 7], [3,6,8]],

[[3, 4, 5], [0, 10, 110], [0,0,0]],

[[6, 7, 8], [6, 5, 4], [1,7,4]],

[[9, 0, 1], [3, 7, 4], [0,0,0]],

[[9, 0, 1], [3, 3, 4], [0,0,0]]

])

sequence_length = [3, 1, 3, 2, 2]

train_X.shape, train_X[:,2:3,:].reshape(5, 3)

tf.reset_default_graph()

x = tf.placeholder(tf.float32, shape=(None, 3, 3)) # 輸入數據只需能夠迭代并符合要求shape即可，list也行，shape不指定表示沒有shape約束，任意shape均可

rnn_cell = tf.nn.rnn_cell.BasicRNNCell(num_units=6) # state_size[hidden_size]

lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(num_units=6) # state_size[hidden_size]

outputs1, state1 = tf.nn.dynamic_rnn(rnn_cell, x, dtype=tf.float32, sequence_length=sequence_length)

outputs2, state2 = tf.nn.dynamic_rnn(lstm_cell, x, dtype=tf.float32, sequence_length=sequence_length)

with tf.Session() as sess:

sess.run(tf.global_variables_initializer()) # 初始化rnn_cell中參數變量

outputs1, state1 = sess.run((outputs1, state1), feed_dict={x: train_X})

outputs2, state2 = sess.run([outputs2, state2], feed_dict={x: train_X})

print(outputs1.shape, state1.shape) # (4, 3, 5)->(batch_size, time_step_size, state_size), (4, 5)->(batch_size, state_size)

print(outputs2.shape) # state2為LSTMStateTuple(c_state, h_state)

print("---------output1state1-----------")

print(outputs1) # 可以看出output1的最后一個時刻的輸出即為state1, 即output1[:,-1,:]與state1相等

print(state1)

print(np.all(outputs1[:,-1,:] == state1))

print("---------output2state2-----------")

print(outputs2) # 可以看出output2的最后一個時刻的輸出即為LSTMStateTuple中的h

print(state2)

print(np.all(outputs2[:,-1,:] == state2[1]))

再來懟懟dynamic_rnn中數據序列長度tricks

思路樣例代碼

from collections import Counter

import numpy as np

origin_data = np.array([[1, 2, 3],

[3, 0, 2],

[1, 1, 4],

[2, 1, 2],

[0, 1, 1],

[2, 0, 3]

])

# 按照指定列索引進行分組(看作RNN中一個樣本序列),如下為按照第二列分組的結果

# [[[1, 2, 3], [0, 0, 0], [0, 0, 0]],

# [[3, 0, 2], [2, 0, 3], [0, 0, 0]],

# [[1, 1, 4], [2, 1, 2], [0, 1, 1]]]

# 第一步，將原始數據按照某列序列化使之成為一個序列數據

def groupby(a, col_index): # 未加入索引越界判斷

max_len = max(Counter(a[:, col_index]).values())

for i in set(a[:, col_index]):

d[i] = []

for sample in a:

d[sample[col_index]].append(list(sample))

# for key in d:

# d[key].extend([[0]*a.shape[1] for _ in range(max_len-len(d[key]))])

return list(d.values()), [len(_) for _ in d.values()]

samples, sizes = groupby(origin_data, 2)

# 第二步，根據當前這一批次的中最大序列長度max(sizes)作為padding標準(不同批次的樣本序列長度可以不一樣，但同一批次要求一樣(包括padding的部分))，當然也可以一次性將所有樣本(不按照批量)按照最大序列長度padding也行，可能空間浪費

paddig_samples = np.zeros([len(samples), max(sizes), 3])

for seq_index, seq in enumerate(samples):

paddig_samples[seq_index, :len(seq), :] = seq

paddig_samples

以上這篇keras在構建LSTM模型時對變長序列的處理操作就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持我們。

本文標題: keras在構建LSTM模型時對變長序列的處理操作

本文地址: http://www.cppcns.com/jiaoben/python/324123.html

總結

以上是生活随笔為你收集整理的lstm 变长序列_keras在构建LSTM模型时对变长序列的处理操作的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： ios 侧滑返回停顿_iOS push侧
下一篇：各种说明方法的例句_说明方法和例句

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

lstm 变长序列_keras在构建LSTM模型时对变长序列的处理操作

總結