理解LSTM 時間步長和特徵
在給定的Keras 程式碼中,trainX 陣列的形狀為(樣本、時間步長、特徵) )。這意味著資料被重新整形為三維數組,其中第一維表示樣本數,第二維表示時間步數,第三維表示特徵數。
在您提供的圖表的上下文中,每個綠色框代表一個時間步,每個粉紅色框代表一個特徵。因此,程式碼正在考慮「多對一」的情況,其中每個綠色框(時間步)有多個粉紅色框(特徵)。
在考慮多元序列時,特徵參數變得相關,例如同時對兩隻金融股票進行建模。在這種情況下,每個特徵將代表一隻股票,特徵的數量將等於正在建模的股票的數量。
了解有狀態 LSTM
有狀態 LSTM 不會保存批次運作之間的單元記憶體值。相反,它們在內部跨批次維護其狀態。在所提供的程式碼的情況下,批次大小為 1,LSTM 將根據目前輸入更新其內部狀態,並使用該狀態來處理下一個輸入。透過重置訓練運行之間的狀態,LSTM 被迫在每個批次中重新開始。
這種行為對於預測未來時間步等情況非常重要,其中模型需要記住過去輸入的上下文做出準確的預測。
附加說明
以上是Keras LSTM 中的時間步長和特徵如何運作?的詳細內容。更多資訊請關注PHP中文網其他相關文章!