LSTM 시간 단계 및 특징 이해
LSTM 모델에서 시간 단계 및 특징은 입력 데이터의 차원을 나타냅니다. 시간 단계는 시퀀스의 데이터 포인트 수를 나타내고 기능은 각 데이터 포인트 내의 다양한 변수 또는 차원을 나타냅니다.
예제에서 입력 데이터는 다음 차원을 사용하여 3D 배열로 재구성됩니다.
따라서 각 샘플은 3개의 데이터 포인트의 시퀀스이며 각 데이터 포인트는 단일 입력으로 구성됩니다. 변수.
상태 저장 LSTM
상태 저장 LSTM은 각 시간 단계에서 업데이트되는 숨겨진 상태를 유지합니다. 이를 통해 모델은 과거 입력으로부터 학습하고 상황에 따라 예측할 수 있습니다. stateful=True인 경우 LSTM은 배치 간의 숨겨진 상태를 기억하므로 순차 데이터에 유용할 수 있습니다.
코드에서 배치 크기 1을 사용하고 100세대 동안 모델을 훈련합니다. 그러나 model.reset_states()를 사용하여 각 에포크 후에 상태를 재설정할 수도 있습니다. 이는 모델이 배치 간의 과거 입력으로부터 실제로 학습하지 않고 기본적으로 각 배치를 새로운 시퀀스로 처리한다는 것을 의미합니다.
상태 저장 LSTM을 올바르게 훈련하려면 훈련 중에 상태를 재설정하지 않아야 합니다. 대신, 새 시퀀스를 시작하거나 새 데이터 포인트에 대해 예측하려는 경우에만 상태를 재설정해야 합니다.
펼쳐진 다이어그램
제공한 다이어그램 LSTM 네트워크의 펼쳐진 아키텍처를 보여줍니다. 두 경우 모두 빨간색 상자는 입력 단계를 나타내고 녹색 상자는 숨겨진 상태를 나타냅니다.
편집 1:
다음 다이어그램은 첫 번째 펼쳐진 다이어그램에 해당합니다. 귀하가 제공한 내용:
[시간 단계당 하나의 입력 단계가 있는 펼쳐진 다이어그램 이미지]
귀하가 제공한 다이어그램 두 번째 펼쳐진 다이어그램에 해당:
[모든 입력 단계가 동시에 포함된 펼쳐진 다이어그램 이미지]
편집 2:
시간 단계 이해 기능 인수는 LSTM 모델에 필수적입니다. 자세한 내용은 원본 게시물과 댓글에 제공된 리소스를 참조하세요.
추가 참고 사항:
위 내용은 시간 단계와 기능이 LSTM 모델 성능과 상태 저장 훈련에 어떤 영향을 미치나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!