為什麼我的 Keras 模型在訓練期間似乎只使用了 Fashion MNIST 資料集的一部分，即使它正在處理 1875 個批次？-Python教學-PHP中文網

為什麼我的 Keras 模型在訓練期間似乎只使用了 Fashion MNIST 資料集的一部分，即使它正在處理 1875 個批次？

Barbara Streisand

發布： 2024-11-04 09:06:02

原創

887 人瀏覽過

Why does my Keras model seem to only use part of my Fashion MNIST dataset during training, even though it's processing 1875 batches?

Keras 訓練限制：解決部分資料集使用

使用Keras 訓練神經網路模型時，確保整個資料集是至關重要的訓練期間使用。然而，在某些情況下，使用者可能會遇到僅使用一小部分資料的問題。本文探討了一個特定案例，其中在 Fashion MNIST 資料集上訓練的模型僅使用部分可用數據，提供了全面的解釋和解決方案。

提供的程式碼片段利用 model.fit() 方法預設參數，其中批次大小為 32。這意味著在每次迭代或 epoch 期間，模型都會處理訓練資料集中的 32 個樣本。對於包含 60,000 個樣本的 Fashion MNIST 資料集，模型需要多次迭代整個資料集才能完成訓練。然而，控制台中顯示的輸出表明模型在 1875 次迭代中完成了一個 epoch。

出現這種差異是因為 model.fit() 方法報告的是訓練期間處理的批次數，而不是總數樣品。因此，在本例中，模型對 1875 個批次進行訓練，每個批次包含 32 個樣本，總共有 1875 * 32 = 60,000 個樣本。這意味著該模型確實在利用整個資料集進行訓練，儘管在每個時期顯示「1875/1875」的誤導性進度條。

為了避免混淆並準確追蹤訓練過程的進度，它建議計算並顯示每個時期處理的樣本數。這可以透過修改列印進度的程式碼來實現，如下所示：

<code class="python">for epoch in range(10):
    print(f"Current Epoch: {epoch + 1}")
    for batch_idx in range(1875):
        model.train_step((train_images[batch_idx * 32 : (batch_idx + 1) * 32],
                          train_labels[batch_idx * 32 : (batch_idx + 1) * 32]))
        print(f"Batch {batch_idx + 1} processed.")</code>

登入後複製

使用此方法，控制台將同時顯示批次和樣本的進度，讓您清楚地了解訓練過程並確認模型正在按預期利用整個數據集。

以上是為什麼我的 Keras 模型在訓練期間似乎只使用了 Fashion MNIST 資料集的一部分，即使它正在處理 1875 個批次？的詳細內容。更多資訊請關注PHP中文網其他相關文章！