如上一篇部落格文章中所提到的,YOLOv8 在文件版面分析中表現非常出色。我透過 DocLayNet 資料集訓練了 YOLOv8 系列的所有模型,發現即使是最小的模型,整體 mAP50-95 也達到了 71.8,而最大的模型達到了令人印象深刻的 78.7。
最近,Ultralytics 發布了 YOLOv11,這是其 YOLO 系列即時物體偵測器的最新版本。這個新版本對架構和訓練方法都帶來了重大改進。
?結果看起來很有希望!我決定再次在 DocLayNet 資料集上訓練所有 YOLOv11 模型,並與先前的 YOLOv8 系列進行比較。
對於這個實驗,我繼續使用我的儲存庫 https://github.com/ppaangggg/yolo-doclaynet 來準備資料並使用我的自訂腳本訓練模型。這種方法確保了資料準備和訓練過程的一致性,從而可以公平地比較 YOLOv8 和 YOLOv11 模型。
YOLOv11 模型的訓練與評估過程非常簡單,可以使用簡單的命令列指令執行:
# To train the model python train.py {base-model} # To evaluate the model python eval.py {path-to-your-trained-model}
這是YOLOv8模型與YOLOv11比較的詳細評估表:
label | boxes | yolov8n | yolov11n | yolov8s | yolov11s | yolov8m | yolov11m | yolov8l | yolov11l | yolov8x | yolov11x |
---|---|---|---|---|---|---|---|---|---|---|---|
Params (M) | 3.2 | 2.6 | 11.2 | 9.4 | 25.9 | 20.1 | 43.7 | 25.3 | 68.2 | 56.9 | |
Caption | 1542 | 0.682 | 0.717 | 0.721 | 0.744 | 0.746 | 0.746 | 0.75 | 0.772 | 0.753 | 0.765 |
Footnote | 387 | 0.614 | 0.634 | 0.669 | 0.683 | 0.696 | 0.701 | 0.702 | 0.715 | 0.717 | 0.71 |
Formula | 1966 | 0.655 | 0.673 | 0.695 | 0.705 | 0.723 | 0.729 | 0.75 | 0.75 | 0.747 | 0.765 |
List-item | 10521 | 0.789 | 0.81 | 0.818 | 0.836 | 0.836 | 0.843 | 0.841 | 0.847 | 0.841 | 0.845 |
Page-footer | 3987 | 0.588 | 0.591 | 0.61 | 0.621 | 0.64 | 0.653 | 0.641 | 0.678 | 0.655 | 0.684 |
Page-header | 3365 | 0.707 | 0.704 | 0.754 | 0.76 | 0.769 | 0.778 | 0.776 | 0.788 | 0.784 | 0.795 |
Picture | 3497 | 0.723 | 0.758 | 0.762 | 0.783 | 0.789 | 0.8 | 0.796 | 0.805 | 0.805 | 0.802 |
Section-header | 8544 | 0.709 | 0.713 | 0.727 | 0.745 | 0.742 | 0.753 | 0.75 | 0.75 | 0.748 | 0.751 |
Table | 2394 | 0.82 | 0.846 | 0.854 | 0.874 | 0.88 | 0.88 | 0.885 | 0.891 | 0.886 | 0.89 |
Text | 29917 | 0.845 | 0.851 | 0.86 | 0.869 | 0.876 | 0.878 | 0.878 | 0.88 | 0.877 | 0.883 |
Title | 334 | 0.762 | 0.793 | 0.806 | 0.817 | 0.83 | 0.832 | 0.846 | 0.844 | 0.84 | 0.848 |
All | 66454 | 0.718 | 0.735 | 0.752 | 0.767 | 0.775 | 0.781 | 0.783 | 0.793 | 0.787 | 0.794 |
我還建立了一個圖表來說明這兩個系列的模型大小和分數之間的關係:
根據上面的表格和圖,我們可以得出結論
根據上面的表格和圖表,我們可以得出結論,YOLOv11 模型在所有尺寸上始終優於 YOLOv8 模型。這些改進在較小的模型中尤其明顯,與 YOLOv8n 相比,YOLOv11n 的 mAP50-95 提高了 1.7%。此外,YOLOv11 模型通常比 YOLOv8 模型具有更少的參數,這表明除了更好的性能之外,效率也得到了提高。
我最喜歡的模型是 YOLOv11l。它的大小與 YOLOv8m 差不多,但它的性能甚至超過了 YOLOv8x!
然而,儘管模型大小是 YOLOv11l 的兩倍,YOLOv11x 僅比 YOLOv11l 略有改進。
您對 YOLOv11 的結果有何看法?您有使用 YOLO 模型進行文件佈局分析的經驗嗎?我很想在下面的評論中聽到您的見解和經驗!
以上是YOLOv 文件佈局分析的新突破的詳細內容。更多資訊請關注PHP中文網其他相關文章!