Pengesanan objek ialah tugas penting dalam bidang penglihatan komputer, digunakan untuk mengenal pasti objek dalam imej atau video dan mencari lokasinya. Tugasan ini biasanya dibahagikan kepada dua kategori algoritma, satu peringkat dan dua peringkat, yang berbeza dari segi ketepatan dan keteguhan.
Algoritma pengesanan sasaran satu peringkat menukarkan pengesanan sasaran kepada masalah pengelasan Kelebihannya ialah ia pantas dan boleh menyelesaikan pengesanan hanya dalam satu langkah. Walau bagaimanapun, disebabkan terlalu memudahkan, ketepatan biasanya tidak sebaik algoritma pengesanan objek dua peringkat.
Algoritma pengesanan sasaran satu peringkat biasa termasuk YOLO, SSD dan R-CNN Lebih Pantas. Algoritma ini biasanya mengambil keseluruhan imej sebagai input dan menjalankan pengelas untuk mengenal pasti objek sasaran. Berbeza daripada algoritma pengesanan objek dua peringkat tradisional, mereka tidak perlu menentukan kawasan terlebih dahulu, tetapi secara langsung meramalkan kotak sempadan dan kategori objek sasaran. Disebabkan pendekatan yang mudah tetapi cekap ini, algoritma pengesanan objek satu peringkat lebih popular dalam aplikasi penglihatan masa nyata.
Algoritma pengesanan objek dua peringkat terdiri daripada dua langkah: pertama menjana kawasan calon, dan kemudian menjalankan pengelas pada wilayah ini. Kaedah ini lebih tepat daripada satu peringkat, tetapi lebih perlahan.
Algoritma pengesanan sasaran dua peringkat yang mewakili termasuk R-CNN, Fast R-CNN, Faster R-CNN dan Mask R-CNN. Algoritma ini mula-mula menjana satu set wilayah calon menggunakan rangkaian cadangan wilayah dan kemudian mengelaskan setiap wilayah calon menggunakan rangkaian saraf konvolusi. Kaedah ini lebih tepat daripada kaedah satu peringkat, tetapi memerlukan lebih banyak sumber dan masa pengiraan.
1
Algoritma pengesanan objek satu peringkat biasanya mempunyai kelajuan yang lebih tinggi dan penggunaan memori yang lebih rendah, tetapi ketepatan biasanya lebih rendah sedikit daripada algoritma dua peringkat. Memandangkan algoritma satu peringkat meramalkan kotak sempadan objek terus daripada imej atau video input, adalah sukar untuk meramalkan objek dengan bentuk kompleks atau oklusi separa dengan tepat. Di samping itu, disebabkan kekurangan langkah pengekstrakan wilayah calon dalam pengesanan dua peringkat, algoritma satu peringkat mungkin dipengaruhi oleh bunyi latar belakang dan kepelbagaian objek.
Algoritma pengesanan sasaran dwi-peringkat berprestasi lebih baik dari segi ketepatan, terutamanya untuk objek yang sebahagiannya tersumbat, bentuk kompleks atau saiz yang berbeza. Melalui proses pengesanan dua peringkat, algoritma dwi peringkat boleh menapis bunyi latar belakang dengan lebih baik dan meningkatkan ketepatan ramalan.
2. Kelajuan
Algoritma pengesanan objek satu peringkat biasanya lebih pantas daripada algoritma pengesanan objek dwi peringkat. Ini kerana algoritma satu peringkat mengendalikan tugas pengesanan sasaran sebagai satu langkah, manakala algoritma dua peringkat memerlukan dua langkah untuk diselesaikan. Dalam aplikasi penglihatan masa nyata seperti pemanduan autonomi, kelajuan adalah faktor yang sangat penting.
3. Kebolehsuaian kepada skala dan putaran yang berbeza
Algoritma pengesanan sasaran dwi peringkat biasanya mempunyai kebolehsuaian yang lebih baik kepada skala dan putaran yang berbeza. Ini kerana algoritma dua peringkat mula-mula menjana kawasan calon yang boleh mengandungi pelbagai skala dan putaran objek sasaran, dan kemudian melakukan pengelasan dan pelarasan kotak sempadan pada wilayah ini. Ini membolehkan algoritma dwi peringkat menyesuaikan diri dengan lebih baik kepada pelbagai senario dan tugasan.
4. Penggunaan sumber pengkomputeran
Algoritma pengesanan sasaran dwi peringkat biasanya memerlukan lebih banyak sumber pengkomputeran untuk dijalankan. Ini kerana ia memerlukan dua langkah pemprosesan dan memerlukan banyak pengiraan dalam setiap langkah. Sebaliknya, algoritma satu peringkat mengendalikan tugas pengesanan objek sebagai satu langkah dan oleh itu biasanya memerlukan lebih sedikit sumber pengiraan.
Ringkasnya, algoritma pengesanan sasaran satu peringkat dan dwi peringkat masing-masing mempunyai kelebihan dan keburukan tersendiri untuk dipilih bergantung pada senario dan keperluan aplikasi tertentu. Dalam senario yang memerlukan ketepatan pengesanan tinggi, seperti pemanduan autonomi, algoritma pengesanan sasaran dua peringkat biasanya dipilih Dalam senario yang memerlukan kelajuan tinggi untuk pemprosesan masa nyata, seperti pengecaman muka, algoritma pengesanan sasaran satu peringkat boleh dibuat. dipilih.
Atas ialah kandungan terperinci Perbezaan antara algoritma pengesanan sasaran satu peringkat dan dwi peringkat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!