Segmentation and Masking Model (SAM) ialah model pembelajaran mendalam untuk segmentasi imej yang dicadangkan oleh Microsoft Research Asia. Matlamat utama SAM adalah untuk menyelesaikan dua masalah utama dalam pembahagian imej: pembahagian bentuk arbitrari dan ketepatan keputusan pembahagian. Dengan menggunakan algoritma pembelajaran mendalam lanjutan, SAM dapat melakukan pembahagian sempadan yang tepat bagi objek berbeza dalam imej dan menjana topeng yang sepadan untuk pengecaman dan analisis objek selanjutnya. Berbanding dengan kaedah segmentasi tradisional, SAM mempunyai fleksibiliti dan ketepatan yang lebih tinggi, dan boleh digunakan dengan berkesan untuk pelbagai tugas pemprosesan imej, seperti analisis imej perubatan, automatik
SAM ialah kaedah yang boleh membahagikan dengan tepat daripada imej Teknologi untuk objek berbentuk sewenang-wenangnya. . Ia menggunakan mekanisme perhatian tersegmen dengan membahagikan imej kepada segmen dan memproses bahagian yang menarik sahaja. Selain itu, SAM juga menggunakan idea pembahagian contoh untuk memproses setiap contoh secara individu, seterusnya meningkatkan ketepatan pembahagian.
Model SAM terutamanya terdiri daripada tiga bahagian: rangkaian pembahagian, rangkaian piramid ciri dan mekanisme perhatian tersegmen.
1. Rangkaian Segmentasi
Tugas utama rangkaian segmentasi adalah untuk menukar imej input kepada topeng segmentasi. Untuk mencapai matlamat ini, SAM menggunakan struktur rangkaian pengekod-penyahkod berasaskan ResNet. Bahagian pengekod menggunakan struktur rangkaian sisa untuk mengekalkan maklumat semantik imej semasa menurunkan sampel. Bahagian penyahkod menggunakan kaedah penyahkonvolusi dan pensampelan untuk memulihkan peta ciri pengekod kepada saiz imej asal. Dalam setiap lapisan penyahkod, SAM menggunakan sambungan langkau untuk menggabungkan ciri peringkat rendah pengekod dengan ciri peringkat tinggi penyahkod, dengan itu meningkatkan ketepatan pembahagian. Melalui reka bentuk struktur rangkaian ini, SAM boleh mencapai tugas pembahagian imej dengan berkesan.
2. Rangkaian Piramid Ciri
Tugas utama rangkaian piramid ciri adalah untuk menyediakan ciri berskala untuk mekanisme perhatian yang tersegmentasi. SAM menggunakan struktur rangkaian piramid ciri berdasarkan ResNet, yang boleh mengekstrak ciri daripada peta ciri skala berbeza untuk menyesuaikan diri dengan objek sasaran yang berbeza saiz dan bentuk. Output rangkaian piramid ciri dimasukkan ke dalam mekanisme perhatian tersegmen untuk pemprosesan.
3. Mekanisme perhatian tersegmentasi
Mekanisme perhatian bersegmen adalah bahagian teras SAM Ia meningkatkan ketepatan pembahagian dengan membahagikan imej kepada beberapa segmen dan hanya memproses bahagian yang diperlukan. Khususnya, mekanisme perhatian tersegmen membahagikan output rangkaian piramid ciri kepada beberapa segmen bersebelahan, dan kemudian mengira berat perhatian setiap segmen secara berasingan. Pemberat perhatian ini boleh digunakan untuk mengawal kepentingan setiap segmen untuk menangkap bentuk dan sempadan objek sasaran dengan lebih baik.
Akhir sekali, SAM menggandakan berat perhatian setiap segmen dengan keluaran rangkaian piramid ciri untuk mendapatkan perwakilan ciri setiap segmen, yang dimasukkan ke dalam rangkaian pembahagian untuk pembahagian. Mekanisme perhatian tersegmen ini boleh mengendalikan objek sasaran bentuk sewenang-wenangnya dan mengurangkan pemprosesan kawasan latar belakang, dengan itu meningkatkan kecekapan dan ketepatan pembahagian. . bentuk. Disebabkan kecekapan dan ketepatannya, SAM telah digunakan secara meluas dalam bidang pembahagian imej dan telah mencapai hasil yang luar biasa dalam banyak aplikasi, seperti pemanduan autonomi, analisis imej perubatan dan keselamatan pintar.
Atas ialah kandungan terperinci Model Adaptif Pemisahan Perenggan (PSAM). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!