MobileNet adalah model sumber terbuka yang dibuat untuk menyokong kemunculan telefon pintar. Ia menggunakan seni bina CNN untuk melaksanakan tugas penglihatan komputer seperti klasifikasi imej dan pengesanan objek. Model yang menggunakan seni bina ini biasanya memerlukan banyak kos pengiraan dan sumber perkakasan, tetapi Mobilenet dibuat untuk bekerja dengan peranti mudah alih dan membenamkan.
Selama bertahun-tahun, model ini telah digunakan untuk pelbagai aplikasi dunia nyata. Ia juga mempunyai beberapa keupayaan, seperti mengurangkan parameter menggunakan convolution pemisahan mendalam. Oleh itu, dengan sumber perkakasan terhad peranti mudah alih, teknik ini dapat membantu menjadikan model berfungsi.
Kami akan membincangkan bagaimana model ini dengan cekap mengklasifikasikan imej menggunakan kelas yang diramalkan pra-terlatih kepada imej pengelas dengan kedalaman.
Jadual Kandungan Prinsip kerja mobilenet covulation standard
Bagaimanakah kerja konvolusi kedalaman dan pointwise?
Jadi, perbezaan di sini ialah dengan mendalam menggunakan hanya satu penapis, tugas pendaraban dikurangkan, yang bermaksud output mempunyai bilangan saluran yang sama seperti input. Ini membawa kepada konvolusi pointwise.
tbe pointwise convolution menggunakan penapis 1 × 1 yang menggabungkan atau mengembangkan ciri -ciri. Ini membantu model untuk mempelajari corak yang berbeza di ciri -ciri saluran untuk membuat peta ciri baru. Ini membolehkan konvolusi pointwise meningkatkan atau mengurangkan bilangan saluran dalam peta ciri output.
Mobilenet Architecure
Mekanisme ini membawa pengurangan jumlah parameter dan latensi untuk memenuhi kekangan sumber. Senibina membolehkan kecekapan dan ketepatan dalam output model.
Versi kedua model ini (MobileneTv2) dibina dengan peningkatan. Mobilenet v2 memperkenalkan jenis blok bangunan khas yang disebut sisa terbalik dengan kesesakan. Blok ini membantu mengurangkan bilangan saluran yang diproses, menjadikan model lebih cekap. Ia juga termasuk pintasan antara lapisan kesesakan untuk meningkatkan aliran maklumat. Daripada menggunakan fungsi pengaktifan standard (RELU) di lapisan terakhir, ia menggunakan pengaktifan linear, yang berfungsi lebih baik kerana data mempunyai saiz spatial yang lebih rendah pada peringkat itu.
bagaimana untuk menjalankan model ini?
mengimport perpustakaan yang diperlukan untuk klasifikasi imej
from transformers import AutoImageProcessor, AutoModelForImageClassification from PIL import Image import requests
image = Image.open('/content/imagef-ishfromunsplash-ezgif.com-webp-to-jpg-converter.jpg')
Fungsi 'image.open' digunakan dari perpustakaan PIL untuk memuatkan imej dari laluan fail, yang, dalam kes ini, telah dimuat naik dari peranti tempatan kami. Alternatif lain adalah untuk mengambil imej menggunakan urlnya.
preprocessor = AutoImageProcessor.from_pretrained("google/mobilenet_v2_1.0_224") model = AutoModelForImageClassification.from_pretrained("google/mobilenet_v2_1.0_224")
inputs = preprocessor(images=image, return_tensors="pt") outputs = model(**inputs) logits = outputs.logits
# model predicts one of the 1000 ImageNet classes predicted_class_idx = logits.argmax(-1).item() print("Predicted class:", model.config.id2label[predicted_class_idx])
inilah output:
Berikut adalah pautan ke fail colab.
Aplikasi model ini
Semasa pandemik Covid, mobilenet digunakan untuk mengkategorikan x-ray dada menjadi tiga: normal, covid, dan pneumonia virus. Hasilnya juga datang dengan ketepatan yang sangat tinggi.
Mobilenet adalah hasil daripada masterclass oleh penyelidik Google dalam membawa model dengan kos pengiraan yang tinggi ke peranti mudah alih tanpa mengganggu kecekapan mereka. Model ini dibina di atas seni bina yang membolehkan penciptaan klasifikasi imej dan pengesanan hanya dari aplikasi mudah alih. Kes penggunaan dalam penjagaan kesihatan dan pertanian adalah bukti kapasiti model ini.
Terdapat beberapa perkara bercakap tentang bagaimana model ini berfungsi, dari seni bina ke aplikasi. Berikut adalah beberapa kemuncak artikel ini:
Media yang ditunjukkan dalam artikel ini tidak dimiliki oleh Analytics Vidhya dan digunakan pada budi bicara penulis.
Ans. MobileneTv2 menggunakan konvolusi yang boleh dipisahkan dan sisa terbalik, menjadikannya lebih cekap untuk sistem mudah alih dan tertanam berbanding dengan CNN tradisional.
Q2. Bolehkah MobileNeTv2 digunakan untuk aplikasi masa nyata?ans. MobileNeTv2 dioptimumkan untuk tugas-tugas klasifikasi imej latensi rendah dan masa nyata, menjadikannya sesuai untuk peranti mudah alih dan kelebihan.
Q3. Betapa tepatnya MobileNeTv2 berbanding dengan model yang lebih besar?ans. Walaupun MobileNeTv2 dioptimumkan untuk kecekapan, ia mengekalkan ketepatan yang tinggi dekat dengan model yang lebih besar, menjadikannya pilihan yang kuat untuk aplikasi AI mudah alih.
Q4. Betapa tepatnya MobileNeTv2 berbanding dengan model yang lebih besar?Ans. Walaupun MobileneTv2 dioptimumkan untuk kecekapan, ia mengekalkan ketepatan yang tinggi dekat dengan model yang lebih besar, menjadikannya pilihan yang kuat untuk aplikasi AI mudah alih.
Atas ialah kandungan terperinci Bagaimana cara melakukan klasifikasi imej dengan model MobileNeTv2?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!