Rumah > Peranti teknologi > AI > Memeluk Klasifikasi Imej Wajah: Panduan Komprehensif Dengan Contoh

Memeluk Klasifikasi Imej Wajah: Panduan Komprehensif Dengan Contoh

Lisa Kudrow
Lepaskan: 2025-03-07 09:34:09
asal
155 orang telah melayarinya

memanfaatkan wajah pelukan untuk klasifikasi imej: panduan komprehensif

Klasifikasi imej, asas AI dan pembelajaran mesin, mencari aplikasi di pelbagai bidang, dari pengiktirafan wajah kepada pengimejan perubatan. Pakaian muka muncul sebagai platform yang kuat untuk tugas ini, terutamanya bagi mereka yang biasa dengan pemprosesan bahasa semulajadi (NLP) dan semakin, penglihatan komputer. Butiran panduan ini menggunakan muka pelukan untuk klasifikasi imej, memenuhi kedua -dua pemula dan pengamal yang berpengalaman.

memahami klasifikasi imej dan memeluk kelebihan wajah

Klasifikasi imej melibatkan mengkategorikan imej ke dalam kelas yang telah ditetapkan menggunakan algoritma yang menganalisis kandungan visual dan meramalkan kategori berdasarkan corak yang dipelajari. Rangkaian Neural Convolutional (CNNs) adalah pendekatan standard kerana keupayaan pengiktirafan corak mereka. Untuk menyelam yang lebih mendalam ke dalam CNN, rujuk artikel kami "Pengenalan kepada Rangkaian Neural Convolutional (CNNS)." Artikel "Klasifikasi dalam Pembelajaran Mesin: Pengenalan" kami memberikan pemahaman yang lebih luas tentang algoritma klasifikasi.

muka pelukan menawarkan beberapa kelebihan:

Hugging Face Image Classification: A Comprehensive Guide With Examples

faedah utama menggunakan muka pelukan untuk klasifikasi imej

  • kebolehcapaian: API intuitif dan dokumentasi komprehensif memenuhi semua tahap kemahiran.
  • Model pra-terlatih: Repositori yang luas model pra-terlatih membolehkan penalaan yang cekap pada dataset tersuai, meminimumkan masa latihan dan sumber pengiraan. Pengguna boleh melatih dan menggunakan model mereka sendiri.
  • Komuniti & Sokongan: Komuniti yang bersemangat menyediakan sokongan yang tidak ternilai dan bantuan penyelesaian masalah.
Pakaian muka juga memudahkan penggunaan model di seluruh platform awan utama (AWS, Azure, Google Cloud Platform) dengan pelbagai pilihan kesimpulan.

Hugging Face Image Classification: A Comprehensive Guide With Examples

pilihan penempatan model di seluruh platform awan

Penyediaan Data dan Preprocessing

Panduan ini menggunakan dataset "kacang" yang memeluk untuk demonstrasi. Selepas memuatkan, kami akan memvisualisasikan data sebelum pra -proses. Notebook Google Colab yang disertakan menyediakan kod. Kod ini diilhamkan dengan memeluk dokumentasi rasmi Face.

Keperluan Perpustakaan:

Pasang perpustakaan yang diperlukan menggunakan PIP:

Mulakan semula kernel selepas pemasangan. Import Perpustakaan yang diperlukan:
pip -q install datasets
pip -q install transformers=='4.29.0'
pip -q install tensorflow=='2.15' 
pip -q install evaluate
pip -q install --upgrade accelerate
Salin selepas log masuk
Salin selepas log masuk

import torch
import torchvision
import numpy as np
import evaluate
from datasets import load_dataset
from huggingface_hub import notebook_login
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from transformers import DefaultDataCollator
from transformers import AutoImageProcessor
from torchvision.transforms import RandomResizedCrop, Compose, Normalize, ToTensor
from transformers import AutoModelForImageClassification, TrainingArguments, Trainer
import matplotlib.pyplot as plt
Salin selepas log masuk
Salin selepas log masuk
pemuatan data dan organisasi:

Muatkan dataset:

pip -q install datasets
pip -q install transformers=='4.29.0'
pip -q install tensorflow=='2.15' 
pip -q install evaluate
pip -q install --upgrade accelerate
Salin selepas log masuk
Salin selepas log masuk

Dataset mengandungi 1034 imej, masing -masing dengan 'image_file_path', 'imej' (PIL objek), dan 'label' (0: angular_leaf_spot, 1: bean_rust, 2: sihat).

Fungsi penolong menggambarkan imej rawak:

import torch
import torchvision
import numpy as np
import evaluate
from datasets import load_dataset
from huggingface_hub import notebook_login
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from transformers import DefaultDataCollator
from transformers import AutoImageProcessor
from torchvision.transforms import RandomResizedCrop, Compose, Normalize, ToTensor
from transformers import AutoModelForImageClassification, TrainingArguments, Trainer
import matplotlib.pyplot as plt
Salin selepas log masuk
Salin selepas log masuk

Bayangkan enam imej rawak:

beans_train = load_dataset("beans", split="train")
Salin selepas log masuk

Hugging Face Image Classification: A Comprehensive Guide With Examples

Contoh gambar dari dataset kacang

preprocessing data: Pecahkan dataset (kereta api 80%, pengesahan 20%):

Buat Label Mappings:
labels_names = {0: "angular_leaf_spot", 1: "bean_rust", 2: "healthy"}

def display_random_images(dataset, num_images=4):
   # ... (function code as in original input) ...
Salin selepas log masuk

pemuatan model dan penalaan halus
display_random_images(beans_train, num_images=6)
Salin selepas log masuk

Muatkan model VIT pra-terlatih:

Kod memuatkan model pra-terlatih, mentakrifkan transformasi (saiz semula, normalisasi), dan menyediakan dataset untuk latihan. Metrik ketepatan ditakrifkan untuk penilaian.
beans_train = beans_train.train_test_split(test_size=0.2)
Salin selepas log masuk

Log masuk untuk memeluk wajah:

(ikuti arahan di skrin)
labels = beans_train["train"].features["labels"].names
label2id, id2label = dict(), dict()
for i, label in enumerate(labels):
   label2id[label] = str(i)
   id2label[str(i)] = label
Salin selepas log masuk

Konfigurasikan dan memulakan latihan:

(hasil latihan seperti yang ditunjukkan dalam input asal)
checkpoint = "google/vit-base-patch16-224-in21k"
image_processor = AutoImageProcessor.from_pretrained(checkpoint)
# ... (rest of the preprocessing code as in original input) ...
Salin selepas log masuk

penggunaan model dan integrasi

Tolak model terlatih ke hab muka yang memeluk:

Model ini kemudiannya boleh diakses dan digunakan melalui:
notebook_login()
Salin selepas log masuk

    portal muka memeluk:
  1. secara langsung memuat naik imej untuk ramalan.
  2. Perpustakaan Transformers:
  3. Gunakan model dalam kod python anda.
  4. REST API:
  5. Gunakan titik akhir API yang disediakan untuk ramalan. Contoh Menggunakan API:
kesimpulan dan sumber selanjutnya
training_args = TrainingArguments(
    # ... (training arguments as in original input) ...
)

trainer = Trainer(
    # ... (trainer configuration as in original input) ...
)

trainer.train()
Salin selepas log masuk

Panduan ini menyediakan klasifikasi imej yang komprehensif menggunakan wajah pelukan. Sumber pembelajaran lebih lanjut termasuk:

"Pengenalan Menggunakan Transformers dan Hugging Face"
  • "Pemprosesan Imej dengan Python" Track Skill
  • "Apakah pengiktirafan imej?" Artikel
  • Panduan ini memberi kuasa kepada pengguna semua peringkat untuk memanfaatkan wajah pelukan untuk projek klasifikasi imej mereka.

Atas ialah kandungan terperinci Memeluk Klasifikasi Imej Wajah: Panduan Komprehensif Dengan Contoh. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan