ホームページ > テクノロジー周辺機器 > AI > 顔の画像分類を抱き締める:例を備えた包括的なガイド

顔の画像分類を抱き締める:例を備えた包括的なガイド

Lisa Kudrow
リリース: 2025-03-07 09:34:09
オリジナル
154 人が閲覧しました

画像分類のための抱きしめの顔を利用する:包括的なガイド

AIと機械学習の礎石である画像分類は、顔の認識から医療イメージングまで、多様な分野全体のアプリケーションを見つけます。 抱きしめる顔は、特に自然言語処理(NLP)やますますコンピュータービジョンに精通している人にとって、このタスクの強力なプラットフォームとして浮上しています。このガイドの詳細は、イメージ分類のためのハグ顔を使用して、初心者と経験豊富な開業医の両方に対応しています。

画像の分類を理解し、顔の利点を抱き締める

画像分類には、視覚コンテンツを分析し、学習パターンに基づいてカテゴリを予測するアルゴリズムを使用して、画像を事前定義されたクラスに分類することが含まれます。 畳み込みニューラルネットワーク(CNNS)は、パターン認識能力のために標準的なアプローチです。 CNNSへのより深い潜水については、記事「畳み込みニューラルネットワーク(CNNS)の紹介」を参照してください。 「機械学習の分類:はじめに」記事は、分類アルゴリズムのより広い理解を提供します。

hugging顔がいくつかの利点を提供します:

画像分類に顔を抱き締めることの重要な利点Hugging Face Image Classification: A Comprehensive Guide With Examples

アクセシビリティ:

直感的なAPIと包括的なドキュメントは、すべてのスキルレベルに対応しています。
  • 事前に訓練されたモデル:事前に訓練されたモデルの膨大なリポジトリにより、カスタムデータセットで効率的な微調整を可能にし、トレーニング時間と計算リソースを最小限に抑えます。 ユーザーは、独自のモデルをトレーニングおよび展開できます
  • コミュニティ&サポート:
  • 活気のあるコミュニティは、貴重なサポートとトラブルシューティング支援を提供します。 フェイスのハグは、さまざまな推論オプションを使用して、主要なクラウドプラットフォーム(AWS、Azure、Googleクラウドプラットフォーム)全体でモデルの展開を簡素化します。
  • クラウドプラットフォーム全体のモデルデプロイメントオプション
  • データの準備と前処理

    このガイドでは、デモンストレーションのために抱きしめる顔の「豆」データセットを使用しています。 読み込み後、前処理前にデータを視覚化します。 付随するGoogle Colabノートブックは、コードを提供します。 このコードは、Faceの公式ドキュメントを抱き締めることに触発されています

    Hugging Face Image Classification: A Comprehensive Guide With Examples ライブラリの要件:

    PIPを使用して必要なライブラリをインストールします:

    インストール後にカーネルを再起動します。 必要なライブラリをインポート:

    データの読み込みと編成:

    データセットをロードします:

pip -q install datasets
pip -q install transformers=='4.29.0'
pip -q install tensorflow=='2.15' 
pip -q install evaluate
pip -q install --upgrade accelerate
ログイン後にコピー

データセットには10​​34の画像が含まれており、それぞれに「Image_file_path」、「Image」(PIL Object)、および「ラベル」(0:Angular_Leaf_spot、1:Bean_rust、2:Healthy)が含まれています。

ヘルパー関数はランダムイメージを視覚化します:

import torch
import torchvision
import numpy as np
import evaluate
from datasets import load_dataset
from huggingface_hub import notebook_login
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from transformers import DefaultDataCollator
from transformers import AutoImageProcessor
from torchvision.transforms import RandomResizedCrop, Compose, Normalize, ToTensor
from transformers import AutoModelForImageClassification, TrainingArguments, Trainer
import matplotlib.pyplot as plt
ログイン後にコピー
6つのランダムイメージを視覚化します:

beans_train = load_dataset("beans", split="train")
ログイン後にコピー

Hugging Face Image Classification: A Comprehensive Guide With Examples

豆のデータセットからのサンプル画像

データ前処理:

データセットを分割します(80%列車、20%の検証):

labels_names = {0: "angular_leaf_spot", 1: "bean_rust", 2: "healthy"}

def display_random_images(dataset, num_images=4):
   # ... (function code as in original input) ...
ログイン後にコピー
作成ラベルマッピングの作成:

display_random_images(beans_train, num_images=6)
ログイン後にコピー
モデルの読み込みと微調整

事前に訓練されたVITモデルをロードします:

beans_train = beans_train.train_test_split(test_size=0.2)
ログイン後にコピー
コードは、事前に訓練されたモデルをロードし、変換(サイズ変更、正規化)を定義し、トレーニング用のデータセットを準備します。 精度メトリックは、評価のために定義されています

顔を抱き締めるためにログイン:

(画面上の指示に従ってください)
labels = beans_train["train"].features["labels"].names
label2id, id2label = dict(), dict()
for i, label in enumerate(labels):
   label2id[label] = str(i)
   id2label[str(i)] = label
ログイン後にコピー

トレーニングを設定して開始する:

(元の入力に示されているトレーニング結果)
checkpoint = "google/vit-base-patch16-224-in21k"
image_processor = AutoImageProcessor.from_pretrained(checkpoint)
# ... (rest of the preprocessing code as in original input) ...
ログイン後にコピー

モデルの展開と統合

訓練されたモデルを抱きしめている顔のハブに押します:

モデルにアクセスして使用できます
notebook_login()
ログイン後にコピー

フェイスポータルの抱きしめ:
    予測のために画像を直接アップロードします。
  1. トランスフォーマーライブラリ:
  2. Pythonコード内のモデルを使用します
  3. REST API:予測に提供されたAPIエンドポイントを利用します。 APIを使用した例:
  4. 結論とさらなるリソース
このガイドは、ハグする顔を使用した画像分類の包括的なウォークスルーを提供します。 さらなる学習リソースには、次のものがあります
training_args = TrainingArguments(
    # ... (training arguments as in original input) ...
)

trainer = Trainer(
    # ... (trainer configuration as in original input) ...
)

trainer.train()
ログイン後にコピー

「トランスフォーマーの使用と顔を抱き締めるための紹介」

「Pythonによる画像処理」スキルトラック

    「画像認識とは何ですか?」記事
  • このガイドは、すべてのレベルのユーザーが、画像分類プロジェクトのハグの顔を活用できるようにします。

以上が顔の画像分類を抱き締める:例を備えた包括的なガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート