データ拡張用の 10 の Python ライブラリ

WBOY
リリース: 2023-10-07 16:57:03
転載
1093 人が閲覧しました

データ拡張は、人工知能と機械学習の分野における重要なテクノロジーです。これには、モデルのパフォーマンスと一般化を向上させるために、既存のデータセットにバリエーションを作成することが含まれます。 Python は、いくつかの強力なデータ拡張ライブラリを提供する人気の AI および ML 言語です。この記事では、データ拡張用の Python ライブラリを 10 個紹介し、各ライブラリのコード スニペットと説明を提供します。

データ拡張用の 10 の Python ライブラリ

#Augmentor

##Augmentor は、画像強化のための汎用 Python ライブラリです。回転、反転、色の操作など、さまざまな操作を画像に簡単に適用できます。画像強化に Augmentor を使用する方法の簡単な例を次に示します。

import Augmentor  p = Augmentor.Pipeline("path/to/your/images") p.rotate(probability=0.7, max_left_rotatinotallow=25, max_right_rotatinotallow=25) p.flip_left_right(probability=0.5) p.sample(100)
ログイン後にコピー

Albumentations

Albumentations Master は、ランダムな回転などのさまざまな強化機能をサポートしています。 、フリップと明るさの調整。彼は、私が最もよく使用する拡張ライブラリの 1 つです。

import albumentations as A  transform = A.Compose([A.RandomRotate90(),A.HorizontalFlip(),A.RandomBrightnessContrast(), ]) augmented_image = transform(image=image)["image"]
ログイン後にコピー

Imgaug

##Imgaug は、画像やビデオを拡張するためのライブラリです。幾何学的変換や色空間の変更など、幅広い拡張機能を提供します。 Imgaug を使用した例を次に示します。

import imgaug.augmenters as iaa  augmenter = iaa.Sequential([iaa.Fliplr(0.5),iaa.Sometimes(0.5, iaa.GaussianBlur(sigma=(0, 2.0))),iaa.ContrastNormalization((0.5, 2.0)), ]) augmented_image = augmenter.augment_image(image)
ログイン後にコピー
nlpaug

nlpaug は、テキスト データの拡張のために特別に設計されたライブラリです。同義語の置換や文字レベルの置換など、テキストのバリエーションを生成するためのさまざまな手法が提供されます。

import nlpaug.augmenter.word as naw  aug = naw.ContextualWordEmbsAug(model_path='bert-base-uncased', actinotallow="insert") augmented_text = aug.augment("This is a sample text.")
ログイン後にコピー
imgaugment

imgauge は、画像の強化に焦点を当てた軽量のライブラリです。使いやすく、回転、反転、色調整などの操作が可能です。

from imgaug import augmenters as iaa  seq = iaa.Sequential([iaa.Fliplr(0.5),iaa.Sometimes(0.5, iaa.GaussianBlur(sigma=(0, 2.0))),iaa.ContrastNormalization((0.5, 2.0)), ]) augmented_image = seq(image=image)
ログイン後にコピー
Text Attack

Text Attack は、自然言語処理 (NLP) モデルを強化および攻撃するための Python ライブラリです。 NLP タスクの敵対的な例を生成するためのさまざまな変換が提供されます。使用方法は次のとおりです。

from textattack.augmentation import WordNetAugmenter  augmenter = WordNetAugmenter() augmented_text = augmenter.augment("The quick brown fox")
ログイン後にコピー
TAAE

Text Augmentation and Adversarial Examples (TAAE) ライブラリは、テキスト拡張の​​ためのもう 1 つのツールです。これには、同義語の置換や文のシャッフルなどのテクニックが含まれます。

from taae import SynonymAugmenter  augmenter = SynonymAugmenter() augmented_text = augmenter.augment("This is a test sentence.")
ログイン後にコピー
Audiomentations

#Audiomentations はオーディオ データの強化に重点を置いています。サウンド処理を伴うタスクには必須のライブラリです。

import audiomentations as A  augmenter = A.Compose([A.PitchShift(),A.TimeStretch(),A.AddBackgroundNoise(), ]) augmented_audio = augmenter(samples=audio_data, sample_rate=sample_rate)
ログイン後にコピー
ImageDataAugmentor

ImageDataAugmentor は画像データの拡張用に設計されており、一般的な深層学習フレームワークとうまく連携します。これを TensorFlow で使用する方法は次のとおりです。

from ImageDataAugmentor.image_data_augmentor import * import tensorflow as tf  datagen = ImageDataAugmentor(augment=augmentor,preprocess_input=None, ) train_generator = datagen.flow_from_directory("data/train", batch_size=32, class_mode="binary")
ログイン後にコピー
Keras ImageDataGenerator

Keras は、Keras と TensorFlow Built を使用するときに使用される ImageDataGenerator クラスを提供します。 - 画像向上のためのソリューション。

from tensorflow.keras.preprocessing.image import ImageDataGenerator  datagen = ImageDataGenerator(rotation_range=40,width_shift_range=0.2,height_shift_range=0.2,shear_range=0.2,zoom_range=0.2,horizontal_flip=True,fill_mode="nearest", ) augmented_images = datagen.flow_from_directory("data/train", batch_size=32)
ログイン後にコピー
概要

これらのライブラリは、画像およびテキスト データの幅広いデータ拡張技術をカバーしています。お役に立てば幸いです。 。

以上がデータ拡張用の 10 の Python ライブラリの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート