コンピュータービジョン用のデータセット (2)-Python チュートリアル-php.cn

コンピュータービジョン用のデータセット (2)

DDD

リリース： 2024-11-24 13:55:14

オリジナル

421 人が閲覧しました

コーヒー買ってきて☕

*私の投稿では、MNIST、EMNIST、QMNIST、ETLCDB、くずし字、Moving MNIST について説明しています。

(1) ファッション-MNIST(2017):

には、10 クラスの 10 クラスのラベルにそれぞれ接続された 70,000 のファッション画像があります。 *メモ:
- 電車で 60,000、テストで 10,000。
- 各画像は 28x28 ピクセルです。
は PyTorch の FashionMNIST() です。

Datasets for Computer Vision (2)

(2) カリフォルニア工科大学 101(2003):

には、8,677 個のオブジェクト画像があり、それぞれが 101 のカテゴリ (クラス) のラベルに関連付けられています。 *各画像は約 300x200 ピクセルです。
は PyTorch の Caltech101() です。

Datasets for Computer Vision (2)

(3) カリフォルニア工科大学 256(2007):

には、257 のカテゴリ (クラス) のラベルに接続された 30,607 個のオブジェクト画像があります。 ※実際にはCaltech 256という名前に対して257のカテゴリー(クラス)があります。
は PyTorch の Caltech256() です。

Datasets for Computer Vision (2)

(4) CelebA(大規模なCelebFaces属性)(2015):

には、それぞれ 40 の属性に関連付けられた 202,599 人の有名人の顔画像があります。 *メモ:
- トレイン用に 162,770、検証用に 19,867、テスト用に 19,962 です。
- Google DriveからGoogle Drive APIでダウンロードすると混雑しすぎるため、Google Driveから直接ダウンロードすることをお勧めします。
は PyTorch の CelebA() です。

Datasets for Computer Vision (2)