Ensembles de données pour la vision par ordinateur (2)

DDD
Libérer: 2024-11-24 13:55:14
original
355 Les gens l'ont consulté

Achetez-moi un café☕

*Mon article explique MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji et Moving MNIST.

(1) Mode-MNIST(2017) :

  • a les 70 000 images de mode reliées chacune à un label de 10 classes avec 10 classes : *Mémos :
    • 60 000 pour le train et 10 000 pour le test.
    • Chaque image mesure 28x28 pixels.
  • est FashionMNIST() dans PyTorch.

Datasets for Computer Vision (2)

(2) Caltech 101(2003) :

  • a les 8 677 images d'objets chacune connectée à une étiquette de 101 catégories (classes). *Chaque image mesure environ 300 x 200 pixels.
  • est Caltech101() dans PyTorch.

Datasets for Computer Vision (2)

(3) Caltech 256(2007) :

  • a les 30 607 images d'objets connectées à une étiquette de 257 catégories (classes). *En fait, il compte 257 catégories (classes) contre le nom Caltech 256.
  • est Caltech256() dans PyTorch.

Datasets for Computer Vision (2)

Datasets for Computer Vision (2)

(4) CelebA (attributs CelebFaces à grande échelle)(2015) :

  • les 202 599 images de visages de célébrités sont chacune connectées à 40 attributs : *Mémos :
    • 162 770 pour le train, 19 867 pour la validation et 19 962 pour le test.
    • Le téléchargement direct depuis Google Drive est recommandé car le téléchargement avec l'API Google Drive depuis Google Drive est trop encombré.
  • est CelebA() dans PyTorch.

Datasets for Computer Vision (2)

(5) CIFAR-10(Institut canadien de recherches avancées-10)(2009) :

  • a les 60 000 images de véhicules et d'animaux reliées chacune à une étiquette de 10 classes : *Mémos :
    • 50 000 pour le train et 10 000 pour le test.
    • Chaque image mesure 32x32 pixels.
  • est CIFAR10() dans PyTorch.

Datasets for Computer Vision (2)

(6) CIFAR-100(Institut canadien de recherches avancées-100)(2009) :

  • a les 60 000 images d'objets chacune connectée à une étiquette de 100 classes : *Mémos :
    • 50 000 pour le train et 10 000 pour le test.
    • Chaque image mesure 32x32 pixels.
  • est CIFAR100() dans PyTorch.

Datasets for Computer Vision (2)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:dev.to
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal