Set Data untuk Penglihatan Komputer (2)

DDD
Lepaskan: 2024-11-24 13:55:14
asal
355 orang telah melayarinya

Beli Saya Kopi☕

*Siaran saya menerangkan MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji dan Moving MNIST.

(1) Fesyen-MNIST(2017):

  • mempunyai 70,000 imej fesyen setiap satu disambungkan ke label daripada 10 kelas dengan 10 kelas: *Memo:
    • 60,000 untuk kereta api dan 10,000 untuk ujian.
    • Setiap imej ialah 28x28 piksel.
  • ialah FashionMNIST() dalam PyTorch.

Datasets for Computer Vision (2)

(2) Caltech 101(2003):

  • mempunyai 8,677 imej objek setiap satu disambungkan ke label daripada 101 kategori(kelas). *Setiap imej adalah kira-kira 300x200 piksel.
  • ialah Caltech101() dalam PyTorch.

Datasets for Computer Vision (2)

(3) Caltech 256(2007):

  • mempunyai 30,607 imej objek yang disambungkan kepada label daripada 257 kategori(kelas). *Sebenarnya, ia mempunyai 257 kategori(kelas) berbanding nama Caltech 256.
  • ialah Caltech256() dalam PyTorch.

Datasets for Computer Vision (2)

Datasets for Computer Vision (2)

(4) CelebA(Atribut CelebFaces Berskala Besar)(2015):

  • mempunyai 202,599 imej wajah selebriti setiap satu disambungkan kepada 40 atribut: *Memo:
    • 162,770 untuk kereta api, 19,867 untuk pengesahan dan 19,962 untuk ujian.
    • Muat turun terus dari Google Drive adalah disyorkan kerana memuat turunnya dengan API Google Drive daripada Google Drive adalah terlalu sesak.
  • ialah CelebA() dalam PyTorch.

Datasets for Computer Vision (2)

(5) CIFAR-10(Canadian Institute For Advanced Research-10)(2009):

  • mempunyai 60,000 imej kenderaan dan haiwan setiap satu disambungkan ke label daripada 10 kelas: *Memo:
    • 50,000 untuk kereta api dan 10,000 untuk ujian.
    • Setiap imej ialah 32x32 piksel.
  • ialah CIFAR10() dalam PyTorch.

Datasets for Computer Vision (2)

(6) CIFAR-100(Institut Kanada Untuk Penyelidikan Lanjutan-100)(2009):

  • mempunyai 60,000 imej objek setiap satu disambungkan ke label daripada 100 kelas: *Memo:
    • 50,000 untuk kereta api dan 10,000 untuk ujian.
    • Setiap imej ialah 32x32 piksel.
  • ialah CIFAR100() dalam PyTorch.

Datasets for Computer Vision (2)

Atas ialah kandungan terperinci Set Data untuk Penglihatan Komputer (2). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan