Légende par lots multi-GPU avec JoyCaption. JoyCaption utilise Meta-Llama-3.1–8B et google/siglip-so400m-patch14–384 ainsi qu'un réseau neuronal de sous-titrage d'images optimisé.
Lien : https://www.patreon.com/posts/110613301
Lien pour l'éditeur de sous-titres par lots : https://www.patreon.com/posts/108992085
Coder plusieurs GPU en Python, Torch et bitsandbytes était vraiment un défi.
Notre application utilise le modèle affiné de sous-titrage d'image JoyCaption.
Notre application prend également en charge le chargement de modèles bitsandbytes 4 bits, même en mode multi-GPU (9,5 Go de VRAM)
Testé sur 8x RTX A6000 (cloud) et RTX 3090 TI + RTX 3060 (mon PC)
1 clic pour installer sur Windows, RunPod et Massed Compute
Excellente qualité de sous-titres, distribue automatiquement les images dans chaque GPU, de nombreuses fonctionnalités. Vous pouvez reprendre le sous-titrage avec l'option Ignorer les images sous-titrées.
Pour plus de détails, consultez les captures d'écran
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!