Comment jouer à la peinture IA, très populaire cette année-IA-php.cn

1. Avant-propos

2022 peut certainement être considéré comme la première année de l'AIGC. À en juger par les tendances de recherche sur Google, le volume de recherche pour la peinture IA et l'art généré par l'IA augmentera en 2022.

Comment jouer à la peinture IA, très populaire cette année

Une raison très importante de l'explosion de la peinture IA cette année est l'open source de Stable Diffusion, qui est également indissociable du développement rapide du modèle de diffusion ces dernières années, combiné avec OPENAI Le langage de texte déjà développé le modèle GPT-3 facilite le processus de génération du texte aux images.

2. Le goulot d'étranglement du GAN (Generative Adversarial Network)

De sa naissance en 2014 à StyleGAN en 2018, le GAN a fait de grands progrès dans le domaine de la génération d'images. Tout comme les prédateurs et les proies dans la nature rivalisent et évoluent ensemble, le principe du GAN est simplement d'utiliser deux réseaux de neurones : un comme générateur et un comme discriminateur. Le générateur génère différentes images pour que le discriminateur puisse juger si le résultat est qualifié. ou non, les deux s'affrontent pour entraîner le modèle.

Comment jouer à la peinture IA, très populaire cette année

GAN (Generative Adversarial Network) a obtenu de bons résultats grâce à un développement continu, mais il y a certains problèmes qui sont toujours difficiles à surmonter : manque de diversité dans les résultats générés, effondrement du mode (le générateur ne fonctionne pas après avoir trouvé le meilleur mode) Encore mieux), l'entraînement est difficile. Ces difficultés ont rendu difficile la production de produits pratiques par l’art généré par l’IA.

3. Percée du modèle de diffusion

Après des années de goulots d'étranglement dans le GAN, les scientifiques ont mis au point une méthode de modèle de diffusion très magique pour entraîner le modèle : utiliser des chaînes de Markov pour combiner les images originales qui y sont continuellement ajoutées, et finalement, cela devient une image de bruit aléatoire, puis le réseau neuronal d'entraînement est autorisé à inverser ce processus et à restaurer progressivement l'image de bruit aléatoire à l'image d'origine. De cette manière, le réseau neuronal peut générer une image à partir de zéro. Pour générer des images à partir du texte, le texte de description est traité et ajouté sous forme de bruit à l'image d'origine. Cela permet au réseau neuronal de générer des images à partir du texte.

Comment jouer à la peinture IA, très populaire cette année

Le modèle de diffusion (modèle de diffusion) facilite la formation du modèle. Il ne nécessite qu'un grand nombre d'images. La qualité des images générées peut également atteindre un niveau très élevé et les résultats générés peuvent être excellents. La diversité est la raison pour laquelle la nouvelle génération d’IA peut avoir une « imagination » incroyable.

Bien sûr, la technologie a fait des percées. La version améliorée de StyleGAN-T lancée par NVIDIA fin janvier a fait des progrès incroyables par rapport à Stable Diffusion, il faut 3 secondes pour générer une image avec la même puissance de calcul. StyleGAN -T ne prend que 0,1 seconde. Et StyleGAN-T est meilleur que le modèle de diffusion dans les images basse résolution, mais dans la génération d'images haute résolution, le modèle de diffusion domine toujours. Étant donné que StyleGAN-T n'est pas aussi largement utilisé que Stable Diffusion, cet article se concentrera sur l'introduction de Stable Diffusion.

4. Stable Diffusion

Plus tôt cette année, le cercle de la peinture IA a connu une ère de combats entre Disco Diffusion, DALL-E2 et Midjouney. Ce n'est que lorsque Stable Diffusion est devenu open source que la poussière est retombée. une période de temps. En tant que modèle de peinture IA le plus puissant, Stable Diffusion, a provoqué un carnaval dans la communauté IA. Fondamentalement, de nouveaux modèles et de nouvelles bibliothèques open source naissent chaque jour. Surtout après le lancement de la version WebUI d'Auto1111, utiliser Stable Diffusion est devenu très simple, qu'il soit déployé dans le cloud ou localement. Avec le développement continu de la communauté, de nombreux excellents projets, tels que Dreambooth et deforum, sont devenus Stable. Un plug-in pour la version Diffusion WEBUI a été ajouté, permettant de réaliser en un seul arrêt des fonctions telles que la mise au point de modèles et la génération d'animations. 5. Introduction au gameplay et aux capacités de peinture de l'IA introduction (les images suivantes sont utilisées) Sortie du modèle SD1.5)

Comment jouer à la peinture IA, très populaire cette année

Introduction

Input

Output

text2img

Générez des images via une description textuelle, et vous pouvez spécifier le style de l'artiste et le type d'art via une description textuelle. Voici un exemple dans le style de l’artiste Greg Rutkowski.

une belle fille avec une chemise à fleurs posant pour une photo avec son menton posé sur sa main droite, par Greg Rutkowski

Comment jouer à la peinture IA, très populaire cette année

img2img

Générez des images à partir d'images et de descriptions de texte

une belle fille avec une chemise à fleurs posant pour une photo avec son menton posé sur sa main droite, par Greg Rutkash

Comment jouer à la peinture IA, très populaire cette année

inpainting

Basé sur img2img, en définissant le masque, seul le une zone à l'intérieur du masque est dessinée, ce qui est généralement utilisé pour modifier des mots-clés afin d'affiner l'image.

une belle fille avec une chemise fleurie souriant doucement posant pour une photo avec son menton posé sur sa main droite, par Greg Rutkowski

Comment jouer à la peinture IA, très populaire cette année

utilisation DreamBooth est un grand modèle affiné basé sur la formation du modèle SD. Après la formation, le modèle peut utiliser le text2img img2img mentionné ci-dessus et d'autres capacités

NovelAI

text2img

La meilleure animation bidimensionnelle. À l'heure actuelle, NAI est formé sur la base d'images publiques du site Web de Danbooru en tant qu'ensemble de données. Cependant, en raison de problèmes de droits d'auteur sur Danbooru lui-même, NovelAI a été relativement controversé et le modèle a été divulgué par des services commerciaux, alors utilisez-le. avec prudence.

une belle fille avec une chemise à fleurs posant pour une photo avec son menton posé sur sa main droite

Comment jouer à la peinture IA, très populaire cette année

NovelAI

img2img

Utilisez le modèle de NovelAI pour img2img. La peinture Yijian AI, qui est actuellement très populaire dans diverses communautés, utilise également cette capacité. Mais Yiyi a mentionné dans la clause de non-responsabilité que leur modèle d'animation avait été formé sur l'ensemble de données collectées.

*La description textuelle de l'exemple de droite est basée sur le contenu de l'image et l'inférence de l'IA. Le style de l'artiste est aléatoire

une belle fille avec une chemise à fleurs posant pour une photo avec son menton posé sur sa main droite.

Comment jouer à la peinture IA, très populaire cette année

AI Peinture

Comment jouer à la peinture IA, très populaire cette année

Modèle de sujet formé sur la base des photos des utilisateurs

Formez un modèle pour le sujet basé sur plusieurs photos fournies par l'utilisateur. Ce modèle peut être utilisé pour générer n'importe quelle image contenant le sujet en fonction de la description.

Cet ensemble d'images utilise 20 photos de collègues pour former un modèle 2000 step-out basé sur le modèle Stable Diffusion 1.5, avec plusieurs sorties d'invite stylisées.

exemple rapide (Figure 1) :

portrait d'Alicepoizon, portrait vfx très détaillé, moteur irréel, greg rutkowski, loish, rhads, caspar david friedrich, makoto shinkai et lois van baarle, ilya kuvshinov, rossdraws, elegent, tom bagshaw , alphonse mucha, illumination globale, environnement détaillé et complexe

*alicepoizon est le nom donné à ce personnage lors de la formation de ce modèle

Comment jouer à la peinture IA, très populaire cette année

Modèle de style formé sur la base du même type de style

Utiliser un ensemble d'images du même style pour former un grand modèle affiné, qui peut être utilisé pour générer des images de style unifié.

Cet ensemble d'images est généré à l'aide du modèle de style affiné formé par Dewu Digital Collection ME.X. une belle fille avec une chemise fleurie

Comment jouer à la peinture IA, très populaire cette année

Lionel Messi

Comment jouer à la peinture IA, très populaire cette année

Leonardo DiCaprio

Comment jouer à la peinture IA, très populaire cette année

Scarlett Johansson

Comment jouer à la peinture IA, très populaire cette année

6. Introduction aux principales applications actuelles

	Introduction	Échantillons
De belles images, Douyin, 6pen, Yijian et d'autres sociétés fournissent Le Le service de peinture AI	offre une expérience de peinture AI plus pratique et vous pouvez utiliser de nombreux grands modèles personnalisés avec différents styles.
midjouney et DallE 2	Deux commercialisations AI painting service. Midjouney possède son propre modèle unique avec un degré élevé de productisation ; DallE 2 fournit des services API payants et a des effets de génération de meilleure qualité.
Lensa, Manjing, etc. fournissent des services de formation de modèles personnels	fourni Le précédent service Dreambooth + Stable Diffusion coûte environ 18 à 25 yuans par fois. Il télécharge 15 à 20 photos d'utilisateurs et génère environ 20 photos artistiques personnalisées.
AI Communauté Open Source Huggingface	//m.sbmmt.com/link/81d7118d88d5570189ace943bd14f142 La communauté open source grand public actuelle, similaire à github, compte un grand nombre d'utilisateurs qui ont affiné (affiné) Modèles de diffusion stable, qui peuvent être téléchargés et déployés sur votre propre serveur ou ordinateur local. Par exemple, le modèle pix2pix à droite est un modèle de diffusion stable combiné à GPT3, qui peut compléter la fonction d'inpainting mentionnée ci-dessus grâce à une description en langage naturel.

7. Créez votre propre service WEBUI de diffusion stable

7.1 Cloud La version

est construite ici en utilisant la puissance de cloud computing fournie par AutoDL. Vous pouvez également utiliser d'autres plateformes telles que Google Colab ou Baidu Fei Paddle.

Enregistrez d'abord un compte sur AutoDL et louez un hébergeur cloud avec une carte graphique A5000/RTX3090. https://www.autodl.com/market/list
Créez une image sur cet hôte Pour l'image, vous pouvez sélectionner l'image de l'algorithme packagé sur www.codewithgpu.com. Ici, nous prenons l'image https://www.codewithgpu.com/i/AUTOMATIC1111/stable-diffusion-webui/Stable-Diffusion-for-NovelAI comme exemple. Sélectionnez-la et créez-la.

Comment jouer à la peinture IA, très populaire cette année

Après la création, allumez et démarrez JupiterLab,

Comment jouer à la peinture IA, très populaire cette année

exécutez la commande suivante pour démarrer le service. Si vous rencontrez un espace disque système insuffisant, vous pouvez également déplacer le dossier stable-diffusion-webui/ vers le disque de données et redémarrer autodl-tmp. Si vous rencontrez un échec de démarrage, vous pouvez configurer l'accélération des ressources académiques en fonction de l'emplacement de votre machine.

cd stable-diffusion-webui/
rm -rf outputs && ln -s /root/autodl-tmp outputs
python launch.py --disable-safe-unpickle --port=6006 --deepdanbooru

Copier après la connexion

6.2 本地版本

Copier après la connexion

Si vous disposez d'un ordinateur avec une bonne carte graphique, vous pouvez la déployer localement. Voici une introduction à la construction de la version Windows :

Vous devez d'abord installer Python 3.10.6 et ajouter des variables d'environnement à. le chemin
Installation git
Clone Stable Diffusion WEBUI code du projet local
Placez le fichier modèle dans le répertoire models/Stable-Diffusion Les modèles associés peuvent être téléchargés à partir de //m.sbmmt.com/link/81d7118d88d5570189ace943bd14f142.
Exécutez webui-user.bat, accédez au service via l'adresse IP de l'ordinateur local et le port 7860.

8. Résumé

Cet article présente des informations pertinentes sur la peinture IA. Les amis intéressés peuvent également déployer le service eux-mêmes et essayer d'apprendre à utiliser DreamBooth ou la dernière version de Lora pour affiner les grands modèles. Je crois qu'en 2023, à mesure que la popularité de l'AIGC continue d'augmenter, notre travail et notre vie apporteront d'énormes changements grâce à l'IA. Le lancement de ChatGPT il y a quelque temps nous a donné un énorme choc. Tout comme la possibilité de rechercher des informations lorsque nous sommes entrés sur Internet, apprendre à utiliser l'IA pour nous aider dans notre travail sera également une capacité très importante à l'avenir.

9. Références

Des causes aux controverses, parlons de l'IA en première année d'art génératif de l'IA

https://sspai.com/post/76277

Neural Network Study Notes 6 - Generative AI Une compréhension préliminaire du GAN et de la diffusion derrière la peinture

https://blog.csdn.net/qq_45848817/article/details/127808815

Comment fonctionnent les modèles de diffusion : les mathématiques à partir de zéro

https://theaisummer. com/diffusion-models/

Présentation de la structure du GAN en utilisant via ' s ' ' s ' à travers ‐ ‐ ‐ ‐ ‐ off

L'application virale d'avatar IA Lensa m'a déshabillé — sans mon consentement

https://www.technologyreview.com/2022/12/ 12/1064751/the-viral-ai-avatar-app-lensa-undressed-me-without-my-consent/

instruct-pix2pix

//m.sbmmt.com/link/81d7118d88d5570189ace943bd14f142timbrooks/instruct -pix2pix

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!