2022 pasti boleh dikatakan sebagai tahun pertama AIGC Berdasarkan arah aliran carian Google, jumlah carian untuk lukisan AI dan seni yang dihasilkan oleh AI akan meningkat pada tahun 2022.
Sebab yang sangat penting bagi letupan lukisan AI tahun ini ialah sumber terbuka Stable Diffusion, yang juga tidak dapat dipisahkan daripada Model Difusi dalam tahun kebelakangan ini, perkembangan pesat model resapan dalam beberapa tahun kebelakangan ini, digabungkan dengan model bahasa teks OPENAI yang telah dibangunkan GPT-3, menjadikan proses penjanaan daripada teks kepada imej lebih mudah.
Sejak kelahirannya pada 2014 hingga StyleGAN pada 2018, GAN telah mencapai kemajuan besar dalam bidang penjanaan imej. Sama seperti pemangsa dan mangsa dalam alam semula jadi bersaing dan berkembang bersama, prinsip GAN hanyalah menggunakan dua rangkaian saraf: satu sebagai penjana dan satu sebagai diskriminator Penjana menjana imej yang berbeza untuk menilai sama ada hasilnya atau tidak, kedua-duanya bersaing antara satu sama lain untuk melatih model.
GAN (Generative Adversarial Network) telah mencapai keputusan yang baik melalui pembangunan berterusan, tetapi terdapat beberapa masalah yang sentiasa sukar diatasi: kekurangan kepelbagaian dalam hasil yang dijana , Mod runtuh (penjana berhenti membuat kemajuan selepas mencari mod terbaik), dan kesukaran latihan yang tinggi. Kesukaran ini telah menyukarkan seni yang dijana AI untuk menghasilkan produk praktikal.
Selepas bertahun-tahun tempoh kesesakan GAN, saintis menghasilkan kaedah Model Resapan yang sangat ajaib untuk melatih model: Imej asal menggunakan rantai Markov secara berterusan tambah titik hingar padanya, dan akhirnya menjadi imej hingar rawak Kemudian rangkaian saraf latihan dibenarkan untuk membalikkan proses ini dan secara beransur-ansur memulihkan imej hingar rawak kepada imej asal Dengan cara ini, rangkaian saraf boleh Ia dikatakan keupayaan untuk menghasilkan imej dari awal. Untuk menjana imej daripada teks, teks penerangan diproses dan ditambah sebagai bunyi pada imej asal Ini membolehkan rangkaian saraf menjana imej daripada teks.
Model Penyebaran menjadikan latihan model lebih mudah Ia hanya memerlukan sejumlah besar gambar, dan kualiti imej yang dijana juga boleh dipertingkatkan. Mencapai tahap yang sangat tinggi, dan menjana kepelbagaian hasil yang hebat, inilah sebabnya generasi baharu AI boleh mempunyai "imaginasi" yang sukar dipercayai.
Sudah tentu, teknologi telah membuat penemuan baru Versi StyleGAN-T yang dipertingkatkan yang dilancarkan oleh NVIDIA pada penghujung Januari telah mencapai kemajuan yang menakjubkan kuasa. 3 saat, StyleGAN-T hanya mengambil masa 0.1 saat. Dan StyleGAN-T adalah lebih baik daripada Model Resapan dalam imej resolusi rendah, tetapi dalam penjanaan imej resolusi tinggi, Model Resapan masih mendominasi. Memandangkan StyleGAN-T tidak digunakan secara meluas seperti Stable Diffusion, artikel ini terutamanya memperkenalkan Stable Diffusion.
Awal tahun ini, AI painting circle mengalami era Disco Diffusion, DALL-E2, dan Midjouney sehingga Stable Diffusion adalah sumber terbuka ia memasuki satu tempoh masa. Debu telah diselesaikan Sebagai model lukisan AI yang paling berkuasa, Stable Diffusion telah menyebabkan karnival dalam komuniti AI Pada asasnya, model baharu dan perpustakaan sumber terbuka baru dilahirkan. Terutama selepas pelancaran versi WebUI Auto1111, menggunakan Stable Diffusion telah menjadi perkara yang sangat mudah sama ada digunakan dalam awan atau tempatan Dengan pembangunan berterusan komuniti, banyak projek yang sangat baik, seperti Dreambooth dan deforum, telah menjadi Stabil. Pemalam untuk versi Diffusion WEBUI telah ditambah, membolehkan fungsi seperti model penalaan halus dan penjanaan animasi diselesaikan dalam sehenti.
Berikut ialah pengenalan kepada permainan dan keupayaan yang tersedia pada masa ini menggunakan Stable. Resapan
Pengenalan kepada keupayaan Resapan Stabil (gambar berikut dikeluarkan menggunakan Model SD1.5) | |||
Pengenalan |
Input |
Output |
|
text2img |
Jana imej melalui penerangan teks dan anda boleh menentukan gaya artis dan jenis seni melalui penerangan teks. Berikut adalah contoh dalam gaya artis Greg Rutkowski. |
seorang gadis cantik dengan kemeja berbunga bergambar untuk gambar dengan dagu diletakkan di tangan kanannya, oleh Greg Rutkowski |
|
img2img |
Jana gambar daripada gambar dan huraian teks |
seorang gadis cantik dengan baju bunga bergambar untuk gambar dengan dagu diletakkan di tangan kanannya, oleh Greg Rutkowski |
|
melukis | Berdasarkan img2img, Dengan menetapkan topeng, hanya kawasan dalam topeng dilukis, yang biasanya digunakan untuk mengubah suai kata kunci untuk memperhalusi skrin. | seorang gadis cantik berbaju bunga tersenyum lembut sambil bergambar dengan dagu disandarkan di tangan kanannya, oleh Greg Rutkowski
|
|
Menggunakan DreamBooth berasaskan Model SD melatih model besar yang diperhalusi Selepas latihan, model boleh menggunakan text2img img2img yang disebutkan di atas dan keupayaan lain | |||
NovelAI text2img | Model gaya animasi dua dimensi berprestasi terbaik pada masa ini dilatih oleh NAI berdasarkan imej awam daripada tapak web danbooru sebagai set data, disebabkan isu hak cipta pada danbooru sendiri, NovelAI sentiasa menjadi kontroversi, dan Model ini dibocorkan daripada perkhidmatan komersial dan harus digunakan dengan berhati-hati. | seorang gadis cantik berbaju bunga bergambar untuk gambar sambil dagu diletakkan di tangan kanannya |
|
NovelAI img2img |
Gunakan model NovelAI untuk img2img. Lukisan AI Yijian, yang kini sangat popular dalam pelbagai komuniti, juga menggunakan keupayaan ini. Tetapi Yiyi menyebut dalam penafian bahawa model animasi mereka telah dilatih pada set data yang mereka kumpulkan. *Penerangan teks contoh di sebelah kanan adalah berdasarkan kandungan imej dan inferens AI Gaya artis adalah rawak |
seorang gadis cantik dengan baju bunga. bergambar dengan dagu diletakkan di tangan kanannya AI Painting |
|
Model subjek dilatih berdasarkan foto pengguna | Latih model khusus subjek berdasarkan beberapa foto yang disediakan oleh pengguna Model ini boleh digunakan untuk menjana sebarang gambar yang mengandungi subjek berdasarkan penerangan. |
Set gambar ini menggunakan 20 foto rakan sekerja untuk melatih model 2000 langkah berdasarkan model Stable Diffusion 1.5, dengan beberapa output segera yang digayakan. contoh segera (Rajah 1): potret alicepoizon, potret vfx yang sangat terperinci, enjin tidak sebenar, greg rutkowski, loish, rhads, caspar david friedrich, makoto shinkai dan lois van baarle, ilya kuvshinov, rossdraws, elegent, tom bagshaw, alphonse mucha, pencahayaan global, persekitaran yang terperinci dan rumit *alicepoizon ialah nama yang diberikan kepada watak ini semasa melatih model ini |
|
Model gaya yang dilatih berdasarkan jenis gaya yang sama | Menggunakan set gambar gaya yang sama untuk melatih model besar yang ditala halus, yang boleh digunakan untuk menjana gambar dengan gaya bersatu . | Set gambar ini dijana menggunakan model gaya yang diperhalusi melalui latihan dengan Dewu Digital Collection ME.X. seorang gadis cantik berbaju bunga |
|
|
|||
> |
|||
Scarlett Johansson |
|
|
Pengenalan |
Sampel |
Meitu, Douyin, 6pen, Italian The AI perkhidmatan mengecat yang disediakan oleh syarikat seperti |
menyediakan pengalaman melukis AI yang lebih mudah, dan anda boleh menggunakan banyak model besar tersuai dengan gaya berbeza. |
|
midjouney dan DallE 2 |
Dua perkhidmatan mengecat AI komersial. midjouney mempunyai model uniknya sendiri dengan tahap pengeluaran yang tinggi; DallE 2 menyediakan perkhidmatan API berbayar dan mempunyai kesan penjanaan berkualiti tinggi. |
|
Lensa, Manjing, dll. menyediakan perkhidmatan latihan model peribadi |
menyediakan perkhidmatan Dreambooth + Stable Diffusion sebelumnya, kira-kira 18-25 yuan setiap kali, muat naik 15-20 gambar Foto pengguna, menjana kira-kira 20 foto artistik tersuai. |
|
AI Open Source Community Huggingface |
//m.sbmmt.com/link/81d7118d88d5570189ace943bd14f142 Komuniti sumber terbuka AI arus perdana, serupa dengan github sumber terbuka mempunyai sebilangan besar model berasaskan Resapan Stabil yang diperhalusi (ditala halus) Pengguna sendiri boleh dimuat turun dan digunakan ke pelayan atau komputer tempatan mereka sendiri. Sebagai contoh, model pix2pix di sebelah kanan ialah model Stable Diffusion yang digabungkan dengan GPT3, yang boleh melengkapkan fungsi inpainting yang dinyatakan di atas melalui penerangan bahasa semula jadi. |
|
Di sini dibina menggunakan kuasa pengkomputeran awan yang disediakan oleh AutoDL, anda boleh juga menggunakan Platform lain seperti Google Colab atau Baidu Feipiao, dsb.
Jalankan. arahan berikut untuk memulakan Hanya berkhidmat. Jika anda menghadapi ruang cakera sistem yang tidak mencukupi, anda juga boleh mengalihkan folder stable-diffusion-webui/ ke cakera data dan mulakan semula autodl-tmp. Jika anda menghadapi kegagalan permulaan, anda boleh mengkonfigurasi pecutan sumber akademik mengikut lokasi mesin anda.
cd stable-diffusion-webui/ rm -rf outputs && ln -s /root/autodl-tmp outputs python launch.py --disable-safe-unpickle --port=6006 --deepdanbooru
6.2 本地版本
Jika anda mempunyai komputer dengan kad grafik yang bagus, anda boleh menggunakan ia secara setempat Berikut ialah pengenalan untuk membina versi Windows:
Artikel ini memperkenalkan beberapa maklumat yang berkaitan tentang lukisan AI juga boleh menggunakan perkhidmatan itu sendiri dan cuba belajar menggunakan DreamBooth atau lagu terbaru Lora. model besar. Saya percaya bahawa pada tahun 2023, apabila populariti AIGC terus meningkat, kerja dan kehidupan kita akan banyak diubah oleh AI. Pelancaran ChatGPT suatu ketika dahulu memberikan kami kejutan yang besar Sama seperti keupayaan untuk mencari maklumat apabila kami mula-mula memasuki Internet, belajar menggunakan AI untuk membantu kerja kami juga akan menjadi keupayaan yang sangat penting pada masa hadapan.
https://sspai. com/ post/76277
https://blog.csdn.net/ qq_45848817/article/details/127808815
https://theaisummer.com/diffusion-models/
Gambaran keseluruhan struktur GAN pengenalan ajaib kepada seni AIAtas ialah kandungan terperinci Cara bermain lukisan AI, yang sangat popular tahun ini. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!