記事特集学ぶダウンロードに質問プログラミング辞典ゲーム最近の更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO)

ホームページ > テクノロジー周辺機器 > AI > 本文

ControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセス

王林

リリース： 2024-07-17 01:56:08

オリジナル

132 人が閲覧しました

これも Tusheng のビデオですが、PaintsUndo は別の道を歩んでいます。

ControlNet 作者 Lvmin Zhang が再び仕事に戻りました!今回は絵画の分野を目指します。

新しいプロジェクト PaintsUndo は、開始直後に 1.4,000 個のスターを獲得しました (今も猛烈な勢いで増えています)。

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

プロジェクトアドレス: https://github.com/lllyasviel/Paints-UNDO

このプロジェクトを通じて、ユーザーは静止画像を入力すると、PaintsUndo はペイントプロセス全体のビデオを自動的に生成するのに役立ちます。ラインからドラフトから完成品までたどるトレースがあります。

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

描画プロセス中の線の変化は驚くべきもので、最終的なビデオ結果は元の画像と非常に似ています:

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

完全なペイントプロセスを見てみましょう。 PaintsUndo は、まず単純な線を使用してキャラクターの本体の輪郭を描き、次に背景を描画し、色を適用し、最後に元の画像に似るように微調整します。

PaintsUndo は、単一の画像スタイルに限定されず、対応するペイントプロセスビデオも生成します。

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

フードをかぶったコーギーが優しく遠くを見つめています:

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

ユーザーは単一の画像を入力して複数のビデオを出力することもできます:

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

しかし、PaintsUndoには次のような欠点もあります。複雑な構成があり、作者はこのプロジェクトはまだ改良中であると述べています。

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

PaintsUndo が非常に強力である理由は、画像を入力として受け取り、画像の描画シーケンスを出力する一連のモデルによってサポートされているためです。モデルは、スケッチ、インク入力、シェーディング、陰影付け、変形、左右反転、カラーカーブ調整、レイヤーの可視性の変更、さらには描画プロセス中の全体的なアイデアの変更を含むがこれらに限定されない、人間のさまざまな動作を再現します。。

ローカルデプロイメントプロセスは非常に簡単で、数行のコードで完了できます:

git clone https://github.com/lllyasviel/Paints-UNDO.gitcd Paints-UNDOconda create -n paints_undo python=3.10conda activate paints_undopip install xformerspip install -r requirements.txtpython gradio_app.py

ログイン後にコピー

モデルの紹介

プロジェクト作成者は、推論テストに Nvidia 4090 および 3090TI の 24 GB VRAM を使用しました。著者らは、極端な最適化 (ウェイトオフロードやアテンションスライシングを含む) を適用した場合、理論上の最小 VRAM 要件は約 10 ～ 12.5 GB になると推定しています。 PaintsUndo は、設定に応じて約 5 ～ 10 分で画像を処理すると予想され、通常は 320x512、512x320、384x448、または 448x384 の解像度で 25 秒のビデオが生成されます。

現在、プロジェクトは 2 つのモデルをリリースしています: シングルフレームモデル Paints_undo_single_frame とマルチフレームモデル Paints_undo_multi_frame です。

シングルフレームモデルはSD1.5の修正されたアーキテクチャを使用し、画像と演算ステップを入力として受け取り、画像を出力します。アート作品の作成に通常 1,000 回の手動操作が必要であると仮定すると (たとえば、1 つのストロークが 1 つの操作です)、操作ステップサイズは 0 ～ 999 の整数になります。数字の0は最終的に完成したアートワークであり、数字の999は真っ白なキャンバスに描かれた最初の一筆です。

マルチフレームモデルは、VideoCrafter シリーズのモデルに基づいていますが、オリジナルの Crafter の lvdm は使用せず、すべてのトレーニング/推論コードは完全に最初から実装されています。プロジェクトの作成者はニューラルネットワークのトポロジに多くの変更を加え、広範なトレーニングを行った結果、ニューラルネットワークはオリジナルの Crafter とは大きく異なる動作をするようになりました。

マルチフレームモデルの全体的なアーキテクチャは Crafter に似ており、3D-UNet、VAE、CLIP、CLIP-Vision、Image Projection の 5 つのコンポーネントが含まれます。

マルチフレームモデルは 2 つの画像を入力として受け取り、2 つの入力画像間の 16 の中間フレームを出力します。マルチフレームモデルは、単一フレームモデルよりも一貫した結果が得られますが、速度が大幅に低下し、「創造性」が低下し、フレーム数が 16 フレームに制限されます。

PaintsUndo はデフォルトで単一フレームモデルとマルチフレームモデルを一緒に使用します。まず、単一フレームモデルを使用して約 5 ～ 7 回推論して 5 ～ 7 個の「キーフレーム」を取得します。次に、マルチフレームモデルを使用してこれらのキーフレームを「補間」し、最後に比較的長いビデオが生成されます。

^{参考リンク：https://lllyasviel.github.io/pages/paints_undo/}

以上がControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセスの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

プロジェクト

ソース：jiqizhixin.com

前の記事：Apple App Store で偽の ChatGPT アプリを見分ける方法次の記事：Moka CTO Liu Honze: 大型モデルの時代には、組織と人材構造が新たな変化をもたらすでしょう

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

夢の世界で神のリストを破る方法

2024-07-17 03:54:17
柴犬（SHIB）の時価総額が101億8,000万ドルに回復、市場ランキングでアバランチ（AVAX）を上回る

2024-07-17 03:52:31
「Time at Portia」の放棄された部屋に入る方法

2024-07-17 03:52:05
Python エコシステムを使用した分散型金融 (DeFi) アプリケーションの構築

2024-07-17 03:43:03
GO — プロジェクト構造

2024-07-17 03:41:01
自信に満ち溢れています！ iPhone 16の在庫数量が9000万台に増加

2024-07-17 03:37:30
JueZuZero 初日にレベル 20 まで早くレベルを上げる方法 JueZuZero 初日にレベル 20 まで早くレベル上げする方法。

2024-07-17 03:36:18
三国志天下分け計画における華雄の育て方

2024-07-17 03:34:41
Plants vs. Zombies ハイブリッド版の栽培されたコーヒー豆の用途は何ですか?

2024-07-17 03:29:49
ロールブロックは市場下落の中で仮想通貨投資家にとって究極の安全な避難所として浮上

2024-07-17 03:24:29

最新の問題

モジュールが Vue プロジェクトで定義されていません公式ドキュメントで指定されているように、npmini tvue@latest を実行して、新しい Vue アプリケーションを作成しました。次に、Vue および Vite Web サ...

から 2023-11-17 12:38:53

0

2

394

Vue 3 は Props に基づいて動的にインポートします unplugin-icon を使用してアイコンコンポーネントを作成しています。通常、//scriptimportIconCopyfrom'~icons/prime/copy'//t...

から 2023-11-16 11:40:01

0

1

235

<?php //年、月、日を指定すると、その日付がその年の何日かを出力します (閏年は 4 100 400 であることに注意してください) <?php // 年、月、日を指定すると、その日付がその年の何日かを出力します (閏年は 4 100 400 であることに注意してください) //使用できる技術ルート...

から 2023-11-14 23:55:21

0

1

79

WordPress 6.0 (add_editor_style) が Gutenberg エディターで style.css を読み込まないカスタムWordPressブロックテーマを作成するためにUdemyWordPressコースを受講しています。 function.php にブロックタイプが正常に登録され、Gute...

から 2023-11-12 20:37:50

0

2

261

問題の解決方法: 「リソースをロードできません: net::ERR_CONNECTION_REFUSED http://localhost:8989/route?....」私のプログラムに問題があります。これは LeatlefJs ライブラリを使用した地理情報システムに関するプログラムで、letlef ルーター機能も使用しました。問題は、システムが本...

から 2023-11-12 19:34:27

0

1

244

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート

私たちについて免責事項 Sitemap: PHP中国語ウェブサイト：福祉オンライン PHP トレーニング，PHP 学習者の迅速な成長を支援します！