PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。-AI-php.cn

ここ 2 年ほどで「テキスト生成画像の普及モデル」が非常に普及しており、DALL・E 2 と Imagen はどちらもこれに基づいて開発されたアプリケーションです。

この記事はAI New Media Qubit(公開アカウントID:QbitAI)の許可を得て転載しておりますので、転載については出典元にご連絡ください。

これは一見普通の日本のお弁当です。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

しかし、信じられますか、実際、食べ物のすべてのグリッドには P 編集が施されており、元の写真はまだ江おばさんのものです:

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

△画像を直接切り取って貼り付けると、一見偽物に見える効果が得られます

背後にいるオペレーターはPSのボスではなく、非常に単純な操作性を備えたAIです名前：コラージュディフュージョン。

小さな写真をいくつか見つけて与えるだけで、AI が独自に写真の内容を理解し、要素を非常に自然に配置します。全体像を把握する - 一見したところ、偽りはありません。

その効果は多くのネチズンを驚かせました。

一部の PS 愛好家は直接こう言いました:

これは単なる天の恵みです...Automatic1111 ですぐに利用できるようになることを願っています (Stable Diffusion ユーザーが一般的に使用するネットワーク UI も統合される予定です) PS に挿入すると、のプラグインバージョンで表示されます。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

なぜ効果がこれほど自然なのでしょうか?

実は、このAIが生成した「日本の弁当」にはいくつかのバージョンが生成されており、どれも自然で自然なものばかりです。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

なぜ複数のバージョンがあるのでしょうか?なぜこんなことを聞くかというと、ユーザーがカスタマイズすることもできるので、全体の状況をあまり荒くすることなく、さまざまな細部を微調整することができます。

「日本の弁当」以外にも優れた作品が多数あります。

たとえば、これは AI に与えられた素材です。P 絵の痕跡は明らかです:

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

これは AI がまとめた絵です。どのような P ピクチャの痕跡があるか:

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。

過去 2 年間で、「テキスト生成画像の普及モデル」は、 DALL・E 2 と Imagen は両方ともこの開発されたアプリケーションに基づいています。この拡散モデルの利点は、生成される画像が多様で高品質であることです。

しかし、textは、結局のところ、ターゲット画像に対して、せいぜい曖昧な規範的な役割しか果たせないため、ユーザーは通常、多くの時間を費やす必要があります。良好な結果を得るには、プロンプトを調整する必要があります。また、追加の制御コンポーネントと組み合わせる必要があります。

上記の日本のお弁当を例に挙げます。

ユーザーが「ご飯、枝豆、生姜、寿司が入ったお弁当」とだけ入力した場合、どのようなお弁当なのかは記述されていません。 . 食べ物がどこに置かれているか、それぞれの食べ物がどのようなものであるかの説明はありません。ただし、それを明確にする必要がある場合は、ユーザーが短いエッセイを書く必要がある場合があります...

これを考慮して、スタンフォード大学のチームは別の角度から始めることにしました。

彼らは、伝統的なアイデアを参照し、パズルを通じて最終イメージを生成することを決定し、新しい普及モデルを開発しました。

興味深いのは、率直に言って、このモデルは古典的な手法を使用して「詳しく説明された」と考えることができることです。

最初の階層化です: レイヤーベースの画像編集 UI を使用して、ソース画像を RGBA レイヤーに分解します (R、G、B はそれぞれ赤、緑、青を表します)。透明性のため)、これらのレイヤーをキャンバス上に配置し、各レイヤーをテキストプロンプトと組み合わせます。

レイヤー化により、画像内のさまざまな要素を変更できます。

これまで、レイヤー化はコンピュータグラフィックスの分野では成熟した技術でしたが、以前はレイヤー化された情報が単一の画像出力結果として使用されるのが一般的でした。

この新しい「パズル拡散モデル」では、階層情報がその後の操作の入力となります。

PS の使い方がわからなくても、AI パズル技術によりすでに偽物を本物のように見せることができます。