AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです-AI-php.cn

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです

WBOY

リリース： 2024-01-12 08:51:26

転載

1447 人が閲覧しました

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです

19 世紀は印象派芸術運動が栄えた時代で、絵画、彫刻、版画などの芸術の分野に影響を与えました。印象派は、形式的な正確さをほとんど追求せずに、短いスタッカートのブラシストロークを使用することを特徴とし、後に印象派の芸術スタイルに発展しました。つまり、印象派の画家の筆致は修正されておらず、明らかな特徴を示しており、形式的な正確さを追求しておらず、どこか曖昧ですらある。印象派の芸術家は、光と色の科学的な概念を絵画に導入し、伝統的な色の概念に革命をもたらしました。

D3GA では、作成者はユニークな目標を持っており、逆のことを行うことでフォトリアリスティックなパフォーマンス効果を作成したいと考えています。この目標を達成するために、著者は仮想キャラクターの構造と外観を構築し、リアルタイムで安定した効果を実現するための最新の「セグメントブラシストローク」として D3GA のガウススプラッターテクノロジーを創造的に使用しました。

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです

「日の出・印象」は印象派の有名画家モネの代表作です。

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです

アニメーション用の新しいコンテンツを生成できるリアルな人物像を作成するには、現在アバターの構築が必要です。大量の作業用マルチビューデータ。これは、単眼式の方法では精度が限られているためです。さらに、既存の技術では、正確な 3D レジストレーションを含む複雑な前処理が必要です。ただし、これらの登録データの取得には反復が必要であり、エンドツーエンドのプロセスに統合するのは困難です。さらに、正確な登録を必要とせず、神経放射野 (NeRF) に基づく方法もあります。ただし、これらの方法では、リアルタイムレンダリングが遅くなったり、衣服のアニメーションに問題が生じたりすることがよくあります。

Kerbl らは、古典的なサーフェススプラッティングレンダリング方法をベースに改良された 3D ガウススプラッティング (3DGS) と呼ばれるレンダリング方法を提案しました。神経放射線場に基づく最先端の方法と比較して、3DGS は、高精度の 3D 初期化を必要とせずに、より高速なフレームレートで高品質の画像をレンダリングできます。

ただし、3DGS はもともと静的なシーン用に設計されました。現在、動的シーンのレンダリングに使用できる、時間条件に基づいたガウススプレーティング法を提案している人もいます。この方法は、以前に観察されたものを再生することしかできないため、新しい動きやこれまでに見たことのない動きを表現するのには適していません。

著者は、駆動された神経放射線場に基づいて、3D 人間の外観と変形をモデル化し、標準化された空間に配置しますが、放射線場ではなく 3D ガウスを使用します。ガウススプラッティングでは、パフォーマンスが向上するだけでなく、カメラレイサンプリングヒューリスティックを使用する必要がなくなります。

#残りの問題は、これらのケージの変形を引き起こす信号を定義することです。ドライバー駆動のアバターにおける現在の最先端テクノロジーは、RGB-D 画像や複数のカメラなどの高密度の入力信号を必要としますが、これらの方法は、伝送帯域幅が比較的低い状況には適さない可能性があります。この研究では、著者らは、骨格関節角度や四元数形式の 3D 顔のキーポイントなど、人間のポーズに基づいたよりコンパクトな入力を使用しています。

さまざまな体型、動き、服装 (親密な服装に限定されない) をカバーする 9 つの高品質マルチビューシーケンスで個人固有のモデルをトレーニングすることで、後で次のことが可能になります。あらゆる被写体の新しい姿勢がその姿を動かします。

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルですメソッドの概要

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです ##

論文リンク: https://arxiv.org/pdf/2311.08581.pdf
プロジェクトリンク: https ://zielon.github.io/d3ga/

仮想キャラクターを動的にボリューム化する現在の方法は、変形空間から正準空間に点をマッピングするか、単に依存するかのどちらかです。フォワードマッピング。バックマッピングに基づく方法では、エラーが発生しやすいバックパスが必要であり、視点依存効果のモデル化に問題があるため、正準空間でエラーが蓄積する傾向があります。

そこで、著者はフォワードマッピングのみの方法を採用することにしました。 D3GA は 3DGS に基づいており、ニューラル表現とケージを通じて拡張され、仮想キャラクターの各動的部分の色と幾何学的形状をそれぞれモデル化します。

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです

D3GA は、3D ポーズ ϕ、顔埋め込み κ、視点 dk、および標準ケージ v (および自動的にデコードされた色特徴 hi) を使用して、最終的なレンダリングを生成します。 C￣と補助セグメンテーションは P￣をレンダリングします。左側の入力は、仮想キャラクターパーツごとに 3 つのネットワーク (ΨMLP、ΠMLP、ΓMLP) を通じて処理され、ケージ変位 Δv、ガウス変形 bi、qi、si、色/透明度 ci、oi が生成されます。

ケージ変形によって正準ガウス分布が変形された後、式 9 を介して最終画像にラスタライズされます。

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです

#実験結果

##SSIM、PSNR、および知覚指標 LPIPS の D3GA 評価他の指標についても。表 1 は、D3GA が LBS のみを使用する方式の中で PSNR と SSIM で最高のパフォーマンスを示し (つまり、フレームごとに 3D データをスキャンする必要がない)、これらの指標ですべての FFD 方式を上回り、BD に次いで 2 番目のパフォーマンスを示しています。 FFD は、トレーニング信号が貧弱でテスト画像がないにもかかわらず (DVA は 200 台のカメラすべてを使用してテストされました)。

AI研究も印象派から学べるのでしょうか？これらの本物そっくりの人々は、実際には 3D モデルです