目次
概要と今後の展望
ホームページ テクノロジー周辺機器 AI 神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

May 18, 2023 am 10:52 AM
ai ビジョン

超高解像度は、高品質の画像やビデオを記録および表示するための標準として多くの研究者に歓迎されています。低解像度 (1K HD フォーマット) と比較して、高解像度でキャプチャされたシーンは、通常、細部が非常に鮮明です。クリアで、ピクセル情報は小さなパッチによって増幅されます。しかし、この技術を画像処理やコンピュータビジョンに応用するにはまだ多くの課題があります。

この記事では、Alibaba の研究者が新しいビュー合成タスクに焦点を当て、4K-NeRF と呼ばれるフレームワークを提案します。その NeRF ベースのボリューム レンダリング メソッドは、高忠実度のビュー合成で実装できます。 4K超高解像度で。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

文書アドレス: https://arxiv.org/abs/2212.04701

プロジェクトのホームページ: https://github.com/frozoul/4K-NeRF

早速、最初に効果を見てみましょう (以下)ビデオはダウンサンプリングされています。元の 4K ビデオについては、元のプロジェクトを参照してください)。

方法

次に、この調査がどのように実施されたかを見てみましょう。

4K-NeRF パイプライン (以下に示すように): パッチベースのレイ サンプリング テクノロジーを使用して、低解像度で VC-Encoder (View-Consistent) (DEVO ベース) を共同トレーニングします。 - 次元の幾何学情報は空間内でエンコードされ、VC-Decoder を通過して、高周波、精細かつ高品質のレンダリングと強化されたビューの一貫性を実現します。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

この研究では、DVGO [32] で定義された式に基づいてエンコーダをインスタンス化し、学習されたボクセル グリッドベースの表現は、明示的に地理的にエンコードされたジオメトリです。 :

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

各サンプリング ポイントについて、密度推定値の三線形補間には、体積密度値を生成するためのソフトプラス アクティベーション関数が装備されています:

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

# 色は小規模な MLP を使用して推定されます:

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

このように、設定した直線 r に沿ってサンプリング点の特性を累積することで、各レイ (またはピクセル) の特性値を取得できます。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

VC エンコーダーに埋め込まれた幾何学的特性をより有効に活用するために、この研究では、サンプリングされた光線軸に沿って各光線 r の深さを推定することによって深度マップも生成しました。推定された深度マップは、上記のエンコーダーによって生成されたシーンの 3 次元構造への強力なガイドを提供します。ブロック (ノンパラメトリック正規化でもダウンサンプリング操作でもない) とインターリーブされたアップサンプリング操作を使用して構築されています。特に、この研究では、特徴 F と深度マップ M を単純に連結するのではなく、深度マップ内の深度信号を結合し、学習された変換を通じて各ブロックにそれを注入して、ブロックのアクティベーションを調整します。

従来の NeRF 手法におけるピクセル レベルのメカニズムとは異なり、この研究の手法は光線 (ピクセル) 間の空間情報を捕捉することを目的としています。したがって、NeRF でのランダムなレイ サンプリングの戦略はここでは適切ではありません。したがって、この研究では、光線特徴間の空間依存性の捕捉を容易にするパッチベースの光線サンプリング トレーニング戦略を提案します。トレーニング中に、トレーニング ビューの画像はまずサイズ N_p × N_p のパッチ p に分割され、ピクセルのサンプリング確率が均一になるようにします。画像空間の次元をパッチ サイズで正確に分割できない場合、トレーニング パッチのセットを取得するには、エッジまでパッチを切り詰める必要があります。次に、セットから 1 つ (または複数) のパッチがランダムに選択され、パッチ内のピクセルの光線が反復ごとにミニバッチを形成します。

細かい部分の視覚効果がぼやけたり平滑化しすぎたりする問題を解決するために、この研究では、敵対的損失と知覚損失を追加して、細かい部分の合成を正規化します。知覚損失神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにありますは、事前トレーニングされた 19 層 VGG ネットワークを介して、予測パッチ神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります と特徴空間内の真の値 p の間の類似性を推定します。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

##この研究では、MSE の代わりに 神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります損失を使用して、高周波の詳細の再構成を監視します。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

さらに、この研究では補助的な MSE 損失も追加されており、最終的な総損失関数の形式は次のとおりです。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります実験効果

定性分析##実験では 4K を比較します。 NeRF を他のモデルと比較すると、通常の NeRF に基づく方法では、さまざまな程度のディテールの損失とぼやけがあることがわかります。対照的に、4K-NeRF は、トレーニングの視野が限られているシーンであっても、これらの複雑で高周波のディテールの高品質でフォトリアリスティックなレンダリングを実現します。 #################################定量分析###############この研究は、Plenoxels、DVGO、JaxNeRF、MipNeRF-360、NeRF-SR などの 4k データに基づくいくつかの現在の手法と比較されます。この実験では、画像回復の評価指標を比較として使用するだけでなく、総合的な評価の参考として推論時間やキャッシュメモリも提供します。結果は次のとおりです。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります結果は、一部の指標では一部のメソッドの結果とそれほど変わりませんが、ボクセルの利点が得られます。効率とメモリ コストの両方の点で驚異的なパフォーマンスが達成され、4K 画像を 300 ミリ秒でレンダリングできます。

神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにあります

概要と今後の展望

この研究では、微細なディテールをモデリングする際の NeRF の機能を調査し、非常に高い解像度でシーン内のビューを復元する能力を強化する新しいフレームワークを提案します 微細なディテールの一貫した表現力。さらに、この研究では、幾何学的一貫性を維持し、低位空間での幾何学特性を効果的にモデル化し、幾何学を認識した特徴間の局所相関を利用してフルスケール空間でのビューを実現する、エンコーダ/デコーダ モジュールのペアも導入されています。ベースのサンプリング トレーニング フレームワークにより、パーセプトロン指向の正則化による監視を統合する方法も可能になります。この研究では、フレームワークの効果を動的シーン モデリングと、将来の方向性としてニューラル レンダリング タスクに組み込むことを望んでいます。

以上が神は複雑なオブジェクトと高周波のディテールを復元します。4K-NeRF 高忠実度のビュー合成がここにありますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

C言語でカウントダウンを出力する方法 C言語でカウントダウンを出力する方法 Apr 04, 2025 am 08:54 AM

Cのカウントダウンを出力する方法は?回答:ループステートメントを使用します。手順:1。変数nを定義し、カウントダウン数を出力に保存します。 2。whileループを使用して、nが1未満になるまでnを連続的に印刷します。 3。ループ本体で、nの値を印刷します。 4。ループの端で、n x 1を減算して、次の小さな相互に出力します。

CSSアニメーションで画像シーケンスをスムーズに再生する方法は? CSSアニメーションで画像シーケンスをスムーズに再生する方法は? Apr 04, 2025 pm 05:57 PM

ビデオのような写真の再生を実現する方法は?多くの場合、同様のビデオプレーヤー関数を実装する必要がありますが、再生コンテンツは一連の画像です。直接...

Zustand非同期操作:UseStoreが取得した最新の状態を確保する方法は? Zustand非同期操作:UseStoreが取得した最新の状態を確保する方法は? Apr 04, 2025 pm 02:09 PM

Zustand非同期操作のデータの更新問題。 Zustand State Management Libraryを使用する場合、非同期操作を不当にするデータ更新の問題に遭遇することがよくあります。 �...

クイル編集者にテキスト注釈のネスト効果を実装する方法は? クイル編集者にテキスト注釈のネスト効果を実装する方法は? Apr 04, 2025 pm 05:21 PM

クイル編集者にネストされるテキスト注釈を実装するソリューション。 Text AnnotationにQuill編集者を使用する場合、Quill編集者を使用する必要があることがよくあります。

電子レンダリングプロセスとWebView:効率的な「同期」通信を実現する方法は? 電子レンダリングプロセスとWebView:効率的な「同期」通信を実現する方法は? Apr 04, 2025 am 11:45 AM

電子レンダリングプロセスとウェブビュー...

AIツールを使用して、React Viteプロジェクトでフォアグラウンドページをすばやく構築するにはどうすればよいですか? AIツールを使用して、React Viteプロジェクトでフォアグラウンドページをすばやく構築するにはどうすればよいですか? Apr 04, 2025 pm 01:45 PM

バックエンド開発でフロントエンドページをすばやく構築する方法は? 3年または4年の経験を持つバックエンド開発者として、彼は基本的なJavaScript、CSS、HTMLを習得しました...

CSSを使用して、画像シーケンスのスムーズな再生効果を実現する方法は? CSSを使用して、画像シーケンスのスムーズな再生効果を実現する方法は? Apr 04, 2025 pm 04:57 PM

ビデオのような写真を再生する機能を実現する方法は?多くの場合、アプリケーションで同様のビデオ再生効果を達成する必要がありますが、再生コンテンツは...

高い入力要素の効果を実現する方法が、下部に高いテキストを実現する方法は? 高い入力要素の効果を実現する方法が、下部に高いテキストを実現する方法は? Apr 04, 2025 pm 10:27 PM

入力要素の高さを達成する方法は非常に高くなりますが、テキストは下部にあります。フロントエンドの開発では、高さの設定など、いくつかのスタイルの調整要件に遭遇することがよくあります...

See all articles