SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。-AI-php.cn

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

王林

リリース： 2023-10-30 16:01:08

転載

635 人が閲覧しました

現在、人間の全身の姿勢と形状の推定 (EHPS、表情豊かな人間の姿勢と形状の推定) では研究が大きく進歩していますが、最も先進的な方法はトレーニングデータセットの制限によって依然として制限されています。

最近、南洋理工大学 S-Lab、SenseTime、東京大学上海人工知能研究所、IDEA 研究所の研究者らは、人体の姿勢と姿勢の推定を初めて提案しました。ボディ形状SMPLer-X、ミッションの大型モーションキャプチャーモデル。この調査では、さまざまなデータソースからの最大 450 万のインスタンスを使用してモデルをトレーニングし、7 つの主要なリストで最高のパフォーマンスを達成しました。

SMPLer-X は体の動きをキャプチャするだけでなく、出力もできます顔と手の動き、体型の推定

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

論文リンク: https://arxiv.org/ abs/2309.17448

プロジェクトのホームページ: https://caizhongang.github.io/projects/SMPLer-X/

豊富なデータと巨大なモデルにより、SMPLer-X は強力なパフォーマンスを示しますさまざまなテストやランキングで高い評価を獲得し、未知の環境でも優れた汎用性を備えています

データの拡張に関しては、研究者らは 32 の 3D 人体データセットの包括的な評価と分析を実施して、モデルトレーニングのリファレンス

2. モデルのスケーリングに関しては、視覚的な大きなモデルを使用して、モデルパラメーターの増加を検討します。パフォーマンスに対する量の改善効果

3. 微調整戦略により、SMPLer-X の一般的な大型モデルを専用の大型モデルに変換し、さらなるパフォーマンスの向上を実現できます。

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

要約すると、SMPLer-X はデータスケーリングとモデルスケーリングを調査し (図 1 を参照)、32 の学術データに対して実行しました。 450 万のインスタンスで同時に設定およびトレーニングした結果、AGORA、UBody、EgoBody、EHF を含む 7 つの主要なリストで最高のパフォーマンスを達成しました

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

図 1データとモデルパラメーターの量を増やすことは、キーリスト (AGORA、UBody、EgoBody、3DPW、および EHF) の平均主誤差 (MPE) を減らすのに効果的です

既存の 3D 人体データセットに関する一般化研究

研究者らは 32 の学術データセットについて一般化研究を実施しました。ランキングが実行されました。各データセットのパフォーマンスを測定するために、モデルは以下を使用してトレーニングされました。そのデータセットとモデルは、AGORA、UBody、EgoBody、3DPW、および EHF の 5 つの評価データセットで評価されました。

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

平均一次誤差 (MPE) も表で計算され、さまざまなデータセット間の簡単な比較が容易になります。

データセットの一般化の研究からのインスピレーション

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

多数のデータセットを分析すると (図 3 を参照)、次の 4 つの結論が導き出されます:

1. 単一のデータセットのデータ量に関しては、 100,000 インスタンスのオーダーモデルのトレーニングに使用して、より高いコストパフォーマンスを実現できます;

2. データセットの収集シナリオに関しては、In-the-wild データセットは最高の効果。データが屋内でしか収集できない場合、トレーニング効果を高めるためには、単一のシーンからのデータの使用を避ける必要があります。

データセットの収集に関して、上位 3 つのうち 2 つは、データセットは生成されたデータセットです。近年、生成されたデータセットは優れたパフォーマンスを示しています

# データセットのアノテーションに関しては、擬似ラベルもトレーニングにおいて非常に重要な役割を果たしています

#大規模なモーションキャプチャモデルのトレーニングと微調整

今日の最先端の手法では、通常、トレーニングに少数のデータセット (MSCOCO、MPII、Human3.6M など) のみが使用されます。この論文では、その他のデータセットの使用について研究します

よりランクの高いデータセットが優先されることを考慮して、トレーニングセットとして 5、10、20、および 32 データセットの 4 つの異なるデータサイズを使用し、合計サイズは 750,000、150 万、300 万、4.5 です。

#さらに、研究者らは、一般的な大規模モデルを特定のシーンに適応させるための低コストの微調整戦略も実証しました。

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

#上記の表は、AGORA などの主要なテストの一部を示しています。テストセット (表 3)、AGORA 検証セット (表 4)、EHF (表 5)、UBody (表 6)、EgoBody-EgoSet (表 7)。

さらに、研究者らは、ARCTIC と DNA レンダリングの 2 つのテストセットで大規模モーションキャプチャモデルの一般化も評価しました。

研究者SMPLer-X がアルゴリズム設計を超えたインスピレーションをもたらし、強力な全身ヒューマンモーションキャプチャの大型モデルを学術コミュニティに提供できることを期待しています。

コードと事前トレーニングされたモデルは、プロジェクトのホームページでオープンソース化されています。詳細については、https://caizhongang.github.io/projects/SMPLer-X/ をご覧ください。

結果表示

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

以上がSMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマン モーション キャプチャ モデルを提示します。

今日の最先端の手法では、通常、トレーニングに少数のデータ セット (MSCOCO、MPII、Human3.6M など) のみが使用されます。この論文では、その他のデータセットの使用について研究します

SMPLer-X: 7 つの主要なリストを覆し、最初のヒューマンモーションキャプチャモデルを提示します。

今日の最先端の手法では、通常、トレーニングに少数のデータセット (MSCOCO、MPII、Human3.6M など) のみが使用されます。この論文では、その他のデータセットの使用について研究します