著者: Yu Sheng
AIGC の時代が到来しました。メタバースはどこまで進んでいますか?
推奨読書:
AIGC「Generation Power」|No.1 AIGCシーズン①
AI不安を克服する最善の方法は「AIGCに参加する」こと|AIGC季刊第1号
2023年、AIGCはずっと「急上昇」するでしょう。
アメリカの人工知能研究会社OpenAIが開発したAI会話モデルChatGPTがAIGCの火花を散らし、短期間で大草原の火を起こしたその後、百度「文心宜燕」、SenseTime Technology 「日本」 日清センノバをはじめとした国産大型モデル製品が続々と発売されております。
それだけではなく、AIGCでは映像、音声、映像など様々な分野の新製品を次々と紹介していきます。 iiMedia Consultingのデータによると、中国のAIGC産業の中核市場規模は2023年に79億3000万元、2028年には2767億4000万元に達すると予想されている。
それに比べて、頻繁に世間に登場する「メタバース」という概念は置き去りにされているように思えます。しかし実際には、AIGC とメタバースは相互に補完しており、両者の間にトレードオフはありません。
それでは、AIGC はメタバースにどのような技術サポートを提供できるのでしょうか? AIGC によってもたらされた現在の「業界の激震」の感覚を維持し、メタバース コンテンツとアプリケーション シナリオの構築における力を与える効果に変えることができるでしょうか?メタバースからどれくらい離れていますか?
これらの質問をもとに、No. 1 は、広州仮想電影有限公司のマーケティング部門ディレクターであるジン・マオセン氏と杭州友聯時報有限公司の創設者兼 CEO であるジャン・ヤーホン氏にインタビューし、次のことについて話そうとしました。メタバースの「人」の視点から AIGC がメタバースの「人」に対して何ができるかについて話しましょう。
主要なブレークスルー: AI バーチャル ヒューマンに魂を注入する
「バーチャル ヒューマンは、将来のメタバースにおいて非常に重要な概念です。」
Virtual Cinema の Jing Maosen 氏によると、現実の人間が操作するデジタル アバターであれ、メタバース内のいわゆる NPC であれ、メタバースでは不可欠な存在です。ただし、メタバースの通常の動作に十分な数の仮想人間を作成するには、すべての仮想人間を現実の人間が操作することは必然的に不可能です。
AI バーチャル ヒューマンの重要性は自明です。
2018 年以降、テンセント、バイドゥ、アリババなどの多くの大手インターネット企業やメディア企業がデジタル バーチャル ヒューマン サービスを開始しました。新華社とテンセントの「Xiao Zheng」、アリババの「AYAYI」、浙江衛星テレビの「Gu Xiaoyu」、マンゴースーパーメディアの「YAOYAO」などのバーチャルデジタルユーザーは数え切れないほどいる。
しかし、AI仮想人間の致命的な弱点は、彼らには魂がないことです。
つまり、現在市販されている AI バーチャル ヒューマンに対する私たちの理解のほとんどは、人間と真にコミュニケーションできる仮想人ではなく、人間の表情を理解できない魂のない AI ロボットであるということです。ジン・マオセン氏はまた、現在のAI主導のバーチャルヒューマンには、固い動き、機敏さが不十分な表現、感情のない声、フィードバック効率の低さなどの問題があり、それがバーチャルヒューマン産業の発展をある程度制限していると述べた。
しかし、ChatGPTが普及してからは、業界の多くの人が「ChatGPTはAIバーチャルヒューマンに魂を吹き込む」と考えるようになりました。
GPT-4 を例に挙げると、大規模なマルチモーダルの事前トレーニング済みモデルとして、画像とテキストの入力を同時に受け入れ、それに応じて対応する応答を返すことができます。第一世代の ChatGPT と比較して、GPT-4 の問題解決スキルとコミュニケーション スキルは大幅に向上しました。
それでは、「ChatGPTがAI仮想人間に魂を吹き込む」というアイデアは実現可能でしょうか?
Jing Maosen は、この道が可能であると信じています。
ChatGPT の事前トレーニング モデルと強力な知識ベースに基づいて、バーチャル ヒューマンは、対応する指示を受け取った後、データベース内の関連情報を迅速に取得し、短時間で対応する応答を返すことができるため、ChatGPT とバーチャル ヒューマンを実現できます。これらの相互補完的な利点により、人間の日常的なコミュニケーションや表現の状態に近い、仮想の人々間のインタラクション。
国内の仮想技術サービスプロバイダーであるShiyou Technologyは2月1日、同社のデジタルヒューマン事業がAIの「頭脳」であるChatGPTを利用し、デジタルヒューマン自身の人間的背景やその他の関連データセットを利用し、それに基づいていることを発表した。 OpenAIには脳形成パーソナライズモデルトレーニングがあります。さらに、Yuanjing Technology、Cape Cloudなどの企業も、同社のデジタルヒューマン関連ビジネスをChatGPTに接続し、仮想デジタルヒューマン関連のビジネス能力を強化・強化していると述べた。
これに基づいて、Jing Maosen 氏は、バーチャル ヒューマン産業が将来、新たなイノベーションとアップグレードの到来をもたらすだろうと予測しています。
具体的には、今後バーチャルヒューマン産業は「質的」と「量的」の2つの方向で発展していきます。
まず、一部の高品質なバーチャル ヒューマンは引き続き最適化と改善が行われ、高精度の方向に開発されます。例えば、バーチャル・ピクチャーズ社は、長年にわたりバーチャル・ヒューマンの映像制作とモデル制作に注力しており、同社が制作したバーチャル・ヒューマン「クレーン・チェイス」は映画・テレビ分野に根ざしており、数多くの映画・テレビ作品に参加している。アニメーション作品もあり、オンラインでのリーチは 1 億人を超えています。
2 つ目は、AI によって駆動される機能的で応用的なバーチャル ヒューマンの数が大幅に増加し、本格的に展開されることです。 「ChatGPT を含む大規模なモデル製品や、AI マッピングや AI モデリングなどの関連テクノロジーは、バーチャル ヒューマン業界の資産コストを削減します。多くの中小規模の新興企業も、この分野でかなりの成功を収めることができます。発展の機会があれば、業界全体がさらに繁栄するでしょう。」
包括的なエンパワーメント: 地球を再建するための時間加速
情報普及のメディアレベル部門の観点から見ると、AIGC 関連企業の産業レイアウトの主な分野は、テキスト、画像、オーディオ、ビデオです。
しかし、AIGC に関与する関連産業分野から判断すると、AIGC は実際には、情報、ゲーム、メディア、映画やテレビの制作、電子商取引、金融コンサルティングなどのさまざまな分野に組み込まれており、あらゆる分野に多大な影響を与えています。私たちの日常生活のさまざまな側面。
同様に、AIGC もメタバースの構築を完全に強化します。
Youlian Times の創設者兼 CEO である Jiang Yahong 氏は、メタバースに関する自身のビジョンから始まり、メタバースの空間構築、コンテンツ生成、体験シナリオにおける AIGC の権限強化について詳しく説明しました。
彼は、AIGC がメタバースにどのように力を与えるかについて話すとき、最初に考えるべきことは、メタバースの「人々」が仮想世界でどのように生活し、働き、消費するかであると信じています。 「メタバースでは、同僚と仕事をするときも、社交するときも、娯楽を楽しむときも、私たち全員が自分のデジタル アバターを持ち、スペースに制限されることなくメタバースのさまざまなアプリケーション シナリオを体験できる必要があります。」
メタバースの基本構造として、現実の 3D デジタル ヒューマンには、メタバース カンファレンス、文化博物館、文化観光、大学、オフライン展示ホール、映画やテレビ、ゲーム エンターテイメント、ブランド プロモーションなどを含む、非常に幅広い応用の見通しがあります。 。
現在、Youlian 時代には、文化や観光のシーン、映画制作、ゲーム エンターテイメント、ブランド プロモーション、オフライン展示ホールなどで実際の製品があり、特にデジタル アバターのリアルタイム生成、Youlian 3D クラウド アレイが活躍しています。カメラ。これは、メタバースで現実のデジタル人物を作成するための商用グレードのスマート デバイスです。1 秒で撮影して作成でき、最速 5 分で現実の 3D デジタル アバターを生成できます。コストはわずかです。 100元、デジタルアバターの作成方法で「消費者レベル」の画期的な進歩を達成。 Jiang Yahong 氏は、AIGC の開発は、リアルタイム生成デジタル アバターの精度とアプリケーション シナリオの開発の点で新たな機会をもたらすと述べました。
具体的にメタバースにおける「人」そのもののレベルで言えば、AIGC は仮想人に「頭脳」を与えるだけでなく、仮想人の画像描画、モデル生成、構築も大幅に向上させることができます。また、音声出力の擬人化だけでなく、仮想人間の表現や動作の柔軟性と信頼性においても質的発展をもたらすことができます。
たとえば、国際的な 3D エンジン大手 Unity China のシニアマネージャーであり、端子間移植技術の責任者である孫志鵬氏は、「デイリー経済ニュース」の記者とのインタビューで、AI ペインティング、3D に対応すると述べました。エンジンは「一文モデリング」を実現するかもしれない。
別の例として、Jing Maosen 氏はインタビューの中で AI モーション キャプチャ テクノロジーについて具体的に言及しました。
モーション キャプチャ分野におけるバーチャル ヒューマン業界の投資と維持コストは常に非常に高額であり、「光学式モーション キャプチャ スタジオを構築するだけでも数百万の投資が必要であり、多くの新興企業にとってこれは非常に困難です」非常に高い投資コストがかかります。」
AIモーションキャプチャ技術は、撮影した映像をもとに映像内のキャラクターの動きを正確に識別・再現し、仮想ヒューマンの骨格動作データを自動生成します。その上で、このデータをバーチャルヒューマンの3Dモデルに当てはめることで、バーチャルヒューマンの動作駆動が完成する。
このプロセスでは、高価なプロ仕様のモーション キャプチャ装置や、モーション キャプチャ装置を装着してバーチャル ヒューマンを動かす専門スタッフが不要となり、モーション キャプチャのコストを削減しつつ、モーション キャプチャの効率も向上する一石二鳥です。
このように見ると、AIGC によるメタバースにおける「人々」のエンパワーメントは包括的です。
AIGC は、メタバースのシーン構築に確かな技術サポートを提供し、メタバースにおける「人」のさまざまな活動のための新たな空間を切り開く一方で、AIGC 自体をフィールドに応用することもできます。また、バーチャル ヒューマンの制作コストも削減され、より多くの人がメタバースで自分のデジタル アバターを持つ機会が与えられます。
結局のところ、元宇宙の究極の姿に到達する時間は加速されました。
Jing Maosen 氏は、メタバースを現実に実装することは、実際には仮想世界で地球を再作成することに相当し、それには膨大な量のエンジニアリングと資産が必要であると述べました。この過程でAIの支援があれば、地球の再建までの時間は早くなります。
現実に戻る: 私たちとメタバースの間の距離
「AIGCの時代がやってくる」
Jing Maosen 氏は、これが ChatGPT の高い柔軟性、高精度、高いフィードバック効率を体験した後の第一印象であると率直に語りました。
ChatGPT が人々の仕事の 80% を置き換えるだろう、AI ペイントが中級および低レベルのオリジナルの画家の地位を置き換えるだろう、などの議論が横行しています。同時に、ChatGPT 研究者やアルゴリズム エンジニアなどの新しい役職が創設され、コンピューター テクノロジを使用する人々の能力に対してより高い要件が課されています。
「AIが描く『スペースオペラ』」
これは当然のことではありません。
ジェネレーティブ AI は、コンピューター ビジョン、データ マイニング、機械学習、インテリジェント音声テクノロジー、自然言語処理、ナレッジ グラフ、その他のコア AI テクノロジーを統合し、創造性、表現、反復、コミュニケーション、パーソナライゼーションなどで役割を果たすことができます。利点。しかし、No.1はAIGCの実際の実践において「理想」と「現実」の間に矛盾があることを面談の中で知りました。
2022 年 7 月、Baidu CEO の Robin Li 氏は、2022 Baidu World Conference で、AIGC は 3 つの開発段階を経ると判断しました: 1 つ目は AIGC を使用して人間のコンテンツ制作を支援する「アシスタント段階」で、2 つ目は「アシスタント段階」です。 AIGCが仮想と現実が共存し、人間と機械の共生状況を形成するバーチャルヒューマンの姿で登場する「コラボレーションステージ」、3つ目がAIGCが独自にコンテンツ制作を完了する「オリジナルステージ」です。
今、私たちは「コラボステージ」と「オリジナルステージ」の交錯期にいます。
例えば、バーチャルヒューマン業界における「魂のないバーチャルヒューマン」の問題は、ChatGPTなどの大規模なモデルにアクセスすることである程度解決できますが、実際の運用やアプリケーション実装のプロセスでは、自然言語処理が必要となります。変換も考慮する必要があり、情報のフィードバック効率が不十分であるなどの問題がある。
仮想人物に十分なリアリティと生々しさが備わって初めて、仮想人物の価値が最大限に引き出されます。
「現在、AI に対するみんなの期待はそれほど高くありません。」Jing Maosen 氏は、ほとんどの人が現在の AIGC テクノロジーを経験的な考え方で見ているが、AIGC 関連アプリケーションの実際の実装段階では、それらの AI がうまく機能しないと分析しました。 ChatGPT が理解できない人間のニーズは、AIGC の将来の発展を決定する鍵となります。
現在の AIGC の人気は、メタバースが本格的な隆盛を迎えるまでの序曲に過ぎないとも言え、思い描いたメタバースの「究極の姿」にはまだまだ程遠いです。
Jiang Yahong 氏はまた、現在のメタバースはまだ初期段階にあり、メタバース関連アプリケーションの実際の実装には少なくとも 3 年はかかるだろうと述べました。同氏は、Youlian Times が取り組んでいるデジタル アバターの撮影と制作の作業は、メタバース構築プロセスの一部にすぎませんが、メタバースの非常に重要なインフラストラクチャでもあると率直に認めました。そして市場は爆発するのを待っています。
さらに、別の問題は、関連するメタバースの消費および応用シナリオがまだ完全にオープンになっていないことです。 バーチャル ヒューマン業界を例に挙げると、現在のバーチャル ヒューマンのアプリケーション市場は主にメディアおよびエンターテイメント分野であり、マンドリル ピクチャーズが作成した超現実的なデジタル ヒューマン「メイ セ ティアン」は主に知識の普及に活躍しており、トークショー・パフォーマンス、ファッション、生活、文学・芸術創作などの分野。
ほとんどの人は、参加者や体験者としてではなく、傍観者として仮想の人々とのみ直接対話およびコミュニケーションするため、仮想の人々をより直観的に観察して理解することは困難です。同様に、メタバースについても同様であり、十分な数の人々が参加して初めて、メタバースの原型が最初に確立されたとみなすことができます。
これに関して、Jiang Yahong 氏は、メタバースの核となる要素には、空間、人、コンテンツ、シーンが含まれる必要があると述べ、ビジネスの観点からは、メタバース内の「人、物、場所」を迅速に管理できる必要があると述べました。反映されました。 「これに基づいて、バーチャル ヒューマン産業の経済的価値をさらに解き放ち、メタバースの真の意味を反映することができます。」
結論その 1
2022 年 10 月、AIGC スタートアップの Jasper はシリーズ A 資金調達で 1 億 2,500 万米ドルを受け取りました。 Jasper が誕生時の無名状態からユニコーン企業となって名声を得るまでに、わずか 18 か月かかりました。
Jasper を含め、AIGC を利用して急速に発展している企業は数え切れないほどあります。大量の資本の流入と市場規模の急速な拡大により、AIGC業界は新たな急速な発展を迎えることが予想されます。
4 月 19 日、学者の Yu Guoming 氏は「メタバース、AIGC、コミュニケーション革命 - ChatGPT から総合インテリジェント時代の未来へ」と題した講演を行い、ChatGPT の主な焦点を 12 の側面から体系的に明らかにしました。インテリジェントな相互接続の新時代をもたらすために、メタバースはデジタル インテリジェンス時代の必然の産物です。
AIGC の人気のせいで、私たちはフローティング メタバースに関する空想や議論から遠ざかり、メタバースの開発を推進するコア テクノロジ エンジンである AI と AIGC が見え始めていることを認めなければなりません。おそらく将来的には、AIGC の鍵を借りてメタバースへの扉を真に開くことができるようになるでしょう。
以上がAIGC はメタバースの「人々」に対して何ができるでしょうか? |No.1 AIGCシーズン②の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。