私たちのフォトアルバムには、愛する人の写真やビデオがあります。
私たちのソーシャル メディアには、愛する人の音声ストリップがあります。
私たちには AI テクノロジーも急成長しています。私たちと私たちの愛する人たちは、別の形で出会いました。
2020 年、杭州の若い中国人ソフトウェア エンジニアはリップシンク テクノロジーに関する記事を偶然発見しました。
メカニズムは非常に単純です。コンピューター プログラムを使用して、口の動きを音声録音と一致させます。
彼はすぐに、10年前に亡くなった祖父のことを思い出しました。
「このテクノロジーを使って、もう一度祖父に一言言えるでしょうか?」Yu Jialin さんは自問しました。
実のところ、私たちが開発されたテクノロジーを使って亡くなった親戚を再建しようとしたのはこれが初めてではありません。
さまざまなチャット プログラム、顔認識 AI モデル、音声認識、およびアクション認識モデルの助けを借りて、さらに、保存されている愛する人の音声およびビデオ データを使用して、私たちは再現を試みることができます。亡くなった親戚の登場人物と思い出。
その後、再び「チャット」することができます。
Yu Jialinさんは今年29歳です。 12年前、彼の祖父は彼を永遠に去りました。
愛する人を亡くした後、人は必ず何かを後悔し始めます。余嘉林さんは、あるとき祖父が自分がプレイしていたゲームを中断し、祖父に怒鳴ったことを覚えている。
また、余佳林さんは祖父に、二度と学校に迎えに来ないようにと言いました。
彼と彼の家族が亡くなった祖父をとても懐かしく感じたのは、このような小さなことでした。
余嘉林さんは、祖父が亡くなって以来、祖父について言及することを避けてきたと語った。悲しみに囚われないようにするために、彼らはできるだけ忘れることを選択します。
Griefbot が登場しました。
これは数年前から存在する AI モデルで、亡くなった親戚について私たちが持っているさまざまな情報を学習することで人間を模倣することができます。
しかし、ちょうど昨年、生成 AI が突然爆発的に発展し、Griefbot のパフォーマンスは突然別のレベルに押し上げられました。
以前、Griefbot には大量のデータが必要でした。現在、Yu Jialin のようなエンジニアは、保存されているデータをこのモデルに入力し、見た目、話し方、考え方を正確に再現できるようになりました。
外国の研究者らは、今日のテクノロジーにより、AI はあまりにも多くのサンプルを必要とせずに人の性格を作り変えることができると述べています。
特に、ChatGPT のようなシステムと組み合わせると、ほとんどの人が自然に話したり書いたりする方法をすでによく理解しています。
研究者らは、必要な情報を入力してシステムを微調整すると、99% の類似性が達成できると述べています。特に明らかな違いはありません。
この技術を使って祖母の元に戻った余嘉林さんは、祖父の古い手紙をたくさん見つけましたが、その手紙の中の祖父は、余嘉林さんが会ったことのない祖父でした。
同時に、10年以上前に祖父が撮った写真やビデオ、そして祖父が彼に送ったテキストメッセージも発見した。
残念ながら、数週間のトレーニングとデバッグの後でも、Yu Jialin のプログラミング能力にはまだ限界があります。インタラクション中に各質問に回答するのに約 10 分かかります。
たとえば、彼はグリーフボットに「おじいちゃん、私が誰だと思いますか?」と尋ねました。
ボットは「あなたは誰ですか? 違います」と答えました。重要なことは、人生そのものが美しい奇跡だということです。」
しかし、このボットにさらに多くの情報を与えることで、状況をさらに改善できる可能性があります。
「ハッピー ティーハウスは放送を停止しました。」
おじいちゃんは言いました。「ああ、残念だ。これは私の一番好きな番組なんだ。
現時点で、Yu Jialin さんは、この番組がますます成熟していると感じています。そこで、彼はおばあちゃんにボットを見せました。
余嘉林さんのおばあちゃんは、画面に映る夫が質問に答えるのを静かに見守り、目にはほんのり感情が宿っていた。
余嘉林さんは、このロボットが祖母にとって良い精神的糧になると信じていると語った。
余嘉林さんは記者に向かって、自分と祖父だけの会話を共有したくないと述べた。
ステーション b のビデオでは、アップオーナーのウー・ウーリウさんが、おばあちゃんを「復活させる」プロセス全体を復元してくれました。
彼はまず、祖母の本物のようなアバターを生成するために、現在主流の AI ペイント ソフトウェアである Midjourney を選択しました。 AIはアップロードされた写真とテキストの説明に基づいていくつかの選択肢を生成し、UPの所有者は頭の中にある記憶に基づいて最も現実的なものを選択します。
次に、同じパターンに従い、テキストを使用して特定の顔の特徴を調整します。シワ、目、髪型、立ち居振る舞いなど。
現在のテクノロジーでは、生成されたアバターの詳細をすでに完璧に仕上げることができることがわかります。
#次のステップはオーディオです。繰り返しますが、これらの素材は過去の電話録音、ビデオ録画、または WeChat の音声から得られます。 Yu Jialin と同じように、Wu Wuliu も過去の祖母の電話の音声を AI にアップロードしました。
その後、ビデオ編集ソフトAUを使って調整を行った。また、よりクリアな音声サンプルを数秒の短い文に切り分けて、注釈を付けやすくします。
最後に、処理された音声をパッケージ化し、音声合成システムに組み込みます。
音声合成システムを使用して、Wu Wuliu さんはテキスト読み上げを試しました。
#これで基本的な素材は完成です。次のステップは最も重要なステップであり、仮想デジタル ピープルを生成します。D-ID を通じて、ユーザーはデジタル仮想人物を生成し、彼らとコミュニケーションをとることができます。
左側でアバターを選択し、右側でテキストまたは音声をアップロードします。
ウェブサイトのおばあちゃんの画像は本物そっくりで、音声もおばあちゃんの「地元のなまり」を完璧に再現しています。右側のアットホームなチャット コンテンツと組み合わせると、おばあちゃんと直接ビデオ通話をしているような気分になります。
興味深いのは、おばあちゃんからのこれらの「応答」も ChatGPT によって生成されていることです。
Wu Wuliu さんは ChatGPT に「おばあちゃんがいなくてとても寂しいです。彼女の口調を真似して話しかけてくれませんか?」
人工知能人間味のあるこの作品は、人々を涙させずにはいられません。 Wu Wuliu さんも、祖母の思い出を頼りに、ChatGPT を祖母に近づけようと最善を尽くしました。
#テクノロジーの最終目標は、人々に力を提供することです。この力は物質的なものだけではなく、より重要なことには精神的なものでもあります。これらのチャット内容は完全な擬人化ではありませんが、一部不適切な表現もございます。
しかし、一般的には、人生の些細な出来事でも、人々に最も優しい経験を与えることができます。
新しい時代の悲しみの糧ボストンの専門家は、新しい時代の悲しみの糧の開発について次のように述べました。テクノロジー、時代が経つにつれて、人々が悲しみを表現する方法は確実に変化します。
1980 年代、人々は愛する人を記念して、彼らについての物語を書いたかもしれません。現在では、電子データを保存することがさらに一般的になっています。
心理学者は、遺族のクライアントが空の椅子に、まるで愛する人がまだ座っているかのように話すのを手助けすることがよくあります。
もちろん、新しいテクノロジーによってもたらされる新しい変化は必ずしも良いものではありません。
当時、Wu Wuliu のビデオはステーション B で広範な議論を引き起こしました。
亡くなった親戚を仮想のデジタル存在に変えるという行為は、まだ新しいものです。視点を変えることはそう簡単ではありません。
一部のネチズンは、結局のところ、デジタル仮想の人々は彼を追悼する人々の精神的な支えにはなり得ないと述べました。
AI への過度の依存さえあるかもしれません。
このため、余嘉林氏は祖父を改造したロボットを削除しました。
彼は、過去に過度に浸りたくない、ましてや 1 日中 AI を抱えたくない、と言いました。
以上が杭州の少年は、祖父を「復活」させるためにグリーフボットを使用しましたが、AI にあまり依存したくないため、現在は削除されています。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。