コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > テクノロジー周辺機器 > AI > AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

王林

リリース： 2023-06-06 11:13:02

転載

646 人が閲覧しました

私たちはよく「行動する前によく考えて」、蓄積された経験を最大限に活用するように教えられますが、この言葉は AI にもインスピレーションを与えました。

従来の意思決定AIモデルは、忘却効果の存在により効果的に経験を蓄積することができませんでしたが、中国主導の研究によりAIの記憶方法が変わりました。

新しい記憶方法は人間の脳を模倣し、AI の経験蓄積効率を効果的に向上させ、それによって AI のゲームパフォーマンスを 29.9% 向上させます。

研究チームは、ミラケベック AI 研究所とマイクロソフトモントリオール研究所のそれぞれ 6 名で構成されており、そのうち 4 名は中国人です。

彼らは、その結果をメモリ付き意思決定変換器 (DT-Mem) と名付けました。

従来の意思決定モデルと比較して、DT-Mem は適用範囲が広く、モデル運用の効率も高くなります。

アプリケーションの効果に加えて、DT-Mem のトレーニング時間も最小 200 時間から 50 時間に短縮されました。

同時に、チームは、DT-Mem がトレーニングされていない新しいシナリオに適応できるようにする微調整方法も提案しました。

微調整されたモデルは、これまで学習していないゲームでも優れたパフォーマンスを発揮します。

動作メカニズムは人間からインスピレーションを得ています

従来の意思決定モデルは LLM に基づいて設計されており、暗黙的メモリを使用しており、そのパフォーマンスはデータと計算に依存します。

暗黙記憶は意図的に記憶されるのではなく無意識に生成されるため、意識的に思い出すことはできません。

もっと簡単に言うと、関連するコンテンツは明らかにそこに保存されていますが、モデルはその存在を知りません。

この暗黙記憶の特性が従来のモデルにおける忘却現象を決定づけ、作業効率の低下につながります。

忘却現象は、問題を解決するための新しい方法を学習した後、古い問題と新しい問題が同じタイプであっても、モデルが古い内容を忘れてしまう可能性があるという点で現れます。

人間の脳は 分散記憶ストレージ 方式を採用しており、記憶内容は脳の複数の異なる領域に分散して保存されます。

このアプローチは、複数のスキルを効果的に管理および整理するのに役立ち、それによって忘れる現象を軽減します。

これに触発されて、研究チームは、さまざまな下流タスクのための情報を保存、混合、取得するための内部作業記憶モジュールを提案しました。

具体的には、DT-Mem は、トランスフォーマー、メモリモジュール、および多層認識 (MLP) モジュールの 3 つの部分で構成されます。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

DT-Mem の Transformer は GPT-2 のアーキテクチャを模倣していますが、アテンションメカニズムの後のフィードフォワード層を削除しています。

同時に、GPT-2 の MLP モジュールは DT-Mem の一部として独立したコンポーネントに分割されます。

この 2 つの中間として、研究チームは中間情報を保存および処理するための作業記憶モジュールを導入しました。

この構造は、メモリを使用してさまざまなアルゴリズムを推論するニューラルチューリングマシンからインスピレーションを得ています。

メモリモジュールは、Transformer によって出力された情報を分析し、その保存場所と、それを既存の情報と統合する方法を決定します。

さらに、このモジュールでは、この情報が将来の意思決定プロセスでどのように使用されるかについても検討します。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

#これらのタスクは、大まかに 5 つのステップで完了します。まず、メモリモジュールがランダムマトリックスとして初期化されます。

次に入力情報の並べ替えですが、このステップでは情報を Transformer に渡すのではなく、タプルの形式で同じ空間に格納します。

その後、保存場所を決定する必要があります。人間は通常、関連する情報を同じ場所に保存しますが、DT-Mem もこの原則に基づいています。

最後の 2 つのステップであるメモリの更新と取得は、メモリモジュールの中核であり、DT-Mem 全体の最も重要なリンクです。

メモリの更新とは、タスクのニーズに合わせて情報を適時に更新できるように、既存の情報を編集および置換することを意味します。

このステップでは、DT-Mem は消去ベクトルと書き込みベクトルを計算し、それらを既存のデータと混合する方法を決定します。

メモリの検索とは、既存の情報にアクセスして回復することであり、意思決定が必要な場合に関連する有用な情報をタイムリーに取得することです。

実際に使用する前に、DT-Mem は事前トレーニングプロセスを通過する必要があります。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

DT-Mem の微調整に関しても、チームは新しい手法を提案しました。

DT-Mem はタスクに基づいてラベル付けされたデータを使用するため、この種の微調整は DT-Mem が新しいタスクに適応するのに役立ちます。

このプロセスは、低ランク適応 (LoRA) に基づいており、既存のマトリックスに低ランク要素を追加します。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

トレーニング時間は最大 32 分の 1 に短縮されます

DT-Mem の意思決定能力をテストするために、研究チームは次のことを行いました。それはいくつかのゲームゲームをプレイします。

全部で 5 つのゲームがあり、すべて Atari からのものです。

同時に、チームはリファレンスとして従来モデル M[ulti-game]DT のパフォーマンスもテストしました。

結果として、DT-Mem の 4 試合の最高成績はすべて MDT よりも優れていました。

具体的には、DT-Mem は MDT と比較して DQN 正規化スコアを 29.9% 改善します。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

ただし、DT-Mem のパラメータ量は 20M に過ぎず、MDT (200M パラメータ) の 10% に過ぎません。

これほどのパフォーマンスは大したものと言っても過言ではありません。

DT-Mem は、優れたパフォーマンスに加えて、トレーニング効率も MDT を上回ります。

MDT の 13M パラメータバージョンのトレーニングには 200 時間かかりますが、20M DT-Mem のトレーニングには 50 時間しかかかりません。

200M バージョンと比較すると、トレーニング時間は 32 倍短縮されますが、パフォーマンスはさらに優れています。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

#チームが提案した微調整方法のテスト結果は、この微調整により DT-Mem の適応能力が向上することも示しています。未知のシナリオ。

以下の表のテストに使用されたゲームは MDT に知られているため、MDT のパフォーマンスはこのラウンドの測定の基礎として使用されないことに注意してください。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

チームは、ゲームのプレイに加えて、Meta-World ML45 ベンチマークを使用して DT-Mem のテストも行いました。

今回参考にしたのはH[yper]DTとP[romot]DTです。

結果は、微調整を行わないモデルでは、DT-Mem スコアが HDT より 8 パーセントポイント高いことを示しています。

ここでテストした HDT には 69K のパラメータしかありませんが、230 万のパラメータを持つ事前トレーニング済みモデルに依存しているため、実際のパラメータ数は DT-Mem の 10 倍以上であることに注意してください ( 147K).倍。

AIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇

紙のアドレス: https://arxiv.org/ abs/2305.16338

以上がAIが人間の脳の記憶モデルを模倣し、ゲームスコアが29.9%急上昇の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

モデル効率

ソース：51cto.com

前の記事：モノのインターネットは人工知能の進化の要です次の記事：10,000 ワードの長文丨 AI セキュリティ産業チェーン、ソリューション、起業の機会を解体する

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

未来を創る: まったくの初心者のための Java プログラミング

2024-10-13 13:32:21
あなたは一人ではありません: サポート力のあるコミュニティとともに Python をマスターしましょう

2024-10-12 11:58:51
初心者からプログラマーまで: Python プログラミングの力を活用する

2024-10-11 20:06:51
プログラマーのように考える: Java の基礎を学ぶ

2024-10-11 18:59:31
Java をシンプルに: プログラミング能力を高める初心者向けガイド

2024-10-11 18:30:51
PHP でブログを構築する: 初心者に優しいプロジェクト

2024-10-11 15:51:51
システムの言語を話す: C を一度に 1 行ずつ学習

2024-10-11 15:42:10
C のデータ構造とアルゴリズム: 初心者に優しいアプローチ

2024-10-11 14:41:20
涙のないコーディング: 簡単な方法で C を学ぶ

2024-10-11 14:08:31
Java によるデータ分析: 情報処理の初心者ガイド

2024-10-11 13:42:21

最新の問題

複数のルートで宣言されたワーカープールは、しきい値を気にせずに CPU 使用率を維持できますか CPU を集中的に使用するタスクを処理するワーカープールを備えた Node.js システムを見つけたいと考えていますが、複数のルートにわたる CPU 使用率については少し混乱してい...

から 2024-04-06 19:54:23

0

1

444

MySQL SQLクエリを使用して別のテーブルのフィールドの合計を計算する次のようなスキーマがあります。属性「user_id」と「username」を持つユーザーテーブルと、属性「customer_id」（user_idのFK）と「finalPrice...

から 2024-04-06 19:39:29

0

1

441

Web サイトから入力要素を取得できませんそこで、Twitter から入力要素を取得しようとしていますが、それを実行すると、ノードターミナルでこのようなエラーが表示され続け、その結果、このコードによって作成されたブラウザ...

から 2024-04-06 18:59:57

0

1

442

テンプレートのメソッドで定義された変数の使用 Vue (v3 ではなく v2) を使用するのは初めてで、テンプレート内 (メソッド内で定義された) で変数を使用しようとしています。私の簡略化されたコード: <templa...

から 2024-04-06 18:10:25

0

2

513

SCSSを使用してデフォルト値とCSS変数を生成するウェブサイトのスタイリングを実装しています。レガシーサポートの理由から、少なくともしばらくの間は IE11 をサポートする必要があります。ワークフローと私の健全性の理由から、私は...

から 2024-04-06 17:46:54

0

1

355

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート