7月の最も人気のあるAI研究リストが発表、馬毅氏の最新「標準モデル」が9位にランクイン-AI-php.cn

7月に最も人気のあるAI研究のリストが発表されました!

Reddit ネチズン @bycloudai がまとめたこのリストは、Twitter のいいね数、リツイート、DeepMind、Google、MIT CSAIL などの有名機関を含む Github スターに基づいて、2022 年 7 月の AI 研究トップ 10 にランク付けされています。

7月の最も人気のあるAI研究リストが発表、馬毅氏の最新「標準モデル」が9位にランクイン

誰がリストに載っているのか見てみましょう~

TOP1: トランスフォーマーの形式アルゴリズム

著者: Mary Phuong、Marcus Hutter

機関: DeepMind

7月の最も人気のあるAI研究リストが発表、馬毅氏の最新「標準モデル」が9位にランクイン

要約: この文書は、Transformer のアーキテクチャとアルゴリズムの独立した数学的に正確な概要を目的としています。 Transformer とは何か、そのトレーニング方法、その使用方法、主要なアーキテクチャコンポーネント、および最も著名なモデルのプレビューについて説明します。

トップ 2: 自信に満ちた適応言語モデリング

著者: Tal Schuster、Adam Fisch、Jai Gupta、Mostafa Dehghani、Dara Bahri、Vinh Q Tran、Yi Tay、Donald Metzler

機関: Google、MIT CSAIL

7月の最も人気のあるAI研究リストが発表、馬毅氏の最新「標準モデル」が9位にランクイン

要約: Transformer ベースの大規模言語モデル (LLM) の最近の進歩により、多くのタスクのパフォーマンスが大幅に向上しました。ただし、パフォーマンスが向上する一方で、モデルのサイズも大幅に増加するため、推論プロセスが複雑になり、コストが増加する可能性があります。ただし、実際には、大規模な言語モデルでは、さまざまな難易度からなる一連の反復が生成されます。

この研究では、さまざまな量のコンピューター入力と生成期間を動的に割り当てるためのフレームワークである Confident Adaptive Language Model-ing (CALM) を紹介します。

早期終了デコードには、ここで扱ういくつかの問題が含まれます: (1) どのような信頼性尺度を使用するか、(2) シーケンスレベルの制約をローカルトークンの終了決定にリンクする、(3) 失われた隠蔽表現のバックトラック前のトークンが早期に終了したため。 3 つの異なるテキスト生成タスクに関する理論分析と実験を通じて、計算量の削減におけるフレームワークの有効性を実証し、高いパフォーマンスを維持しながら最大 3 倍まで高速化できる可能性があります。

トップ 3: 言語モデルは (ほとんど) 知っていることを知っています

著者: Saurav Kadavath、Tom Conerly、Amanda Askell、Tom Henighan など

組織: Anthropic

7月の最も人気のあるAI研究リストが発表、馬毅氏の最新「標準モデル」が9位にランクイン

要約: この論文では、言語モデルが自身の主張の妥当性を評価し、どの質問に正しく答えることができるかを予測できるかどうかを調査します。まず、より大きなモデルが正しい形式で提供されると、さまざまな多肢選択式質問や正誤問題に対して適切に調整されることを示します。したがって、モデルに最初に答えを提案してから、その答えが正しい確率 P(True) を評価するように依頼することで、オープンサンプリングタスクを自己評価できます。

P(True) は、そのパフォーマンス、キャリブレーション、さまざまなタスクにわたるスケーリングにおいて魅力的であると考えています。特定の可能性の妥当性を予測する前に、モデルが独自のサンプルの多くを考慮できるようにすると、自己評価のパフォーマンスがさらに向上します。次に、特定の提案された答えを参照せずに、「質問に対する答えを知っている」確率である P(IK) を予測するモデルをトレーニングできるかどうかを調査します。