ChatGTPの普及以来、ChatGTPを中心に開発されたAIアプリケーションが次々と登場し、人工知能の威力を実感しています!
最近、Facebook の親会社 Meta は、LLaMA と呼ばれる人工知能大規模言語モデル (Large Language Model Meta AI) をリリースしました。
他の大規模モデルと同様、Meta LLaMA は一連の単語を「入力」として受け取り、次の単語を予測してテキストを再帰的に生成することによって機能します。
レポートによると、Meta は複数のパラメータ (7B、13B、33B、65B) を備えた LLaMA を開発中です。その中で、LLaMA 65B と LLaMA 33B は 1.4 兆トークンでトレーニングされ、最小モデルの LLaMA 7B も 1 兆トークンでトレーニングされました。
さらに、LLaMA モデルは、ラテン語やキリル文字を含む 20 の言語でトレーニングされており、以前にリリースされた大規模なモデルよりもはるかに少ない計算能力を必要とします。
FAIR チームは、LLaMA はまだどのメタ製品にも使用されていないと述べました。
「DeepMind」や「OpenAI」とは異なり、LLaMA はトレーニング コードを公開します。Meta は、このテクノロジーを AI 研究者に公開することを優先する予定です。 LLaMAを利用したい場合は申請を行い、承認後に利用することができます。
以上がAI分野にまた1人の「強豪」が加わった、Metaが新たな大規模言語モデルLLaMAをリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。