AI 百科事典: ChatGPT の仕組み-AI-php.cn

AI 百科事典: ChatGPT の仕組み

王林

リリース： 2023-04-12 13:31:03

転載

4550 人が閲覧しました

AI 百科事典: ChatGPT の仕組み

ChatGPT はすぐに何百万もの人々の注目を集めましたが、多くの人はそれがどのように機能するかを理解していなかったために警戒していました。この記事では、それを理解しやすいように分解してみます。

ただし、ChatGPT は本質的には非常に複雑なシステムです。 ChatGPT を使って遊んでみたい、または ChatGPT が何であるかを理解したい場合、コアインターフェイスはチャットウィンドウであり、そこで質問したりクエリを提供すると AI が応答します。覚えておくべき重要な点は、チャットではコンテキストが保持されるということです。つまり、メッセージは以前の情報を参照でき、ChatGPT はこれをコンテキスト的に理解できることになります。

クエリがチャットボックスに入力されると何が起こりますか?

ニューラルネットワーク

まず第一に、ChatGPT のフレームワークの下では発見すべきことがたくさんあります。機械学習は過去 10 年間で急速に発展しており、ChatGPT はその成果を達成するために多くの最先端テクノロジーを利用しています。

AI 百科事典: ChatGPT の仕組み

ニューラルネットワークは相互接続された「ニューロン」の層であり、各ニューロンは入力の受信、処理、ネットワークへの受け渡しを担当します。の次のニューロン。ニューラルネットワークは、今日の人工知能のバックボーンを形成しています。入力は通常、処理されるデータの何らかの側面を表す「特徴」と呼ばれる一連の数値です。たとえば、言語処理の場合、特徴は文内の各単語の意味を表す単語の埋め込みである可能性があります。

単語埋め込みは、ニューラルネットワークがテキストの意味を理解するために使用する単純なテキストの数値表現であり、意味論的に論理的な方法で応答するなど、他の目的に使用できます!

ChatGPT で Enter キーを押すと、テキストはまず単語埋め込みに変換され、インターネット全体からのテキストでトレーニングされます。次に、入力単語の埋め込みが与えられた場合に、適切な応答単語の埋め込みのセットを出力するようにトレーニングされたニューラルネットワークが存在します。これらの埋め込みは、入力クエリに適用される逆演算を使用して人間が読める単語に翻訳されます。このデコードされた出力は、ChatGPT が出力するものです。

ChatGPT モデルサイズ

変換と出力生成の計算コストは非常に高くなります。 ChatGPT は、1,750 億個のパラメータを持つ大規模な言語モデルである GPT-3 の上に位置します。これは、OpenAI が大規模なデータセットを使用して調整した広範なニューラルネットワークには 1,750 億の重みがあることを意味します。

したがって、各クエリには少なくとも 2 回の 1,750 億の計算が必要となり、その計算はすぐに増加します。 OpenAI は、計算コストを削減するためにこれらの計算をキャッシュする方法を見つけた可能性がありますが、この情報がどこかで公開されているかどうかは不明です。さらに、今年初めにリリースされる予定の GPT-4 には、パラメーターが 1,000 倍あると言われています!

計算の複雑さの点で実際のコストが発生するでしょう! ChatGPT が有料になっても驚かないでください。現在、OpenAI を無料で実行するために何百万ドルも費やされているため、まもなく製品化されます。

エンコーダ、デコーダ、および RNN

自然言語処理で一般的に使用されるニューラルネットワーク構造は、エンコーダ/デコーダネットワークです。これらのネットワークは、入力シーケンスをコンパクトな表現に「エンコード」し、その表現を出力シーケンスに「デコード」するように設計されています。

伝統的に、エンコーダー/デコーダーネットワークは、逐次データを処理するためにリカレントニューラルネットワーク (RNN) と組み合わせられてきました。エンコーダは入力シーケンスを処理して固定長ベクトル表現を生成し、それがデコーダに渡されます。デコーダはこのベクトルを処理し、出力シーケンスを生成します。

エンコーダ/デコーダネットワークは、機械翻訳などのタスクで広く使用されています。入力はある言語の文であり、出力はその文を別の言語に翻訳したものです。これらは、要約や画像キャプションの生成タスクにも適用されます。

AI 百科事典: ChatGPT の仕組み