本番グレードの会話型 AI システムにおける ChatGPT の欠点-AI-php.cn

本番グレードの会話型 AI システムにおける ChatGPT の欠点

PHPz

リリース： 2023-04-12 19:16:01

転載

1663 人が閲覧しました

翻訳者|Bugatti

レビュアー|Sun Shujuan

ChatGP は、その詳細で人間味あふれる文章による回答で世界中の注目を集め、以下について活発な議論が行われています。人々はこの人工知能（AI）とどのように対話すべきなのか。多くの点で、ChatGPT は以前の GPT-3.5 のアップグレードバージョンですが、依然として改ざんされる傾向があります。専門家らは、実稼働グレードのアプリケーションの場合、AI 開発者は ChatGPT を他のツールと組み合わせて完全なソリューションを実現することを検討する可能性があると述べています。

本番グレードの会話型 AI システムにおける ChatGPT の欠点

ChatGPT と GPT-3.5 は OpenAI によって開発され、Microsoft Azure でトレーニングされています。どちらも大規模な言語モデルに基づいた会話型 AI システムですが、大きな違いがあります。

まず第一に、Generative Pre-training Transformer (GPT) 3.5 は ChatGPT よりも早く登場し、そのニューラルネットワークには ChatGPT よりも多くの層があります。 GPT-3.5 は、言語の翻訳、テキストの要約、質問への回答など、多くのタスクを処理できる汎用言語モデルとして開発されました。 OpenAI は GPT-3.5 用の API インターフェイスのセットを提供し、開発者がその機能にアクセスするためのより効率的な方法を提供します。

ChatGPT は GPT-3.5 に基づいており、特にチャットボットとして開発されています (「会話エージェント」は業界で好まれている用語です)。制限要因の 1 つは、ChatGPT にはテキストインターフェイスのみがあり、API がないことです。 ChatGPT は、大規模な会話テキストのセットでトレーニングされており、GPT-3.5 や他の生成モデルよりも優れた会話を実行します。応答は GPT-3.5 よりも速く生成され、その応答はより正確です。

ただし、どちらのモデルも捏造される傾向があり、業界内で言うところの「幻覚」を示すものです。 ChatGPT の幻覚率は 15% ～ 21% です。同時に、GPT-3.5 の幻覚率は約 20% から 41% に増加したため、ChatGPT はこの点で改善されました。

シリコンバレーの企業 Moveworks は、自社の AI 会話プラットフォームで言語モデルやその他の機械学習技術を使用しており、幅広い業界の企業で使用されています。同社の創設者で機械学習担当副社長のジャン・チェン氏は、（すべての言語モデルに共通する問題である）作り話であることが多いが、ChatGPTは以前のAIモデルに比べて大幅に改善されていると述べた。

「ChatGPT は人々に本当に感銘を与え、驚かせました」と、テクノロジー巨人の名を冠した検索エンジンを開発した元 Google エンジニアのチェン氏は語ります。「その推論機能は、多くの機械学習実務者を驚かせるかもしれません。」

Moveworks は、さまざまな言語モデルやその他の技術を使用して、クライアント向けにカスタマイズされた AI システムを構築しています。同社は、数年前に Google がオープンソース化した言語モデルである BERT の大ユーザーです。同社は GPT-3.5 を使用しており、すでに ChatGPT の使用を開始しています。

ただし、Chen 氏によると、ChatGPT には実稼働グレードの会話型 AI システムを構築する場合に限界があるそうです。このタイプのテクノロジーを使用してカスタムの会話型 AI システムを構築する場合は、さまざまな要素を考慮する必要があります。間違った答えを提供せず、過度に偏らず、適切な答えを提供しないシステムを構築するには、どこに線が引かれているかを知ることが重要です。人々をあまり長く待たせないシステム。

Chen 氏は、ChatGPT は、質問に答える意味のある応答を生成する点で BERT よりも優れていると述べました。具体的には、ChatGPT は、文内の次の単語を予測するように設計された BERT よりも強力な「推論」機能を備えています。

ChatGPT と GPT-3.5 は、質問に答えるための説得力のある応答を提供できますが、そのクローズドなエンドツーエンドの性質により、Chen のようなエンジニアがトレーニングを受けることができません。これは、業界固有の対応に合わせてコーパスをカスタマイズすることへの障壁にもなります (小売業者や製造業者は、法律事務所や政府とは異なる言葉を使用します)。この閉鎖的な性質が偏見を減らすことをさらに困難にしている、と同氏は述べた。

BERT は、Moveworks のような企業がホストできるほど小規模です。同社は、企業固有のデータを収集し、そのデータをトレーニング用の BERT モデルにフィードするデータパイプラインを構築しました。この取り組みにより、Moveworks は、GPT-3.5 や ChatGPT のようなクローズドシステムでは不可能な、最終的な会話型 AI 製品をより高度に制御できるようになります。

#当社の機械学習スタックは階層化されており、「当社では BERT を使用していますが、他の機械学習アルゴリズムも使用しているため、顧客固有のロジックや顧客固有のデータを組み込むことができます。」とチェン氏は述べました。 OpenAI モデルははるかに大規模で、はるかに大規模なコーパスでトレーニングされていますが、特定の顧客に適しているかどうかを知る方法はありません。

彼は次のように述べています。「(ChatGPT) モデルは、そこに供給されるすべての知識をエンコードするように事前にトレーニングされています。それ自体は特定のタスクを実行するように設計されていません。それが加速し、急速な成長を達成できる理由これは、アーキテクチャ自体が実際には非常にシンプルであるという事実によるものです。同じものが何層にも重ねられているため、すべてがいわば融合しています。このアーキテクチャのおかげで、学習能力があることはわかっていますが、実際にはそうではありません」

Chen 氏は、ChatGPT には一時的な効果があるかもしれないと考えていますが、会話型 AI の実稼働グレードのツールとしての有用性は少し誇張されている可能性があります。より良いアプローチは、特定の 1 つのモデルに完全にコミットするのではなく、複数のモデルの強みを活用して、クライアントのパフォーマンス、精度、バイアスの期待、およびテクノロジーの基礎的な機能とより適切に連携することです。

彼はこう言いました。「私たちの戦略は、さまざまな場所で一連の異なるモデルを使用することです。大きなモデルを使用して小さなモデルを教えることができます。そうすれば、小さなモデルははるかに優れたものになるでしょう」より高速です。たとえば、セグメント化された検索を実行したい場合は、ある種の BERT モデルを使用し、それをある種のベクトル検索エンジンとして実行する必要があります。ChatGPT はこれには大きすぎます。」

現時点では、ChatGPT は現実世界のアプリケーションでの使用が限られているかもしれませんが、それは重要ではないという意味ではありません。 ChatGPT がもたらす永続的な影響の 1 つは、実践者の注目を集め、将来の会話型 AI テクノロジーの有効性の限界に挑戦するよう人々を鼓舞することである、とチェン氏は述べました。

彼は次のように言いました。「これによって新たな分野が開かれると思います。今後、ブラックボックスをオープンにしていくと、さらに興味深い方法や応用が生まれると思います。これが私たちが楽しみにしていることです。私たちはこの分野の研究開発に取り組んでいます。」

原題: 生産会話型 AI システムにおける ChatGPT の欠点 、著者: Alex Woodie

以上が本番グレードの会話型 AI システムにおける ChatGPT の欠点の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。