このサイトの 11 月 10 日のニュースによると、OpenAI は、組織と協力して AI モデルをトレーニングするためのパブリック/プライベート データセットを生成することを発表する文書を発行しました。 「もっと作る...組織はAIの将来を導くのに役立つ」そして「より有用なモデルから恩恵を受ける」。
このサイトは、OpenAI が次のように述べていることをブログから知りました。「最終的に AI をより安全にし、すべての人類に利益をもたらすために、AI モデルがすべてのトピック、業界、文化、言語を深く理解できるようにしたいと考えています。これには、同じくらい深く理解する必要があります。」可能な限り幅広いトレーニング データ セット。」
OpenAI は、データ パートナー プログラムの一環として、「人間社会を反映」し、現在オンラインで簡単にアクセスできない「大規模な」データ セットを収集すると発表しました。 。同社は、画像、音声、ビデオなどの複数のモダリティにまたがって取り組む予定ですが、 特に、さまざまな言語、トピック、形式にわたる「人間の意図を表現する」データ (長文の文章や会話など) を求めています。
OpenAI は、光学式文字認識ツールと自動音声認識ツールを組み合わせて、組織と協力して、トレーニング データをデジタル化し、必要に応じて機密情報や個人情報を削除する予定であると述べました。 OpenAI は、2 種類のデータセットを作成したいと考えています。
AI モデルのトレーニングに誰でも使用できるパブリック オープン ソース データセットと、独自の AI モデルをトレーニングするためのプライベート データセットのセットです。OpenAI は、プライベート セットはデータをプライベートに保ちたいが、OpenAI のモデルで自社の領域をよりよく理解したい組織向けであると述べています。これまでのところ、OpenAI はアイスランド政府および Miðeind ehf と提携して GPT-4 を改善しています。アイスランド語を話す能力があり、Free Law Project と協力してモデルの法的文書の理解を向上させています。
以上がOpenAI は AI モデルをトレーニングするためのデータセットを生成するパートナーを探していますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。