5 月 4 日のニュースによると、Robin Li 氏は Baidu の社内イベントで、Baidu は ChatGPT を作成する機会を逃したが、Google は追加で 4,000 万ドルを費やし、ChatGPT を作成できなかったという人もいると述べました。 ChatGPT を終了します。
以前、ChatGPT の主任科学者である Ilya Sutskever 氏は小さな会社を設立していましたが、Baidu、Microsoft、Google がこの人材を求めて競い合い、最終的に Google が 4,400 万米ドルでこの人材を獲得しました。
Robin Li 氏はまた、ChatGPT との 2 か月の差についての以前の発言についても言及しました。努力によって追いつくことは可能ですが、百度が決して追いつけない可能性もあります。」
詳細:
ロビン・リーはウェン・シンについて次のように語っています。 ChatGPTベンチマークの敷居は非常に高く、Baiduは大手メーカーの中で世界で初めてベンチマークに成功
3月16日午後, Baiduは北京本社で新世代の大企業、言語モデルと生成AI製品のWen Xinyiyanをテーマにした記者会見を開催した。 Baidu の創設者、会長兼 CEO である Robin Li 氏と、Baidu の最高技術責任者である Wang Haifeng 氏が出席し、文学創作、ビジネスコピーライティング作成、数学的計算、中国語理解、および多言語分野における Wen Xin Yi Yan の 5 つの使用シナリオをデモンストレーションしました。モーダル生成の総合力。
現場でのデモンストレーションから判断すると、温信宜燕氏は人間の意図をある程度理解する能力があり、回答の正確さ、論理性、流暢さは徐々に人間のレベルに近づいています。しかし、Robin Li 氏は、この種の大規模な言語モデルは開発や完成の段階には程遠く、改善の余地がたくさんあるとも何度も述べていますが、将来的には間違いなく急速に発展し、経つごとに変化するでしょう。日。
百度はまた、温信宜燕氏の招待試験計画も発表した。 3月16日から、最初のユーザーはWenxinyiyanの公式Webサイトでテストコードを招待して製品を体験することができ、将来的にはさらに多くのユーザーに公開される予定です。さらに、Baidu Smart Cloud は間もなく、企業顧客向けに Wenxinyiyan API インターフェース通話サービスをオープンします。予約は3月16日に正式に開始されます。「Baidu Smart Cloud」を検索して公式Webサイトに入り、Wenxin Yiyan Cloudサービステストへの参加を申請できます。
現在、大規模な言語モデルと生成 AI は新しい技術パラダイムを表しており、世界中のどの企業も逃すことのできないチャンスです。 Baidu Wenxinyiyan は、金融、エネルギー、メディア、政府事務など、何千もの業界のインテリジェントな変革を支援する人工知能ベース型のエンパワーメント プラットフォームとして位置付けられています。ロビン・リー氏は「百度は皆さんと協力して人工知能技術の進歩を推進し、誰もが最先端の生産性ツールを使用できるようになり、誰もがその恩恵を受けられるようにしたいと考えている。」と述べた。 、ロビン・リーは、文学創作、ビジネスコピーライティング作成、数学的計算、中国語理解、マルチモーダル生成を含む 5 つの使用シナリオにおける Wenxinyiyan のパフォーマンスを示しました。
文学創作シーンでは、温信宜燕は有名な SF 小説「三体問題」の中核となるコンテンツを開発しました。対話の質疑応答、要約分析、コンテンツ作成の総合的な能力を反映して、「三体問題」を書き続けるための 5 つの角度からの提案を要約し、提示しました。
さらに、温信宜燕氏は、「三体問題」の作者とテレビシリーズのロールプレイヤーに関する事実に関する質問に正確に答えました。生成 AI は事実に関する質問に答えるときに「でっち上げ」を行うことがよくありますが、Wen Xinyiyan 氏は Baidu の知識を強化した大規模モデルのコンセプトを継続し、事実に関する質問の精度を大幅に向上させています。
ビジネスコピーライティング作成シナリオで、Wen Xinyiyan は、会社の名前付け、スローガンの作成、プレス リリースの作成というクリエイティブ タスクを正常に完了しました。
温信宜燕氏は、3回連続のコンテンツ制作で、人間の意図を正確に理解し、それを明確に表現することに成功し、これが膨大なデータに基づいて起こる「知性の創発」です。 Wenxin Yiyan 大規模モデルのトレーニング データには、数兆の Web ページ データ、数十億の検索データと画像データ、毎日の数百億の音声通話データ、および 5,500 億の事実のナレッジ グラフが含まれます。
Wen Xinyiyan はある程度の思考能力も備えており、数学的推論や論理的推論などの比較的複雑なタスクを学ぶことができます。人間の論理的思考を働かせる「同じ檻の中のニワトリとウサギ」などの古典的な問題に直面したウェン・シンイーヤンは、問題の意味を理解し、問題を解決するための正しいアイデアを持ち、正しい手順に従って問題を計算することができます。学生のように一歩一歩正解です。
文学の創作、ビジネスのコピーライティングの作成、および数学的計算は、大規模言語モデルの共通の利点と能力であり、これに基づいて、Wenxinyiyan は、より優れた中国語理解とマルチモーダル生成機能も示しています。
現場でのデモンストレーション中、温信宜燕氏は「洛陽の紙は高い」という慣用句の意味と、それに対応する「洛陽の紙は高い」の経済理論を正しく説明し、また、この 4 つを使ったアクロスティックな詩を作成しました。 「洛陽の紙は高いよ」という言葉。
マルチモーダル生成の観点から、Robin Li は Wen Xin Yi Yan のテキスト、画像、オーディオ、ビデオを生成する能力を実証しました。興味深いことに、Wenxinyiyan は四川語などの方言で音声を生成することもできます。Wenxinyiyan のビデオ生成機能は、コストが高いため現在すべてのユーザーに公開されていませんが、将来的には徐々にアクセスできるようになる予定です。
「マルチモーダルは、生成 AI の明らかな開発トレンドです。」ロビン・リー氏は、「将来的には、大規模なマルチモーダル モデルを統合するバイドゥの能力が高まるにつれて、ウェン シンイーヤンのマルチモーダル生成能力も向上し続けるでしょう。」 "
ウェン・シンイーヤンのパフォーマンスから判断すると、ある程度人間の意図を理解する能力があり、その回答の正確さ、論理性、流暢さは徐々に人間のレベルに近づいています。しかし全体として、この種の大規模な言語モデルは完全には開発されておらず、実際のユーザーからのフィードバックによる段階的な反復に依存しています。
Wang Haifeng 氏は、Wenxinyiyan は、ERNIE および PLATO シリーズ モデルに基づいて開発された、新世代の知識強化型大規模言語モデルであると述べました。その主要テクノロジーには、教師あり微調整、人間のフィードバックによる強化学習、プロンプト、知識強化、検索強化、対話強化が含まれます。最初の 3 つは、このような大規模な言語モデルで使用される技術であり、ERNIE や PLATO で応用・蓄積され、Wen Xinyiyan でさらに強化・磨きをかけたものであり、最後の 3 つは、百度がすでに技術的優位性を持っている技術です。また、ウェン・シンイーヤンが将来ますます強くなる基盤でもあります。
Li Yanhong 氏は次のように強調しました。「Wen Xinyiyan は、実際のユーザーからのフィードバック、開発者の呼び出し、モデルの反復の間にフライホイールを確立します。効果は急速に向上し、「3 日後には感動するだろう」という驚きをもたらします。 "
Robin Li 氏は、Baidu は現在、世界の主要メーカーの中でベンチマークとなる ChatGPT 製品を作成した最初の企業であると述べました。 Robin Li 氏は、「どの企業であっても、このような大規模な言語モデルを数か月で構築することは不可能です。ディープラーニングと自然言語処理には何年もの粘り強さと蓄積が必要であり、すぐに達成できるものではありません。」
Wen Xinyiyan は、百度の長年にわたる取り組みの継続であると言えます。人類が人工知能の時代に突入するにつれ、IT技術の技術スタックはこれまでの3層から「チップ-フレームワーク-モデル-アプリケーション」の4層へと根本的な変化を遂げた。現在、Baidu は、ハイエンド チップの Kunlun コアから Feipiao 深層学習フレームワーク、Wenxin の事前トレーニングされた大規模モデル、検索に至るまで、これら 4 つの層でフルスタック レイアウトを備えている世界で数少ない人工知能企業の 1 つです。 、インテリジェント クラウド、自動運転や Xiaodu などのアプリケーションには、あらゆるレベルで業界をリードする自社開発テクノロジーが搭載されています。
Robin Li 氏は、Baidu AI のフルスタック レイアウトの利点は、テクノロジー スタックの 4 層アーキテクチャでエンドツーエンドの最適化を実現でき、効率が大幅に向上することだと考えています。特に、フレームワーク層とモデル層の間には強力な相乗効果があり、より効率的なモデルを構築し、コストを大幅に削減できます。実際、非常に大規模なモデルのトレーニングと推論は、深層学習フレームワークにとって大きな課題となります。たとえば、数千億のパラメータ モデルの効率的な分散トレーニングをサポートするために、Baidu Flying Paddle は特別に開発した 4D ハイブリッド並列テクノロジを備えています。
Baidu が 2 月に「Wen Xin Yi Yan」を正式に発表して以来、650 社以上の企業が Wen Xin Yi Yan エコシステムへのアクセスを発表しました。
Robin Li 氏は、大規模な言語モデルが業界に 3 つの大きなチャンスをもたらすと予測しています。
最初のカテゴリは、主流のビジネス モデルが IaaS から MaaS に変化した新しいタイプのクラウド コンピューティング企業です。 Wen Xin 氏の言葉は、クラウド コンピューティング業界におけるゲームのルールを根本的に変えることになります。これまで企業は、コンピューティング能力やストレージなどの基本的なクラウド サービスに基づいてクラウド ベンダーを選択していました。将来的には、フレームワークが優れているかどうか、モデルが優れているかどうか、そしてモデル、フレームワーク、チップ、アプリケーションの 4 つの層間の連携にさらに依存することになります。
Wen Xinyiyan は、Baidu Intelligent Cloud を通じて外部サービスを提供し、企業が独自のモデルやアプリケーションを構築できるように支援します。農業、工業、金融、教育、医療、輸送、エネルギーなどの主要分野で効率が大幅に向上します。あらゆる産業に新たな産業空間を迅速に形成し、デジタルチャイナの実現を支援します。ロビン・リー氏は、百度スマートクラウドが近い将来、温信宜燕のクラウドサービスとアプリケーション製品(パブリッククラウドサービスと民営化展開の両方を含む)を中心としたテーマで記者会見を開催すると予測した。
2 番目のカテゴリは、インダストリ モデルを微調整する企業です。これは、一般的な大規模モデルと企業の間の中間層です。業界に対する洞察に基づいて、一般的な大規模モデルの機能を使用してソリューションを提供できます。業界のお客様への企画です。この点に関して、百度文信モデルは電力、金融、メディアなどの分野で10以上の業界モデルをリリースしている。
3 番目のカテゴリは、大規模なモデル ベースに基づいてアプリケーションを開発する企業、つまりアプリケーション サービス プロバイダーです。 Robin Li 氏は、ほとんどの起業家や企業にとって本当のチャンスは、ChatGPT や Wenxinyiyan のような基本的な大規模モデルをゼロから構築することではなく、これは非常に非現実的で非経済的だと主張しました。これは、一般的な大規模言語モデルに基づいて重要なアプリケーション サービスを先取りして開発する本当の機会である可能性があります。現在、テキスト生成、画像生成、オーディオ生成、ビデオ生成、デジタル人物、3D、その他のシナリオに基づいて、多くの起業家精神にあふれたスター企業が出現しており、将来的には新たな巨人となる可能性があります。
「私たちは、人工知能が今日のあらゆる業界を完全に変えると信じています。AI の長期的な価値とあらゆる階層への破壊的な変化はまだ始まったばかりです。将来的には、さらに多くのキラー アプリケーションや現象が登場するでしょう。最高級の製品の出現により、さらに多くのマイルストーンイベントが発生するでしょう」とロビン・リー氏は語った。 (オレンジ 1 個)
以上がロビン・リー氏は、BaiduがChatGPTに「乗り遅れた」という批判に応え、Googleが4000万ドルを費やしたにも関わらず同様の製品をまだ発売していないことを指摘したの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。