ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

WBOY

リリース： 2023-05-26 23:55:11

転載

4099 人が閲覧しました

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

昨年末の ChatGPT の人気以来、Baidu、360、Alibaba Cloud、iFlytek など、国内 10 社以上が大型言語モデルの製品を次々と発表し、大型モデルのレイアウトを発表しています。人工知能に焦点を当てた対応レイアウトも徐々にリリースされています。

Megvii Technology は 2 月 10 日、関連する基盤技術を公開し、一般画像モデル、ビデオ理解モデル、計算写真モデル、自動運転知覚モデルの 4 つの方向に展開したと発表しました。

4月10日、SenseTimeは大型モデルシステム「RiRiXin SenseNova」を発表しました;

待望のモデルがついに登場 5月18日、Yuncong Technologyが自社開発した「Calmモデル」が正式発表された。

公開情報によると、Yuncong Technology は 36 億元を調達する予定で、その全額は業界の大規模モデルプロジェクトに使用されます。そして本日、Yuncong Technology が開発した「Congrong Large Model」が正式に公開されました。見てください、大型モデルの迫力をご覧ください。

トラップはバイパスされていません。分類インターフェイスは大規模モデルの機能を示しています

記者会見中、Yuncong Technology の創設者である Zhou Xi 氏は共同で現場で Congrong モデルをデモンストレーションし、質疑応答、読解、文学創作、問題解決における Congrong モデルの機能を実証しました。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

彼らが初めてステージに登場したとき、Yuncong Technology の同僚が尋ねた「皆さんにご挨拶できますか」や「それではテストさせてください」などの簡単な質問で、論理的で完全な会話を形成することができました。

次に、AI モデルをテストするために Congrong Model にいくつかの古典的な質問を投げます。「クルミは脳に栄養を補給できますか、ドアに挟まれたクルミは脳に栄養を補給できますか?」、「赤緑色覚異常は起こりますか?」赤鯉と緑鯉とロバを読んでください」

Congrong の大きなモデルはどれも「罠」から抜け出すことはできませんでしたが、クルミの問題については、Congrong は自分を正当化することができ、完全な答えを持っているように見えましたが、彼はそれを真剣に捏造していました。赤緑色覚異常の人は特定の単語を読めるかどうかですが、答えは、赤い鯉と緑の鯉やロバを区別できないということです。

ライブデモンストレーションでは、周熙は答えを説明したり、その場でコミュニケーションを取ったりすることはなく、プレゼンテーション全体が非常に急いでいるように見えました。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

同じ 2 つの質問について、Sutu.com は Wen Shinyiyan 氏に尋ねました。Wenxinyiyan 氏は、赤緑色覚異常の質問に答え、赤い鯉と緑の鯉やロバの区別ができませんでした。クルミに関する質問に答えるとき、Wenxinyiyan Xin Yiyan 氏の答えは次のとおりです。正しく、論理的に一貫していること。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

現在の人工知能の大規模言語モデルには、脳の質問を理解して答えるという分析能力にまだ欠陥があることがわかります。

文学作品の創作に関しては、現場での質問に応じて、穏やかなモデルは創造的なコピーライティングを簡単に提供でき、プロンプトに従って変換し、対応するコピーライティングを再生成することができ、アイデアの論理において優れたパフォーマンスを発揮します。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

さらに、Yuncong Technology は、Python と C 言語を使用してコードを記述し、分析し、注釈を付けることで、現場で大規模モデルのコードを記述する能力も実証しました。技術的な背景を持つ Yunchong Technology の創設者である Zhou Xi 氏も、 Congrong Large Model のコーディング能力について、現場での評価は「中学生のコーディングレベルに達している」というものでした。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

さらに、Congrong の大型モデルでは、さまざまな能力に応じてインターフェイスも区別されます。読解能力については、対話用の特別なインターフェイスに変換する必要があります。読解インターフェイスに入るとき、本の完全な内容が入力されています。インタラクティブなインターフェースの左側元の本の内容が横にあり、右側のダイアログバーで質問や意見交換ができます。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

Congrong の大型モデルは、書籍の内容に基づいて質問に答えて特定できます。Congrong の回答にはハイパーリンクが要約されており、回答が掲載されている書籍の場所を直接特定できます。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

Congrong 大型モデルが示す機能は一流ではありませんが、オンサイトのデモンストレーション結果から判断すると、中国語と英語の翻訳、複数ラウンドの翻訳など、市場にあるほとんどの大型言語モデルの機能を達成できます。対話力、読解力、コーディング力、ライティング能力、全体的なパフォーマンスは非常に満足です。

Yunchong Technology は、高校入試、大学入試、大学入試の問題を統合し、ChatGPT3.5 を使用した質疑応答コンテストを開催するなど、客観的な質問にも特に焦点を当てていたことも言及する価値があります。

オンサイトデモベンチマーク ChatGPT 穏やかな大規模モデル: 動作しない場合は試してください

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

競技プロセス全体を通じて、Rongrong モデルの回答速度は ChatGPT3.5 よりも大幅に優れていましたが、客観的な質問の回答正答率は ChatGPT3.5 よりも低かったとのことです。、Rongrong モデル、ChatGPT3.5 の回答速度、ChatGPT4.0 の回答正答率はそれぞれ 71%、73.34%、86.34% です。

ChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょう

一部のネチズンは、 「あまりにも早いし、冷静になるのは間違っている」 と嘲笑せずにはいられませんでした。

周熙氏は記者会見で、現在の大型モデルは完璧ではないが、Yuncong Technologyは人工知能を堅持し続け、大型モデルを段階的に改良し続けていると述べた。メディアで以前の財務報告データの問題に直面して、記者会見では、Yuncong Technologyの多くのリーダーもまた、たとえ財務報告データが目を引くものでなくても、Yuncongの製品は非常に強力であると信じていることをデモンストレーションで常に強調しました。

周熙は、「現在の大型モデルの時代は、人工知能技術の標準化をさらに促進することができ、その限界効果は増大している。大規模な現実のシナリオをより迅速かつ効率的に変更できるようになり、以前とは異なります」と率直にさえ述べました。「多点技術クローズドループ」段階では、プロジェクトのカスタマイズ度が大きくなり、入出力比のバランスが崩れ、最終的に損失が発生します。

Yunchong Technology の公式 Web サイトの事業分野から判断すると、主にスマートファイナンス、スマートガバナンス、スマートシティ、スマートトラベル、スマートビジネスなどが含まれます。Rongrong 大型モデルの発売に伴い、Yuncong Technology はそれを既存事業さまざまな分野を組み合わせて業界の大きなモデルを立ち上げる。

注目に値するのは、Yuncongは中国検査検疫局と協力して大規模な品質モデルを立ち上げ、神州信息と協力して大規模な金融モデルを立ち上げ、深セン新聞産業と協力して大規模なエンターテインメントモデルを立ち上げ、そしてJiadu Technologyと協力する予定である。 Jin Shiyuan は大型製造モデルを共同で立ち上げ、Youzu.com と協力して大型ゲームモデルを立ち上げ、Aiden Technology と協力して大型医療モデルを立ち上げました。

さらに、クラウドは、ライブブロードキャストルームのインテリジェントな構築やライブブロードキャストプレサービスの提供などのフルプロセス機能を実現できる、Damai デジタルヒューマンライブブロードキャストプラットフォームなど、いくつかの大規模モデルアプリケーション起業家プロジェクトを内部で育成しています。加熱予測。さらに、インテリジェントな教育 AI ウィザードがあり、既存のコースシラバスや質問バンクなどの基本モデルに基づいてカスタマイズされた演習問題を生成し、自己生成された質問バンクと組み合わせて、さらに学習計画を提供できます。

新しく発表された Congrong の大型モデルがまだ内部テスト段階にあるにもかかわらず、あえて ChatGPT に対してベンチマークを行っていることは賞賛に値します。主観的な質問への回答精度の違いは、中国人による大型人工知能モデルの絶え間ない追求を裏付けています。 ChatGPTとの差も歴然としており、単純な質問への回答の正確さには深い意味があるのかもしれません。

のんびりとした大型モデルの発売は、業界最速でも最強でもないが、中国の人工知能企業にとって、頂点に上り詰め、常に技術の限界に挑戦する勇気の精神である。

最近、米国で開催された上院公聴会で、人工知能分野の専門家も、人工知能の停止は中国への権力移譲につながり、「民主主義」を妨げる可能性があると米国上院に警告した。「人工知能の発展。

人工知能の分野では、世界の注目が中国に集まっています。Sutu.com は今後も人工知能企業の発展に注目し、中国企業が人工知能分野の技術的ボトルネックを突破し続けることを共に楽しみにしています。科学技術。

以上がChatGPT を使用したライブベンチマーク!また大規模な AI モデルがリリースされ、非常に多くの業界に浸透するでしょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。