ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。-AI-php.cn

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

WBOY

リリース： 2024-02-01 10:30:10

転載

1416 人が閲覧しました

「私は今、Miqu と Perplexity Labs の Mistral-Medium が同じモデルであると 100% 確信しています。」

最近、「Mistral-Medium モデルの漏洩」に関するニュースがみんなの関心を集めました。注意。

噂によると、「Miqu」と呼ばれる新しいモデルに関するリークニュースは、言語モデルの心の知能指数を評価するためのベンチマークであるEQ-Benchに関連しているそうです。関連データによると、EQ-Bench と MMLU の相関は約 0.97、Arena Elo との相関は約 0.94 です。興味深いことに、このベンチマーク評価では、Miqu が GPT-4 を除くすべての大型モデルを直接上回り、そのスコアは Mistral-Medium に非常に近くなっています。このニュースは幅広い注目と議論を呼びました。

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

^{画像ソース: https://x.com/N8Programs/status/1752441060133892503?s=20}

オープンソースのアドレス: https://huggingface.co/miqudev/miqu-1-70b

このような強力なモデルの場合、プロジェクトの発行者は謎の人物です:

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

誰かが「誰があなたを作ったのか」と尋ねたので、ミクは直接報告しました:「私はミストラルアルチームによって作成されました。」

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

# 誰かが両方のモデルに同じテスト質問を送信しましたが、受け取った回答はすべてロシア語でした。テスターは疑惑を深めました。「標準的なパズルは知っているようですが、もしそれがいたずらだったら、ロシア語でも答えられるように調整できるわけがありません。」

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

翻訳中途中の表現はほぼ同じです。

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

ミクはどこから来たのですか?本当にミストラル・ミディアムなのか？

2 日間続いた熱い議論の中で、多くの開発者が 2 つのモデルを比較しました。比較の結果、次の可能性が指摘されました:

1. Miqu は Mistral-Medium ;

2. Miqu は確かに MistralAI のモデルですが、初期の MoE 実験版または他のバージョンです;

3. Miqu は Llama2 の微調整されたバージョンです。

先ほど、最初の可能性を支持する開発者が挙げた理由を紹介しました。事件が明らかになるにつれて、より多くの開発者が復号化操作に従事し、2 つのモデルに対してより詳細なテストを実施しました。夜更かししたredditユーザーが実施したテストでは、MiquがMistralAIモデルの初期バージョンに近いことが判明した。

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

#開発者は、このモデルを 4 つの専門的なドイツ語のオンラインデータ保護トレーニング/試験に適用しました。テストデータ、問題、すべての説明書はドイツ語で書かれていますが、キャラクターカードは英語で書かれています。これにより、翻訳スキルと言語間の理解をテストします。

具体的なテスト方法は次のとおりです:

情報を提供する前に、ドイツ語でモデルに次のように指示します。「いくつかの情報を提供します。この情報に注意してください」ただし、理解したことを確認するために「OK」を使用してください。それ以外は何も言わないでください。」これは、モデルが命令を理解し実行する能力をテストするためです。
トピックに関するすべての情報を提供した後、モデルに質問します。これは多肢選択問題 (A/B/C) で、最初と最後の質問は同じですが、選択肢の順序と文字 (X/Y/Z) が変更されています。各テストには 4 ～ 6 問、合計 18 問の多肢選択問題が含まれています。
モデルによる正解数に基づくランキング。最初はコース情報を提供した後に回答を検討し、2 番目は事前に情報を提供せずに盲目的に回答します。同点の場合の回答です。すべてのテストは独立したユニットであり、コンテキストは各テスト間でクリアされ、セッション間ではメモリや状態は保持されません。

詳細なテストレポートは次のとおりです:

miqudev/miqu-1-70b GGUF Q5_K_M、32K コンテキスト、Mistral フォーマット: 4 4 4 5=17 のみ/18 チャンネル複数選択の質問で正解が得られます。事前情報なしで、質問に答えて正しい答えを答えてください: 4 3 1 5=13/18。指示どおりにデータ入力が「OK」で確定されませんでした。

テスト中、開発者は、Miqu が Mixtral と多くの類似点があることを発見しました。優れたバイリンガルのドイツ語のスペルと文法、返信への翻訳の追加、返信へのメモやコメントの追加などです。

ただし、この開発者のテストでは、Miqu のパフォーマンスは Mixtral-8x7B-Instruct-v0.1 (4 ビット) よりも悪く、それでも Mistral Small および Medium よりは優れていました。ただし、Mixtral 8x7B Instruct よりも優れているわけではありません。開発者は、Miqu が漏洩した MistralAI モデル、おそらく古い概念実証モデルである可能性があると推測しています。

これは、これまでに確認した中で 2 番目の主張を裏付ける最も詳細なテストです。

しかし、一部の開発者は、Miqu は MistralAI とは何の関係もなく、むしろ Llama 70B に似ていると信じています。そのアーキテクチャは Llama 70B と「まったく同じ」であり、「専門的なハイブリッドモデルではない」からです。

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

同様に、テストを行った結果、Miqu が実際にはラマに似ていることがわかった人もいます。

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

しかし、スコア差ほら、Miqu と Llama 70B は明らかに同じモデルではありません。

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

つまり、Miqu は Llama の微調整されたバージョンであるか、Mistral-Medium の初期バージョンであると誰かが結論付けました:

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

前者が真の場合、Miqu は Mistral-Medium データセットで微調整された Llama 70B である可能性があります:

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

後者が真の場合、Miqu はミストラル API を抽出しただけですが、おそらく「米国が月面着陸を捏造した」レベルの茶番劇になるでしょう:

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。

#最後の質問、誰ですか漏洩者？

多くの X プラットフォームユーザーから提供された手がかりによると、流出した疑いのあるモデルはもともと 4chan と呼ばれる Web サイトに投稿されたものです。この Web サイトは完全に匿名のリアルタイムメッセージングフォーラムで、ユーザーは登録せずにグラフィックやテキストのコメントを投稿できます。

ミストラルミディアムが誤って漏洩した？リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。