目次
目次
Grok 4とは何ですか?
クロード4とは何ですか?
Grok 4 vs Claude 4:パフォーマンスベースの比較
タスク1:SecurePay UIプロトタイプ
比較分析
タスク2:物理学の問題
Grok 4による応答
クロード4による応答
タスク3:ネットワーク内の重要な接続
ホームページ テクノロジー周辺機器 AI Grok 4 vs Claude 4:どちらが良いですか?

Grok 4 vs Claude 4:どちらが良いですか?

Jul 12, 2025 am 09:37 AM

2025年半ばまでに、AIの「武器競争」は熱くなり、Xaiと人類は両方ともフラッグシップモデルであるGrok 4とClaude 4をリリースしました。これらの2つのモデルは、デザイン哲学と展開プラットフォームの反対側にありますが、推論とコーディングのベンチマークに向かって頭から競争するため、互いに比較されています。 Grok 4がアカデミックチャートのトップである間、Claude 4はコーディングパフォーマンスで天井を壊しています。燃えるような質問は、Grok 4またはClaude 4-どのモデルが優れているかです。

このブログでは、3つの異なるタスクでGrok 4とClaude 4のパフォーマンスをテストし、結果を比較して究極の勝者を見つけます!

目次

  • Grok 4とは何ですか?
  • クロード4とは何ですか?
  • Grok 4 vs Claude 4:パフォーマンスベースの比較
  • 全体的な分析
  • Grok 4 vs Claude 4:ベンチマーク比較
  • 結論
  • よくある質問

Grok 4とは何ですか?

Grok 4は、Xaiがリリースした最新のマルチモーダル大型言語モデルで、Xからアクセスし、Grokアプリ/Webサイトで使用できる最新の大型言語モデルです。 Grok 4は、ツール使用でネイティブにトレーニングされたエージェントLLMです。このモデルは、すべての分野で学術的な質問を解決し、さまざまなベンチマークで他のほとんどすべてのLLMを上回るのに優れています。これに加えて、Grok 4には、256Kトークンの容量、リアルタイムWeb検索、および人間と落ち着いて相互作用する強化された音声モードを備えた大きなコンテキストウィンドウが組み込まれています。 Grok 4には、優れた推論と人間のような思考能力が満載されており、これまでで最も強力なモデルの1つとなっています。

Grok 4のすべてを知るために、このブログを読むことができます:Grok 4はこちらで、それは素晴らしいです。

クロード4とは何ですか?

Claude 4は、これまで人類によってリリースされた最も先進的な大規模な言語モデルです。このマルチモーダルLLMは、ハイブリッド推論、高度な思考、エージェント構築能力を備えています。このモデルは、単純なクエリの稲妻の応答を紹介しますが、複雑なクエリの場合、より深い推論に移行し、多くの場合、マルチステップタスクを小さなタスクに分割します。パフォーマンスを効率で提供し、コーディングの問題のための優れた結果を記録します。

このブログにアクセスして、Claude 4について詳細に読んでください:Claude 4が出ています、そしてそれは驚くべきことです!

Grok 4 vs Claude 4:パフォーマンスベースの比較

2つのモデルのニュアンスを理解したので、まず2つのモデルのパフォーマンス比較を見てみましょう。

Grok 4 vs Claude 4:どちらが良いですか?

グラフから、Claude 4が応答時間とタスクあたりのコストさえもGrok 4を破っていることは明らかです。しかし、私たちは常に数字で行く必要はありません。さまざまなタスクの2つのモデルをテストし、上記の統計が当てはまるかどうかを確認しましょう。

タスク1:SecurePay UIプロトタイプ

プロンプト: 「HTML、CSS、およびJavaScriptを使用して、インタラクティブで視覚的に魅力的な支払いゲートウェイWebページを作成します。」

Grok 4による応答

クロード4による応答

比較分析

Claude 4は、カード、PayPal、Apple Payの機能を含む洗練された要素を備えた包括的なユーザーインターフェイスを提供します。また、アニメーションとユーザーインターフェイスのリアルタイム検証もサポートしています。 Claude 4のレイアウトは、StripeやRazorpayなどの実際のアプリケーションをモデル化します。

Grok 4もモバイルファーストですが、はるかに剥奪されています。いくつかの基本的な検証機能を備えたカード入力のみをサポートします。非常にシンプルでクリーンで応答性の高いレイアウトがあります。

評決: Claude 4は豊富なプレゼンテーションやショーケースに最適であるため、両方のユーザーインターフェイスには異なるユースケースがあります。 Grok 4は、迅速でインタラクティブなモバイルアプリケーションの学習と構築に最適です。

タスク2:物理学の問題

プロンプト: 「それぞれAと2aの半径を持つ質量mと4mの2つの薄い円形ディスクは、中心を介してそれぞれaと2aの半径を硬く固定します。このアセンブリはしっかりと平らな表面に敷設され、表面に滑ることなく転がって、角度の軸全体が存在するように、角度全体を見ることができます。次の声明のうち、(s)は本当ですか?

A.その質量の中心に関するアセンブリの角運動量の大きさは17ma²ω / 2です
B. lのz-コンポーネントの大きさは55ma²ωです
C.ポイントoに関するアセンブリの質量の角運動量の大きさは81ma²ωです
D.アセンブリの質量の中心は、ω/5の角速度でZ軸を周りに回転します。

Grok 4 vs Claude 4:どちらが良いですか?

Grok 4による応答

Grok 4は、長さのロッドで取り付けられた2枚の色Mと4mのディスクで問題を考慮します√24a。それは重心、ローリングのための傾斜角を見つけ、信頼できるソースであるVedantuとfiitjeeを使用してJee Advanced 2016の質問を検証します。Grooveは、現実の文脈の仮想ソースからの論理控除と有効な確認を使用して、正しい答えをAとDにします。

Grok 4 vs Claude 4:どちらが良いですか?

クロード4による応答

Claude 4は、段階的な思考プロセスを通じて物理ベースの分析ガイドを使用しています。それは、質量の中心を発達させ、それらがどのように転がすかを提案し、平行軸定理を使用して慣性の瞬間を評価し、より詳細と説明を提供し、解決策だけよりも教育目的で、理論的にはより良い目的で優れています。 Claudeは、すべてのオプション広告が正しいと結論付けていますが、これは間違っています。これは、Claudeが結論をオーバードローし、その応答の正確さに到達するためです。

Grok 4 vs Claude 4:どちらが良いですか?

比較分析

評決:反復よりも正確さと効率性を探している場合、Grokは、その推論と、文献がサポートする答えのみを参照したい人よりも優れた論理を使用できるかどうかの現実のために優れています。 Claudeは、概念的な明快さでわずかに優れた理論を提供しますが、最終的に最終的な精度で失敗します。

タスク3:ネットワーク内の重要な接続

プロンプト: 「接続[i] = [AI、bi]がサーバーAIとBIの間の接続を表すネットワークを形成する無向サーバーからサーバーへの接続に接続された0からN - 1の番号が付いています。

重要な接続とは、削除された場合、一部のサーバーが他のサーバーに到達できないようにする接続です。

ネットワーク内のすべての重要な接続を任意の順序で返します。

入力:n = 4、接続= [[0,1]、[1,2]、[2,0]、[1,3]]

出力:[[1,3]]

説明:[[3,1]]も受け入れられます。

例2:入力:n = 2、接続= [[0,1]]出力:[[0,1]]」

Grok 4による応答

#含む<bits .h>
名前空間STDを使用。
クラスソリューション{
公共:
   ベクター<vector> > criticalconnections(int n、vector <vector> >&connections){
       ベクター<vector> > adj(n);
       for(auto&conn:connections){
           adj [conn [0]]。push_back(conn [1]);
           adj [conn [1]]。push_back(conn [0]);
       }
       ベクター<int> disc(n、-1)、low(n、-1)、親(n、-1);
       ベクター<vector> >橋;
       int time = 0;
       関数<void> dfs = [&](int u){
           disc [u] = low [u] = time;
           for(int v:adj [u]){
               if(disc [v] == -1){//訪問されていません
                   親[v] = u;
                   dfs(v);
                   low [u] = min(low [u]、low [v]);
                   if(low [v]> disc [u]){
                       bridges.push_back({u、v});
                   }
               } else if(v!= parent [u]){
                   low [u] = min(low [u]、disc [v]);
               }
           }
       };
      
       for(int i = 0; i <n i if dfs><h4>クロード4による応答</h4>
<pre class="brush:php;toolbar:false">クラスソリューション{
公共:
   ベクター<vector> > criticalconnections(int n、vector <vector> >&connections){
       //隣接リストを作成します
       ベクター<vector> >グラフ(n);
       for(auto&conn:connections){
           グラフ[conn [0]]。push_back(conn [1]);
           グラフ[conn [1]]。push_back(conn [0]);
       }
       // Tarjanのアルゴリズムの配列を初期化します
       ベクター<int> 発見(n、-1); //発見時間
       ベクター<int> 低(n、-1); //低リンク値
       ベクター<int> 親(n、-1); // DFSツリーの親
       ベクター<vector> >橋; //ブリッジを保存します
       int time = 0; //グローバルタイムカウンター
       //すべての未訪問ノードに対してDFSを実行します
       for(int i = 0; i <n i if dfs void u> >&グラフ、ベクトル<int>& 発見、
            ベクター<int>&low、ベクトル<int>&親、ベクトル<vector> >&橋、int&time){
       //訪問中の現在のノードをマークします
       発見[u] = low [u] = time;
       //隣接するすべての頂点を探索します
       for(int v:graph [u]){
           if(discovery [v] == -1){// vが訪問されていない場合
               親[v] = u;
               DFS(V、グラフ、ディスカバリー、低、親、橋、時間);
               //低リンク値を更新します
               low [u] = min(low [u]、low [v]);
               // Edge UVがブリッジであるかどうかを確認します
               if(low [v]> discovery [u]){
                   bridges.push_back({u、v});
               }
           }
           else if(v!= parent [u]){//バックエッジ(親ではない)
               low [u] = min(low [u]、discovery [v]);
           }}}};
int main(){
   ソリューションソル;


   int n = 5;
   ベクター<vector> >接続= {
       {0、1}、{1、2}、{2、0}、{1、3}、{3、4}
   };


   ベクター<vector> > result = sol.criticalconnections(n、connections);


   cout <h3>比較分析</h3>
<p>Grok 4とClaude 4は、CにTarjan Trunk-Queryアルゴリズムを実装しますが、さまざまなファッションに実装しています。 Claude 4は、標準のオブジェクト指向アプローチを使用しました。さらに、DFSロジックを2番目のヘルパーメソッドに分離し、モジュール化に役立ち、最終的には従うのが少し簡単になりました。このスタイルは、教育目的や、他のグラフの問題へのソリューションをデバッグまたは拡張する場合に優れています。</p>
<p> Grok 4は、メイン方法内で、探索にラムダ関数を使用しました。これは最も簡潔でモダンなスタイルです。競争力のあるプログラミングや小さなツールに特に適しています。ロジックを範囲に保ち、グローバルな副作用を最小限に抑えますが、特にプログラミングを初めて使用する人にとっては、読むのが少し難しいかもしれません。</p>
<p><strong>最終評決:</strong>読みやすく保守可能なコードを作成しようとしているときに、Claude 4に頼ることができます。一方、優先順位がより速く、より短いコードを使用して、Grok 4に頼ることができます。</p>
<h2>全体的な分析</h2>
<p>Grok 4は、3つのタスクすべての精度、速度、および機能に焦点を当てています。また、問題をうまく解決するかどうかにかかわらず、実際の適用性にも非常に熟練しています。 Claude 4に関しては、その強みはその理論的な深さ、閉鎖、構造にあり、教育的または保守可能な設計により適しています。とはいえ、クロードは分析で過度に到達することがあり、精度レベルにも影響を与える可能性があります。</p>
<table>
<thead><tr>
<td><strong>側面</strong></td>
<td><strong>Grok 4</strong></td>
<td><strong>クロード4</strong></td>
</tr></thead>
<tbody>
<tr>
<td> <strong>UIデザイン</strong>
</td>
<td>清潔でモバイルファースト、最小限。学習とMVPに最適です</td>
<td>リッチ、アニメーション、マルチオプションUI;デモ&ポーランドに最適です</td>
</tr>
<tr>
<td><strong>物理学の問題</strong></td>
<td>正確で、論理的、ソース検証。 A&Dに正しく答えます</td>
<td>概念的に強いが間違っている(すべてa〜dマークされた)</td>
</tr>
<tr>
<td><strong>グラフアルゴリズム</strong></td>
<td>簡潔なラムダベースのコード。高速コーディングシナリオに最適です</td>
<td>モジュラー、読み取り可能なコード。教育/デバッグにより良い</td>
</tr>
<tr>
<td><strong>正確さ</strong></td>
<td>高い</td>
<td>中程度(過剰な一般化による)</td>
</tr>
<tr>
<td><strong>コードの明確さ</strong></td>
<td>適度に効率的ですが密度が高い</td>
<td>読みやすく、拡張が非常に簡単です</td>
</tr>
<tr>
<td><strong>実世界の使用</strong></td>
<td>優れた(CP、クイックツール、正確な回答)</td>
<td>良い(しかし、遅く、過剰に分析する傾向がある)</td>
</tr>
<tr>
<td><strong>に最適です</strong></td>
<td>速度、精度、コンパクトロジック</td>
<td>教育、読みやすさ、拡張性</td>
</tr>
</tbody>
</table>
<h2>Grok 4 vs Claude 4:ベンチマーク比較</h2>
<p>このセクションでは、いくつかの主要な利用可能なパブリックベンチマークでGrok 4とClaude 4を対比します。以下の表は、それらの違いといくつかの重要なパフォーマンスメトリックを示しています。推論、コーディング、レイテンシ、およびコンテキストウィンドウサイズを含みます。これにより、どのモデルが技術的な問題解決、ソフトウェア開発、リアルタイムの相互作用などの特定のタスクで優れた機能を実行するかを測定できます。</p>
<table>
<thead><tr>
<td><strong>メトリック/機能</strong></td>
<td><strong>Grok 4(Xai)</strong></td>
<td><strong>クロード4(ソネット4&オパス4)</strong></td>
</tr></thead>
<tbody>
<tr>
<td><strong>リリース</strong></td>
<td>2025年7月</td>
<td>2025年5月(Sonnet 4&Opus 4)</td>
</tr>
<tr>
<td> <strong>I/Oモダリティ</strong>
</td>
<td>テキスト、コード、音声、画像</td>
<td>テキスト、コード、画像(ビジョン);組み込みの音声はありません</td>
</tr>
<tr>
<td><strong>HLE(人類の最後の試験)</strong></td>
<td>
<em>ツール付き:</em> 50.7%(新しいレコード)<em>ツールなし:</em> 26.9%</td>
<td>
<em>ツールなし:</em> 〜15〜22%(GPT-4、Gemini、Claude Opusの典型的な範囲が報告されています) <em>:(</em>報告されていません)</td>
</tr>
<tr>
<td> <strong>mmlu</strong>
</td>
<td> 86.6%</td>
<td>ソネット:83.7%; Opus:86.0%</td>
</tr>
<tr>
<td> <strong>SWEベンチ(コーディング)</strong>
</td>
<td> 72–75%(パス@1)</td>
<td>ソネット:72.7%; Opus:72.5%</td>
</tr>
<tr>
<td><strong>その他のアカデミック</strong></td>
<td>AIME(数学):100%; GPQA(物理):87%</td>
<td>公開されていない同等のベンチマーク。 Claude 4は、コーディング/エージェントタスクに焦点を当てています</td>
</tr>
<tr>
<td><strong>遅延と速度</strong></td>
<td>75.3 tok/s;最初のトークンに〜5.7秒</td>
<td>Sonnet:85.3 Tok/s、1.68 s ttft; opus:64.9 tok/s、2.58 s ttft</td>
</tr>
<tr>
<td><strong>価格設定</strong></td>
<td>30ドル/月(標準); 300ドル/月(重い)</td>
<td>ソネット:100万トークンあたり$ 3/$ 15(入力/出力)(ソネット4で利用可能な無料ティア); Opus:1mあたり$ 15/$ 75</td>
</tr>
<tr>
<td> <strong>APIおよびプラットフォーム</strong>
</td>
<td>XAI API X.com/Grokアプリを介してアクセス可能</td>
<td>人類API;また、AWS BedrockおよびGoogle Vertex AIで</td>
</tr>
</tbody>
</table>
<h2>結論</h2>
<p>Grok 4をClaude 4と比較すると、さまざまな値用に構築された2つのモデルが表示されます。 Grok 4は高速で正確で、実際のユースケースと整合しています。したがって、技術的なプログラミング、迅速なプロトタイピング、およびその価値の正確性と速度を問題解決するのに最適です。 UIの設計、エンジニアリングの問題、機能プログラミングに基づいたアルゴリズムの作成などの分野で、常に明確で簡潔で非常に効果的な応答を提供します。</p>
<p>対照的に、Claude 4は、明確さ、構造、深さの強さを提供します。その教育に焦点を当てて設計された読みやすさのコーディングスタイルにより、保守可能なプロジェクトにより適しています。概念的な理解を伝えるのを助けるため、そして教育とデバッグの目的。それにもかかわらず、私はクロードが分析にあまりにも遠くに行くことがあり、質問に対する回答の質に影響を与えるかもしれないと思います。</p>
<p>したがって、優先順位が生のパフォーマンスと現実世界のアプリケーションである場合、Grok 4がより良い選択です。あなたの優先事項がきれいなアーキテクチャ、概念的な明快さ、および/または教育と学習である場合、Claude 4が最善の策です。</p>
<h2>よくある質問</h2>
<strong>Q1。全体的に正確なモデルはどれですか?</strong><p> A. Grok 4には、特に技術的な解像度や現実世界の物理学の問題で、実行されるタスク全体でより良い最終回答があります。</p> <strong>Q2。 UIまたはフロントエンドコーディングに適しているのはどれですか?</strong><p> A. Claude 4は、アニメーションと複数の方法を備えた、はるかに豊かで洗練されたUI出力を提供します。 Grok 4は、モバイルファーストとクイックプロトタイプに適しています。</p> <strong>Q3。誰がGrok 4を使用する必要がありますか?</strong><p> A.競争力のあるプログラミング、数学、迅速なユーティリティツールなどのタスクにおいて、速度、簡潔さ、および正確性を持つ開発者、研究者、または学生。</p> <strong>Q4。どのモデルがベンチマークのコーディングでパフォーマンスが向上しますか?</strong><p> A.両方のモデルは、SWEベンチで同様に機能し(〜72〜75%)、Grok 4は特定の推論ベンチマークで(わずかに)前方に引っ張られ、描画ボックスを除くタスクの完了全体で一貫性がありました。</p> <strong>Q5。両方のモデルをAPIを介して使用できますか?</strong><p> A.はい、Grok 4はXaiのAPIおよびGrokアプリを介して利用できます。 Claude 4は、AnthropicのAPIから入手できます。</p></vector></vector></vector></int></int></int></n></vector></int></int></int></vector></vector></vector>

以上がGrok 4 vs Claude 4:どちらが良いですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

AI投資家は停滞していますか? AIベンダーと購入、構築、またはパートナーになる3つの戦略的なパス AI投資家は停滞していますか? AIベンダーと購入、構築、またはパートナーになる3つの戦略的なパス Jul 02, 2025 am 11:13 AM

投資は活況を呈していますが、資本だけでは十分ではありません。評価が上昇し、独特の衰退があるため、AIに焦点を当てたベンチャーファンドの投資家は、優位性を獲得するために購入、構築、またはパートナーの重要な決定を下す必要がありますか?各オプションを評価する方法とpr

AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう Jul 04, 2025 am 11:10 AM

それについて話しましょう。 革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さの特定と説明など、最新のAIで進行中のForbes列のカバレッジの一部です(こちらのリンクを参照)。 アギに向かっています

Kimi K2:最も強力なオープンソースエージェントモデル Kimi K2:最も強力なオープンソースエージェントモデル Jul 12, 2025 am 09:16 AM

今年初めにゲナイ産業を混乱させたオープンソースの中国モデルの洪水を覚えていますか? Deepseekはほとんどの見出しを取りましたが、Kimi K1.5はリストの著名な名前の1つでした。そして、モデルはとてもクールでした。

AIからAGIへのパスでの大規模な知性の爆発を予測する AIからAGIへのパスでの大規模な知性の爆発を予測する Jul 02, 2025 am 11:19 AM

それについて話しましょう。 革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さの特定と説明など、最新のAIで進行中のForbes列のカバレッジの一部です(こちらのリンクを参照)。 hの読者のために

Grok 4 vs Claude 4:どちらが良いですか? Grok 4 vs Claude 4:どちらが良いですか? Jul 12, 2025 am 09:37 AM

2025年半ばまでに、AIの「武器競争」は熱くなり、Xaiと人類は両方ともフラッグシップモデルであるGrok 4とClaude 4をリリースしました。これら2つのモデルは、設計哲学と展開プラットフォームの反対側にありますが、

推論モデルのための考え方は長期的にはうまくいかないかもしれません 推論モデルのための考え方は長期的にはうまくいかないかもしれません Jul 02, 2025 am 11:18 AM

たとえば、モデルに「(x)人は(x)会社で何をしているのですか?」という質問をする場合、システムが必要な情報を取得する方法を知っていると仮定して、このようなものに見える推論チェーンを見るかもしれません:COの詳細を見つける

このスタートアップは、AIソフトウェアをテストするためにインドに病院を建設しました このスタートアップは、AIソフトウェアをテストするためにインドに病院を建設しました Jul 02, 2025 am 11:14 AM

臨床試験は医薬品開発における膨大なボトルネックであり、キムとレディは、PI Healthで構築していたAI対応ソフトウェアが、潜在的に適格な患者のプールを拡大することでより速く、より安価にできると考えました。しかし、

上院は、トランプの予算法案に押し込まれた10年間の州レベルのAI禁止を殺す 上院は、トランプの予算法案に押し込まれた10年間の州レベルのAI禁止を殺す Jul 02, 2025 am 11:16 AM

上院は、火曜日の朝99-1で投票して、擁護団体、議員、そしてそれを危険な行き過ぎと見なした何万人ものアメリカ人からの土壇場の騒動の後、モラトリアムを殺しました。彼らは静かにいませんでした。上院は聞いた

See all articles