コミュニティ学ぶツールライブラリレジャー

日本語

ホームページ > テクノロジー周辺機器 > AI > ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

王林

リリース： 2023-04-15 09:16:02

転載

1625 人が閲覧しました

ChatGPT はバグ修正においてどれくらい優れていますか?

最後に、この問題について真剣に研究している人がいます--

ドイツとイギリスの研究者が、ChatGPT の能力をテストするための「チャレンジ」を設定しました。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

ChatGPT に加えて、研究者らはバグを修正する他の 3 人の「AI ヒーロー」も発見し、それぞれ 40 個のエラーコードを修正するよう依頼しました。

結果は本当に未知数で、比べてみて衝撃を受けました。

ChatGPT は、2 位 (21 件) を大きく引き離して 31 件のバグを正確に修正し、「AI バグ修正の世界」で SOTA スコアを直接獲得しました。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

それ以来、この研究は多くのネチズンの注目を集め、議論するようになりました。Reddit のこの投稿のタイトルには「注意」と「注意」という言葉も使われています。 :

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

# しかし実際、これは本当にプログラマーを「危険」にするのでしょうか?

まずこの研究を見てみましょう。

ChatGPT はバグ修正が得意です

ChatGPT はバグ修正を目的として特別に設計されたものではありませんが、その開始以来、多くのネチズンがこの機能があることを発見しました。

したがって、ChatGPT がバグをどの程度修正できるかを調べるために、研究者は標準エラー修復ベンチマークセット QuixBugs を評価用に導入しました。

とそれと競合する AI プレーヤーは、それぞれ CodeX、CoCoNut、Standard APR です。

研究者らは QuixBugs から 40 個の問題を選択し、それぞれのバグを修正するよう依頼しました。

ChatGPT にバグを修正させる方法は、ダイアログボックスで質問することです:

このコードに何か問題がありますか?

第 1 ラウンドの対戦後の結果は次のとおりです。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

第 1 ラウンドの戦闘結果から判断すると、ChatGPT は修復されました。 19、CodeX 21 が修正され、CoCoNut が 19 で修正され、標準 APR は 7 でした。

そして研究者らは、ChatGPT の回答が CodeX に最も似ていることも発見しました。これは、それらが同じ言語モデルファミリーに属しているためです。

このとき、友人の中には「ChatGPT は CodeX ほど強力ではないのでは？」と尋ねる人もいるでしょう。

心配しないでください。忘れないでください。ChatGPT の特徴の 1 つは、質問すればするほど、より良い結果が得られることです。

たとえば、このベンチマークセットには、ビットカウントと呼ばれる質問があります。ChatGPT は、修復の最初のラウンドで間違った答えを返しました:

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

もともと、 ChatGPT は 7 行目の n ^ = n - 1 を n & = n - 1 に変更する必要があります。

しかし、最初のラウンドでは、次のような答えが返されました:

予想される動作と問題の原因となった入力に関する詳細な情報がなければ、プログラムにバグがあるかどうかわかりません。

したがって、さらに詳しい情報を提供した後、ChatGPT は質問に正しく答えました。

類推すると、最初のラウンドで正しく回答されなかった質問に対してより多くの情報プロンプトを提供した後、ChatGPT のバグ修正機能は大幅に改善されました。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

# #最終的に、ChatGPT は QuixBugs の 40 の質問のうち 31 に正解しました。

ネチズンは複雑な感情を抱いています

このような実験結果に関して、ChatGPTのバグ修正とSOTAの勝利に対するネチズンの態度は異なります。

一部のネチズンは、この問題でプログラマーは危機を感じるべきではなく、幸せになれるはずだと信じています。

つまり、このような便利なツールがあれば、プログラマは半分の労力で 2 倍の結果が得られるということです。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

ただし、これについては別の見方をする人もいます。

仕事が単純になったからといって、人手が増えるわけではありません。必要です。少ないですか?

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

しかし、一部のネチズンは、その作業に終わりがないと感じています:

AI によって開発時間が 1 桁短縮できたとしても、それはプログラマーが必要とするだけです。次のジョブがより速く処理されます。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだ

全体的に、ChatGPT はバグ修正に優れており、プログラマに致命的な害を与えることはありません。

しかし、OpenAI の他の活動に焦点を当てたらどうでしょうか?

コードを書くための ChatGPT のグローバル採用およびアウトソーシングトレーニング

これに先立ち、OpenAI は、ChatGPT の重要な用途の 1 つはプログラマがコードをチェックするのを支援することであると述べました。

つまり、補助的に利用できるツールという位置づけです。

「ChatGPT は脅威である」という見方に比べ、ChatGPT の機能が完全に進化すると、プログラマはバグを書くことを恐れる必要がなくなります。

OpenAI によって配置されたチェス盤には、バグを修正したり、タワープログラマーの地位を盗んだりするだけではありません。

OpenAI をより大きく、より強力にするために、ラテンアメリカと東ヨーロッパで 1,000 件のアウトソーシングポジションを提供することが公開されました。

外注従業員の主な仕事は、データにラベルを付け、コードを書くように ChatGPT をトレーニングすることです

これら 1,000 人のうち 40% がプログラマーです。彼らは OpenAI モデル用のデータを作成し、それをソフトウェアの学習に使用しますエンジニアリングタスク。

長い間、OpenAI のトレーニングデータは GitHub から取得されてきました。

外部委託された初心者のプログラマが作成するデータセットには、コード行だけでなく、コード行の背後にある人間の思考の論理的なステップも含まれるようになりました。

南米のソフトウェア開発者が、OpenAI の 5 時間の無料コーディングテストを完了したというニュースを発表しました。

プロセス全体を通じて、彼のタスクは 2 つの部分に分割されました。

コーディングの問題に対処する方法を英語で説明し、解決策を提供します。
バグが見つかった場合、OpenAI はバグの具体的な状況と修正方法について詳しく質問します。

プログラマは、問題について考える各ステップを示す必要があり、OpenAI が ChatGPT に非常に具体的なトレーニングデータを提供したいのではないかと推測しています。

Tesla の元 AI ディレクター、アンドレイ・カルパシー氏は Twitter で次のように冗談を飛ばしました:

最近人気のあるプログラミング言語は英語です。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだそうは言っても、ChatGPT に強力なバグ修正機能があるのは良いことです。また、それが本当に進化できるのであれば、それも良いことです。コードの暗記部分を完了できるポイント。

結局のところ、OpenAI が設立されたときに表明された目的は、「汎用人工知能が全人類に利益をもたらすことを保証する」ということでした。

一見すると、この組織が長年にわたって行ってきたことは、一部の人々の努力を利用してより多くの人々を失業させることに取り組んでいるように見えます。

Dota2 アリーナでの人間の粉砕から GPT-3、DALL-E2、ChatGPT の輝かしいパフォーマンスまで、Dota2 がもたらす新製品には常に「xxx は職を失いそうだ」という議論がつきものです。」

しかし、何があっても、ビジネスは常にそれを支持してきました。

現時点では、OpenAI の主なビジネスモデルは API 料金、トークン料金、ソフトウェアライセンスです。

OpenAI は最近、ChatGPT の有料版 ChatGPT Pro もリリースしました。料金は月額 42 米ドル (約 285 人民元) です。

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだロボット対話スタートアップが雨後の筍のように出現しているにもかかわらず、市場が引き続き OpenAI に対して楽観的である兆候は数多くあります。

Microsoft は、OpenAI に数十億ドルを投資し、OpenAI のモデルを Microsoft Bing などのコンシューマおよびエンタープライズ製品に統合すると発表しました。

関係者によると、追加投資額は約100億ドル。

同時にWSJは、1月初旬に億万長者のピーター・ティール氏が設立したベンチャーキャピタルファンドであるファウンダーズ・ファンドがOpenAIへの投資交渉を行っていることを明らかにした。

資金調達額は少なくとも3億ドルに達すると報じられている。

One More Thing

実験の最初のラウンドでは、ChatGPT は QuixBugs データセットのビット数の問題を解決できませんでした。

しかし、今もう一度この質問をすると、ChatGPT は「再び渡される」ことができることがわかります:

ChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだつまり、これは ChatGPT がから変更されましたこの研究中に問題を解決する方法を学びましたか?

参考リンク:

[1] //m.sbmmt.com/link/5f5d472067f77b5c88f69f1bcfda1e08
[2] https://www.php. cn/link/8a47481ae534860850adf59f145e6b40
[3] //m.sbmmt.com/link/7806689d934e610d660caf5536fea0b2
[4] //m.sbmmt.com/link/4271846620d203fd0511c422d483cdbd

以上がChatGPT のバグ修正は分野を席巻し、その精度は 78% でした。ネチズン: プログラマは幸せになるべきだの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

ai chatgpt データセット

ソース：51cto.com

前の記事：GPU は数秒で 3D モデルを生成できます。 OpenAI の新作: Point-E はテキストを使用して 3D 点群モデルを生成できます次の記事：自動運転ハードウェアが事前に組み込まれた後、自動車会社はデータの閉ループをどのように実現するのでしょうか?

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

未来を創る: まったくの初心者のための Java プログラミング

2024-10-13 13:32:21
あなたは一人ではありません: サポート力のあるコミュニティとともに Python をマスターしましょう

2024-10-12 11:58:51
初心者からプログラマーまで: Python プログラミングの力を活用する

2024-10-11 20:06:51
プログラマーのように考える: Java の基礎を学ぶ

2024-10-11 18:59:31
Java をシンプルに: プログラミング能力を高める初心者向けガイド

2024-10-11 18:30:51
PHP でブログを構築する: 初心者に優しいプロジェクト

2024-10-11 15:51:51
システムの言語を話す: C を一度に 1 行ずつ学習

2024-10-11 15:42:10
C のデータ構造とアルゴリズム: 初心者に優しいアプローチ

2024-10-11 14:41:20
涙のないコーディング: 簡単な方法で C を学ぶ

2024-10-11 14:08:31
Java によるデータ分析: 情報処理の初心者ガイド

2024-10-11 13:42:21

最新の問題

React Native Expo を使用して複数の画像を Firebase コレクションと Firebase にアップロードします ReactNative の「expo」を使用して複数の画像を Firebase Storage および Firebase Database コレクションにアップロードしようとしてい...

から 2024-04-04 23:20:02

0

1

1468

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート