記事特集学ぶダウンロードに質問プログラミング辞典ゲーム最近の更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

ホームページ> テクノロジー周辺機器> AI> 本文

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

WBOY

リリース： 2023-05-10 14:22:07

転載

1061 人が閲覧しました

ChatGPT には「ヒューマンフィードバック強化学習 (RLHF)」と呼ばれる核となるトレーニング方法があります。

これにより、モデルがより安全になり、出力結果が人間の意図とより一致するようになります。

Google Research と UC Berkeley の研究者らは、AI ペイントでこの方法を使用すると、画像が入力と完全に一致しない状況を「処理」でき、その効果も驚くほど良好であることを発見しました—

最大 47% の改善が達成できます。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

△左が安定拡散、右が改善効果

現時点では、AIGC分野で人気の2つのモデルが見つかったようですある種の「共鳴」。

AI ペイントに RLHF を使用するにはどうすればよいですか?

RLHF、正式名は「Reinforcement Learning from Human Feedback」で、2017 年に OpenAI と DeepMind が共同開発した強化学習テクノロジーです。

名前が示すように、RLHF はモデルの出力結果 (つまりフィードバック) を人間が評価してモデルを直接最適化します。LLM では、「モデルの値」を人間の値とより一致させることができます。

AI 画像生成モデルでは、生成された画像をテキストプロンプトと完全に一致させることができます。

具体的には、まず人間のフィードバックデータを収集します。

ここで、研究者らは合計 27,000 を超える「テキストと画像のペア」を生成し、何人かの人間にそれらを採点するように依頼しました。

わかりやすくするために、テキストプロンプトには、量、色、背景、ブレンドオプションに関連する次の 4 つのカテゴリのみが含まれます。人間のフィードバックは、「良い」、「悪い」、「しない」の 3 つのみに分類されます。知っています(スキップ)" "。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

2 番目に、報酬関数を学習します。

このステップでは、取得した人間の評価で構成されるデータセットを使用して報酬関数をトレーニングし、この関数を使用してモデルの出力に対する人間の満足度を予測します (式の赤い部分)。

このようにして、モデルは結果がテキストとどの程度一致するかを認識します。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

#報酬関数に加えて、著者は補助タスク (式の青い部分) も提案しています。

つまり、画像生成が完了した後、モデルは大量のテキストを提供しますが、元のテキストはそのうちの 1 つだけであり、画像が一致するかどうかを報酬モデルに「自らチェック」させます。文章。

この逆の操作により、効果を「二重の保険」にすることができます (下図のステップ 2 を理解するのに役立ちます)。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

最後に、微調整です。

つまり、テキスト画像生成モデルは、報酬重み付け尤度最大化 (以下の式の最初の項目) を通じて更新されます。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

#過学習を避けるために、作成者はトレーニング前のデータセットの NLL 値 (式の第 2 項) を最小化しました。このアプローチは、structGPT (ChatGPT の「直接の前身」) に似ています。

エフェクトは 47% 増加しましたが、明瞭度は 5% 低下しました。

次の一連のエフェクトに示すように、元の安定した拡散と比較して、RLHF で微調整されたモデルは、 :

(1) テキスト内の「two」と「green」をより正確に理解します;

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

(2) ではありません「海」を無視する背景要件として;

(3) 赤いタイガーが必要な場合は、「より赤い」結果が得られます。

具体的なデータから判断すると、微調整モデルの人間の満足度は 50% で、元のモデル (3%) と比較して 47% 向上しています。

ただし、その代償として画像の鮮明さが 5% 失われます。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

下の写真からも、右側のオオカミが左側のオオカミよりも明らかにぼやけていることがわかります。

はいしたがって、著者らは、より大規模な人による評価データセットとより優れた最適化 (RL) 手法を使用することで状況を改善できる可能性があると示唆しています。

著者について

この記事の著者は合計 9 名です。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

韓国科学技術研究院の Google AI 研究科学者 Kimin Lee 博士は、カリフォルニア大学バークレー校で博士研究員として研究を実施しました。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

中国人著者は 3 人です:

Liu Hao カリフォルニア大学バークレー校の博士課程の学生で、主な研究対象はフィードバックニューラルです。ネットワーク。

Du Yuqing はカリフォルニア大学バークレー校の博士課程候補者で、主な研究方向は教師なし強化学習法です。

責任著者のShixiang Shane Gu (Gu Shixiang) は、学部の学位を三大巨人の一人であるヒントンに師事し、ケンブリッジ大学を卒業して博士号を取得しました。

ChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えました

△Gu Shixiang

この記事を書いているとき、彼はまだ Google 社員でしたが、現在は OpenAI に転職しました。 ChatGPT担当者からの報告に直属します。

論文アドレス:

https://arxiv.org/abs/2302.12192

参考リンク: [1]https://www.php .cn/link/4d42d2f5010c1c13f23492a35645d6a7

[2] https://openai.com/blog/instruction-following/

以上がChatGPT のコアメソッドを AI ペイントに使用でき、効果が 47% 向上担当著者: OpenAI に切り替えましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

ai chatgpt 絵画

ソース：51cto.com

前の記事：モバイルセンサーによる正確かつ効率的な、時間横断的な 6 自由度の視覚的位置決め次の記事：ChatGPTに挑戦、マスク氏は真実を追求する「TruthGPT」人工知能の構築を望んでいる

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

建玉減少の中でトンコイン価格が下落

2024-08-17 03:44:08
機関投資家は2024年第2四半期にスポットビットコインETFに47億ドルを流入

2024-08-17 03:42:08
ビットコイン（BTC）マイニング株、8月初旬に大幅下落、人工知能（AI）関連で上昇を取り戻す

2024-08-17 03:38:08
NYSEとナスダック、SECの要請を受けてビットコインとイーサETFオプションのルール変更を撤回

2024-08-17 03:31:08
ナスダックとニューヨーク証券取引所、ビットコインETFオプションの提案を撤回、しかし関心は残る

2024-08-17 03:30:08
Binance Futures が新しいプロモーションで 30,000 USDC の賞金総額を発表

2024-08-17 03:29:08
Tron エコシステムが独自のミームトークン起動パッドである SunPump を開始

2024-08-17 03:28:08
DTX Exchange (DTX) が Cardano (ADA) と Tron (TRX) を覆す

2024-08-17 03:25:08
MoonTaurus (MNTR) がミームコインセクターのトップ候補として浮上し、市場の優位性をめぐってドージコイン (DOGE) に挑戦

2024-08-17 03:24:08
ブラックロックのオンチェーン資産が上昇する中、グレースケールは熾烈な競争に直面している

2024-08-17 03:23:08

最新の問題

React.js でアニメーションカウンターを作成する: ステップバイステップガイド React でカウンターをアニメーション化する方法を探しています。たとえば、次の構造を持つ 3 つのコンポーネントがあります。マスター: 論理コンポーネントカウンタ (マスター...

から 2023-10-21 19:46:40

0

1

285

背景画像変更時のちらつきを防ぐ方法次のように、JavaScript を使用してキャンバスから div に繰り返し背景画像を適用しています。 varimg_canvas=document.createElement(...

から 2023-10-20 21:38:57

0

2

344

SVG パスにグラデーションを追加することはできますか? スクリプトによってトリガーされる単純な読み込みインジケーターを Web サイトに配置したいと考えています。これは勾配のある単純な円弧であり、ユーザーが待っている間に回転する必要があ...

から 2023-10-18 14:55:02

0

2

195

React.StrictModeとfabric.jsのCanvasインスタンスを使用した再レンダリング選択可能な形状をインスタンス化するファブリックキャンバスとボタンを作成しています。次の状況でコンポーネントが 2 回再レンダリングされる理由がわかりません。そのため、生地の形状を...

から 2023-09-21 23:48:52

0

1

464

アニメーション機能の低速巻き戻し機能が動作しないのはなぜですか? div がアニメーションなしで通常の状態に戻る理由がわかりません。ここですべてを試しましたが、私のコードは次のとおりです。多くの場所を探しましたが、問題が見つかりません。 <...

から 2023-09-20 16:33:43

0

1

206

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート

私たちについて免責事項 Sitemap: PHP中国語ウェブサイト：福祉オンライン PHP トレーニング，PHP 学習者の迅速な成長を支援します！