Article Sujet apprentissage Télécharger Questions et réponses Dictionnaire de programmation Jeu mises à jour récentes

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

Maison> Périphériques technologiques> IA> le corps du texte

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

WBOY

Libérer： 2023-05-10 14:22:07

avant

1061 Les gens l'ont consulté

ChatGPT中有这样一个核心训练方法，名叫“人类反馈强化学习（RLHF）”。

它可以让模型更安全、输出结果更遵循人类意图。

现在，来自谷歌Research和UC伯克利的研究人员发现，将该方法用在AI绘画上，“治疗”图像跟输入不完全匹配的情况，效果也奇好——

可以实现高达47%的改进。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

△ 左为Stable Diffusion，右为改进后效果

这一刻，AIGC领域中两类大火的模型，似乎找到了某种“共鸣”。

如何将RLHF用于AI绘画？

RLHF，全称“Reinforcement Learning from Human Feedback”，是OpenAI和DeepMind于2017年合作开发的一种强化学习技术。

正如其名，RLHF就是用人类对模型输出结果的评价（即反馈）来直接优化模型，在LLM中，它可以使得“模型价值观”更符合人类价值观。

而在AI图像生成模型中，它可以让生成图像与文本提示得到充分对齐。

具体而言，首先，收集人类反馈数据。

在这里，研究人员一共生成了27000余个“文本图像对”，然后让一些人类来打分。

为了简单起见，文本提示只包括以下四种类别，分别关乎数量、颜色、背景和混合选项；人类的反馈则只分“好”、“坏”与“不知道（skip）”。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

其次，学习奖励函数。

这一步，就是利用刚刚获得的人类评价组成的数据集，训练出奖励函数，然后用该函数来预测人类对模型输出的满意度（公式红色部分）。

这样，模型就知道自己的结果究竟有几分符合文本。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

除了奖励函数，作者还提出了一个辅助任务（公式蓝色部分）。

也就是当图像生成完成后，模型再给一堆文本，但其中只有一个是原始文本，让奖励模型“自己检查”图像是否跟该文本相匹配。

这种逆向操作可以让效果得到“双重保险”（可以辅助下图中的step2进行理解）。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

最后，就是微调了。

即通过奖励加权最大似然估计（reward-weighted likelihood maximization）（下公式第一项），更新文本-图像生成模型。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

为了避免过拟合，作者对预训练数据集上的NLL值（公式第二项）进行了最小化。这种做法类似于InstructionGPT (ChatGPT的“直系前辈”）。

效果提升47%，但清晰度下滑5%

如下一系列效果所示，相比原始的Stable Diffusion，用RLHF微调过后的模型可以：

（1）更正确地get文本里的“两只”和“绿色”；

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

（2）不会忽略“大海”作为背景的要求；

（3）想要红老虎，能给出“更红”的结果。

从具体数据来看，微调后的模型人类满意度为50%，相比原来的模型（3%），得到了47%的提高。

不过，代价是失去了5%的图像清晰度。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

从下图我们也能很清楚的看到，右边的狼明显比左边的糊一些：

对此，作者表示，使用更大的人类评价数据集和更好的优化 (RL) 方法，可以改善这种情况。

关于作者

本文一共9位作者。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

一作为谷歌AI研究科学家Kimin Lee，韩国科学技术院博士，博士后研究在UC伯克利大学展开。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

华人作者三位：

Liu Hao，UC伯克利在读博士生，主要研究兴趣为反馈神经网络。

Du Yuqing，同UC伯克利博士在读，主要研究方向为无监督强化学习方法。

Shixiang Shane Gu (顾世翔)，通讯作者，本科师从三巨头之一Hinton，博士毕业于剑桥大学。

ChatGPT核心方法可用于AI绘画，效果飞升47%，通讯作者：已跳槽OpenAI

△ 顾世翔

值得一提的是，写这篇文章时他还是谷歌人，如今已经跳槽至OpenAI，并在那里直接向ChatGPT负责人报告。

论文地址：

https://arxiv.org/abs/2302.12192

参考链接：[1]//m.sbmmt.com/link/4d42d2f5010c1c13f23492a35645d6a7

[2]https://openai.com/blog/instruction-following/

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées：

ai chatgpt 绘画

source：51cto.com

Article précédent：移动传感器引导的跨时节六自由度视觉定位，准确且高效 Article suivant：挑战 ChatGPT，马斯克欲打造寻求真相的“TruthGPT”人工智能

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Le prix du Toncoin chute au milieu de la baisse des intérêts ouverts

2024-08-17 03:44:08
Les investisseurs institutionnels ont investi 4,7 milliards de dollars dans les ETF Spot Bitcoin au deuxième trimestre 2024

2024-08-17 03:42:08
Bitcoin (BTC) Mining Stocks See Notable Decline in Early August, Giving Back Gains Linked to Artificial Intelligence (AI)

2024-08-17 03:38:08
NYSE and Nasdaq Withdraw Bitcoin and Ether ETF Options Rule Changes After SEC Request

2024-08-17 03:31:08
Nasdaq and NYSE Withdraw Bitcoin ETF Options Proposals, But Interest Remains

2024-08-17 03:30:08
Binance Futures Announces 30,000 USDC Prize Pool in New Promotions

2024-08-17 03:29:08
The Tron Ecosystem Launches Its Own Meme Token Launchpad, SunPump

2024-08-17 03:28:08
DTX Exchange (DTX) Overshadows Cardano (ADA) & Tron (TRX)

2024-08-17 03:25:08
MoonTaurus (MNTR) Emerges as a Top Contender in the Meme Coin Sector, Challenging Dogecoin (DOGE) for Market Dominance

2024-08-17 03:24:08
Grayscale Faces Fierce Competition as Blackrock's Onchain Assets Climb

2024-08-17 03:23:08

Derniers numéros

Créer un compteur animé dans React.js : un guide étape par étape Je cherche un moyen d'animer un compteur dans React. Par exemple, j'ai 3 composants avec l...

Depuis 2023-10-21 19:46:40

0

1

285

Comment empêcher l'image d'arrière-plan de scintiller lors d'un changement J'applique une image d'arrière-plan répétitive du canevas au div via JavaScript comme ceci...

Depuis 2023-10-20 21:38:57

0

2

344

Est-il possible d'ajouter des dégradés aux chemins SVG ? Je souhaite mettre en place sur mon site Web un simple indicateur de chargement déclenché ...

Depuis 2023-10-18 14:55:02

0

2

195

Re-rendu à l'aide de React.StrictMode et de l'instance Canvas de fabric.js Je crée une toile en tissu et des boutons qui instancient des formes qui doivent être séle...

Depuis 2023-09-21 23:48:52

0

1

464

Pourquoi la fonctionnalité de rembobinage lent de ma fonction d'animation ne fonctionne-t-elle pas ? Je ne comprends pas pourquoi le div revient à son état normal sans animation. J'ai tout es...

Depuis 2023-09-20 16:33:43

0

1

206

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal

À propos de nous Clause de non-responsabilité Sitemap: Site Web PHP chinois：Formation PHP en ligne sur le bien-être public，Aidez les apprenants PHP à grandir rapidement！