文章专题学习下载问答编程词典手游最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

首页> 科技周边> 人工智能> 正文

AI自主设计提示词，谷歌DeepMind发现数学'深呼吸”能让大模型涨8分！

王林

发布： 2023-09-22 20:13:03

转载

642 人浏览过

提示词中加上“深呼吸”，AI大模型数学成绩就能再涨8.4分！

谷歌DeepMind团队最新发现，用这个新“咒语”（Take a deep breath）结合大家已经熟悉的“一步一步地想”（Let’s think step by step），大模型在GSM8K数据集上的成绩就从71.8提高到80.2分。

而且这个最有效的提示词，是AI自己找出来的。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

有人开玩笑说，当你深呼吸后，散热风扇的转速就会提高

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

有些人认为，新入职的高薪工程师们也应该冷静下来，因为他们的工作可能不会持续太久

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

相关论文《大语言模型是优化器》，再次引起轰动。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

具体来说，大模型自己设计的提示词在Big-Bench Hard数据集上最高提升50%。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

也有人的关注点在“不同模型的最佳提示词不一样”。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

在论文中，不仅仅是提示词设计这一任务，还测试了大模型在线性回归和旅行商问题等经典优化任务上的能力

模型不同，最佳提示词也不同

优化问题无处不在，基于导数和梯度的算法是强大的工具，但现实应用中也经常遇到梯度不适用的情况。

为解决这个问题，团队开发了新方法OPRO，也就是通过提示词优化（Optimization byPROmpting）。

不再是通过形式化定义优化问题并用程序求解，而是通过自然语言描述优化问题，并要求大型模型生成新的解决方案

一图流总结，就是对大模型的一种递归调用。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

每一步优化中，以之前生成的解决方案和评分作为输入，大模型生成新的方案并评分，再将其添加到提示词中，供下一步优化使用。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

论文主要使用谷歌的PaLM 2和Bard中的text-bison版本作为评测模型。

作为优化器，我们将使用四种模型，包括GPT-3.5和GPT-4

研究结果显示，不同的模型设计出的提示词风格以及适用的提示词风格也各不相同

此前在GPT系列上的AI设计出的最优提示词是“Let’s work this out in a step by step way to be sure we have the right answer.”

这个提示词使用APE方法设计，论文发表在ICLR 2023上，在GPT-3（text-davinci-002）上超过人类设计的版本“Let’s think step by step”。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

在谷歌系的PaLM 2和Bard上，APE版本在这次作为基准测试中表现不如人类版本

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

OPRO方法设计出来的新提示词中，“深呼吸”和“拆解这个问题”对PaLM来说效果最好。

对于text-bison版的Bard大模型来说，更倾向于提供更详细的提示词

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

此外，该论文还展示了大型模型在数学优化器方面的潜力

线性回归作为连续优化问题的示例。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

旅行商问题作为离散优化问题的示例。

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

仅仅通过提示，大模型就能找到不错的解决方案，有时甚至匹敌或超过手动设计的启发式算法。

然而，团队也认为大模型还无法替代传统基于梯度的优化算法。当问题规模较大时，例如节点数量较多的旅行商问题，OPRO方法的表现并不理想

团队提出了对未来改进方向的想法。他们认为目前的大模型还无法有效地利用错误案例，仅仅提供错误案例无法让大模型捕捉到错误的原因

一个有前景的方向是结合关于错误案例的更丰富的反馈，并总结优化轨迹中高质量和低质量生成提示的关键特征差异。

这些信息有可能帮助优化器模型更有效地改进过去生成的提示，并有可能进一步减少进行提示优化所需的样本数量

论文放出大量最优提示词

论文来自谷歌与DeepMind合并后的部门，但作者以原谷歌大脑团队为主，包括Quoc Le、周登勇。

共同一作为康奈尔大学博士毕业的复旦校友Chengrun Yang，和UC伯克利博士毕业的上交大校友陈昕昀。

团队还在论文中提供了许多实验中得到的最佳提示词，包括电影推荐、恶搞电影名字等实用场景。如果有需要的朋友，可以自行参考

AI自主设计提示词，谷歌DeepMind发现数学深呼吸”能让大模型涨8分！

论文地址：https://arxiv.org/abs/2309.03409

以上是AI自主设计提示词，谷歌DeepMind发现数学'深呼吸”能让大模型涨8分！的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

ai 模型

来源：51cto.com

上一篇：解密大规模模型的“迷思”，云测数据发布行业AI大模型数据解决方案下一篇：全新捷象灵立库托盘机器人：颠覆无人叉车赛道！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

KTC'25GR950”24.5 英寸显示器上架：1080P 180Hz Fast IPS，579 元

2024-08-19 22:45:02
红龙 KS87 三模机械键盘上架：Gasket 结构、4000 毫安时电池，148 元

2024-08-19 22:41:37
工具和资源 [实时文档]

2024-08-19 22:41:32
如何使用 PHP 缓存提高网站性能？

2024-08-19 22:33:39
轻松管理和安装您的私有 Go 模块

2024-08-19 22:33:32
华为freebuds

2024-08-19 22:02:08
三国谋定天下奇门阵有什么用

2024-08-19 21:49:08
荣耀Magic V3确认在IFA 2024全球首发；你也可以赢得一个

2024-08-19 21:42:42
努比亚Z70 Ultra拥有业界首款1.5K屏下摄像头

2024-08-19 21:42:33
如何防范最新电脑病毒攻击

2024-08-19 21:38:08

最新问题

Vue项目中未定义模块我刚刚通过运行npmini tvue@latest创建了一个新的Vue应用程序，如官方文档中指定的那样。然后我尝试按照Vue和Vite网站上的指南将Tailwind添加到我的应用程...

来自于 2023-11-17 12:38:53

0

2

394

tp6 查询器如何优化 tp6 model模型关联多个数据表查询时，使用查询器会很慢，要怎么优化，有没有优化的方法呀！求助！！！！！

来自于 2023-11-17 08:50:36

0

0

84

如何根据角色为每个用户定义一组权限的Laravel Spatie权限设置方法？我有4种类型的用户使用我的系统：1.超级管理员2.超级管理员团队、3.管理员和4。管理团队成员，因为我使用spatie来处理角色和权限，所以我有一组对于所有类型的用户来说都很常见的...

来自于 2023-11-14 12:58:58

0

1

292

WordPress 6.0 (add_editor_style) 不会在古腾堡编辑器中加载 style.css 我正在学习UdemyWordPress课程来创建自定义WordPress块主题。我成功在function.php中注册了块类型，并且可以在古腾堡编辑器中选择我的块。教程建议使用以下...

来自于 2023-11-12 20:37:50

0

2

261

遇到PHPMailer未定义类型错误（尝试使用Composer也无效）我不知道为什么会收到此“PHPMailer未定义类型”错误。首先，我尝试直接下载zip并从github复制代码，同样的问题出现，然后我下载了我不想下载的composer，但下载后仍...

来自于 2023-11-12 17:35:06

0

1

180

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1395102
php入门教程之一周学会PHP

4207058
JAVA 初级入门视频教程

2353289
小甲鱼零基础入门学习Python视频教程

493460
PHP 零基础入门教程

826556

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责声明 Sitemap: PHP中文网：公益在线PHP培训，帮助PHP学习者快速成长！