社区

学习

工具库

AI工具

休闲

简体中文

首页 > 科技周边 > 人工智能 > 封闭式学习背后的数学

封闭式学习背后的数学

王林

发布： 2025-02-26 00:03:10

原创

643 人浏览过

现代大语言模型（LLMS）的关键特征（LLMS）

内部文化学习（ICL）允许变形金刚根据输入提示中的示例进行适应。使用几个任务示例，很少有提示有效地证明了所需的行为。但是，变形金刚如何实现这种适应？本文探讨了ICL背后的潜在机制。

The Math Behind In-Context Learning

ICL的核心是：给定的示例对（（x，y）），注意机制可以学习算法以将新查询（x）映射到其输出（y）？

> SoftMax的注意力和最近的邻居搜索

softmax的注意公式是：

The Math Behind In-Context Learning

引入反向温度参数，

c ，修改了注意力分配：

The Math Behind In-Context Learning

AS

> c 接近无穷大，注意变成了一个旋转向量，仅关注最相似的令牌 - 实际上是最近的邻居搜索。使用有限的c ，注意与高斯内核平滑相似。这表明ICL可能会在输入输出对上实现最近的邻居算法。 的含义和进一步的研究

了解变压器如何学习算法（如最近的邻居）为汽车打开门。 Hollmann等。在合成数据集上展示了训练变压器，以学习整个汽车管道，从单个通行证中预测新数据的最佳模型和超参数。

最近的研究（Garg等，2022，Oswald等，2023）将变形金刚的ICL与梯度下降联系起来。线性注意力，省略软件操作：

>类似于预处理的梯度下降（PGD）：>

The Math Behind In-Context Learning

一层线性注意执行一个PGD步骤。

结论 The Math Behind In-Context Learning 注意机制可以实现学习算法，通过从演示对学习来启用ICL。尽管多个注意层和MLP的相互作用很复杂，但研究阐明了ICL的力学。本文提供了这些见解的高级概述。

>

进一步阅读：

>内部的学习和归纳负责人
>变形金刚可以在文化中学习什么？简单函数类别的案例研究
变形金刚通过梯度下文学习
变形金刚学习实施预处理的梯度下降

确认

>本文的灵感来自密歇根大学2024年秋季研究生课程。任何错误都是作者的。

以上是封闭式学习背后的数学的详细内容。更多信息请关注PHP中文网其他相关文章！

上一篇：从简历到求职信，使用AI和LLM，带有Python和简化下一篇：2024年编码的LLM：价格，性能和争取最佳的战斗

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

培训大语言模型：从TRPO到GRPO

2025-02-26 04:41:08
托管开源LLM的经济学

2025-02-26 03:15:10
当机器提前思考时：战略AI的兴起

2025-02-26 03:06:12
了解chatgpt的演变：第3部分 - Codex和Consendgpt的见解

2025-02-26 02:58:10
LLM中具有稀疏自动编码器的特征电路的配方

2025-02-26 01:46:08
封闭式学习背后的数学

2025-02-26 00:03:10
从简历到求职信，使用AI和LLM，带有Python和简化

2025-02-25 23:59:12
我们需要的一切吗？

2025-02-25 19:49:12
AI驱动的信息提取和对接

2025-02-25 19:27:13
为业务计划和企业家精神制定AI驱动的智能指南

2025-02-25 18:36:11

最新问题

function_exists()无法判定自定义函数 function test() { return true; } if (function_exists('TEST')) { ech...

来自于 2024-04-29 11:01:01

0

3

2837

google 浏览器手机版显示的怎么实现老师您好，google 浏览器怎么变成手机版样式的？

来自于 2024-04-23 00:22:19

0

11

2961

子窗口操作父窗口，输出没反应前两句可执行，最后一句没法应

来自于 2024-04-19 15:37:47

0

1

2482

父窗口没有输出 document.onclick = function(){ window.opener.document.write('我是子窗口的输出'); ...

来自于 2024-04-18 23:52:34

0

1

2407

关于CSS思维导图的课件在哪？课件

来自于 2024-04-16 10:10:18

0

0

2453

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1434460
php入门教程之一周学会PHP

4291331
JAVA 初级入门视频教程

2638880
小甲鱼零基础入门学习Python视频教程

515002
PHP 零基础入门教程

874533

最新下载

更多>

网站特效

网站源码

网站素材

前端模板