社区学习工具库休闲

简体中文

首页 > 科技周边 > 人工智能 > 评估清华大学研发的 LLM4VG 基准在视频时序定位方面的性能

评估清华大学研发的 LLM4VG 基准在视频时序定位方面的性能

WBOY

发布： 2024-01-04 22:38:14

转载

1143 人浏览过

清华大学研发 LLM4VG 基准：用于评估 LLM 视频时序定位性能

12 月 29 日消息，大语言模型（LLM）的触角已经从单纯的自然语言处理，扩展到文本、音频、视频等多模态领域，而其中一项关键就是视频时序定位（Video Grounding，VG）。

清华大学研发 LLM4VG 基准：用于评估 LLM 视频时序定位性能

VG任务的目标是根据给定的查询，定位目标视频段的起始和结束时间。这个任务的核心挑战在于准确确定时间边界。

清华大学研究团队近日推出了“LLM4VG”基准，这是一个专门设计用于评估 LLM 在 VG 任务中的性能。

在考虑此基准的时候，有两种主要的策略被考虑了。第一种策略是直接在文本视频数据集（VidLLM）上训练视频语言模型（LLM）。这种方法是通过在大规模的视频数据集上进行训练，来学习视频和语言之间的关联，以提高模型的性能。第二种策略是将传统的语言模型（LLM）与预训练的视觉模型结合起来。这种方法是基于预训练的视觉模型，将视频的视觉特

清华大学研发 LLM4VG 基准：用于评估 LLM 视频时序定位性能

在一种策略中，VidLLM模型直接处理视频内容和VG任务指令，并根据其训练输出预测文本-视频之间的关系。

第二种策略则更加复杂，它涉及到LLM（Language and Vision Models）和视觉描述模型的运用。这些模型能够生成与VG（Video Game）任务指令相结合的视频内容的文本描述，而这些描述经过精心设计的提示来实现。

这些提示是经过精心设计的，它们的目的是将VG的指令和提供的视觉描述有效地结合起来，以帮助LLM处理和理解与任务相关的视频内容。

据观察，VidLLM 尽管直接在视频内容上进行训练，但在实现令人满意的 VG 性能方面仍然存在很大差距。这一发现强调了在训练中纳入更多与时间相关的视频任务以提高性能的必要性。

清华大学研发 LLM4VG 基准：用于评估 LLM 视频时序定位性能

而第二种策略优于 VidLLM，为未来的研究指明了一个有希望的方向。该策略主要限制于视觉模型的局限性和提示词的设计，因此能够生成详细且准确的视频描述后，更精细的图形模型可以大幅提高 LLM 的 VG 性能。

清华大学研发 LLM4VG 基准：用于评估 LLM 视频时序定位性能

总之，该研究对 LLM 在 VG 任务中的应用进行了开创性的评估，强调了在模型训练和提示设计中需要更复杂的方法。

本站附上论文参考地址：//m.sbmmt.com/link/a7fd9fd835f54f0f28003c679fd44b39

以上是评估清华大学研发的 LLM4VG 基准在视频时序定位方面的性能的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

人工智能清华大学

来源：51cto.com

上一篇：时研家AI的创新之路瞄准百亿腕表市场下一篇：提供多款UE游戏的6DOF VR体验——UEVR Beta展示

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

什么是 NullPointerException，如何修复它？

2024-10-22 09:46:29
从新手到程序员：您的旅程从 C 基础知识开始

2024-10-13 13:53:41
使用PHP解锁网络开发：初学者指南

2024-10-12 12:15:51
揭秘 C：为新程序员提供一条清晰简单的道路

2024-10-11 22:47:31
释放您的编码潜力：绝对初学者的 C 编程

2024-10-11 19:36:51
释放你内心的程序员：C 绝对初学者

2024-10-11 15:50:41
使用 C 自动化您的生活：适合初学者的脚本和工具

2024-10-11 15:07:41
PHP 变得简单：Web 开发的第一步

2024-10-11 14:21:21
使用 Python 构建任何东西：释放创造力的初学者指南

2024-10-11 12:59:11
编码的关键：为初学者释放 Python 的力量

2024-10-11 12:17:31

最新问题

放大 d3.js 时散点图点不会保持值这是我第一次使用d3.js，所以请耐心等待。我在vue.js文件中将其作为纯JavaScript实现。我正在尝试制作具有缩放功能的散点图。到目前为止，我几乎一切正常，但当我缩放时，...

来自于 2024-04-06 18:16:26

0

1

403

我在使用CSS网格时遇到了高度不符合预期的问题，我可能犯了哪些错误？我目前正在学习CSS网格，并且被要求通过将其分解为网格来制作这张卡片。附上了我想要制作的网格的图片。实际上有一个更大的网格（在CSS中称为profile-grid），所有这些卡片都...

来自于 2024-04-06 12:52:14

0

1

339

我的乘法 (*) 命令不计算我的星号不起作用，当我执行calc()函数并执行乘法标记（即星号）时，该函数不起作用我想尽快解决这个问题，因为我正在学习编程，我需要你帮助解决--标记大小：计算(var(--cel...

来自于 2024-04-04 21:18:17

0

1

315

如何在 html 中为我的框赋予不同的颜色？附注我已经更新了该帖子，以使其更加清晰！如何为html中的框指定不同的颜色来标记内部和外部应用程序？我正在尝试将盒子标记为不同的颜色，作为内部外部应用程序的标记。然后这个html被...

来自于 2024-04-02 23:21:49

0

1

302

如何根据父元素高度自动调整子元素的上边距？我在一次老的大学考试中遇到了问题。基本上它要求：获取这个json文件[{"colore":"#FF0080","pos_orizz...

来自于 2024-04-02 13:49:19

0

1

301

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1421465
php入门教程之一周学会PHP

4265314
JAVA 初级入门视频教程

2517137
小甲鱼零基础入门学习Python视频教程

506305
PHP 零基础入门教程

861486

最新下载

更多>

网站特效

网站源码

网站素材

前端模板