社区学习工具库休闲

简体中文

首页 > 科技周边 > 人工智能 > 目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

WBOY

发布： 2024-06-02 16:41:05

原创

1216 人浏览过

目标检测领域，迎来了新进展——

Grounding DINO 1.5，IDEA研究院团队出品，在端侧就可实现实时识别。

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

这一进展获得AI大佬沉向洋转发，他一般都是一年一转的节奏。

此次发布主要有两个版本：Pro和Edge。 Pro版更强，Edge版更快。

它仍然保留了上一个版本Grounding DINO双编码器-单解码器结构，在此基础上通过结合更大的视觉backbone 扩大模型尺寸，并使用超过2000万的Grounding 数据获得了丰富的语料，大幅提升了检测精度和速度，且通过Pro和Edge版本分别针对不同应用场景进行了优化。

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

在大规模数据集构建和高精度需求场景中，Pro版本表现卓越，而Edge版本则在端侧部署中展示了其独特的优势。

这就来分别看一看。

Pro版目标检测新SOTA

Grounding DINO 1.5 Pro版本实现了当前开集目标检测SOTA水平，在图像和文本的语义理解上表现出色，能够快速、准确地根据语言提示检测和识别图像中的目标对象。

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

△在COCO、LVIS、ODinW35和ODinW13基准测试中的零样本迁移性能对比

物体级别理解是机器和物理世界交互的感知基础，也是解决多模态大模型（VLM）幻觉问题绕不过去的基础问题。

作为当前性能最好的开集检测模型，Grounding DINO 1.5 Pro 可以帮助构建海量的具有物体级别语义信息的多模态数据，从而有效地助力多模态大模型的训练。

它可以将长文本描述中的短语与图像中的具体对象或场景精确匹配，以增强AI对视觉内容和文本之间关系的理解

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

另外，在其他需要处理大量复杂数据的领域，如电商、社交媒体和自动驾驶等，Grounding DINO 1.5 Pro 也具有强大应用价值。

例如，在电商领域，该模型可以帮助快速标注商品图像，优化搜索和推荐系统。在社交媒体中，该模型能自动标注用户上传的图片，提升内容审核和分类的效率。

支持行业数据微调

除此之外，Pro版还支持通过行业数据进行微调（fine tuning），以满足各行业的特定需求，从而达到更加精准的识别效果。

为了验证微调带来的提升，CVR团队在视觉领域通用的LVIS等公开数据集上进行了对比实验。

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

从最后两行可看出，Grounding DINO 1.5 Pro经过微调，在多个数据集上都展现出大幅的性能提升。

而在多个实际场景，也十分适配。

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

像在医疗领域，通过微调后的Grounding DINO 1.5 Pro可以更准确地识别医疗影像中的病灶，辅助医生进行诊断，提高诊疗效率。

在零售行业，微调后的模型能更精准地识别和分类商品，有助于库存管理和销售分析。

Edge版端侧可部署

在端侧部署方面，Grounding DINO 1.5 Edge版本通过模型结构优化，成功部署在NVIDIA Orin NX卡上，并实现了10FPS的推理速度。

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

再者，它可以让机器人和开放环境进行交互。

目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞

在自动驾驶领域，Grounding DINO 1.5 Edge未来可以在车辆上实时运行，实现高效的目标检测和环境感知，提高驾驶安全性。在智能安防中，该模型能快速处理视频监控数据，实时检测异常行为，提升安全监控的响应速度。

未来，Grounding DINO 1.5 Edge的运行速度有望提升至20到30FPS，进一步扩大其在边缘计算领域的应用范围。

论文链接：
https://arxiv.org/abs/2405.10300
项目试玩链接：
https://deepdataspace.com/playground/grounding_dino

以上是目标检测新SOTA，端侧实时识别，沉向洋罕见转发点赞的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

ai 目标检测

来源：51cto.com

上一篇：DiffMap：首个利用LDM来增强高精地图构建的网络下一篇：用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

什么是 NullPointerException，如何修复它？

2024-10-22 09:46:29
从新手到程序员：您的旅程从 C 基础知识开始

2024-10-13 13:53:41
使用PHP解锁网络开发：初学者指南

2024-10-12 12:15:51
揭秘 C：为新程序员提供一条清晰简单的道路

2024-10-11 22:47:31
释放您的编码潜力：绝对初学者的 C 编程

2024-10-11 19:36:51
释放你内心的程序员：C 绝对初学者

2024-10-11 15:50:41
使用 C 自动化您的生活：适合初学者的脚本和工具

2024-10-11 15:07:41
PHP 变得简单：Web 开发的第一步

2024-10-11 14:21:21
使用 Python 构建任何东西：释放创造力的初学者指南

2024-10-11 12:59:11
编码的关键：为初学者释放 Python 的力量

2024-10-11 12:17:31

最新问题

function_exists()无法判定自定义函数 function test() { return true; } if (function_exists('TEST')) { ech...

来自于 2024-04-29 11:01:01

0

3

2221

google 浏览器手机版显示的怎么实现老师您好，google 浏览器怎么变成手机版样式的？

来自于 2024-04-23 00:22:19

0

11

2364

子窗口操作父窗口，输出没反应前两句可执行，最后一句没法应

来自于 2024-04-19 15:37:47

0

1

1976

父窗口没有输出 document.onclick = function(){ window.opener.document.write('我是子窗口的输出'); ...

来自于 2024-04-18 23:52:34

0

1

1862

关于CSS思维导图的课件在哪？课件

来自于 2024-04-16 10:10:18

0

0

1933

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1423147
php入门教程之一周学会PHP

4268666
JAVA 初级入门视频教程

2535670
小甲鱼零基础入门学习Python视频教程

507325
PHP 零基础入门教程

862667

最新下载

更多>

网站特效

网站源码

网站素材

前端模板