大模型与具身智能的火花，ICML 2024 MFM-EAI Workshop征稿和挑战赛启动-人工智能-PHP中文网

大模型与具身智能的火花，ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

PHPz

发布： 2024-07-15 11:57:57

原创

807 人浏览过

大模型与具身智能的火花，ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

Workshop 主页： https://icml-mfm-eai.github.io/

概述

近年来，多模态基础模型（MFM），例如 CLIP、ImageBind、DALL・E 3、GPT-4V、Gemini 和 Sora，已成为人工智能领域最引人注目且发展迅速的领域之一。同时，MFM 的开源社区也涌现出了诸如 LLaVA、LAMM、MiniGPT-4、Stable Diffusion 和 OpenSora 等具有代表性的开源项目。

不同于传统计算机视觉和自然语言处理模型，这类 MFM 正在积极探索通用问题解决方案。通过引入 MFM，具身智能（EAI）能够在模拟器和现实世界环境中更好地处理各种复杂任务。然而，在 MFM 和 EAI 的交叉领域，仍有许多尚未探讨和解决的问题，包括智能体长期决策、智能体运动规划、新环境泛化能力等。

本次 Workshop 将致力于探讨几个关键问题，包括但不限于：

MFM 的泛化能力；
用于具身智能的 MFM；
基于生成模型的世界模型；
模仿学习数据收集。

Workshop 征稿

该 workshop 聚焦于多模态基础模型（MFM）、具身智能（EAI）以及两项研究的交叉领域。本次征稿主题包括但不限于：

Training and evaluation of MFM in open-ended scenarios
Data collection for training embodied Agents
Framework designs for MFM-powered embodied agents
Perception and high-level planning in embodied agents empowered by MFM
Decision-making and low-level control in embodied agents empowered by MFM
Evaluation of the capability of embodied agents
Generative model as world simulator
Limitations of MFM in empowering EAI

投稿规则

本次投稿将通过 OpenReview 平台实行双盲审稿。投稿的正文篇幅为 4 页，参考文献和补充材料篇幅不限。

投稿格式和模板遵循 ICML 2024 投稿指南：https://icml.cc/Conferences/2024/CallForPapers
投稿入口：https://openreview.net/group?id=ICML.cc/2024/Workshop/MFM-EAI

时间节点

所有时间节点均为 [AoE] (Anywhere on Earth)。

大模型与具身智能的火花，ICML 2024 MFM-EAI Workshop征稿和挑战赛启动

MFM-EAI 挑战赛

三个赛道（可同时参与）

EgoPlan 挑战

EgoPlan 挑战旨在评估多模态大模型在现实世界场景中，针对人类日常活动所涉及的真实任务的规划能力。模型需要依据任务目标描述、第一人称视角视频和当前环境观察，选择合理的动作推进任务完成。

比赛官网：https://chenyi99.github.io/ego_plan_challenge/
报名方式：填写 [Google 表单](https://docs.google.com/forms/d/e/1FAIpQLScnWoXjZcwaagozP3jXnzdSEXX3r2tgXbqO6JWP_lr_fdnpQw/viewform?usp=sf_link)
报名时间：即日起 - 2024 年 7 月 1 日
奖项设置：
- 冠军：800 美元
- 亚军：600 美元
- 创新奖：600 美元