지역 사회 배우다 도구 라이브러리 여가

한국어

집 > 기술 주변기기 > 일체 포함 > OmniDrive: 대형 모델을 3D 운전 작업에 맞추기 위한 프레임워크

OmniDrive: 대형 모델을 3D 운전 작업에 맞추기 위한 프레임워크

PHPz

풀어 주다： 2024-05-06 15:16:35

앞으로

1098명이 탐색했습니다.

희소 쿼리를 사용하여 시각적 표현을 3D로 리프트 및 압축한 다음 LLM에 공급하는 새로운 3D MLLM 아키텍처로 시작하세요.

제목: OmniDrive: 3D 인식 추론 및 계획을 통한 자율 주행을 위한 전체적인 LLM 에이전트 프레임워크

저자 소속: Beijing Institute of Technology, NVIDIA, Huazhong University of Science and Technology

오픈 소스 주소: GitHub - NVlabs/OmniDrive

다양성 MLLM(대형 언어 모델)의 개발로 인해 강력한 추론 기능을 활용하는 LLM 기반 자율 주행에 대한 관심이 높아졌습니다. MLLM의 강력한 추론 기능을 활용하여 계획 행동을 개선하는 것은 2D 추론을 넘어 완전한 3D 상황 인식이 필요하기 때문에 어렵습니다. 이러한 과제를 해결하기 위해 이 연구에서는 에이전트 모델과 3D 운전 작업 간의 강력한 정렬을 위한 포괄적인 프레임워크인 OmniDrive를 제안합니다. 프레임워크는 희소 쿼리를 사용하여 관측 표현을 3D로 리프트 및 압축한 다음 LLM에 공급하는 새로운 3D+MLLM 아키텍처로 시작됩니다. 이 쿼리 기반 표현을 사용하면 동적 개체와 정적 지도 요소(예: 교통 도로)를 공동으로 인코딩하여 3D의 인식-동작 정렬을 위한 간결한 세계 모델을 제공할 수 있습니다. 또한 장면 설명, 교통 규칙, 3D 접지, 반사실적 추론, 의사 결정 및 계획을 포함한 포괄적인 시각적 질문 응답(VQA) 작업을 포함하는 새로운 벤치마크를 제안합니다. 광범위한 연구를 통해 복잡한 3D 장면에서 OmniDrive의 뛰어난 추론 및 계획 기능이 입증되었습니다.

네트워크 구조

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

실험 결과

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架

위 내용은 OmniDrive: 대형 모델을 3D 운전 작업에 맞추기 위한 프레임워크의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨：

git 3d 자율주행

원천：51cto.com

이전 기사：MLP가 하룻밤 사이에 사망했습니다! MIT Caltech 및 기타 혁신적인 KAN, 기록을 깨고 DeepMind를 무너뜨린 수학적 정리 발견 다음 기사：현재 프런트엔드 편집기를 살펴보세요.

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

코딩의 핵심: 초보자를 위한 C의 힘 활용

2024-10-13 11:44:01
PHP 및 MySQL을 사용하여 웹사이트를 데이터베이스에 연결

2024-10-13 09:56:31
Python을 사용한 문제 해결: 초보 코더로서 강력한 솔루션 잠금 해제

2024-10-11 20:58:41
단순화된 Python Power: 프로그래밍에 대한 초보자 친화적인 접근 방식

2024-10-11 16:53:11
PHP와 소셜 미디어: 귀하의 웹사이트를 전 세계와 통합하세요

2024-10-11 11:54:51
PHP를 사용한 동적 이미지 갤러리: 귀하의 작업을 온라인으로 선보이세요

2024-10-10 16:21:01
PHP로 API 및 웹 서비스 구축

2024-10-10 15:18:02
Demystifying Java: 새로운 프로그래머를 위한 명확하고 쉬운 길

2024-10-10 13:34:01
C로 게임과 그래픽 만들기: 재미있고 실용적인 소개

2024-10-10 13:26:26
Glory of Kings에서 Cheng Yaojin을 플레이하는 방법은 무엇입니까?

2024-10-10 11:38:42

최신 이슈

3. JS 3D 모델이 추가되었으나 보이지 않습니다. 내 웹사이트에 3D 모델을 추가하려고 합니다. 저는 세 개의 .js를 사용하고 있습니다. 모든 것을 시도했지만 3D 모델을 표시할 수 없었습니다. 개발자 도구의 ...

에서 2024-04-03 19:06:13

0

1

264

TypeError: ThreeJs를 사용하여 정의되지 않은('위치' 읽기) 속성을 읽을 수 없습니다. 내 웹사이트의 히어로 섹션 배경에 3D 모델을 통합하려고 합니다. 작동하지만 창 크기를 수동으로 변경하면 3D 모델이 새 크기에 맞춰 조정되지 않습니다. 첫 번째...

에서 2024-04-01 12:01:52

0

1

416

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿