Greater Bay Area Science Forum │ 심천대학교 Huang Hui 교수: 지능형 그래픽 인식으로 로봇의 '목이 막히는' 문제를 해결합니다.-일체 포함-php.cn

Southern Finance 옴니미디어 연수생 기자 Ma Jialu가 Nansha에서 보도합니다

실제 3차원 동적 환경 기능이 부족하여 로봇 지능의 추가 개발이 제한됩니다. "5월 20일, 과학 기술 혁신 분야의 국가 리더이자 심천대학교 컴퓨터 및 소프트웨어 학부장인 Huang Hui는 여성 과학자 하위 포럼인 "군중 속에서 그녀를 찾아서"에서 지능형 그래픽 인식에 대한 자신의 연구를 소개했습니다. " 결과적으로 드론을 사용하여 3차원 공간을 완전 자동 및 자율적으로 탐색하고 더 적은 데이터량으로 더 높은 정밀도의 모델링을 달성합니다. 현재 이 성과는 국제적으로 선도적인 위치에 있습니다. 디지털 트윈, 지능형 로봇 제조 등 다양한 분야에 활용 가능합니다.

Greater Bay Area Science Forum │ 심천대학교 Huang Hui 교수: 지능형 그래픽 인식으로 로봇의 목이 막히는 문제를 해결합니다.

더 작은 데이터 크기, 더 높은 정확도

중국과학원 물리학연구소는 한때 디지털 트윈의 정의를 대중화했습니다. 디지털 트윈, 영어 이름은 Digital Twin(디지털 트윈)이며 디지털 매핑 및 디지털 미러링으로도 알려져 있습니다. 디지털 트윈은 특정 장치나 시스템을 기반으로 디지털 '복사본'을 생성하는 것을 의미합니다. 간단히 말하면 현실 세계의 물리적 사물을 디지털 가상 경험으로 변환하는 것입니다.

2023년 초 중국정보통신기술원에서 발표한 '디지털 트윈 시티 산업 지도 연구 보고서(2022)'에서는 우리나라 디지털 트윈 산업의 발전 단계가 성장기에 접어들고 있는 것으로 관찰됐다. 시장은 활발하고, 시장주체는 지속적으로 확대되고 있습니다. 디지털 트윈은 '메타버스'의 구축 효율성과 실제감을 크게 향상시킬 수 있으며, '메타버스' 개념의 대중화와 함께 디지털 트윈의 첨단 기술이 더욱 발전하고 있다. 사람들에게 더 친숙합니다.

과거에는 데이터 트윈이 데이터를 수집하는 데 많은 인력과 물적 자원이 필요했고, 모델 구축을 위해 많은 계산을 사용했습니다. Huang Hui는 데이터 수집 비용이 높고, 적시성이 낮으며, 3D 모델링 객체가 구조화되지 않고 상관되지 않는다는 점을 지적했습니다. 이는 현재의 디지털 트윈이 지능적, 모듈식, 경량화, 구조화 및 범용성을 갖추는 것을 어렵게 만드는 문제점입니다.

위 문제에 대응하여 지난 10년 동안 Huang Hui는 어려움을 극복하기 위해 "지능형 그래픽 및 지각 컴퓨팅"에 집중했으며, 3차원 도시 스냅샷을 자동으로 수집하는 Usee 정밀 사진 측량 기술을 제안하는 데 앞장섰습니다. 휴대용 드론을 통해 밀리미터 수준의 고화질 해상도를 제공합니다. 전체 프로세스는 지속적으로 계획되고 처음부터 끝까지 크라우드소싱되어 최소한의 시야각으로 최대의 범위를 보장하는 동시에 대규모 도시 장면 데이터의 양을 200배로 줄입니다. 기하학적 세부 손실이 0.6m 미만으로 데이터 수집 장비에 대한 투자가 70% 감소됩니다. 다양한 정보와 양성 신진대사를 정확하게 매핑합니다. 이 기술은 근접 고정밀 도시 3차원 항공 조사라는 단일 프로젝트에 널리 사용되었으며, 적용 범위는 세계에서 국제적으로 선도적인 위치를 유지하고 있습니다.

심천시의 약 2,200제곱킬로미터에 대한 모델링을 예로 들어 보겠습니다. 실제로 모델링은 어려운 공역 조정, 수많은 고도 제한, 빈번한 기상 영향, 열악한 데이터 품질 및 긴 수집 시간이라는 문제에 직면합니다. 기존 모델링 방식을 사용하면 6천만 장의 이미지 데이터를 수집하고 60TB 모델을 구축하는 데 2년이 걸리며 총 비용은 1억 5천만 달러가 소요된다. 수집 방법의 주기가 길고 빈도가 낮기 때문에 City Twin의 3차원 기반에 대한 실시간 업데이트가 불가능합니다. 우시의 정밀 사진 측량 기술을 최적화하면 정확도 저하 없이 2천만 장의 사진 데이터를 활용해 8개월 만에 6TB 소형 모델 구축이 가능해지며, 총 비용도 60% 절감되는 6천만 장으로 절감된다.

디지털 트윈은 군집 지능, 무인 운전, 스마트 도시, 국토 안보, 산업 제조 및 기타 분야에서 중요한 가치와 중요성을 갖습니다. "Huang Hui는 Youshi의 정밀 사진 측량 기술이 드론을 사용하여 3차원 공간에 대한 완전 자동 및 독립적 탐사를 수행하고 클라우드 컴퓨팅을 실현함으로써 3차원 도시 재건의 비용과 문턱을 크게 줄일 수 있다고 말했습니다. 미래의 정밀 지능형 주행 지도, 실생활 3차원 내비게이션, 고정밀 도시 관리 정보 플랫폼 등

3차원 인식 부족으로 "로봇 목에 걸려요"

'디지털 트윈시티 산업지도 연구보고서(2022)'에서는 최근 인공지능 기술이 모델링 분야에 점차 적용되고 있으며, 사진 모델링과 영상 모델링이 향후 발전 트렌드로 자리 잡았음을 제시하고 있다. Huang Hui에 따르면 로봇 연구를 지원하기 위해 인공 지능을 적용하면 데이터 분석의 효율성이 향상되고 보다 효율적인 3차원 모델링 솔루션을 찾는 데 도움이 될 수 있습니다. 그녀는 그녀와 그녀의 팀이 지능형 로봇에 대한 연구를 더욱 발전시키기 위해 지능형 그래픽과 인공지능을 결합하는 방법을 연구하고 있다고 밝혔습니다.

지능형 그래프 인식의 과제는 ChatGPT에 비해 대규모 교육에 사용할 수 있는 데이터가 부족하다는 것입니다. Huang Hui는 ChatGPT에서 사용하는 원본 데이터는 기본적으로 수동으로 선별하고 주석을 달았으며 "깨끗하다"고 말했습니다. 그러나 이것이 3차원 공간으로 확장되면 난이도가 크게 높아질 것입니다. 한 품목의 사진을 1,000번 촬영할 수 있지만 1,000장의 사진 모두가 품목을 완전하고 정확하게 설명하지 못할 수도 있습니다. 다시 말하면, 소규모의 3차원 공간 데이터를 처리하기 위해 인공지능 모델을 훈련할 때 많은 양의 데이터를 처리해야 한다는 뜻이다.

로봇 지능이 정체되는 이유는 실제 3차원 동적 환경 능력이 부족하기 때문입니다. "왜 그렇게 어려운가요? 황휘는 일반적인 청소 로봇에 비유하여 다음과 같이 설명했습니다. 이제 청소 로봇을 평평한 표면에서 움직이게 하고, 장애물을 감지하고 피하며, 막히는 것을 방지하는 것이 쉽지 않습니다. 즉, 지능형 그래픽 인식 3차원 공간에서 사물의 형태를 판단할 수 있어야 하며, 이후 사물의 기능과 동적, 정적 관계를 판단할 수 있어야 하며, 보다 진보된 인식을 가질 수 있는 로봇 체화 지능을 부여하는 것이 필요하다. , 실제 3차원의 복잡한 동적 환경을 진정으로 직면하고 변화시킬 수 있으며, 인간처럼 "보고" 이해하여 결정과 행동을 내릴 수 있습니다.

20년 이상의 기초 연구 끝에 Huang Hui는 환경 인식, 기하학적 모델링, 의미론적 이해 및 자율적 의사 결정의 전체 체인을 통합하기 위해 팀을 이끌었습니다. 그러나 자연어 이해에 있어 상당한 진전을 이룬 ChatGPT 등 인공지능 기술에 비하면 아직 해결되지 않은 핵심 과학적 문제가 많고, “아직 갈 길이 멀다”고 한다.

더 많은 콘텐츠를 보려면 21 Finance APP을 다운로드하세요

위 내용은 Greater Bay Area Science Forum │ 심천대학교 Huang Hui 교수: 지능형 그래픽 인식으로 로봇의 '목이 막히는' 문제를 해결합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!