社区学习工具库休闲

简体中文

首页 > 科技周边 > 人工智能 > 把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

PHPz

发布： 2024-06-09 21:56:30

原创

333 人浏览过

北航的研究团队，用扩散模型“复刻”了一个地球？

在全球的任意位置，模型都能生成多种分辨率的遥感图像，创造出丰富多样的“平行场景”。

而且地形、气候、植被等复杂的地理特征，也全都考虑到了。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

受Google Earth启发，北航的研究团队从俯拍视角出发，将整颗地球的卫星遥感影像“装进”了深度神经网络。

基于这样的网络，团队构建出了覆盖全球的俯视视角视觉生成模型MetaEarth。

MetaEarth拥有6亿参数，可实现多种分辨率、无界且覆盖全球任意地理位置的遥感图像生成。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

覆盖全球的遥感图像生成模型

相比于此前的研究，构建世界范围的视觉生成基础模型更具挑战性，过程之中克服了多个难点。

模型容量是挑战，因为地球具有城市、森林、沙漠、海洋、冰川和雪地等广泛的地理特征，需要模型能够理解并表征。

即使是同一类型的人造地物，在不同的纬度、气候和文化环境下，也会表现出巨大差异，这对生成模型的容量提出了很高的要求。

MetaEarth成功解决了这一困难，实现了不同地点、地貌的高分辨率、大范围场景生成。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

另外，实现分辨率可控的遥感图像生成，同样是一项挑战。

因为在俯拍图像成像过程中，地物特征的展现受分辨率影响很大，在不同图像分辨率下具有明显的差异，难以具备在指定分辨率（米/像素）下精准生成的能力。

而在MetaEarth生成不同分辨率的图像时，都能准确合理地呈现地物特征，而且不同分辨率之间的关联性也得到了精确对应。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

最后是无界图像生成的挑战——与日常自然图像不同，遥感图像具有超大幅宽的特性，边长可能达到数万像素，此前的方法都难以生成连续、任意大小的无界图像。

但MetaEarth生成的连续无界场景，避开了这一缺陷，可以看到随着“镜头”的平移图像的移动十分丝滑。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

此外，MetaEarth具有强大的泛化性能，能够以未知场景作为条件输入级联生成多分辨率图像。

例如，将GPT4-V生成的“潘多拉星球”作为初始条件输入模型，MetaEarth仍然能够生成具有合理地物分布和逼真细节的图像。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

下游任务上的验证结果表明，MetaEarth作为一种全新的数据引擎，有望为地球观测领域各类下游任务提供虚拟环境和训练数据支持。

实验过程中，作者选择了遥感图像分类这一基础任务进行验证，结果显示，MetaEarth所生成的高质量图像的辅助下，下游任务分类精度有显著提升。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

作者认为，MetaEarth有望为卫星等空天无人系统平台提供一个逼真的虚拟环境，并在城市规划、环境监测、灾害管理、农业优化等领域广泛应用；

除了作为数据引擎之外，MetaEarth在构建生成式世界模型方面也具有巨大潜力，为未来的研究提供新的可能。。

那么，MetaEarth究竟是如何实现的呢？

6亿参数扩散模型“复刻”地球

MetaEarth基于概率扩散模型构建，具有超过六亿的参数规模。

为支持模型训练，团队收集了一个大型遥感图像数据集，包含覆盖全球大多数地区的多个空间分辨率的图像及其地理信息（纬度、经度和分辨率）。

在本项研究中，作者提出了一种分辨率引导的自级联生成框架。

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

△MetaEarth的整体框架

在该框架下，仅用单一模型即可实现给定地理位置的多分辨率图像生成，并在每一级分辨率下创造出丰富多样的“平行场景”。

具体来说，这是一种编解码器结构的去噪网络，将低分辨率条件图像和空间分辨率编码后与去噪过程的时间步嵌入相结合，预测每个时间步的噪声，实现图像生成。

为了生成无界的任意大小图像，作者还设计了一种内存高效的滑动窗口生成方法和噪声采样策略。

该策略将生成的图像切分成重叠的图像块作为条件，通过特定的噪声采样策略，使相邻图像块的共享区域生成相似的内容，从而避免拼接缝隙。

此外，这种噪声采样策略，也使得模型能在实现任意尺寸的无界图像生成时，消耗更少的显存资源。

团队简介

本研究的作者来自北京航空航天大学的“学习、视觉与遥感实验室”（LEarning, VIsion and Remote sensing laboratory，LEVIR Lab），实验室由国家杰青史振威教授领导。

史振威教授曾经的博士生、密歇根大学博士后，现任该实验室成员的邹征夏教授，是本文的通讯作者。

论文地址：//m.sbmmt.com/link/31bb2feb402ac789507479daf9713b00
项目主页：//m.sbmmt.com/link/a0098fd07db7692267fca4f4169c9ba2

以上是把整个地球装进神经网络，北航团队推出全球遥感图像生成模型的详细内容。更多信息请关注PHP中文网其他相关文章！

相关标签：

图像模型生成

来源：51cto.com

上一篇：Meta AI的首席执行官LeCun：不要从事LLM工作下一篇：大模型App腾讯元宝上线！混元再升级，打造可随身携带的全能AI助理

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

编码的关键：为初学者释放 C 的力量

2024-10-13 11:44:01
使用 PHP 和 MySQL 将您的网站连接到数据库

2024-10-13 09:56:31
使用 Python 解决问题：作为初学者，解锁强大的解决方案

2024-10-11 20:58:41
Python 的力量，简单：一种适合初学者的编程方法

2024-10-11 16:53:11
PHP 和社交媒体：将您的网站与世界融为一体

2024-10-11 11:54:51
使用 PHP 的动态图像画廊：在线展示您的作品

2024-10-10 16:21:01
使用 PHP 构建 API 和 Web 服务

2024-10-10 15:18:02
揭秘 Java：为新程序员提供一条清晰、简单的道路

2024-10-10 13:34:01
使用 C 创建游戏和图形：有趣且实用的介绍

2024-10-10 13:26:26
王者荣耀程咬金怎么玩？

2024-10-10 11:38:42

最新问题

在多个路由中声明的workerpool是否仍然可以保持其cpu使用率而不关心阈值我希望找到一个带有workerpool的node.js系统来处理CPU密集型任务，但是对于多条路由中的cpu使用情况，我有些困惑。一个场景是这样的：route1.js:constw...

来自于 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查询计算另一张表中字段的总和我有一个这样的模式：具有属性“user_id”和“username”的用户表以及具有属性“customer_id”（user_id的FK）和“finalPrice”的订单表数据库架...

来自于 2024-04-06 19:39:29

0

1

441

无法从网站获取输入元素所以我试图从Twitter获取一个输入元素，但当我运行它时，它不断在节点终端中给我一个这样的错误，结果，由此代码创建的浏览器窗口将自行关闭，因为它找不到正确的输入选择器。如何获取正...

来自于 2024-04-06 18:59:57

0

1

442

在模板中使用在方法中定义的变量这是我第一次使用Vue（v2而不是v3），并且我一直在尝试在模板内使用变量（在方法内定义）。我的简化代码：<template><divclass="co...

来自于 2024-04-06 18:10:25

0

2

513

使用SCSS生成默认值和CSS变量我正在实现网站样式。出于遗留支持的原因，我需要支持IE11，至少一段时间。出于工作流程和我的理智原因，我想尽可能使用css变量。我已经研究过这个解决方案，它会生成一些有效的东西，但...

来自于 2024-04-06 17:46:54

0

1

355

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1424251
php入门教程之一周学会PHP

4270503
JAVA 初级入门视频教程

2547758
小甲鱼零基础入门学习Python视频教程

507801
PHP 零基础入门教程

863552

最新下载

更多>

网站特效

网站源码

网站素材

前端模板