用AI俯瞰全球!北航最新研究成果!
创始人
2024-08-12 13:08:19
0

将地球“装进”神经网络

实现虚拟环球旅行需要几步?

近日

北京航空航天大学

史振威教授和邹征夏教授团队

研发一种“数字地球(MetaEarth)”

遥感生成式模型

可生成全球任意地理位置

多分辨率、无界的遥感图像

MetaEarth生成式遥感基础模型

团队用“整颗”地球的

卫星遥感影像训练深度神经网络

克服了多种要素特征泛化、

表征一致性等难题

最终在六亿参数规模的网络中

创造覆盖全球的“平行世界”

近年来,Stable Diffusion、Sora等多种AI视觉生成模型引起了学术界和工业界的广泛关注。结合特定领域知识,生成逼真且多样的专业图像和视频数据,已成为各垂直领域的发展趋势。特别是在航空航天遥感领域,发展具有遥感特色的视觉生成模型,对于城市规划等应用具有重要的价值

MetaEarth在生成全球范围内、多分辨率、无界和虚拟无限的遥感图像方面具有强大的能力

现有生成模型的规模仍局限于日常人类活动场景,生成图像的分辨率和信息容量有限。在本项目中,研究者们从遥感俯拍视角出发,提出并构建了“数字地球(MetaEarth)”遥感生成式基础模型实现了世界范围内的遥感图像生成。同时考虑了城市、森林、沙漠、海洋、冰川和雪地等广泛的地貌特征。

MetaEarth作为一种神经网络驱动的数据引擎,有望为卫星等空天无人系统平台提供一个逼真的虚拟环境,并在城市规划、环境监测、灾害管理、农业优化等领域广泛应用;除此之外,MetaEarth在构建生成式世界模型方面也具有巨大潜力,为未来的研究提供新的可能。

在研究中都遇到了哪些挑战

研究团队又是如何解决的呢

和小萱一起了解——

如何覆盖整个地球的信息量

“天高地迥,觉宇宙之无穷”,从雪山巅峰到辽阔海面,从广袤原野到茂密丛林,生成全球尺度的图像需要包括广泛的地理特征。仅对于同一地区,在不同的纬度、气候和文化环境下,也会表现出巨大差异,这对生成模型的容量提出了很高的要求。

在过去的研究中,尽管出现了图像生成技术在遥感领域的尝试,但此类方法通常仅在小规模的数据集上进行训练,缺少地貌的多样性。为解决上述问题,团队构建了一种超过6亿参数的概率扩散模型,并收集了大规模遥感数据集用于模型的训练,包括来自覆盖全球大多数区域的多个空间分辨率的图像及其地理信息(纬度、经度和分辨率)。

全球各种土地特征图像,包括水体、山脉、沙漠、农田、城市和乡村地区

如何生成可控分辨率的图像

在俯拍图像成像过程中,地物特征的展现受分辨率影响很大,在不同图像分辨率下具有明显的差异,难以具备在指定分辨率(米/像素)下精准生成的能力。

MetaEarth框架图

为此,作者提出一种分辨率引导的自级联生成框架。不同于过去的单级生成方法,所提出的框架以多层级的方式,依次生成给定地理位置的低分辨率到高分辨率的图像。具体而言,研究者们在不同级联阶段之间构建了一个统一模型,共享相同的网络权重,由前一阶段生成的低分辨率图像及其空间分辨率指导生成更高分辨率的图像。随着级联层数的积累,生成的遥感图像在分辨率和内容上都表现出多样性。

由MetaEarth生成的大尺寸高分辨率图像示例

如何生成无界图像

在遥感领域,现有的图像生成方法通常只能生成有限尺寸的图像(如 512x512 像素),对于如何生成尺寸更大、场景更广的图像的研究还较少。与日常自然图像不同,遥感图像具有超大幅宽的特性,边长可能达到数万像素。如果简单地“拼接”每个独立生成的图像会导致视觉上的不连续,因此生成连续、任意大小的无界图像仍然是一个待解决的重要问题。

怎样实现“丝滑”连接呢?北航团队提出一种内存高效的滑动窗口生成方法和噪声采样策略。该策略将生成的图像切分成重叠的图像块作为条件,通过特定的噪声采样策略,使相邻图像块的共享区域生成相似的内容,从而避免拼接缝隙。此外,这种噪声采样策略,也使得模型能在实现任意尺寸的无界图像生成时,消耗更少的显存资源。

生成无界图像流程图

论文链接:https://arxiv.org/abs/2405.13570

团队简介

史振威

教授 博士生导师

邹征夏

教授 博士生导师

北航史振威教授和邹征夏教授团队面向民生保障等国家重大需求,长期从事遥感图像处理相关研究。团队在《电气与电子工程师协会会报(Proceedings of the IEEE)》《IEEE模式分析与机器智能汇刊(TPAMI)》《IEEE地球科学与遥感汇刊(IEEE Transactions on Geoscience and Remote Sensing)》等IEEE重要学术期刊上发表科研论文120余篇(ESI高被引论文17篇),论文被引用1万余次。在进行学术研究的同时,团队注重将理论研究与实际应用相结合,承担了高分五号卫星地面处理、资源/高分系列卫星地物分类/变化监测和目标检测识别、巴基斯坦首颗遥感卫星云雪识别等系统的研制,研究成果已应用于20余型卫星,在民生领域得到广泛应用。

瞄准科技前沿,肩负时代重任

自主创新,敢为人先

北航人将继续勇于创新

为国家高水平科技自立自强

积极贡献北航力量!

出品 | 航小萱®工作室

素材来源|量子位公众号

国家自然科学基金委员会 北航宇航学院

编辑 | 姜雨萱

点分享

点个赞

点在看

相关内容

香港维尔利与联合国健康技术...
香港维尔利健康科技集团正式宣布,已与联合国健康技术基金(Unite...
2025-07-12 15:13:30
上海中华职院:百人精培,瞄...
2025年,迁址上海崇明区的上海中华职业技术学院(简称“中华职院”...
2025-07-12 14:42:12
看了AI生成的ASMR吃播...
前段时间,一条用 AI 生成的切水果 ASMR 短视频,在洋抖上爆...
2025-07-12 13:13:44
上海AI实验室团队:如何优...
这项由上海AI实验室和复?dan大学联合开展的突破性研究发表于20...
2025-07-12 13:13:26
月之暗面Kimi K2发布...
月之暗面今天宣布,正式发布Kimi K2模型,并同步开源。Kimi...
2025-07-12 06:12:21
AI医疗新突破!
最近,微软分享医药领域数据,在疑难医学问题上,AI诊断正确率达85...
2025-07-11 16:42:26

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...