我们如何映射世界太阳能发电站

最初发表在这个条目DescartesLabs博客,的作者写的全球库存的太阳能装置数据集,可以在资源表。ob体育下载地址有关更多信息,请参见全文自然

这是越来越明显,世界必须尽快过渡到低碳经济,防止气候变化的最坏影响。虽然这仍然是一个巨大的任务,最近2022年IPCC的报告显示进步的迹象——一年一度的全球温室气体排放增长放缓(例如,路透),国家已经开始采取行动新增发电容量的80%以上来自可再生能源,与91%的太阳能和风能(例如,Irena]。此外,运动脱碳世界经济已经从边缘到主流,现在世界上80%的经济在某种形式的脱碳的承诺(例如,牛津大学的报告]。

虽然没有灵丹妙药,技术进步起到了重要作用。直到现在,它已经不可行跟踪所有这些新太阳能发电厂。由于卫星图像分析和机器学习的进步,现在可以地图基础设施、气候影响,全球趋势带来新层次的透明度和可操作的信息。

一个太阳能创世纪

生成的数据集在全球库存的太阳能装置是公开的ob体育下载地址

2018年,凯尔故事,卢卡斯Kruitwagen在斯坦福自然资本研讨会。我们都一直在思考同样的问题——如果你可以映射所有世界上太阳能设施吗?

但首先,为什么这是重要的,为什么有人照顾吗?很明显,太阳能将是一个关键组成部分的可再生能源系统将替代目前的化石燃料的来源。光伏发电容量自2009年以来每年超过40%的速度增长,到2040年预计将增长近10倍¹。构建这个巨大的光伏产能增长伴随着许多权衡——多少设施已建成,新设施应该坐落的地方,有什么潜在影响对生物多样性和土地保护优先,又能做些什么来缓解气候变化风险?这些本质上是空间的问题,需要知道太阳能设施的确切位置。

目前库存不能完全满足这些需求。大多数库存提供总发电量不明确的地方(例如IEA, IRENA或BP),和那些设施位置通常是自我报告,因此不完整(即。WRI的GPPDOpenPV我们),昂贵的更新,经常自营(IHS的发电厂)。我们问自己,如果你可以使用卫星图像和机器学习简单的地图世界上所有的太阳能设施吗?

这正是我们着手做的。

映射与机器学习全球太阳能

机器学习来检测太阳能电池板。每一行显示一个不同的例子的位置。列是:(1)Sentinel-2形象;(2)空客现货形象;(3)Sentinel-2模型预测地图;(4)现货模型预测地图;(5)设施足迹多边形在最后的数据库。

我们开发了一个机器学习的管道在卫星影像地图太阳能设施。

关键的选择是使用什么样的卫星图像。我们选择的工作有两个来源:空客和哨兵2。空客现货提供高空间分辨率给出图像每像素1.5,足以看到太阳能电池板的模式在数组。高空间分辨率允许我们地图准确脚印对太阳能设施,这是很重要的,因为发电能力直接关系到小组收集区。

我们还利用ESA的Sentinel-2卫星的图像(S2)。S2 12-band相机,需要一个新的地球上每个点的照片大约每5天。我们发现更完整的光谱信息足以仍可靠地找到太阳能设施,和不断更新图像意味着我们甚至能找到最近安装的设施——这通常是失踪的老点图像。此外,一旦我们发现太阳能设施,我们可以回顾时间浏览所有图像采取S2确定何时设施了。

第二个关键的选择是使用什么类型的模型。机器学习是唯一可行的方法我们知道在这种规模的分析数据。我们想每个设施的足迹地图,不仅检测位置,所以我们选择模型的语义分割模型的方法需要在卫星图像和输出一个完整的预测地图——每个像素的可能性在太阳能设施。现代深度学习模型如卷积神经网络一直显示先进的图像分析任务的性能,包括太阳能电池板²的映射。经过几次试验,我们选择使用UNet架构。

第三个关键的选择是训练数据。我们使用大量的数据可以在公开街道地图(OSM)作为一个起点。OSM数据主要来自北美和欧洲,但缺乏在亚洲。以确保我们能够映射太阳能设施在世界范围内,我们也大量的设施上手写在中国和其他亚洲国家。

然后我们单独训练UNet模型对现货和S2图像。

机器学习的管道

使用单个模型,实际应用很少完成和映射全球太阳能设施也不例外。迭代式的实验过程让我们开发一个多步分析管道如下图所示。我们将这个过程分为两个步骤,一个全球性的初始搜索,然后一系列步骤为真正的检测滤波器。管道有单独分支Sentinel-2和现场图像,与最终检测合并在最后一步。在第一步中,我们使用了UNets为每个图像源搜索全球太阳能设施³候选人。结果集有很多假阳性,所以我们设计了一套基于机器学习的过滤步骤分离出真正的检测。

现场结果过滤使用训练ResNet图像分类器,并使用一个RNN S2结果过滤。在这个阶段(“RNN-2”),我们测量的安装日期每个候选人通过部署第二UNet RNN模型在整个久远的S2的图像。在某种程度上,你必须停止迭代模型,所以在这个阶段,我们两个手工查阅所有剩下的候选人只产生一个完全纯粹的数据集验证设施。这是有趣的吗?不——我们花了数万小时的深夜手动检查。但鉴于我们刚刚使用了ML搜索整个全球,回想起来这是可以应付的。我们加工确认检测到多边形脚印最后合并数据集从每个管道分支进入最后一个主数据集。

我们这个管道在笛卡尔实验室地理空间平台上部署。这需要力量的计算的壮举。现货全球搜索处理在4.5 ~ 170 tb的图像连续175天使用一个集群GPU在云中节点。Sentinel-2管道加工~ 380 tb的数据实时大约2个月,使用100万cpu小时左右。毫无疑问,这些都是大规模计算。

它是可行的搜索整个世界在几天内改变的可能性,应该改变我们的方法在未来全球气候解决方案。

机器学习管道检测太阳能设施

结果

我们聚合全球太阳能数据集,不同颜色的安装日期。

结果是首开先河的全球数据集的太阳能设施。我们68661设施,这是比以前多了432%最佳可用数据集。我们丰富这个数据集,包括安装日期,确定覆盖类设施上安装,现有资产层面和匹配数据库。现在公开WRI的这个数据集ob体育下载地址

我们聚合全球数据集,颜色由覆盖类设施安装。较低的面板包括:安装(b)时间序列;(c)的分布安装大小由土地覆盖类型;地方偏见(d)和全球之间的偏差(e) PV土地覆盖和本地/全球土地覆盖类(有关详细信息,请参阅文章。

分开的想法

这个数据集是重要的管理角色过渡到太阳能的脱碳全球经济。这样的空间数据需要加快能源转型的方方面面——从降低可再生能源的间歇性与代现在把和预测;电网适应新兴气候变化风险;评估政策干预的疗效更快的部署可再生能源。

对我们来说同样重要的是,这是一个示范的可能——在全球范围内的映射。气候变化是一个全球性的挑战,通过这种技术,我们发现这样是可行的地图和监控基础设施在整个地球。在未来几年,人类必须将开发一个更全面的了解我们的经济活动影响和影响自然世界的变化。我们是乐观的,兴奋地看到这样的技术将推动气候解决方案在未来前进!

¹看到,例如:国际能源机构。2018年世界能源展望。技术代表、法国巴黎(2018年)。国际可再生能源机构。可再生能力统计》2019年。技术代表、阿布扎比(2019)。

²有许多文件映射太阳能电池板包括:

  • Yu, J。王,Z。Majumdar, A & Rajagopal r . Deepsolar:机器学习框架来有效地构造一个太阳能部署数据库在美国。焦耳2,2605 - 2617 (2018)
  • 侯,x et al . Solarnet:深度学习框架从卫星影像地图在中国太阳能工厂。在气候变化的人工智能车间,ICLR2020 (ICLR, 2020)
  • Imamoglu, N。木村,M。宫本茂,H。Fujita, a .中村& r .太阳能发电厂多光谱卫星图像上检测使用weakly-supervised cnn和反馈特性和m-pcnn融合。arXiv预印本arXiv: 1704.06410 (2017)
  • Malof, j . M。布拉德伯里,K。柯林斯,l . m . &纽厄尔·r·g .自动检测太阳能光伏阵列的高分辨率航空影像。应用能源183、229 - 240 (2016)。
  • 卡米洛·j·A。王,R。柯林斯,l . M。布拉德伯里,K。& Malof, J. M. Application of a semantic segmentation convolutional neural network for accurate automatic detection and mapping of solar photovoltaic arrays in aerial imagery. CoRR abs/1801.04018 (2018).

³假设设施将会相当接近人类,我们定义了搜索区域通过扩张全球人类人口密度过高的地图。有关详细信息,请参阅文章。

凯尔的故事是可持续发展的战略举措使笛卡尔实验室吗

卢卡斯Kruitwagen是气候变化与人工智能研究员,兼联合创始人在牛津大学地球观测

查看我们的目录可信的和及时的数据

在facebook上分享
在twitter上分享
分享在linkedin

留下一个回复

你的电子邮件地址将不会被发表。必填字段标记*