在我们理解宇宙的努力中,我们变得贪婪,进行更多的观察,而不是我们知道如何处理。卫星每年发射数百TB的信息,智利正在建造的一台望远镜每晚将产生15TB的空间图像。人类不可能对所有人进行筛选。天文学家Carlo Enrico Petrillo告诉The Verge: “观察星系图像是我们工作中最浪漫的部分。问题是保持专注。“这就是为什么Petrillo训练人工智能程序来寻找他的原因。
Petrillo和他的同事正在寻找一种基本上是太空望远镜的现象。当一个巨大的物体(一个星系或一个黑洞)进入远处的光源和地球上的观察者之间时,它会弯曲它周围的空间和光线,形成一个透镜,使天文学家能够仔细观察这个令人难以置信的古老而遥远的部分。应该被阻挡的宇宙。这被称为引力透镜,这些透镜是了解宇宙构成的关键。然而,到目前为止,找到它们一直是缓慢而繁琐的工作。
这就是人工智能的用武之地 - 寻找引力透镜只是一个开始。正如斯坦福大学教授安德鲁·吴(Andrew Ng)曾经说过的那样,人工智能的能力是能够自动化任何“一个典型的人只能用不到一秒钟的时间做的事情。”不到一秒的时间听起来不那么大思考,但当涉及筛选当代天文学创造的大量数据时,它是一个天赐之物。
这波人工智能天文学家不只是在想这种技术如何对数据进行排序。他们正在探索什么可能是一种全新的科学发现模式,人工智能可以绘制出我们从未见过的宇宙部分。
但首先:引力镜片。爱因斯坦的广义相对论在20世纪30年代一直预测到这种现象,但第一个例子直到1979年才被发现。为什么?嗯,空间非常非常大,人类需要很长时间才能看到它,特别是没有今天的望远镜。到目前为止,这使得对引力镜片的追捕成为零碎的事情。
“我们现在拥有的镜头已经通过各种方式被发现,” 明尼苏达大学天体物理学教授Liliya Williams告诉The Verge。“有些人是偶然发现的,人们正在寻找完全不同的东西。通过两三次调查,人们在寻找它们时发现了一些。但其余的都是偶然发现的。“
看图像正是AI擅长的那种东西。因此,波恩,那不勒斯和格罗宁根大学的Petrillo及其同事转向了硅谷所钟爱的AI工具:一种由数字“神经元”组成的计算机程序,模仿大脑中的神经元,响应输入而激发。为这些程序(称为神经网络)提供大量数据,它们将开始识别模式。他们特别擅长处理视觉信息,并用于为各种机器视觉系统提供动力 - 从自动驾驶汽车的摄像头到Facebook的图片标记面部识别。
正如上个月发表的一篇论文中所描述的那样,将这种技术用于寻找引力透镜是非常简单的。首先,科学家们制作了一个用于训练神经网络的数据集,这意味着可以生成600万个虚拟图像,显示引力透镜的外观和外观。然后,他们将神经网络放在数据上,使其慢慢识别模式。稍后进行一些微调,他们有一个程序可以在眨眼之间识别引力透镜。
“一个非常好的人类分类器将以每小时约一千的速度对图像进行分类,”Petrillo说。根据他的团队正在使用的数据,他估计每30,000个星系就会找到一个镜头。因此,人类分类器在没有睡眠或休息的情况下工作一周,预计只能找到五到六个镜片。相比之下,神经网络在短短20分钟内就完成了21,789张图像的数据库。Petrillo说,那是一台古老的计算机处理器。“这个时间可以缩短很多,”他说。
神经网络不像计算机那么准确。为了避免忽视任何镜头,它的参数相当慷慨。它产生了761个可能的候选人,人类检查并削减到56的选择。需要进一步观察以确认这些是合法的发现,但Petrillo猜测大约三分之一将成为真正的交易。每分钟大约发现一个镜头,相比之下,整个科学界在过去几十年中发现了大约一百个镜头。这是一个令人难以置信的加速,是AI如何帮助天文学的完美例子。
找到这些镜头对于理解天文学的一个重大谜团至关重要:宇宙究竟是由什么构成的?我们熟悉的事物(行星,恒星,小行星等)被认为仅占所有物质的5%,而其他更奇怪的物质构成另外95%。这包括一种被称为暗物质的假设物质,我们从未直接观察到它。相反,我们研究它对宇宙其余部分的引力效应,引力透镜作为关键指标之一。
那么AI还能做些什么呢?研究人员正在研究许多新工具。像Petrillo这样的一些人正在承担识别工作:例如,对星系进行分类。其他人正在帮助梳理数据流以获得有趣的信号,例如神经网络可以消除射电望远镜造成的人为干扰,帮助科学家回归可能令人兴奋的信号。还有更多用于识别脉冲星,定位不寻常的系外行星,或锐化低分辨率望远镜图像。简而言之,潜在的应用程序非常丰富。
这种爆炸的部分原因在于更大的硬件趋势使更广泛的AI领域成为可能,就像大量廉价的计算能力一样。但这也是因为天文学的性质在变化。天文学家不再在无云的夜晚进行寂寞守夜,追踪个别行星的运动; 相反,他们使用复杂的机器,以早期科学家无法想象的数据吞噬天空的一部分。威廉姆斯说,更好的望远镜和更好的数据存储意味着分析比以往任何时候都要多。
分析数据的伟大大片正是人工智能是很大的。我们可以教它识别模式,然后让它像一个不知疲倦的助手一样工作:永不眨眼,始终保持一致。
它是否让天文学家担心他们会把信任放在一台机器上,这台机器可能缺乏发现耸人听闻的人类洞察力?彼得罗说他没有打扰。“一般来说,人类比机器更偏向,效率更低,更容易出错。”威廉姆斯同意:“计算机可能会遗漏某些东西,但他们会系统地错过它们。”只要我们知道它是什么他们不知道,我们可以在没有太大风险的情况下部署自动化系统。
对于一些天文学家来说,AI的潜力不仅仅是数据排序。他们认为人工智能可用于创建信息,填补我们对宇宙观测的盲点。
天文学家Kevin Schawinski和他的团队,专门研究星系和黑洞天体物理学,使用AI来提高模糊望远镜图像的分辨率。为此,他们部署了一种神经网络,擅长生成所研究数据的变化,就像一个训练有素的伪造者,可以模仿着名画家的风格。这些网络,称为生成对抗网络,或GAN,已被用于根据名人的图片创建假面孔 ; 模仿个人声音的假音频对话 ; 以及一系列其他数据类型。它们是当代人工智能研究中最富有的接缝之一,而对于Schawinski来说,它们意味着获取以前没有的信息。
Schawinski及其团队今年早些时候发表的论文展示了如何使用GAN来提高空间图像的质量。他们降低了一系列星系图像的质量,增加了噪点和模糊,然后使用望远镜图像训练的GAN来提高它们的分辨率,并将它们与原始图像进行比较。结果非常准确:足以让Schawinski相信人工智能有可能改进天文学中的各种数据集。他说他和他的团队有很多很酷的结果,但他们在发表之前无法透露任何信息。
Schawinski对该项目持谨慎态度。毕竟,这听起来像是违背了科学的核心原则:你只能通过直接观察它来了解宇宙。“正是出于这个原因,这是一个危险的工具,”他说,并且应该只在我们a)拥有充足,准确的训练数据的地方使用,并且b)可以检查结果。因此,你可以训练一个GAN来生成有关黑洞的数据,然后将它放在天空的一部分上,以前没有详细观察过。然后,如果它表明那里有一个黑洞,那么天文学家就会直接证实这一发现 - 就像引力透镜一样。Schawinski说,与所有科学工具一样,需要进行严格和耐心的测试,以确保您获得的结果不会“让您误入歧途”。
如果这些方法证明富有成效,它们可能会成为一种全新的探索方法,Schawinski将经典的计算机模拟和良好的老式观察结合起来。现在还很早,但回报可能很大。“如果你有这个工具,”Schawinski说,“你可以查看存档中的所有现有数据,并且可能会稍微改进一些数据,并提取更多科学价值。”之前没有的价值。人工智能将执行一种科学炼金术,帮助我们将旧知识转化为新知识。而且我们能够以前所未有的方式探索太空,甚至不会离开地球。