
就像许多高中生一样,我度过了夏天的假期,到处骑自行车,读各种书(是的,我是个爱学习的高中生)。马泰奥·帕兹却把时间用在了更有效的地方,他设计了一套系统,分析了美国国家航空航天局的数据,发现了天空中150万个此前未被识别的天体,未来网报道。就连我自制的业余无线电天线,也远远比不上这个系统。
这一切始于2022年,帕兹加入了加州理工学院“行星搜寻学院”,该计划旨在为帕萨迪纳的高中生提供天文学入门体验。他与导师戴维·基克帕特里克合作,分析了美国国家航空航天局“NEOWISE”卫星积累的海量数据,这些数据最初是用于探测近地小行星的。在进行这项工作时,红外望远镜还发现了更遥远天体的热变化现象。基克帕特里克提出,可以利用部分数据来发现这些天体。来自加州理工学院:
到了那时,我们每条探测记录的表里数据量已经逼近2000亿行了,Kirkpatrick说。“所以我在夏天的想法是,选一小块天空区域,看看能否发现一些变星。然后我们将这些发现标注出来,告诉天文学界:‘这是我们人工发现的新内容,仅凭这个数据集,未来潜力就不可估量。’”
到了那个阶段,我们每条探测记录的表里行数已经逼近2000亿行,覆盖了过去十多年所有观测数据。“所以我在夏天的想法是,选一小片天空区域,看看能否发现一些变星。然后我们将这些发现标注出来,告诉天文学界:‘这是我们人工发现的新内容,仅凭这个数据集,未来潜力就不可估量。’”
然而,帕兹却另有打算。他希望将自己的数学、编程和人工智能知识应用于对完整数据集的分析,覆盖整个天空,从而自动检测这些天体。而不是告诉他这太过分,基尔克帕特里克鼓励了他,帕兹便开始着手工作。
与一些现代学生只是将数据丢进ChatGPT并寄希望于好运不同,帕兹并没有这样做。这恰恰是好事,因为我们已经看到谷歌AI连基本数学运算都做不好。相反,他与其他加州理工学院天文学家合作,编写了自己的算法,将2000亿条数据条目分解为小块,然后分析这些数据中那些标志性的红外特征,从而识别出遥远天体,比如双星、类星体和黑洞。
最终成果是VARnet,帕兹在论文中将其描述为“一个适用于快速天文时序数据分析的强大信号处理模型”。是的,这位高中生甚至在《天文学杂志》上发表了一篇关于其研究发现的论文。加州理工学院已经将他的研究成果应用于研究双星系统。帕兹告诉史密森尼杂志,他的AI模型不仅限于天文学领域,还可以用于任何以时间序列形式呈现的数据,比如分析股票市场数据或环境污染等环境效应。去年,帕兹一家因伊顿山火灾被迫撤离,因此这类贴近现实的应用便显得尤为自然。
因他的成就,帕兹获得了享有盛誉的雷根森科学天才搜索奖。他告诉洛杉矶FOX 11电视台,自己计划将获得的25万美元奖金用于上大学。虽然我高中时每个夏天都在读科幻小说,但这位同学却在做真正的科学研究,这在当时我们根本想象不到会成为学生的可能。
