九游体育app娱乐包含约 2000 亿条单次曝光纪录-九游(jiuyou)体育 官方网站-登录入口
来自好意思国加州的一位少年 Matteo Paz 愚弄我方缔造的 AI 算法,在庞杂的六合数据中,生效从好意思国国度航空航天局的海量不雅测数据中识别出高出 150 万个此前未知的天体。凭借此项确立,Paz 得回了好意思国顶尖的高中生科学竞赛——Regeneron 科学天才奖的最高奖项及 25 万好意思元奖金,其征询效用更所以独处作家的身份,发表在了天体裁限制的巨擘期刊 The Astronomical Journal 上。而取得这些确立的他,如今才刚 18 岁。
图丨 后排的 Matteo Paz 对我方得回第又名感到胆寒(来源:Society for Science)
一位少年的天文梦
张开剩余91%Paz 的天文探索之路始于童年。小学时,母亲常带他干预好意思国加州理工学院的公众不雅星讲座,在他心中埋下了探索星空的种子。2022 年,他加入了加州理工天体裁解释 Andrew Howard 主导的“加州理工行星发现者学院”暑期名目,系统学习天体裁常识。次年,他参与了加州理工为期六周的“暑期征询集聚”(Summer Research Connection)名目,该名目旨在将当地高中生与校园科研导师对接。恰是在此时代,他遭受了对其科研生计产生弥留影响的导师——Davy Kirkpatrick。
Kirkpatrick 是加州理工红外处理与分析中心(IPAC,Infrared Processing and Analysis Center)的资深科学家。Paz 回忆说念:“我十分运道能遭受 Davy。我铭刻第一天和他语言时,就提议我想完成一篇论文,这对于一个短期名目来说方针稠密。但他莫得打击我,反而荧惑我深远探讨。他给了我极大的学术摆脱,这对我当作科学家的成长至关弥留。”Kirkpatrick 本东说念主曾经受惠于良师的劝诱,他暗示:“我但愿能将这种率领精神传递下去,匡助更多有后劲的年青东说念主完了他们的科学逸想。”
Kirkpatrick 交给 Paz 的任务,聚焦于挖掘好意思国国度航空航天局(NASA,National Aeronautics and Space Administration)已退役的“近地天体广域红外巡天探伤器”(NEOWISE,Near-Earth Object Wide-field Infrared Survey Explorer)任务所积存的海量数据。
NEOWISE 千里镜(前身为 WISE)自 2009 年起在红外波段对全天进行扫描,主要搜寻小行星和彗星等近地天体,同期也捕捉到了多数远处六合天体的红外放射变化。这些因亮度变化而被称为“变源”(variable objects)的天体,包括爆发的超新星(supernovae)、脉动变星(pulsating variable stars)、食双星(eclipsing binary stars)以及类星体(quasars)等,它们的光变弧线蕴含着天体物理过程、六合距离乃至六合演化的枢纽信息。NEOWISE 在十余年间积存了近 200 太字节(TB)的数据,包含约 2000 亿条单次曝光纪录。
图丨 WISE 航天器绕地球轨说念运行的见识图(来源:NASA)
但是,从如斯庞杂的数据聚会筛选变源,对传统东说念主工步履而言无异于大海捞针。Kirkpatrick 领先仅但愿 Paz 尝试分析一小片天区,当作见识考证。但 Paz 凭借其在东说念主工智能选修课上培养的兴致以及在帕萨迪纳长入学区数学学院打下的坚实数学基础(他在八年事已完成 AP 微积分 BC 课程),机敏地缔结到 AI 是惩办这一勤奋的枢纽,于是决定缔造一个机器学习模子来自动化分析通盘数据集。
在短短六周的暑期名目中,Paz 不仅构念念并初步完了了名为 VARnet 的东说念主工智能模子,还与 Kirkpatrick 及加州理工的其他天体裁家(如 Shoubaneh Hemmati、Daniel Masters、Ashish Mahabal 和 Matthew Graham)深远疏浚,学习了关系天体物理常识,并了解到 NEOWISE 不雅测节律对探伤某些类型变源的局限性。暑期名目驱散后,征询并未停步。2024 年,Paz 与 Kirkpatrick 无间联结,他握住优化 VARnet 模子,使其粗疏处理 NEOWISE 的一起原始数据。最终,该模子在对高出 4.5 亿个天体进行筛选后,从约 190 万个可能的变源中,证明了 150 万个此前未被编办法新发现。
VARnet 模子:AI 赋能天文新发现
Paz 在 The Astronomical Journal 上发表的论文《一种基于亚毫秒傅里叶和小波的模子,用于从 NEOWISE 单次曝光数据库中索求候选变源》(A Submillisecond Fourier and Wavelet-based Model to Extract Variable Candidates from the NEOWISE Single-exposure Database)留神发扬了 VARnet 的时期细节。
图丨关系论文(来源:The Astronomical Journal)
VARnet 是一个专为快速分析天文时刻序列数据而设想的信号处理模子,该模子的中枢在于交融多种信号处理时期和深度学习步履,以极高效用从嘈杂、不章程的光变弧线(描画天体亮度随时刻变化的图)中索求有用信息。开首,他使用 DBSCAN 聚类算法将属于同 一个天体的脱落不雅测点聚合起来。然后,对汇集到的数据进行细巧的预处理:将星等调理为线性流量,减去中位数以关爱相对变化,使用四分位距进行程序化以挣扎特地值,临了用反双曲正弦函数压缩数据规模,同期对时刻戳进行归一化。
图丨特地索求经由(来源:The Astronomical Journal)
VARnet 模子自身是一个深度神经汇集,其架构整合了多种时期。它愚弄龙套小波变换来进行时频分析,这有助于去噪并捕捉光变弧线中有顷的高频细节变化,如凌星事件的快速下落。Paz 还提议了一种“有限镶嵌傅里叶变换”(FEFT,Finite-Embedding Fourier Transform)。与程序傅里叶变换不同,FEFT 能将自便长度的输入时刻序列映射到一个固定长度的特征向量中,这对于处理长度相反巨大的 NEOWISE 数据至关弥留。
更弥留的是,FEFT 能让汇集在锻真金不怕火中自适应地学习礼聘最弥留的频率信息进行镶嵌,有用捕捉光变弧线中合手续时刻较长的周期性或趋势性变化。卷积神经汇集则被用来学习和识别光变弧线中的时序模式,举例亮度的飞腾、下落、峰值等特定时局。临了,全集聚层(FC Layers)讲求整合来自不同处理模块(时域、频域、不同圭臬)的整个特征信息,并作念出最终的分类判决,判断该天体属于静止、瞬变、脉动如故凌星等预设类别。
图丨 VARnet 模子架构(来源:The Astronomical Journal)
锻真金不怕火这么复杂的模子需要海量的标注数据,但 NEOWISE 数据中已知且分类准确的变星数目相对不及,极端是瞬变天体。为此,Paz 经受了生成合成数据的计谋。他为四种主要天体类别构建了数学模子,不仅模拟了光变弧线的典型时局(如瞬变的爆发与衰减、脉动的复杂波形、凌星的周期性下落),还精准地复现了 NEOWISE 的不章程采样节律和真实的噪声水平。
通过立时化模子参数,其能生成险些无穷量的、高度传神的合成光变弧线用于锻真金不怕火 VARnet。这种步履极地面增强了模子的泛化才略,而真实的已知变星数据则被保留用于最终的模子性能考证。
VARnet 的线路十分出色。在真实的红外源考证集上,它对四种天体类别的分类 F1 分数达到了 0.91。在分别“真实变化”与“无变化/噪声”这个更基础的任务上,其精准率和调回率均高出 97%,F1 分数高达 0.974,暴清楚极高的可靠性。在高性能 GPU 撑合手下,分析单个天体源的平均耗时低于 53 微秒。
150 万个新发现的真谛
Paz 发现的这 150 万个“候选”变源,对于征询六合演化和基本物理法例而言具有弥留真谛。在其发表的论文中,Paz 列举了 VARnet 发现的一些具体案例,以展示其苍劲的探伤才略。
举例,VARnet 发现了一个此前未被编办法食双星候选体,位于 J2000 坐标赤经 18h53m48.3s,赤纬 -59°08′75.1″,通事后续分析,其周期被笃定为约 5.877 天。
(来源:The Astronomical Journal)
另一个弥留发现是分离双星系统 2MASS J01542169-5944445。这个位于 J2000 赤经/赤纬 28.59051°,-59.74571°的系统此前在 GALAH 巡天第三次数据发布中被纪录为化学特异星,但从未被识别为变源天体。VARnet 发现了其显贵的凌星信号,周期约为 5.8061 天,可能存在一个影响其化学因素的伴星。
在征询星河系外方针时,VARnet 的才略相同出色。举例它探伤到了星系 LEDA 174461 的微弱但显贵的亮度变化,以及星系 LEDA 358365 里面发生的一次与超新星 AT 2023lkp 相符的瞬变事件。同期,它还记号了星系 LEDA 340305 的行为星系核线路出的显贵亮度增多。这些具体的发现,不仅考证了 VARnet 的探伤精度和广度,也为后续的留神征询提供了径直的方针。
(来源:The Astronomical Journal)
这些新发现的“程序烛光”(如造父变星)可能为惩办面前的“哈勃常数危险”提供枢纽印迹。而多数超新星、黑洞和双星系统候选者,则为征询恒星演化、元素发源、星系酿成以及极点物理条款下的物资步履提供了前所未有的样本库。
为了让这些发现粗疏被更等闲的天体裁界所愚弄,Paz 和他的导师正在将这些截至整理、汇编成一个名为 VarWISE 的公开星表目次。加州理工学院的一个红外征询小组曾经运转愚弄该目次来征询远处六合中的双星系统。他们曾经发现了数十个往日未被探伤到的双星系统。Kirkpatrick 补充说,这项征询还有助于贪图远处系新手星的质地。
图丨 Matteo Paz 在 2023 年的一个议论会上展示了他名办法初步职责(来源:Kitty Cahalan)
值得一提的是,VARnet 还能有望在天体裁除外施展作用。“我完了的模子不错用于天体裁中的其他时域征询,以及任因何时刻序列口头出现的数据。”Paz 解释说念,“我能看到它与(股票市集)图表分析的关系性,那儿的信息相同以时刻序列时局出现,周期性因素可能至关弥留。你也不错用它来征询大气效应,比如玷污,其中周期性的季节和日夜轮回饰演着弥留变装。”
但脚下,Paz 更但愿愚弄他的 NEOWISE 发现,深远征询阿谁困扰天体裁界已久的六合彭胀率问题。“这要么将有助于惩办面前征询中一个极具争议的话题,要么将揭示一些对于六合发源的确切基础性的东西。”
参考辛苦:
1.https://iopscience.iop.org/article/10.3847/1538-3881/ad7fe6#ajad7fe6s4
2.https://www.caltech.edu/about/news/exploring-space-with-AI
3.https://scitechdaily.com/teen-wins-250k-for-using-ai-to-discover-1-5-million-hidden-objects-in-space/
运营/排版:何晨龙九游体育app娱乐
发布于:北京市