面向科学计算革命的人工智能
我们还研究了用于控制聚变等离子体反应的经过训练的替代模型,在大型强子对撞机上使用SCORE方法的新模型,以及地球2号和目的地地球(DestinE)气候建模的进展。这些研究模型正在演变,变得更像变压器模型。
推荐:将NSDT场景编辑器加入你的3D工具链
3D工具集:NSDT简石数字孪生
面向科学计算革命的人工智能
人工智能及其最新的子领域生成人工智能正在大大加快科学计算研究的变革步伐。从制药和材料科学到天文学,这项改变游戏规则的技术正在开辟新的可能性,并以前所未有的速度推动进步。
在这篇文章中,我们探讨了生成人工智能在科学中的一些令人兴奋的新应用,包括 GPT-3 对 2022 年 ACM 戈登·贝尔特别奖关于 SARS-CoV-2 进化动力学的工作的影响。
我们还研究了用于控制聚变等离子体反应的经过训练的替代模型,在大型强子对撞机上使用SCORE方法的新模型,以及地球2号和目的地地球(DestinE)气候建模的进展。这些研究模型正在演变,变得更像变压器模型。
用于基因组研究的法学硕士
2022 年戈登·贝尔特别奖表彰了来自顶级机构的一组研究人员,以表彰他们对引起大流行的病毒的进化进行建模的开创性工作。利用基因组数据,他们开发了称为基因组规模语言模型(GenSLMs)的大型语言模型(LLM)。这些模型在超过110M个原核基因序列上进行预训练,并在1.5M SARS-CoV-2基因组上进行微调。
GenSLM代表了首批全基因组规模的基础模型之一,并在Polaris和Selene超级计算系统上展示了令人印象深刻的扩展性。
图 1 显示了从在 110M PATRIC 序列上训练的基础模型开始的工作流程。然后对SARS CoV-2 ORF进行微调。经过训练的基础模型可以采用两条路径:
- 一种预测工作流程,使用扩散模型来获取基因组织的层次结构并生成 SARS-CoV-2 基因组。这就是生成AI。输出可以发送到OPENFOLD。
- 检测工作流生成语义相似性评分(嵌入),该评分查看免疫逃逸并识别关注分数的变体。似然分数的序列日志用于进行适应度评估,并创建关注分数的变体(关键输出)。
OPENFOLD模型用于检查为免疫逃逸分析步骤提供反馈的表观性改变。OPENFOLD还通过分子动力学模拟提供PPI相互作用,为适应度评估分析提供信息。
LLM与基因组学和蛋白质组学具有天然的亲和力,因为它们是简单意义上的字母或语言。就像在语言中一样,远离序列的字母的上下文可以有意义。
这种理解上下文的能力使LLM可用于模拟基因组不同部分基因之间的相互作用。这种相互作用称为上位,转换器模型对于理解序列的多个部分如何在 3D 空间中相互作用以支持折叠很有价值。
最初的GenSLM工作流程正在使用GPT-3和强化学习进行扩展和更新,并取得了很好的初步结果,并在Perlmutter超级计算机上进行了大规模训练。
在图 2 中,种子模型(预训练的 LLM)用于生成策略模块,其中包含模型(策略)和参考模型(参考策略)。策略模块流向序列生成、奖励步骤,然后是参考学习损失步骤。奖励模型(序列、结构、函数)也输入到奖励步骤中。反向传播馈送到策略模块中。在 110M PATRIC 序列上训练的基础模型用于微调蛋白质靶标上的模型,创建经过训练的基础模型。
许多智能体处理强化学习策略以输入到多目标损失函数中:
- 代理 1:通过进化耦合分析评估序列。
- 代理 2:通过实验观察评估序列、结构和动力学。
- 代理k:通过分子动力学模拟评估序列,结构和能量。
输入到多功能损失函数中的奖励结果通知奖励模型。
使用扩散模型,使用AlphaFold处理的合成序列似乎折叠成所需的野生型结构。AlphaFold是由DeepMind创建的AI系统,可以从氨基酸序列预测蛋白质的3D结构。
现在,您可以生成具有不同程度序列同一性和正匹配的新序列。您还可以生成具有功能结构域并可作为生产酶的最小序列。随后将进行体外表达和酶促验证。
预计阿贡国家实验室的研究团队将在明年将其工作流程升级到GPT-4。人工智能在科学计算中的变化速度是前所未有的。3年前使用的模型现在已经过时了,如果当前的模型在未来3年内过时也就不足为奇了。这种快速进步正在推动科学研究的进步并开辟新的可能性。
用于融合仿真的深度学习
在环形等离子体的实验中,获得有关等离子体不稳定性的准确信息有助于成功控制等离子体。
例如,等离子体严重中断的一个常见原因是新古典撕裂模式(NTM)。这些中断可能会对实验设备造成损坏。通过识别和控制可以激发NTM的等离子体扰动,可以防止这些干扰。
国际热核聚变堆项目
ITER项目是一项国际努力,旨在建造一个可以产生无限无碳能源的聚变反应堆。ITER的操作和等离子体控制系统的设计依赖于从较小的实验设备推断信息。
通过使用基于第一性原理的模拟研究等离子体不稳定性,可以提高我们对未来聚变装置(如ITER)中动力学和传输的理解和预测。然而,这些模拟的计算成本可能很高,并且需要很长时间才能运行,因此很难在实时实验中使用它们。
DIII-D 国家聚变设施
机器学习模型已被用于预测等离子体控制系统中的等离子体行为。最近,基于深度学习的模型在预测中断和磁信号扰动方面显示出有希望的结果。美国最大的磁聚变研究实验通用原子公司DIII-D国家聚变设施的研究人员开发了一种基于深度学习的代理模型,使用来自全球陀螺动力学环形代码模拟的数据模拟等离子体不稳定性。
该模型已经显示出对线性扭结模式不稳定特性的强大预测能力,并且可以提供基于物理场的不稳定性信息来补充实验测量并指导等离子体控制系统。该模型的推理时间约为毫秒,使其适用于实时等离子控制系统。这种方法显示了在聚变实验中使用机器学习来模拟和预测等离子体不稳定性的潜力。
陀螺动力学环形代码的SGTC代理模型
陀螺动力学环形代码 (SGTC) 的 SGTC 代理模型改变了游戏规则,将仿真时间缩短了至少六个数量级。有史以来第一次,有可能将基于物理的不稳定信息从基于第一原理的大规模并行仿真中引入现代托卡马克的等离子体控制系统。NVIDIA Omniverse 中包含初始 DIII-D 聚变实验代理模型和“控制预测”,以创建聚变反应堆工作流程的数字孪生。视频 1.DIII-D 聚变实验的融合数字孪生工作流程
正在评估SGTC模型,以从神经网络演变为基于变压器的模型。
核物理的生成模型
详细的探测器模拟是粒子和核物理的重要组成部分。模拟用于将预测与数据进行比较,并设计未来的实验。这些模拟使用最广泛的程序是GEANT。
然而,通过这些模拟实现精度需要大量的计算时间,因为粒子必须通过材料传播,导致许多二次粒子发生相互作用。
量热仪是最难模拟的探测器,因为它们的工作是阻止粒子并测量它们沉积的能量。高能物理学(HEP)是探索自然界的基本组成部分以及它们如何在最小和最大尺度上相互作用的物理学领域。在HEP中,所有计算资源的恒定部分使用GEANT用于这些模拟。
但是,由于计算预算限制,无法对大型强子对撞机上的所有事件运行完整的模拟。因此,已经开发出快速仿真方法,这些方法使用调整为完整仿真的更简单模型。这些模型的参数较少,更易于优化和验证,但精度较低。
深度学习提供了一种补充方法,使用灵活的神经网络将随机数转换为结构化数据。
不同类型的深度生成模型用于模拟量热仪淋浴和其他粒子探测器。每种方法都有其优点和缺点:
- GAN 快速灵活,但优化可能具有挑战性,并且可能会遭受模式崩溃的影响。
- 变分自动编码器(VAE)可以学习输入数据的平滑潜在状态表示,但与标准自动编码器相比,训练起来可能更复杂,计算成本更高。
- 归一化流 (NF) 往往对模式崩溃具有鲁棒性,并且具有凸损失函数,但难以扩展到更高维数据集。
一类新的深度生成算法称为基于 SCORE 的生成模型,最大限度地减少了单个生成器网络的凸损失函数,并在训练后提供对完整数据可能性的访问。这些模型在网络架构上具有更大的灵活性,并且可以引入瓶颈层,从而减少可训练参数的数量并提高可扩展性。
用于气候建模的 HPC 和 AI
制定有效的战略来减轻和适应气候变化的影响取决于我们创建准确的气候模型的能力,这些模型可以精确预测长期范围内的区域气候趋势。超高分辨率气候建模需要比目前高出数百万到数十亿倍的计算能力,从而能够提前几十年模拟云层形成和区域极端天气事件预测。
通过利用 GPU 加速计算、深度学习、物理信息神经网络、AI 超级计算机和海量数据集的功能,我们可以将计算速度提高一百万倍。此外,超分辨率技术使我们更接近超高分辨率气候建模所需的十亿倍飞跃。
这些进步使预警成为可能,帮助国家、城市和城镇适应和加强其基础设施。预测准确性的提高将激励人们和国家采取更紧迫的行动。
命运与地球-2
2020 年,欧盟委员会推出了 DestinE,这是一项旨在开发高度准确的全球尺度地球数字模型的旗舰计划。该模型将监测、模拟和预测自然现象与人类活动之间的相互作用。
2021 年,NVIDIA 宣布了致力于气候变化预测的地球 2 号计划。E-2 將在 NVIDIA Omniverse 內生成地球的數字孪生,使用加速數字孪生平台進行科學計算。这个 3D 虚拟世界模拟平台包括用于开发物理信息神经网络模型的 NVIDIA Modulus 框架和 FourCastNet 全球数据驱动的基于深度学习的天气预报模型。
Earth-2将与国际气候科学倡议合作。在GTC 2023上,瑞士国家超级计算中心(CSCS)主任Thomas Schulthess强调天气和气候是CSCS下一代系统阿尔卑斯山的“灯塔用例”。
Alps推出了NVIDIA Grace Hopper Superchips,似乎准备参与DestinE。欧洲中期天气预报中心(ECMWF)DestinE主任Peter Bauer在GTC上提到了DestinE的“瑞士组成部分”。
四投网
FourCastNet physics-ML 模型结合了傅里叶神经算子和变压器,并在 10 TB 的地球系统数据上进行训练。它可以模拟和预测极端天气事件,如飓风和大气河流,精度提高 50,000 倍。借助AI超分辨率,这使我们更接近超高分辨率气候建模的目标。这一突破标志着朝着创建地球2迈出了重要的一步。
FourCastNet为科学和社会提供了许多基本的好处,包括高分辨率,高保真度的风和降水预报。虽然在不到一年的时间内开发出来,并且比ECMWF综合预报系统(IFS)具有更少的变量和垂直水平,这是一个最先进的数值天气预报(NWP)模型,但FourCastNet的准确性可与IFS模型相媲美,并在短时间内优于最先进的深度学习天气预报模型。
FourCastNet的预测比传统的NWP模型快4-5个数量级。这有两个关键的含义:在几秒钟内生成数千个成员的大型集合,以改进概率天气预报,并快速测试关于天气变化机制及其可预测性的假设。
FourCastNet提供了巨大的社会效益,使减灾响应迅速。基于深度学习的模型提供了从各种模型或观测源输入预后变量的灵活性。
气候界面临的一个紧迫挑战是预测极端天气事件在气候变化下将如何变化,例如其频率、强度和时空特征。在FourCastNet在极端气候下实现高保真度后,它就可以应对这一重大挑战。
人工智能驱动的科学计算加速
科学计算研究、研究人员以及管理高性能计算和超级计算基础设施的机构正面临着由生成式人工智能技术带来的前所未有的积极变革。
通过与科学界和行业领导者共同设计,NVIDIA 已经能够提供灵活性来加速本文中提到的工作流程。由最新一代 GPU 加速的新 AI 模型 - NVIDIA Ampere、NVIDIA Ada Lovelace 和 NVIDIA Hopper 架构以及 NVIDIA Grace Hopper Superchip - 都利用了 HPC、AI 和数字孪生的全栈平台。通过拥抱和利用深度学习和HPC的力量,研究人员可以利用这些技术的功能来解决当今科学计算中一些最紧迫的挑战。
3D建模学习工作室 翻译整理,转载请注明出处!