ADiT:从原子统一到科学加速,通用型化学基础模型预示新范式

温故智新AIGC实验室

TL;DR:

Meta、剑桥与麻省理工学院联合提出的ADiT框架,首次实现了分子与晶体等周期性与非周期性原子系统的统一生成,突破了传统建模壁垒。这一技术不仅极大提升了研发效率,更预示着“通用型生成化学基础模型”时代的到来,将颠覆药物研发和新材料发现的范式。

长期以来,原子系统三维结构的生成建模是科学研究与工业应用中的核心难题,却也长期受限于“分而治之”的建模范式。无论是小分子、生物分子,还是晶体及复合体系,尽管其底层物理原理共通,但由于结构特性(如周期性、原子类型与三维坐标的交织)的巨大差异,现有扩散模型往往高度依赖特定系统,缺乏通用性。这不仅增加了研发复杂度,也限制了生成模型的规模化应用和跨领域创新。

在此背景下,Meta基础人工智能研究(FAIR)、剑桥大学与麻省理工学院的联合科研团队提出的全原子扩散Transformer(ADiT),标志着原子系统建模领域的一项里程碑式突破。这项入选ICML 2025的研究,首次实现了周期性材料与非周期性分子的统一生成,为构建真正的“通用型生成化学基础模型”奠定了基石1

技术原理与创新点解析

ADiT的核心创新在于其双核驱动的潜在扩散框架,旨在打破原子系统建模的固有壁垒:

  1. 全原子统一潜在表示:传统方法需针对不同原子系统(如分子或晶体)设计各自的建模范式。ADiT则将所有原子系统抽象为三维空间中的原子集合,通过训练变分自编码器(VAE),将原子类型(分类属性)和三维坐标(连续属性)整合为统一的潜在表示。这意味着,无论是复杂有机分子还是规整的晶体结构,都能被编码到同一个共享的潜在空间中,为后续的统一处理奠定基础2。这种方法极大地简化了多模态数据处理的复杂性,将原子建模的“共性”提炼至一个抽象且统一的层面。

  2. Transformer潜在扩散:在VAE构建的统一潜在空间中,ADiT引入了**扩散Transformer(DiT)**来执行生成建模任务。通过在潜在空间中进行去噪,DiT能够高效地采样新的潜在变量,再经VAE解码器重建为有效的分子或晶体。相比于直接在原始数据空间进行扩散,这种潜在扩散设计将分类与连续属性的复杂性内化至自编码器,使得生成过程更为简化、可扩展。更值得注意的是,ADiT的设计几乎不引入归纳偏差,这使其在处理不同系统时表现出卓越的泛化能力1

ADiT在效率和可扩展性上展现出压倒性优势。数据显示,在相同硬件条件下,生成10,000个样本的时间从传统等变扩散模型的2.5小时缩短至ADiT的20分钟以内,提升了近8倍。即使模型参数扩展至5亿规模(ADiT-L),其性能依然呈现可预测的线性提升,训练损失持续降低,有效性比率稳步提高。这种规模效应印证了Transformer架构在化学领域的强大潜力,也表明通过扩大模型和数据,性能仍有巨大提升空间1。此外,联合训练(如同时在QM9分子数据集和MP20晶体数据集上训练)的ADiT版本,在材料和分子生成任务中全面优于仅在单一数据集上训练的版本,进一步凸显了统一建模的优势。

产业生态影响评估

ADiT的突破性在于将曾经碎片化的原子系统建模推向了统一和通用化,其对产业生态的影响将是深远且变革性的。

首先,在药物研发领域,ADiT有望大幅缩短新药发现周期。传统的药物分子设计耗时耗力,往往依赖于高通量筛选和经验试错。ADiT能够高效、精准地生成具有特定性质的分子结构,尤其是通过逆向设计,根据目标靶点直接生成具有活性和稳定性的候选药物分子。这将显著加速从靶点识别到先导化合物优化的全流程,降低研发成本,并为治疗疑难杂症带来更多可能。

其次,在新材料科学领域,ADiT的统一晶体生成能力将解锁前所未有的材料设计潜力。从高性能电池材料、高效催化剂到新型半导体,传统材料发现依赖于大量的实验合成和表征,周期漫长。ADiT能根据需求(如特定能带结构、机械强度或导电性)快速生成周期性晶体结构,并预测其性能。这使得**“按需设计材料”**成为现实,将极大加速材料科学的迭代速度,赋能清洁能源、航空航天、电子信息等关键产业的发展。

再者,ADiT的出现也为**“AI for Science”**范式注入了新的活力。它不仅是某个特定科学问题的解决方案,更是构建科学基础模型的关键一步。如同GPT之于语言、DALL-E之于图像,ADiT或将成为化学与材料领域的“GPT”,为科学家提供一个统一的、可扩展的、高效的原子级设计工具。这将在产业链上游催生出新的AI辅助设计软件和服务提供商,改变传统研发服务模式,并吸引大量资本涌入这一前沿领域。我们看到,百奥几何的GeoFlow V23、字节跳动的Seedance 1.01等企业级解决方案也纷纷采用或借鉴了Transformer与扩散模型结合的思路,预示着AI生成在科学计算和内容创作领域的广泛应用浪潮。

未来发展路径预测

ADiT的问世,不仅仅是一个技术进步,更是一个未来十年乃至更长时间内科学研究和产业发展方向的预示。

展望未来3-5年,ADiT这类通用型化学基础模型将沿着以下路径演进:

  1. 多模态与多尺度集成:当前ADiT主要聚焦原子类型和三维坐标。未来,模型有望集成更多物理化学信息(如电荷分布、能量态、反应活性)以及多尺度信息(如分子间的相互作用、宏观材料性质)。这将使模型能从更全面的维度理解和生成复杂系统,例如蛋白质-配体复合物、界面现象或介观结构。

  2. 自主发现与实验闭环:通过与自动化实验平台(如机器人化学家、材料合成工作站)结合,ADiT等生成模型将推动形成**“AI驱动的自主科学发现闭环”**。AI不仅生成新结构,还能指导实验验证,并根据实验反馈迭代模型。这将极大加速研发周期,从“AI辅助设计”迈向“AI自主发现”。我们甚至可以想象,未来AI能够自主提出新的化学理论或物理原理。

  3. 算力与数据驱动的性能飞跃:如同大型语言模型的发展轨迹,未来ADiT类模型的性能将持续受益于更大的模型规模、更丰富的高质量数据集以及更强大的计算能力。未来几年,针对特定任务的专业化化学AI芯片和大规模分布式训练平台将成为常态,进一步突破模型性能的上限。

  4. 伦理与监管的挑战:强大的生成能力也带来潜在的伦理和安全风险。例如,ADiT能够设计出前所未有的分子和材料,其中可能包含具有潜在毒性或危害性的物质。如何确保这些模型不被滥用?如何建立负责任的AI研发与部署机制?这些问题将成为政府、企业和学术界需要共同面对的挑战,需要前瞻性的技术治理框架和伦理规范。

ADiT的出现,是人类理解和改造物质世界方式的一次深刻变革。它不仅提升了我们设计分子和材料的效率,更重要的是,它提供了一个统一的视角来审视微观原子世界的内在逻辑,将碎片化的知识体系聚合,使得AI能够像艺术家描绘宏伟画卷一样,描绘和创造出无限可能的物质结构。这不仅仅是技术的胜利,更是人类智慧与机器智能协同演进,共同迈向科学探索新纪元的关键一步。

引用


  1. 入选ICML 2025,Meta/剑桥/MIT提出全原子扩散Transformer框架,首次实现周期性与非周期性原子系统统一生成·HyperAI超神经·田小幺(2025/7/14)·检索日期2025/7/14 ↩︎ ↩︎ ↩︎ ↩︎

  2. Meta/剑桥/MIT提出全原子扩散Transformer框架,首次实现周期性与非 ...·智源社区·(2025/7/14)·检索日期2025/7/14 ↩︎

  3. [论文审查] All-atom Diffusion Transformers: Unified generative ...·The Moonlight·(2025/7/14)·检索日期2025/7/14 ↩︎