
王人集亲和力(affinity),即药物与受体王人集的强度,是判断化合物是否可能成为可行疗法的伏击早期筹划。关于科学家来说,预测王人集亲和力价值精深但难以使用,因为它依赖于通过繁琐实际得回的详备卵白质结构以及计较量精深的基于物理的模拟。这些限度恰是 SandboxAQ 试图通过 AQAffinity 料理的问题。

AQAffinity 是一个新的开源AI 模子,不错径直从卵白质序列预测卵白质-配体王人集亲和力,而无需实际来细目结构。该模子于 1 月与 Nvidia 和洽推出,基于OpenFold Consortium 配置的开源生物分子共折叠模子 OpenFold3 构建,为权衡东谈主员提供了一种更实用的法子来大规模评估预测王人集亲和力。SandboxAQ 的 AISim 业务单位篡改驾驭、物理学家 Adam Lewis 博士先容了他的团队若何辛勤于创建旨在加快药物、化学和材料发现的AI 模子。
AQAffinity 若何进行王人集亲和力预测
"AQAffinity 计较卵白质和分子之间的王人集亲和力," Lewis 告诉媒体。"它给你一个数字,告诉你这个分子对卵白质有多'广宽',这是药物疗效的潜在筹划,通常用于药物配置的早期阶段。"
这个"广宽度"数值匡助权衡东谈主员决定哪些分子值得追求,哪些不太可能告成。王人集亲和力并弗成保证药物会起作用,但这是在进行昂然的实际室实际之前松开多数候选药物范围的最早法子之一。
AQAffinity 与很多现存王人集亲和力预测器具的不同之处在于它若何得出这个广宽度数字。传统法子通常依赖于通过 X 射线晶体学或冷冻电子显微镜等本领得回的实际细主张卵白质结构。这些结构通常难以获取且昂然,而且只存在于部分生物学干系卵白质上。因此,很多药物发现边幅要么王人备无法使用王人集亲和力预测,要么只可将其应用于少数经过充分权衡的卵白质。
相背,AQAffinity 径直从卵白质序列运行,使用标的卵白质的氨基酸序列看成输入。它构建在 OpenFold3 之上,OpenFold3 学习卵白质结构和分子相互作用的里面示意,使王人集亲和力预测或者无需单独的结构输入。这种折柳很伏击,因为它决定了权衡东谈主员不错本色将哪些计较器具应用于给定标的。"你通常会知谈卵白质序列," Lewis 说,"但你不需要成像实际晶体结构数据。"

AQAffinity 让什么变得更苟简
{jz:field.toptypename/}摒除结构条款的一个径直自制是速率。SandboxAQ 示意,AQAffinity 的联想运行速率比传统的基于物理的王人集亲和力法子快得多,允许权衡东谈主员筛选多数候选药物,而无需这些法子带来的艰难计较包袱。
另一个自制是可探询性。通过摒除对实际结构的条款,AQAffinity 不错应用于表征欠安或难以成像的卵白质,况兼不错更早地在多个卵白质中研究王人集亲和力。Lewis 说这使得超过单一标的并在药物发现边幅的早期阶段提议干系问题变得愈加容易。"咱们信得过但愿禁绝的是领有单一药物标的的范式,然后抱最佳的但愿六年,然后插足临床考研。"他说。
AQAffinity 还王人备开源,选拔宽松的 Apache 2.0 许可发布,并可在 Hugging Face 上获取。老师法子和数据来源都有文档记载,允许权衡东谈主员左证里面基准评估模子性能,并针对特定标的或化学空间微调模子。
现时限度
AQAffinity 的速率和可探询性在准确性方面存在权衡。左证早期测试,Lewis 说模子的性能"现在还莫得优于,或者说以致莫得与最佳的基于物理的法子视合并律",他将这一差距刻画为预期之中的,因为 AQAffinity 专注于更快、无结构的预测。他还强调说,模子现在的性能在其老师数据代表的标的范围内最强。"在与老师集结结构相通的范围内,你看到可接受的发达。" Lewis 补充说,超出该范围的泛化才调"现在还不足咱们所但愿的。"
由于这些限度,Lewis 强调AQAffinity 不应被视为现存使命经过的径直替代品。相背,他建议权衡东谈主员在依赖其预测之前,用我方的数据评估该模子。"关于任何新法子,你应该从汇注代表你本色要料理的问题的东西运转,配置某种挂念性权衡,并据此测试模子。"他说。
Lewis 还指出,AQAffinity的开源联想使得针对特定边幅微调模子成为可能,但他警告这么作念需要严慎。"你需要贯注,因为你诚然不念念逼迫数据。你需要有弥散的数据来保留合理的测试集,leyu体育不然你不会知谈模子是否使命精深,因为你只是在展示秀美过的示例。"
SandboxAQ 将这些限度视为抓续配置过程的一部分,而不是使用的拦阻。Lewis 将准确性、速率和泛化性的改进刻画为模子将来版块的积极使命领域。

AQAffinity 在OpenFold 生态系统中的定位
AQAffinity 与OpenFold 生态系统邃密衔接。OpenFold3 自己王人备开源并可用于生意用途,与一些受限、专有或难以零丁评估的竞争生物分子模子造成对比。OpenFold Consortium 是由 Open Molecular Software Foundation 托管的非谋利倡议,汇集了学术实际室、生物制药公司和本领和洽伙伴,共同配置生物学和药物发现的盛开器具。定约成员或者在 2025 年底 beta 测试AQAffinity,将其性能与现存法子进行比拟并提供早期反应。
在小组谋划中,OpenFold Consortium 首席权衡员 Mohammed AlQuraishi 老师指出 AQAffinity 是 OpenFold3 若何联想以救济快速下流篡改的例子。"OpenFold3 允许东谈主们从比他们原来会有的更高的开端运转,"他说。AlQuraishi 说这种进展是可能的,只是因为最近在卵白质建模和 AI 方面的率先,如 AlphaFold,使这些器具在本色的药物发现使命中变得愈加实用。"这些器具还是弥散好用了,"他说。"它们还是超出了纯学术领域,到了不错推动变革的进度。正因如斯,它为这些信得过篡改的、或者将工业界和学术界蚁集在一齐的新组织结构创造了空间。"
Nvidia 的扮装
SandboxAQ 和OpenFold 刻画的大部分进展取决于加快计较的率先。在小组谋划中,Nvidia BioNeMo 高档定约司理 Roy Tal 谋划了该公司若何通过盛开权衡和特定领域优化的王人集,救济像OpenFold3 和 AQAffinity 这么的 AI 驱动药物发现。Tal 将 Nvidia 对盛开模子的快乐刻画为鼓舞 AI 接受的本色条款。"咱们以为这是一个当务之急,为了加多 AI 的选拔,并接续推动快速篡改的措施,伏击的是在开源方面进行多数投资,"他说。"这意味着盛开权重、盛开老师、代码、权衡论文等等。"
Tal 刻画说,人命科学模子对计较系统提议了特有的条款,需要不同于用于说话或视觉模子的优化。他阐扬说,像 OpenFold3 这么的生物学模子依赖于挑升的运算:"OpenFold3 和 AlphaFold 以及近似的架构有称为三角形运算的运算。三角形乘法、三角形重观点——这些是 3D 空间的几何感知运算,当咱们研究图像和说话时并不信得过存在。"
Tal 指出,这些特有的运合计较本钱昂然且耗时,需要定制的料理决策。"咱们决定配置定制的 CUDA 内核,大幅加快这些运算,"他说,补充说这些优化允许更快的老师和推理,同期还或者示意更大的生物分子系统。"关于 OpenFold3 类架构的相配特定部分,咱们用咱们配置的称为cuEquivariance 的库加快它们,该库相对初级,不错插入这些模子,并在 OpenFold3 推出时插入其中,镌汰了老师和推理的时候。"
SandboxAQ 还径直与Nvidia 的 AI 加快器团队和洽优化其 GPU 使命经过。据该公司称,这种和洽匡助将 GPU 驾驭率进步到 95%,并将一个配置周期从计算的三个月镌汰到三周。Tal 将 Nvidia 的扮装刻画为减少计较瓶颈,以便权衡东谈主员不错专注于模子配置和科知识题。"看成咱们要作念的加快计较平台,咱们要料理咱们不错料理的本领瓶颈,"他说,"这么行业不错接续专注于权衡、配置和产物。"

预测将来
SandboxAQ 对AQAffinity 的将来标的苟简而数典忘宗。"咱们念念让它更快,咱们念念让它适用于更芜俚的卵白质,咱们念念让它更准确。"但 Lewis 提到这不单是是苟简地存眷性能筹划,还有对药物发现边幅随时候若何演变的更大影响。"这些筹划很苟简,但不太苟简的是它解锁了什么:"他刻画了向允许权衡东谈主员在边幅伸开过程中再行扫视和矫正假定的使命经过的蜕变。"咱们的愿景是不仅使用这些法子进行造谣筛选,而是驱散新式筛选,这么你不错在活动的过程中查抄多个潜在的药物标的,因为这允许你运转在一个边幅中迭代不同的标的和不同的分子,"他说。"这个念念法是将化学迭代和生物迭代合二为一,这便是咱们正在进行的通盘不同本领流量的灯塔标的。"