ByteDance 在 AI for Science
有
三条
并行的线。
三条线分属不同组织、不同文化、不同产出形态——一条在开放平台(Protenix × PXDesign),一条在学术研究(Seed AI for Science),一条在独立 biotech 公司(Anew Therapeutics)。 本文把三条线的组织结构、研究方向和核心成果梳理清楚,方便快速建立整体认知。
三条线的组织形态对照
下面逐行对比 A / B / C 三条线的归属、负责人、核心成员、地理分布、规模、节奏和产出形态。注意:所有人名按英文拼写保留(中文对应仅在有公开来源时给出)。
| A · 平台 Protenix × PXDesign |
B · 研究 Seed AI for Science |
C · 管线 Anew Therapeutics |
|
|---|---|---|---|
| 组织归属 | ByteDance AML AI4Science 2025 年合并进入 Seed,保留独立产品品牌 |
ByteDance Seed AI4Science Yonghui Wu 管辖范围(主业 LLM) |
独立法人实体 字节 AI drug discovery 的公司化出口 |
| 核心 Leader |
Wenzhi Xiao — 团队联系人 / PI
Xinshi Chen — 技术一把手(Georgia Tech PhD, Le Song 学派)
Yuxuan Zhang — 技术 co-lead
|
Quanquan Gu — UCLA Associate Professor,字节兼职研究员
身份双挂:UCLA 在职 + ByteDance Research Scientist
|
Kai Liu — 创始人级别;字节 AIDD 自 2020 年;AnewOmni 通讯作者
Jianzhu Ma — 清华 AIR,AnewOmni 通讯作者
CEO 未公开披露
|
| 核心成员 |
Jiaqi Guan(UIUC PhD,Seattle) Chengyue Gong(UT Austin PhD) Chan Lu(跨 A / B 的工程桥梁) Shenghao Wu(CMU)· Wenzhi Ma · Kuangqi Zhou |
Zaixiang Zheng(序列 / DPLM 主将) Yi Zhou(SeedFold co-first) Wei Qu(SeedProteo 一作) Fei Ye · Dongyu Xue · Xinyou Wang(NJU)· Ruizhe Chen(Hunan U) |
Yuli She — 第 6 位 founding 成员 William Hilbert · Richard Miller — 国际化信号 Chris Li · Xiangzhe Kong · Youjun Xu Singapore 团队:Cheah Chen Seh · Shi Jie Teo |
| 地理 | Beijing + Seattle | Beijing 为主;Gu 在 UCLA;实习生来自 PKU / NJU / Hunan U / ShanghaiTech | Shanghai + San Jose + Singapore |
| 规模(估计) | ~20–30 名全职 | ~10–15 名全职 + 大量实习生 | 官网列 31 名在职 + 5 名 SAB |
| 节奏 | 每 2–4 个月一次外部发布;产品化节奏 | 半年到一年一次大发;学术周期 | 2026.01–03 连发 3 篇 + BIO 2026 参展;"走出 stealth" 节奏 |
| 开源策略 | Apache 2.0 代码 + 权重 + PXMeter 评测框架 | 论文配套代码有开源,部分权重未公开 | 不开源;按药厂模式运作 |
| 湿实验 | PXDesign 6 靶点 · Protenix-v2 VHH-Fc 与 GPCR 抗体设计(见 §4) | 无团队自身的湿实验能力 | 4 条临床前管线;IL-17A 口服小分子候选 |
三条线如何分工覆盖 AI 药研全栈
AI 驱动的药物发现可以拆成五层:底层物理 / 分子动力学 → 结构预测 → 分子生成与设计 → 湿实验验证 → 临床前管线。下图把每层 ByteDance 的产出按 A / B / C 标色归类,看三条线的覆盖范围和重叠情况。
Protenix 和 SeedFold 是不是同一个东西?
外部经常把这两个模型混为一谈,因为它们都由 ByteDance 发布、都声称超过了 AlphaFold 3。实际上它们是两个不同团队、用两种不同方式解同一个任务,存在明显分工差异。
把 AlphaFold 3 做成开源、可部署、可微调的实用工具。核心贡献:严格复现 AF3 的训练配方,开源权重和推理代码(Apache 2.0),再逐步叠加下游能力(如 v2 内置抗体设计)。
保留 AF3 主体架构(Pairformer + diffusion head)。关注点在工程化:推理加速、模型小型化(Protenix-Mini)、以及如何把结构预测能力迁移到抗体设计任务。
- · Protenix v1:首个达到 AF3 同等精度的开源模型
- · Protenix v2:在 v1 基础上加入抗体设计能力,带湿实验结果
- · PXMeter:一套社区可用的评测工具
- · protenix-server.com:公开 webserver
用新架构在同一类任务上把 AF3 做得更好。不追求复现、不做产品化,走学术路径验证架构想法并在基准上取得领先。
两项关键改动:(1) 把 Pairformer 的 scaling 策略从加深改为加宽;(2) 提出线性三角注意力(Linear Triangular Attention),缓解 AF3 架构的二次方开销。同时提供 Linear 版本(更便宜)和完整版(更准)。
- · SeedFold:在 FoldBench 全面超过 AF3
- · SeedFold-Linear:效率优化版
- · FoldBench:团队自建的评测集,作为论文的基准
- · 解决同一个任务:生物大分子复合物结构预测(蛋白单体、蛋白-蛋白、抗体-抗原、蛋白-配体)
- · 输入 / 输出格式相同:序列 → 3D 原子坐标
- · 都基于 AF3 开启的 Pairformer + diffusion 思路
- · 都在自家评测里报告超过 AF3
- · A 选择忠实复现 AF3;B 选择替换架构
- · A 开源(Apache 2.0 含权重);B 论文为主,权重未开放
- · A 有下游应用(抗体设计、湿实验);B 停在结构预测基准
- · A 每季度一跳的产品节奏;B 半年到一年的学术节奏
- · 两队目前都在 Seed 旗下,但保留独立产品线
- · Chan Lu 同时出现在 Protenix 和 SeedFold 作者列表,是工程桥梁
- · SeedFold 论文只对比 Protenix-0.5(中间版本),未与 v1(同期发布)对比——两队存在一定的独立性
"超过 AlphaFold 3"到底指什么
这一节拆开几个关键问题:AF3 是同一个任务吗?评测指标怎么读?Protenix-v2 在抗体设计上的湿实验数字是什么意思?
AlphaFold 3、Protenix、SeedFold、Boltz-1、Chai-1 都在做同一件事:给定一个生物大分子复合物的组分(氨基酸序列、核酸序列、配体 SMILES),预测其三维结构。 输入输出规格完全一致,可以在相同测试集上跑完整评测。
AF3 原论文用的是 PDB 时间戳切分的测试集。SeedFold 团队提出了新的评测集 FoldBench,并在其上对比 AF3、Boltz、Chai、Protenix、SeedFold。 用自家设计的评测集跑出领先是合理的,但需要留意"benchmark 由其中一方提出"这一 caveat。
| Model | Mono lDDT | P-P DockQ | Ab-Ag DockQ | P-Lig SR |
|---|---|---|---|---|
| AlphaFold 3 | 0.88 | 72.93 | 47.90 | 64.90 |
| Boltz-1 | 0.87 | 68.25 | 33.54 | 55.04 |
| Chai-1 | 0.87 | 68.53 | 23.64 | 51.23 |
| Protenix-0.5 (A) | 0.8773 | 71.50 | 41.00 | 62.30 |
| SeedFold (B) | 0.8889 | 74.03 | 53.21 | 63.12 |
| SeedFold-Linear (B) | 0.8861 | 74.14 | 46.91 | 66.48 |
| 工作 | 靶点范围 | 命中率 |
|---|---|---|
| DeepMind AlphaProteo | 6 靶点 | 论文自报多数 nM 级 |
| Chai Discovery 零样本抗体 | 多靶点 | 16–20% |
| PXDesign (A) | 6 靶点 | 5 / 6 靶点 20–73% nM 级 |
| Protenix-v2 VHH-Fc (A) | AMBP 等可溶靶点 | 全部靶点至少 1 个 hit;单靶点命中率 2–48% |
| Protenix-v2 GPCR (A) | GPCR 靶点 | 16–88% |
展开:SeedProteo binder 设计 in silico 数字
| Target | BoltzGen | RFDiffusion3 | SeedProteo-R | SeedProteo-D |
|---|---|---|---|---|
| BHRF1 | 627 | 9 | 296 | 139 |
| SC2RBD | 0 | 0 | 92 | 80 |
| IL-7RA | 10 | 0 | 100 | 52 |
| PD-L1 | 17 | 1 | 380 | 265 |
| TrkA | 21 | 0 | 232 | 143 |
| Insulin | 99 | 0 | 303 | 181 |
| VEGF-A | 1 | 0 | 127 | 45 |
| IL-17A | 5 | 0 | 47 | 17 |
第三条线:独立 biotech 的半 stealth 状态
Anew Therapeutics 是 ByteDance AI drug discovery 的公司化出口,作为独立法人运作,早期几乎不做外部宣传。2026.01–03 集中发布 3 篇 bioRxiv 论文并确认参加 BIO 2026 展台——属于从 stealth 走向有限公开的阶段。
- · 管线的实验数据尚未公开,所有进展均来自公司自述
- · 不公开 CEO 与 C-suite 结构
- · IL-17A 赛道已有 Cosentyx、Taltz、Bimzelx 等获批药物,差异化点(口服、选择性)还需看到分子数据
- · 三篇论文均为 bioRxiv 预印,未经同行评议
论文:SeedFold (arXiv 2512.24354) · Protenix v2 (bioRxiv 2026.04) · PXDesign (bioRxiv 2025.08) · AnewOmni (bioRxiv 2026.03.12) · AnewSampling (bioRxiv 2026.03.10) · AnewSynth (2026.01) · SeedProteo (arXiv 2512.24192) · DPLM-2.1 (ICML 2025 Spotlight) · APM (arXiv 2504.13075) · PocketXMol (Cell 2026)
官方:seed.bytedance.com/en/direction/ai_for_science · seed.bytedance.com/en/protenix_pxdesign · anewbt.com
组织信息:Hang Li 离任、AI Lab 并入 Seed、Yonghui Wu 加入字节主管基础研究(新闻源:aibase · pandaily · pingwest)
研究范围:2024.10 – 2026.04 间 ByteDance AI for Science 公开与半公开信息。部分数据(Protenix-v2 湿实验 / Anew 管线 / FoldBench 指标)未经第三方复现,读到时请注意 caveat。
仅用于内部讨论,不构成投资建议。