6月17日-上海天鹜科技有限公司(下称“天鹜科技”)与长春金赛药业有限责任公司(下称“金赛药业”)联合宣布,双方在使用AI大模型设计极度耐碱单域抗体方面取得了突破性进展,成功完成了全球*经大模型设计且进入5000升放大生产、落地应用的蛋白质产品的开发。
提升蛋白质的耐碱性历来是一项*挑战性的工作,产业中*真正作为耐碱的亲和填料配基蛋白是ProteinA,科研人员耗费近10年时间才使其耐碱性提升到工业可用,但适用范围仍只针对抗体。
此次,天鹜科技与金赛药业合作,完全通过蛋白质工程通用大模型设计,结合少量湿实验闭环迭代验证,在不到1年时间里,将一个普通的非耐碱单域抗体的耐碱性提升了4倍,并应用在5000升的放大生产中。
这一事件标志着通过AI大模型定制化开发高耐碱亲和填料技术的成熟,该项技术可以将任何单域抗体进化成工业上可以使用的耐碱亲和填料,在任何生物分子的纯化(包括GLP-1,细胞基因治疗载体蛋白,AAV病毒颗粒等)上都可以应用亲和层析的方式,代替无标签蛋白多步层析步骤,解决了这一类分子纯化难度高,生产效率低的问题,是全球范围内首创的下游工艺的重大技术革新。
金赛药业总经理金磊博士表示:“这一突破性进展,不仅标志着低成本地使用亲和层析进行纯化成为可能,也意味着人工智能在生物制药领域迈出了从Science研究到Engineering应用的重要一步,对于提升药物生产效率、降低生产成本、促进新质生产力发展具有深远意义”。
单域抗体的耐碱性改造
生长激素(Growth Hormone, GH)是一种由脑下垂体前叶分泌的多肽激素,对人体的生长发育具有至关重要的作用。它通过直接作用于骨骼、软骨和肌肉,以及间接通过刺激肝脏产生胰岛素样生长因子1(IGF-1)来促进人体生长和细胞增殖,对于治疗儿童矮小症具有显著效果。
作为目前国内*获批上市的长效生长激素,金赛药业金赛增®的生产方式主要采用大肠杆菌分泌型表达技术,利用大肠杆菌高效表达人生长激素,再通过发酵、离心和纯化等步骤制成生长激素。
然而,传统的纯化方式生长激素损失较大。因此,金赛药业在前期筛选了4000万的羊驼单域抗体库,成功找到了一个亲和力优异的单域抗体(Single-domain antibody,sdAb),又称纳米抗体(Nanobody,Nb)、VHH抗体或骆驼抗体,是一种在骆驼科动物体内发现的具有高亲和力的小型蛋白质。考虑到单域抗体的尺寸小、结构简单、易于生产,金赛药业决定使用单域抗体作为亲和层析的亲和填料分子来特异性结合生长激素。
但“碱”是绝大多数蛋白质的天敌,单域抗体的耐碱性较差。蛋白质大都需要在温和的酸碱条件下才能工作,通常当环境中的 PH 小于 5 或 大于 10 时,蛋白质的分子结构就会受到影响。在PH超过 13 的更极端的碱性条件下,蛋白质结构会被进一步破坏,导致其功能和活性的丧失。
生产过程中,使用亲和层析方法完成生长激素的纯化后,需要去除层析介质上的其他有机污染物,减少非特异性吸附,促进介质的再生,以及消毒作用,从而提高纯化效率和介质的重复使用性,因此需要用强碱来洗脱(0.5M NaOH,PH 13-14)这些污染物。当普通的单域抗体遇上强碱的环境,最直接的后果便是其使用寿命变得极短、企业成本攀升。这也是亲和层析这一*的纯化方式在工业生产中推广受限的主因。
AI 蛋白设计通用大模型AccelProtein
耐碱性提升4倍,寿命延长多倍
天鹜科技首席技术官刘灏博士表示:“天鹜科技设计极端耐碱单域抗体,相较于其它企业或者传统方法是有天然优势的。我们的AI蛋白质设计通用大模型AccelProtein(源自上海交通大学洪亮教授团队研发的Pro系列通用人工智能),使用的数据集覆盖了更多极端环境下生物体蛋白质的序列与结构,再借助强大的小样本学习能力,能快速抓取和极端条件相关的特征,这是一般大模型或传统方法所没有的预测抗极端条件突变体的能力”。
传统的耐碱性改造方法是将耐碱性较弱的氨基酸(如天冬酰胺、谷氨酰胺)进行替换,这对于蛋白质耐碱性能的提高虽有效但有限。蛋白质中的其他种类氨基酸及其组合也会对耐碱性有非常大的影响,但这种影响没有普适的规律去总结,因此改造常常陷入碰运气随机突变的局面,使得其工作量大且过程难以预测,难度远大于活性、亲和力、选择性等指标的改造。
天鹜科技的AI蛋白质设计大模型AccelProtein,基于对自然界近10亿条覆盖各种极端环境下的蛋白质序列的自监督学习,理解了天然蛋白质的构成规则,掌握了蛋白质序列、结构及其功能之间复杂的语义联系,可直接预测优秀耐强碱的突变体,这是传统方法及其它缺少恶劣环境下蛋白质数据集的常规大模型所无法做到的。
在初次设计中,AccelProtein大模型就在没有任何实验数据的情况下成功设计出了十余个在耐碱性、亲和力以及热稳定性等方面都优于野生型的单点突变体。在这之后,AccelProtein又发挥了它抓取特征预测多点突变的强大能力,不少多点突变表现出更强的耐碱性、亲和力和热稳定性,甚至基于其学习到的复杂的上位效应,设计出了两个阴性突变组合后变成阳性突变的序列,这是传统设计方法不可能做到的事情。
传统蛋白质工程理性设计会自动放弃阴性突变,因为人类认知难以理解阴性点位如何通过上位效应使得一个多点位突变体更优秀,而大模型是从蛋白质语义出发,它能自动理解这个上位效应,巧妙地将阴性点位加入到突变体使得“语义更通顺”——蛋白功能更好。大模型能巧妙地利用阴性突变,是全领域的一个根本创新,极大地放大了蛋白质工程的设计能力和想象空间。
4个月时间后,经AccelProtein大模型设计后的单域抗体,在蛋白小试环节被证明,经0.5M NaOH处理24小时以后,断裂比例就由改造前(野生型)的60%减少至15%,这意味着耐碱性提高了4倍;和生长激素的结合能力是改造前的2倍;热稳定性相比改造前提高8℃。
当该单域抗体偶联到亲和填料并制备成层析柱以后,经0.5M NaOH 处理6小时和24小时以后剩余的动态载量显示,相较于野生型的单域抗体14#,AI设计后的蛋白分子有明显提升,如M74 碱处理 24h 后的载量为 56.21,相比于野生型的 15.2 提高至接近 4 倍。
结语
“双方此次合作的核心目标,是提升该单域抗体的耐碱性,降低企业的生产成本,提高企业的生产效率。单域抗体在亲和层析中的使用具有巨大前景和工业应用潜力,它能够针对不同底物进行定制化的填料开发,从而拓宽应用范围并增强结合特异性。” 金磊博士表示。
刘灏博士则认为,天鹜科技作为AI for Science 到AI for Engineering的先行者,本次合作成果证明了其AI蛋白质设计通用大模型AccelProtein的产业化落地能力,为生物制药CMC提供了一种更为经济高效的解决方案。
未来,天鹜科技将继续推动通用人工智能技术在蛋白质工程领域的创新与发展,以满足生物制药行业日益增长的需求,为人类健康事业贡献更多的力量。