> 数据图表我想了解一下1.3 底层技术决定AI效用,算法+数据是“限速步骤”2026-1-41.3 底层技术决定AI效用,算法+数据是“限速步骤” 回顾发展延用上述框架分析,分子生成(AI创新价值的代表)的限制因素为算法和数据: 1、尚未有算法能够同时兼顾分子结构创新和合成性:分子生成采用的是深度学习等模型,基于虚拟筛选形成的数据库进行“学习”,但是其学习框架依旧在CADD的基础之上:基于配体的药物设计(LBDD)/基于结构的药物设计(SBDD)。因此通过建模获得的分子符合基础的药化原理,但是往往会缺乏合成性原则导致无法在真实世界中合成。 2、分子生成所需的数据更多维,且来源往往受到保护不会公开。分子生成的数据需要考虑到多个维度:符合化学规则、生物途径、可合成等。同时,AI模型的训练需要兼顾成功与失败的数据,而往往公开的数据都是成功的案例。 AI+制药公司的项目分为两类——仿制药与创新药。创新药的研发AI的表现如前文所述,尚未概念性验证,AI管线整体偏临床早期;而在仿制药的开发上,由于靶点、阳性参考物(仿制的创新药分子)结构等已确立,以CADD的传统方法即可完成开发,AI的边际效应可能不大。 综上,我们认为AI增效作用将会助力AI+药物研发在“1-10”阶段快速发展。同时,我们看好AI的创新价值,分子生成具备诞生BIC/FIC的潜力。实现这一价值,在于算法的突破和数据的获取或者分享,而两者的攻克都需长期的付出和投入。图表14:CADD计算原理示意图资料来源:Arch Pharm Res,中邮证券研究所14中邮证券综合其他