(相关资料图)
“ChatGPT引起了广泛的关注,我们有没有可能在生命科学领域搭建一个类似ChatGPT的模型呢?”加拿大魁北克省人工智能研究中心(Mila)副教授、加拿大高等研究院(CIFAR)人工智能讲席教授唐建在近日召开的《理解未来》科学讲座AI for Science系列第三期上说。
这期讲座主题为“AI4Science和ChatGPT,生物医药的契机?”,由未来论坛理事、北京大学李兆基讲席教授谢晓亮主持。讲座上,中国科学院院士、北京大学教授鄂维南和唐建分别围绕“AI for Science科技革命”“生命科学中的生成式人工智能”话题分享了观点。
唐建指出,人工智能和生物技术的研究正处于黄金时期。语言生成模型如ChatGPT在对话系统领域取得了很大的突破,研究者们正在探索是否能在生物制药领域搭建类似的人工智能模型。目前,研究人员在人工智能与生物医药的交叉领域已有了诸多探索。他举了一些例子:GeoDiff应用在小分子的三维构象预测,E3Bind应用在蛋白质-配体复合物结构预测,ProtSeed同时生成新的蛋白质结构和序列等。
唐建认为,AI分析数据以及机器学习,为科学规律的表达提供了可能性。“AI将可能的文本、知识、代码进行训练,当AI能力达到一定强度后,我们就通过模型的开发,对大量数据进行学习和训练。其中,ChatGPT可以产生全新的原创内容,具有一定的创造力,像一本百科全书,用户可以很快从百科全书中获取需要的知识。在蛋白质设计领域,不论是小分子还是蛋白质分子,本质而言都需要生成一些新的结构,融入ChatGPT,可以提升蛋白质设计的创新度和多样性。”
谢晓亮在前瞻对话环节分享了他对于AI+生命科学领域应用的思考。他指出,基于技术上的突破,生命科学基因组学、冷冻电镜等生命科学领域,逐渐从“数据缺乏学科”转变为“大数据科学”,从“定性学科”转变为“定量学科”。他还提到,AI需要大数据,数据质量非常重要。
以药物设计为例,鄂维南介绍,“现在很多团队都在通过将数据驱动的方法和模型驱动的方法有机结合,构建更加系统、高效、自动化的药物研发过程。”他指出,化学、材料、生物、工程等传统领域都将成为AI的主战场,同时也将催生新一代的产业模式。另一方面,在AI+Science的驱动下,科学研究将从“小农作坊”模式转变到“安卓”模式,“平台科研”将成为全新的科研范式,“社区建设”将成为重要趋势。
“希望我们有效地利用机会,将AI+Science的‘安卓’模式基础设施建设起来,充分利用这一科学发展空间,让中国走在全球科学领域的前沿。”鄂维南说。
《理解未来》科学讲座是未来论坛面向公众开放的高质量公益科普讲座。据了解,讲座目前已成功举办70余场,超过140位科学家参与其中。