在本次讲座中,朱丹青老师为我们带来了一场关于蛋白质工程与机器学习交叉领域的精彩分享。蛋白质作为生命活动的核心执行者,其从DNA编码到复杂三维结构的折叠过程充满了挑战与奥秘。朱老师首先通过视频和图像直观展现了氨基酸序列如何逐步折叠形成二级、三级甚至更高级结构,让我们对蛋白质的复杂性有了更深刻的认识。
蛋白质预测之所以困难,主要在于20种氨基酸的离散组合形成了天文数字级的设计空间,而自然演化需要数百万年才能筛选出功能性蛋白。面对这一挑战,蛋白质工程提供了可能的解决方案。朱丹青老师详细介绍了当前蛋白质工程的两大策略:计算驱动的方法,如基于物理的能量函数模拟蛋白质结构与结合;以及定向进化技术,通过迭代优化设计感兴趣的蛋白质。
近年来,机器学习在蛋白质工程领域展现出巨大潜力。朱老师重点讲解了机器学习在预测任务(如结构预测和功能预测)和设计任务(从功能或结构反推序列)中的应用,并指出表示学习和生成模型正成为研究热点。然而,我们距离“蛋白质版的ChatGPT”还有很长的路要走,AlphaFold虽取得里程碑式突破,但设计任务仍未解决。功能预测仍是长期难题,生成模型虽然强大,但仍需结合物理解释与外推能力。此外,蛋白质领域的数据稀缺问题也要求我们开发更精巧的算法。
朱老师最后总结道,虽然前路充满挑战,但机器学习与蛋白质工程的融合正开启无限可能!
报告结束后,朱丹青与师生进行了深入交流。课程主持人赵晓续向朱丹青赠予了《AI for Science前沿讲座》授课证书,并合影留念。