生物传感器与机器学习辅助改造生物碱合成酶

引言 /Introduction

在生物制造领域，生产治疗性生物碱一直是一个挑战，尤其是那些复杂且难以合成的植物次生代谢产物。石蒜科生物碱，例如用于治疗阿尔茨海默病的药物加兰他敏，因其在植物中的低产量和复杂的合成过程而难以大规模生产。

2024 年 3 月，美国德克萨斯大学奥斯汀分校 Andrew Ellington 课题组在 Nature communication 上发表文章⌈Biosensor and machine learning-aided engineering of an amaryllidaceae enzyme⌋，提出了一种将生物传感器与机器学习技术相结合，用于石蒜科酶工程化改造的创新方法。该方法显著提升了酶性能：产物效价提高 60%，催化活性提升两倍，副产物减少三倍。

Fuchun / 整理

范锐、孟凡康/ 审校

开发对 4-O 甲基诺贝拉丁具有特异性的生物传感器

4-氧甲基诺贝拉丁是许多药用石蒜科生物碱的前体，来源于诺贝拉丁的转化。转录因子 RamR 可用于开发生物传感器，但其对 4-氧甲基诺贝拉丁的特异性较低，同时还能识别其前体诺贝拉丁等化合物。因此研究团队对 RamR 进行了定向进化，希望提高其识别 4-氧甲基诺贝拉丁的特异性。

通过模拟 RamR 与 4-氧甲基诺贝拉丁相互作用的结构，研究团队设计了三个位点饱和（NNS）的 RamR 库，每个库针对 RamR 配体结合口袋内的不同残基。接着，利用 SELIS（Seamless Enrichment of Ligand Inducible Sensors）方法，研究团队筛选了这些变体，以找到那些对 4NB 高度响应的生物传感器。

SELIS( Seamless Enrichment of Ligand Inducible Sensors)
筛选和进化遗传生物传感器的方法。首先是基于生长的筛选，可筛选出无法抑制转录的生物传感器变体；接下来是荧光筛选，可分离对目标分析物高度响应的传感器变体。

在两轮进化之后，作者评估了其对于 4-氧甲基诺贝拉丁的剂量反应，第二轮进化的产物 4NB2 明显在响应 4-氧甲基诺贝拉丁上更加灵敏，也进化出了对于 4-氧甲基诺贝拉丁的特异性。

使用机器学习模型 MutcomputeX 提高 Nb4OMT 酶活性

研究团队使用进化后的生物传感器监测了来自水仙属植物的 Nb4OMT 酶在大肠杆菌中的活性，但发现该酶的催化效率不高：收集大肠杆菌培养基上清液进行色谱分析，以空质粒作为阴性对照，4-氧甲基诺贝拉丁和诺贝拉丁标准样品作为阳性对照，发现诺贝拉丁转化为 4-氧甲基诺贝拉丁的效率较低。

为了进一步提升酶的活性，研究团队开发了一个基于结构的自监督残差神经网络——MutComputeX。这个模型能够预测蛋白质中每个残基的氨基酸可能性，并指导蛋白质工程。通过训练在包含非蛋白质原子的微环境中，MutComputeX 能够识别出那些可能改善酶性能的关键氨基酸变异。

MutCompute 与 MutComputeX
MutCompute：自监督卷积神经网络（CNN），使用局部 3D 化学微环境来预测蛋白质中每个残基的氨基酸可能性，但其原始训练数据限制在具有属于 20 个氨基酸的原子的微环境中，因此 MutCompute 无法在具有来自辅因子、配体或核酸的原子的微环境中提供情境化预测。
相关阅读推荐：Lu, H., Diaz, D.J., Czarnecki, N.J. et al. Machine learning-aided engineering of hydrolases for PET depolymerization. Nature 604, 662–667 (2022).
MutComputeX：重建了数据工程管道，输入表示中添加了磷和卤素的新原子通道（下图 b），新的训练和测试数据集包括采样～256,000 个蛋白质配体界面微环境。接着使用残差卷积架构（ResNet）来提高特征提取能力，进而提高模型的预测能力。训练大量模型后，选取 3 个模型，对 FireProtDB 中的所有突变数据生成零样本预测（zero-shot predictions），并选择与单点突变∆TM 实验数据相关性最高的模型，集成得到最终的模型 MutComputeX。
效果：自监督 3D 残差神经网络（3DResNet）框架在～250 K 残差测试集上实现了～80%的野生型预测精度，而之前的 3DCNN 模型在 6 K 测试集上实现了 69%的预测精度。3DResNets 被证明可以推广到蛋白质-配体相互作用界面，而野生型预测准确率没有下降（蛋白质-配体界面测试集的野生型预测准确率为 81%，而之前的 3DCNN 模型为 62.1%）。最终集成得到的 MutComputeX 总体野生型预测准确率为 67.3%，蛋白质-配体界面野生型预测准确率为 66%。虽然 MutComputeX 的野生型预测精度低于 3DResNet，但它与从 FireProtDB 收集的实验数据相关性最好，所以选择了这个模型。

利用 MutComputeX 预测的变异，研究团队在大肠杆菌中表达了改进的 Nb4OMT 酶，并观察到了显著的性能提升：与野生型（WT）相比，所展示的突变体均荧光信号均增强，突变后酶的转化率也得到了提高。

晶体结构分析揭示酶活性提升原因

研究团队对晶体结构进行分析，使酶活性提高的突变原因可能如下：

A53M 取代将一个较大的疏水蛋氨酸插入到由 Trp50、Tyr81 和 Tyr108 形成的疏水口袋中，稳定 Nb4OMT 的活性位点，提高了酶的热稳定性（上图 c）。

E36P-G40E 双突变体将一个谷氨酸从 36 位转移到 40 位，从而保留了与 Lys118 的盐桥相互作用，而脯氨酸覆盖在α螺旋上（上图 d）。

研究团队也模拟了诺贝拉丁和 Nb4OMT 结合后的结构，在 Nb4OMT 的活性位点中，已有 SAH 和 Ca2+存在，在虚拟对接的结构中，Ca2+将诺贝拉丁的儿茶酚基团部分定位在靠近 SAH 结合位点的位置，诺贝拉丁的儿茶酚基团与蛋氨酸 53（M53）之间的硫-π相互作用也可能限制儿茶酚基团的旋转，从而减少 3 '位置的交叉甲基化，提高酶的特异性。

这项研究不仅展示了生物传感器和机器学习技术在生物制造中的应用潜力，也为生产复杂的植物次生代谢产物提供了新的策略。通过精确控制和优化生物合成途径，这项技术有望大幅提高 Amaryllidaceae 生物碱的生产效率，也有希望泛化应用于生物制造领域生产其他生物碱。

\ END \

生物传感器与机器学习辅助改造生物碱合成酶 | 再创

开发对 4-O 甲基诺贝拉丁具有特异性的生物传感器