
2022年1月9日/医麦客新闻 eMedClub News/--CRISPR/Cas作为最新一代的基因编辑技术,以其简便和高效性,已被广泛应用于生命科学的各个领域。
对于基因编辑来说,编辑系统的精确度十分重要,尤其是在临床应用的方面。然而,CRISPR/Cas技术的脱靶效应仍是这个领域的一大挑战。引导RNA(gRNA)是基因编辑系统的关键组成部分,而gRNA并不总是能够精确的靶向。因此,为了准确预测或评估目标gRNA特异性,近年来通过基于大数据的机器学习来建立精确的gRNA效率预测模型,是CRISPR/Cas基因编辑领域的重要研究方向。
最近,俄罗斯生物信息学家开发了一种新的神经网络架构GuideHOM,通过基于深度学习等机器学习算法来筛选出更准确的最佳gRNA,可用于基于Cas9/Cas12a的基因编辑实验。这一方法将有助于开发出新的CRISPR/Cas系统来进行更有效的DNA修饰,在未来应用于更广泛的疾病。这项研究结果发表在Nucleic Acids Research杂志上。
CRISPR/Cas系统切割目标基因组序列主要有以下几步来实现:
为CRISPR/Cas系统的剪切效率,根据已发表的相关文献,科学家们已开发出多种CRISPR/gRNA效率预测模型。这些模型基于不同的数据制备和采集方式,结合不同策略的机器学习算法训练而得,包括“Azimuth“、“WU-CRISPR”、“CRISPRscan”等。
在Nucleic Acids Research的这项新的研究中,俄罗斯的研究团队利用包含数万个经过实验验证的gRNA的数据集结合深度学习、高斯过程对模型进行训练,从而开发出了gRNA效率预测模型GuideHOM。
▲ 图片来源:Nucleic Acids Research
GuideHOM神经网络是一种以矩阵的顺序乘法实现的可训练数学模型,具有复杂内部结构的大型数字数组。该模型可作为一种gRNA的选择标准,设计出最优的gRNA。
研究人员针对人类22号染色体基因对GuideHOM进行了验证,通过评估脱靶切割效率、DNA裂解效率等,可生成一组能够精确编辑基因的gRNA,并显示了靶向和脱靶切割的顺序偏好。这要归功于GuideHOM预测gRNA的高精确度,这是现有CRISPR/gRNA效率预测模型尚未达到的。
▲ 图片来源:Nucleic Acids Research
该研究的第一作者Bogdan Kirillov表示:“我们的发现可用于各种基于CRISPR/Cas的技术应用,例如遗传疾病治疗、农业技术和基础研究实验。”
脱靶效应仍然是牵动CRISPR基因组编辑的临床应用的主要问题。除了gRNA设计,核酸酶、递送系统也是最小化CRISPR脱靶效应的可行方向。
➤ 核酸酶的选择:核酸酶Cas9能影响切割靶基因的效率和精确度,是限制CRISPR发挥巨大潜力的最主要问题之一,为此开发SpCas9的变体是CRISPR领域的一大趋势。
➤ 递送系统的优化:CRISPR核酸酶在宿主细胞内保持活性的时间长短是导致脱靶效应的另一个重要因素,而Cas9和gRNA的不同表达水平和持续时间一定程度上也取决于所用的递送方法。因此,通过优化递送载体来减少Cas9暴露的持续时间或水平,也是克服脱靶效应的一大策略。
参考资料:
1.https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1065/6430490#312804775
2.https://medicalxpress.com/news/2021-12-neural-network-accurate-dna.html
