
中文标题:使用计算机模拟方法通过 AlphaFold2 预测潜在内分泌干扰化学物质与整个人类蛋白质组的相互作用.英文标题:Interactions of Potential Endocrine-Disrupting Chemicals with Whole Human Proteome Predicted by AlphaFold2 Using an In Silico Approach.与蛋白质的结合是一个关键的分子启动事件,环境污染物通过它对人类产生毒性作用。先前的研究受到三维 (3D) 蛋白质结构可用性的限制,并且仅关注一小部分环境污染物。这项研究利用 AlphaFold2 预测的高精度 3D 蛋白质结构,探索了通过 20,503 种人类蛋白质和 1251 种潜在内分泌干扰化学物质之间的分子对接获得的超过 6000 万种相互作用。总共获得了66,613,773个对接结果,其中1.2%被认为是高结合的,因为它们的对接分数低于-7。预计单核细胞向巨噬细胞分化因子 2 (MMD2) 与最多数量的环境污染物 (526) 发生相互作用,其中多氯联苯和多氯二苯并呋喃占很大比例。降维和聚类分析揭示了不同的蛋白质谱,其特征是对全氟烷基和多氟烷基物质(PFAS)、邻苯二甲酸盐类化学物质和其他污染物具有高结合亲和力,与其独特的富集途径一致。进一步的结构分析表明,具有高比例带电氨基酸残基、相对较低的 α 螺旋含量和高 β 片层含量的结合口袋比其他结合口袋更有可能与 PFAS 结合。这项研究提供了对影响人类健康的各种污染物的毒性途径的见解,并为建立和扩展基于不良结果途径的模型提供了新的视角。

图 1. 环境污染物的来源、聚类和代表性化合物。(A)环境污染物的来源和摘要。(B)半径 < 3 下的 1251 种环境污染物的聚类。(C)10 种污染物的代表性化合物。

图 2. 与 MMD2 结合的化合物及其结合模式。(A) 总共有 526 种化合物根据筛选标准和代表性化学物质与 MMD2 结合。(B) MMD2 结合口袋和与五种代表性化学物质的结合模式。

图 3. 与 10 个簇中的化合物结合的高结合蛋白的生物信息学分析。(A)与 10 个簇中的化合物结合的蛋白质数量。(B)与超过 5% 的化合物结合的蛋白质的 PCA 结果。(C)与超过 5% 的化合物结合的蛋白质的 KEGG 分析。

图 4. 通过 PCA 聚类的三组特异性蛋白质结合位点的结构分析。(A) 组特异性蛋白质结合位点中氨基酸组成的分类。(B) 组特异性蛋白质结合位点的二级结构组成。(C) PFAS 特异性蛋白质结合位点的结构聚类。(D) 从 PFAS 特异性蛋白质结合位点簇中鉴定出的代表性蛋白质。
这项研究的创新点在于首次使用AlphaFold2预测整个人类蛋白质组的三维结构,并通过分子对接分析了1251种潜在内分泌干扰物质(EDCs)与蛋白质的相互作用。通过6600万次对接,发现约1.2%的结合结果具有强结合力。研究还发现,含有高比例带电氨基酸残基的蛋白质结合口袋更容易与PFAS等污染物结合,且PFAS比邻苯二甲酸酯类化合物与蛋白质的结合模式有显著差异。研究结果揭示了EDCs与蛋白质相互作用的潜在毒性机制,提出了这些化学物质对人类健康的长期风险。此外,基于该数据的KEGG通路分析进一步表明,这些高结合蛋白与化学物质可能对代谢、类固醇激素合成和神经传导等关键生理过程产生重要影响。
文章DOI:10.1021/acs.est.4c03774声明:
本公众号仅分享PFAS相关研究进展成果,无商业用途。如有涉及侵权,请立即联系公众号后台或发送邮箱,我们会及时修订或删除!欢迎投稿或合作!
邮箱:pfas2022@163.com