内容实验对AMP机制变化趋势的未来预测

Nature Biotechnology | 深度学习从人类肠道微生物组中识别抗菌肽_百度...

本文通过结合选择分数、小型开放阅读框架、机器学习联合pipeline、元蛋白组数据交叉验证及c_AMP-微生物关联网络筛选5项生物信息学技术,从人类肠道微生物组中精准识别抗菌肽(AMP),成功率约83%(181/216),其中11条高性能AMP可高效杀灭耐药革兰氏阴性菌并治疗小鼠细菌性肺炎感染。一、研究背景与挑战微生物竞争驱动AMP进化:人类肠道微生物组长期竞争和共同进化,编码了大量可杀灭耐药菌的AMP。传统挖掘技术低效:依赖实验试错,且AMP序列短、相似性低,导致生物信息学技术发展受限。研究目标:结合神经网络模型与生物信息学技术,优化基因-多肽样本库,挖掘高性能AMP。二、研究方法与流程样本库构建:以人类肠道微生物组宏基因(154,723个基因)为起点,通过选择分数筛选出4,409条代表性基因。使用小型开放阅读框架确认包含211,759,711条多肽的备选库。图1 全流程示意图机器学习预测:训练LSTM、Attention、BERT 3种模型,发现单模型性能不理想,联用后pipeline精确性(91.31%)、召回率(83.32%)、精确召回曲线(0.9244)大幅提升。对备选库多肽进行预测,筛选出20,426,401条c_AMPs备选库。表1 Pipeline与其他相关模型预测能力对比元蛋白组数据交叉验证:确保多肽正确表达,从c_AMPs备选库中获得2349条序列长度为6-50 AA的c_AMPs。c_AMP-微生物关联网络筛选:计算c_AMP丰度与细菌相对丰度,构建关联网络。根据负相关性FDR≤0.05且在7个以上群组出现的原则,获得241条非冗余c_AMPs。三、研究结果AMP识别成功率:化学合成216条c_AMP,体外抗菌实验表明83.8%(181/216)的多肽至少对一种细菌具有抗菌活性(60μM)。多肽多序列比对显示,绝大多数c_AMP与训练集多肽相似度低于40%,证明其新颖性。高性能AMP生物功能:抗菌广谱性:11条top-c_AMP对大肠杆菌、绿脓杆菌、鲍氏不动杆菌等革兰氏阴性菌均具有抗菌活性。低脱靶毒性:实验表明这些多肽对宿主细胞毒性低。破膜杀菌机理:通过破坏细菌细胞膜实现杀菌。不易产生耐药性:30天耐药性测试显示细菌未对c_AMP产生显著耐药性。治疗小鼠细菌性肺炎:11条c_AMP可有效治疗小鼠细菌性肺部感染。四、研究亮点样本库创新:以人类肠道微生物组为样本库,挖掘深埋其中的高性能AMP。技术整合:结合5项生物信息学技术,不断优化待识别基因-多肽样本库。湿实验验证:通过化学合成和体外抗菌实验,验证c_AMP的抗菌活性及生物功能。五、通讯作者与团队王军研究员:中科院微生物所生物信息和计算生物学研究组组长,研究方向包括微生物组分析、人工智能在微生物组中的应用及微生物与宿主相互作用。六、研究意义与展望设计优势:将几乎无限的多肽理论样本库缩小为包含更大量、更强效AMP的优选样本库,为AMP识别任务的成功打下基础。技术整合必要性:单项技术无法完成AMP筛选,需结合多种生物信息学工具。未来方向:进一步优化pipeline,探索更多微生物组来源的AMP,为解决耐药菌问题提供新策略。


nginx