近日,食品科学与营养工程学院国家果蔬加工工程技术研究中心沈群、薛勇课题组在中国科协和美国科学促进会合作期刊《Research》发表研究性论文 “Mining Bovine Milk Proteins for DPP-4 Inhibitory Peptides using Machine Learning and Virtual Proteolysis”,文章基于人工智能和虚拟水解技术开发了一种从已知蛋白质序列中精准挖掘功能性活性肽的策略。

目前,制备纯度高、结构清晰、功能明确的生物活性肽十分困难。已知结构的功能肽虽然能够人工合成,但价格昂贵、耗时耗力,在功能性食品中大规模应用难度较大。传统的食源性功能肽的研究方法包括蛋白酶水解、功能评价、分离纯化、结构鉴定、虚拟筛选和功能验证等,虽然能够发现一些潜在的功能肽,但是由于水解体系的复杂性,难以实现对水解肽功能性的充分挖掘和表征,也难以建立稳定的、可靠的构效关系,导致产业化和市场应用过程中食源性功能肽存在功效不稳定、不明确的问题。随着蛋白质分离技术的发展,越来越多的食源性蛋白质已实现充分分离和纯化,同时氨基酸序列得到明确的解析。针对已知序列的蛋白质,基于虚拟水解技术可获取不同蛋白酶水解产生的多肽,结合人工智能技术建立的多肽序列和功能的构效关系,可快速实现食源性功能肽的高通量挖掘,继而快速明确酶解条件和所需蛋白质资源,为规模化制备特定功能肽提供理论依据。

本研究开发了结合机器学习和虚拟蛋白水解技术的 DPP-4 抑制肽发现和验证的综合策略。 本研究训练了 GBDT、XGBoost、LightGBM、CatBoost 和 RF 五种机器学习模型,其中LightGBM 表现出卓越的性能,AUC值为0.92 ± 0.01。随后,采用 LightGBM 来预测通过虚拟水解乳蛋白产生肽的DPP-4抑制潜力。通过一系列的计算机筛选过程和体外实验,发现GPVRGPF和HPHPHL表现出良好的DPP-4抑制活性。分子对接和分子动力学模拟进一步证实了这些肽的抑制机制。通过追溯虚拟蛋白步骤,发现GPVRGPF可以通过胰凝乳蛋白酶对β-酪蛋白的酶解获得,而HPHPHL可以通过菠萝蛋白酶或木瓜蛋白酶对κ-酪蛋白的酶解获得。这种创新方法不仅节省了生物活性肽发现的成本和时间,并且有助于初步确定关键水解参数,有利于工业化过程中生物活性肽的高效制备。

图 1. 从乳蛋白中筛选和鉴定 DPP-4 抑制肽的流程 

以上研究中国农业大学为第一完成单位,薛勇副教授为共同通讯作者,本校研究生张译匀为第一作者。相关研究获得了国家重点研发计划项目(2018YFE0206300-02)的资助。

文章链接:https://spj.science.org/doi/pdf/10.34133/research.0391