Header image alt text

Niu Huang's Lab

@NIBS

本文的第一作者,李雪莲博士生

From Big Data to Good Data: 利用模板匹配方法构建高质量的蛋白-配体复合物结构模型数据集BindingNet

王情 博士生,本文的第一作者

ACS Central Science | 以不变应万变:黄牛实验室利用虚拟筛选方法发现可调控新冠病毒刺突蛋白构象转变的小分子调节剂

【VIP来稿】北生所黄牛课题组Int J Mol Sci论文:雪中送炭还是锦上添花——基于靶标结构的虚筛为新药研发贡献了什么?

JCIM | 透过表面现象看机器学习打分函数

Posted by Luyao Ma on November 19, 2022
Posted in news 

朱慧博士生,本文的第一作者。

近年来,机器学习(包括深度学习)打分函数被广泛用于预测蛋白-小分子结合自由能,并且在某些benchmark数据集上表现出优异的预测能力。但如果测试集含有与训练集相似的蛋白-小分子复合体,那么机器学习可能仅通过“学习”训练集的特定分布,就能在类似分布的测试集上取得优异表现。但这只是一种表面现象,因为这类模型往往在异分布的数据集上表现不理想,即不具备泛化能力(Generalization ability)。