ZhuHui
本文的第一作者,朱慧博士生

在图像识别领域,ImageNet数据集的重要性不言而喻。在生物计算领域,2024年黄牛实验室发布的BindingNet v1数据集独树一帜,采用模板匹配技术构建了高质量的蛋白-配体复合物三维结构模型,有效减轻了AI模型在蛋白-小分子亲和力预测中因包埋溶剂可及表面积引发的偏见等问题,为蛋白-配体相互作用研究领域中AI模型的评估和优化奠定了坚实基础,此阶段我们称之为“From Big Data to Good Data”。