Meta回应大模型Llama 4训练作弊争议

访客 2025-04-08 17:35:27 48125

默认

摘要： Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick，但随后就被曝出模型训练测试集作弊。在海...

Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick，但随后就被曝出模型训练测试集作弊。

在海外留学求职交流论坛“一亩三分地”上，发帖人自称是参与Llama 4训练的内部员工，他表示，Llama 4的内部模型性能始终无法达到开源SOTA（State-of-the-Art，顶尖水平）基准，公司领导层提出在训练后期将各种基准测试的“测试集”数据混入训练或微调数据中，以交出一份“好看”的成绩单。

知名科技媒体TechCrunch也发文质疑Llama 4的性能测试存在误导性。

针对舆论，4月8日凌晨，Meta AI部门副总裁Ahmad Al-Dahle发文回应表示，Llama 4一准备好就发布了，所以，不同服务中模型质量难免会有差异，Meta很快会修复这些漏洞提升性能，同时否认在测试集上进行了预训练。

标签：测试模型