本文作者:访客

Meta回应大模型Llama 4训练作弊争议

访客 2025-04-08 17:35:27 48091
Meta回应大模型Llama 4训练作弊争议摘要: Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick,但随后就被曝出模型训练测试集作弊。在海...

Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick,但随后就被曝出模型训练测试集作弊。

Meta回应大模型Llama 4训练作弊争议

在海外留学求职交流论坛“一亩三分地”上,发帖人自称是参与Llama 4训练的内部员工,他表示,Llama 4的内部模型性能始终无法达到开源SOTA(State-of-the-Art,顶尖水平)基准,公司领导层提出在训练后期将各种基准测试的“测试集”数据混入训练或微调数据中,以交出一份“好看”的成绩单。

知名科技媒体TechCrunch也发文质疑Llama 4的性能测试存在误导性。

针对舆论,4月8日凌晨,Meta AI部门副总裁Ahmad Al-Dahle发文回应表示,Llama 4一准备好就发布了,所以,不同服务中模型质量难免会有差异,Meta很快会修复这些漏洞提升性能,同时否认在测试集上进行了预训练。

阅读
分享