
Meta回应大模型Llama 4训练作弊争议

Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick,但随后就被曝出模型训练测试集作弊。
在海外留学求职交流论坛“一亩三分地”上,发帖人自称是参与Llama 4训练的内部员工,他表示,Llama 4的内部模型性能始终无法达到开源SOTA(State-of-the-Art,顶尖水平)基准,公司领导层提出在训练后期将各种基准测试的“测试集”数据混入训练或微调数据中,以交出一份“好看”的成绩单。
知名科技媒体TechCrunch也发文质疑Llama 4的性能测试存在误导性。
针对舆论,4月8日凌晨,Meta AI部门副总裁Ahmad Al-Dahle发文回应表示,Llama 4一准备好就发布了,所以,不同服务中模型质量难免会有差异,Meta很快会修复这些漏洞提升性能,同时否认在测试集上进行了预训练。