新华社电 “‘作假,直至成功’,这是硅谷不光彩的文化。”美国斯坦福大学人工智能实验室主任克里斯托弗·曼宁3日就该校某些研究人员抄袭中国清华大学等机构成果的行为这样评论说。他在社交媒体上还指出,该研究团队应该深刻认识自己的错误。
5月29日,斯坦福大学一个研究团队发布名为Llama3-V的大模型,声称只要500美元的预训练成本,就能用它获得比肩GPT-4V等著名大模型的效果。这一消息在社交媒体和人工智能学术界被广泛转发。
但业内人士很快发现,该大模型涉嫌抄袭清华大学等机构发布的 MiniCPM-Llama3-V 2.5大模型。它们都是基于开源的Llama3大模型,但清华团队进行了独特的训练,包括利用“清华简”(清华大学收藏的一批战国竹简)训练它识别古代中国文字的能力。测试显示,斯坦福大学这个团队发布的大模型居然也能识别“清华简”。
“已经比较确信,斯坦福这个团队‘套壳’了我们的大模型研究成果。”清华大学计算机系长聘副教授刘知远对新华社记者说。
“我们从‘清华简’逐字扫描并标注的数据集从未公开,而Llama3-V展现出了一模一样的识别‘清华简’能力,连做错的样例都一样。”刘知远是清华这个大模型团队成员。他介绍说,在质疑声发酵后,对方已经在网上删除了此前发布的数据库和宣传文章,“从证据和对方反应来看,抄袭性质已比较确定”。
曼宁发声批评后,斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉,并表示要完全撤下Llama3-V模型。