斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視

前段時間，斯坦福大學人工智能研究院（Stanford HAI）發布了一份報告，表示美國在大模型領域遙遙領先。報告指出，2023 年 61 個著名的人工智能模型來自美國的機構，遠遠超過歐盟的 21 個和中國的 15 個。

OpenAI 早期投資人 Vinod Khosla 去年還曾在 X 發文稱，美國的開源模型都會被中國抄襲。

然而，一直被認爲在「追趕美國」的國産大模型現在卻成了被抄襲的對象，而這個抄襲的 AI 團隊，正是來自發布上述報告的斯坦福大學。

斯坦福 AI 團隊主導的 Llama3-V 開源模型，被揪出涉嫌抄襲國內清華面壁智能的開源模型「小鋼炮」MiniCPM-Llama3-V 2.5，瞬間在 AI 圈裏炸開了鍋。

在實錘之下，斯坦福團隊也不得不緊急道歉。

正如面壁智能 CEO 李大海調侃式的回應，這是一種「受到國際團隊認可的方式」。無論我們距離最頂尖的大模型還有多少差距，但國産大模型已經到了不能再被忽視的階段

簡單梳理一下時間線：

斯坦福 AI 團隊發布 Llama3-V，號稱 SOTA 多模態大模型網友質疑該模型抄襲國內面壁智能 MiniCPM-Llama3-V2.5 質疑證據湧現，Llama3-V 作者上演「刪庫跑路」面壁智能官方實錘抄襲，深夜給出聲明 Llama3-V 作者正式道歉，網友各持己見

抄襲面壁智能「小鋼炮」，斯坦福 AI 團隊上演「刪庫跑路」

近日，一個斯坦福 AI 團隊宣布，只需 500 美元就可訓練出一個超越 GPT-4V 的 SOTA 多模態大模型。

但很快，一位 X 用戶 @yangzhizheng1 指出，該項目使用的模型結構和代碼與面壁智能不久前發布的 MiniCPM-Llama3-V2.5 驚人的相似。

爲此，X 用戶 @yangzhizheng1 也放出了相應的質疑證據。

證據一：

Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型結構、代碼，簡直是複制粘貼級別的相似，區別大概就是換了個馬甲——變量名改了改。

就像是同一件衣服，只是換了不同顔色的紐扣，你說巧不巧？

證據二：

Llama3-V 的作者被問到爲啥能提前用上還沒發布的 MinicPM-Llama3-V2.5 分詞器時，他們解釋稱，用的是面壁智能上一代 MinicPM-V-2 項目。

但有媒體向面壁智能官方求證，在 HuggingFace 中，MiniCPM-V2 與 MiniCPM-Llama3-V 2.5 分詞器分別是兩個文件，文件大小也完全不同。

更何況，MiniCPM-Llama3-V 2.5 的分詞器是用 Llama3 分詞器加上 MiniCPM-V 系列模型的特殊 token 組成。

考慮到 MiniCPM-V2 的發布時間早于 Llama3，理論上它不可能包含尚未公開的 Llama3 分詞器技術。

證據三：

更離譜的是，llama3-V 項目的作者面對用戶的質疑，一看事情不妙，幹脆上演了一出「刪庫跑路」的好戲。

連 GitHub 上的項目頁面都撤了，堪稱掩耳盜鈴 2.0 版本。

Hugging Face 地址如下，目前打開該頁面，我們只能看到「404」。

https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6

這還沒完，更多證據正在不斷湧現：

X 用戶 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪聲（由單個標量參數化），出來的模型跟 Llama3-V 就像是一個模子刻出來的。

不僅如此，這模型還能識別「清華簡」這種深奧的戰國古文字，而且錯得都一模一樣，用面壁智能官方的話來說：

不僅對得一模一樣、連錯得都一模一樣。

要知道這一古文字數據，是面壁智能和清華大學自然語言處理實驗室團隊花費數月時間，從清華大學收藏的清華簡上逐字掃描並人工標注得來，從未對外公開過。

那斯坦福 AI 團隊是如何憑空獲得呢？

可以說，面壁智能 6 月 2 日的深夜聲明算得上是徹底實錘斯坦福 AI 研究團隊的抄襲。

直到今天淩晨，斯坦福 Llama3-V 團隊的兩位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就這一學術不端行爲向面壁 MiniCPM 團隊正式道歉，表示 Llama3-V 模型將悉數撤下。

名校學霸也抄襲？中國開源大模型正迎頭趕上

此事之所以在網絡上激起千層浪，一個重要的原因在于抄襲作者的背景實在光鮮。

公開信息顯示，Siddharth Sharma 與 Aksh Garg 均是斯坦福大學計算機系的本科生，曾發表過多篇機器學習領域的論文。其中，Siddharth Sharma 曾在亞馬遜實習過一段時間，目前主要從事于 AI 和數據相關工作。

而 Aksh Garg 的實習履曆，那叫一個豐富，涵蓋 SpaceX、斯坦福大學和加州理工學校等知名組織機構。

至于被這上述兩位作者稱爲「代碼搬運工」的 Mustafa Aljadery，是南加州大學出身，在輿論發酵之後，目前 X 賬號已經被設爲隱私狀態。

對于這的斯坦福 Llama3-V 團隊的道歉聲明，眼尖的網友卻不吃這套。

例如，X 用戶 @xunie 指出，這哥倆將責任歸咎給一個人的甩鍋行爲，莫不是「有福同享，有難你當」？

斯坦福 AI 實驗室主任 Christopher David Manning 也站出來譴責這一抄襲行爲，並且對 MiniCPM 這一優異的中國開源模型表示贊揚。

不過，也有網友抱著「得饒人處且饒人」的態度，悠悠然地鼓勵道：

開放和誠實是科技界非常重要的價值觀，期待你的新作品。

Google DeepMind 研究員 Lucas Beyer 表示，中國開源大模型擁有像 MiniCPM 這樣好的模型，但國際上卻沒給夠應有的關注……

面壁智能團隊也于昨天對此事進行回應。

面壁智能 CEO 李大海表示：「技術創新不易，每一項工作都是團隊夜以繼日的奮鬥結果，也是以有限算力對全世界技術進步與創新發展作出的真誠奉獻。

我們希望團隊的好工作被更多人關注與認可，但不是以這種方式。」

面壁智能首席科學家劉知遠也在知乎上發文表示，表示這次事件從另一個角度證明了中國創新成果的國際影響力，強調了開源共享的重要性，以及對原創精神的尊重。

不得不說，這出 AI 圈的抄襲大戲，教科書般地诠釋了叫「創新不易，且行且珍惜，學術誠信，人人有責」。

要知道，模仿了代碼的形，卻抄不來那份原創的風姿卓絕。

事實上，自去年以來，中國大模型如同雨後春筍般陸續開源，從以往的受益者轉變爲貢獻者，不吝于向世界提供更多開源的優異成果。

上至阿裏巴巴、騰訊等巨頭，下至面壁智能，智譜 AI 、昆侖天工等 AI 初創，也都是開源社區的積極分子，爲中國大模型的發展添磚加瓦。

我們也盼著，這股子開放共享的春風，能吹得更猛烈些。

正如面壁智能 CEO 李大海所呼籲的那樣，大家一起共建開放、合作、有信任的社區環境。加油合作，才能讓世界因 AGI 的到來變得更好！

#歡迎關注愛範兒官方微信公衆號：愛範兒（微信號：ifanr），更多精彩內容第一時間爲您奉上。

愛範兒|原文鏈接· ·新浪微博

娛樂新聞吧

斯坦福團隊抄襲清華系大模型實錘，作者深夜道歉，中國大模型已經無法被忽視

愛範兒