前段時間,斯坦福大學人工智能研究院(Stanford HAI)發布了一份報告,表示美國在大模型領域遙遙領先。報告指出,2023 年 61 個著名的人工智能模型來自美國的機構,遠遠超過歐盟的 21 個和中國的 15 個。
OpenAI 早期投資人 Vinod Khosla 去年還曾在 X 發文稱,美國的開源模型都會被中國抄襲。
然而,一直被認爲在「追趕美國」的國産大模型現在卻成了被抄襲的對象,而這個抄襲的 AI 團隊,正是來自發布上述報告的斯坦福大學。
![](http://image.uc.cn/s/wemedia/s/upload/2024/73f394ed2fb0c8d8619896de15766e7d.jpg)
斯坦福 AI 團隊主導的 Llama3-V 開源模型,被揪出涉嫌抄襲國內清華面壁智能的開源模型「小鋼炮」MiniCPM-Llama3-V 2.5,瞬間在 AI 圈裏炸開了鍋。
在實錘之下,斯坦福團隊也不得不緊急道歉。
正如面壁智能 CEO 李大海調侃式的回應,這是一種「受到國際團隊認可的方式」。無論我們距離最頂尖的大模型還有多少差距,但國産大模型已經到了不能再被忽視的階段
簡單梳理一下時間線:
斯坦福 AI 團隊發布 Llama3-V,號稱 SOTA 多模態大模型 網友質疑該模型抄襲國內面壁智能 MiniCPM-Llama3-V2.5 質疑證據湧現,Llama3-V 作者上演「刪庫跑路」 面壁智能官方實錘抄襲,深夜給出聲明 Llama3-V 作者正式道歉,網友各持己見 抄襲面壁智能「小鋼炮」,斯坦福 AI 團隊上演「刪庫跑路」近日,一個斯坦福 AI 團隊宣布,只需 500 美元就可訓練出一個超越 GPT-4V 的 SOTA 多模態大模型。
但很快,一位 X 用戶 @yangzhizheng1 指出,該項目使用的模型結構和代碼與面壁智能不久前發布的 MiniCPM-Llama3-V2.5 驚人的相似。
爲此,X 用戶 @yangzhizheng1 也放出了相應的質疑證據。
證據一:
Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型結構、代碼,簡直是複制粘貼級別的相似,區別大概就是換了個馬甲——變量名改了改。
就像是同一件衣服,只是換了不同顔色的紐扣,你說巧不巧?
![](http://image.uc.cn/s/wemedia/s/upload/2024/feccc77f95e49112b449c56812dc975a.png)
證據二:
Llama3-V 的作者被問到爲啥能提前用上還沒發布的 MinicPM-Llama3-V2.5 分詞器時,他們解釋稱,用的是面壁智能上一代 MinicPM-V-2 項目。
![](http://image.uc.cn/s/wemedia/s/upload/2024/868dce61f941d7b9bd09b467fb90f592.png)
但有媒體向面壁智能官方求證,在 HuggingFace 中,MiniCPM-V2 與 MiniCPM-Llama3-V 2.5 分詞器分別是兩個文件,文件大小也完全不同。
更何況,MiniCPM-Llama3-V 2.5 的分詞器是用 Llama3 分詞器加上 MiniCPM-V 系列模型的特殊 token 組成。
考慮到 MiniCPM-V2 的發布時間早于 Llama3,理論上它不可能包含尚未公開的 Llama3 分詞器技術。
證據三:
更離譜的是,llama3-V 項目的作者面對用戶的質疑,一看事情不妙,幹脆上演了一出「刪庫跑路」的好戲。
連 GitHub 上的項目頁面都撤了,堪稱掩耳盜鈴 2.0 版本。
![](http://image.uc.cn/s/wemedia/s/upload/2024/f61958432d6b9c468e708a709dc3312e.jpg)
Hugging Face 地址如下,目前打開該頁面,我們只能看到「404」。
https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6
這還沒完,更多證據正在不斷湧現:
X 用戶 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪聲(由單個標量參數化),出來的模型跟 Llama3-V 就像是一個模子刻出來的。
不僅如此,這模型還能識別「清華簡」這種深奧的戰國古文字,而且錯得都一模一樣,用面壁智能官方的話來說:
不僅對得一模一樣、連錯得都一模一樣。
![](http://image.uc.cn/s/wemedia/s/upload/2024/8d0b2bd7e411573b14a20f6f7ab8a0ef.jpg)
要知道這一古文字數據,是面壁智能和清華大學自然語言處理實驗室團隊花費數月時間,從清華大學收藏的清華簡上逐字掃描並人工標注得來,從未對外公開過。
那斯坦福 AI 團隊是如何憑空獲得呢?
可以說,面壁智能 6 月 2 日的深夜聲明算得上是徹底實錘斯坦福 AI 研究團隊的抄襲。
直到今天淩晨,斯坦福 Llama3-V 團隊的兩位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就這一學術不端行爲向面壁 MiniCPM 團隊正式道歉, 表示 Llama3-V 模型將悉數撤下。
名校學霸也抄襲?中國開源大模型正迎頭趕上此事之所以在網絡上激起千層浪,一個重要的原因在于抄襲作者的背景實在光鮮。
公開信息顯示,Siddharth Sharma 與 Aksh Garg 均是斯坦福大學計算機系的本科生,曾發表過多篇機器學習領域的論文。其中,Siddharth Sharma 曾在亞馬遜實習過一段時間,目前主要從事于 AI 和數據相關工作。
而 Aksh Garg 的實習履曆,那叫一個豐富,涵蓋 SpaceX、斯坦福大學和加州理工學校等知名組織機構。
至于被這上述兩位作者稱爲「代碼搬運工」的 Mustafa Aljadery,是南加州大學出身,在輿論發酵之後,目前 X 賬號已經被設爲隱私狀態。
![](http://image.uc.cn/s/wemedia/s/upload/2024/f31cfe9f500e3e2bfcdd53bad76f12bb.jpg)
對于這的斯坦福 Llama3-V 團隊的道歉聲明,眼尖的網友卻不吃這套。
例如,X 用戶 @xunie 指出,這哥倆將責任歸咎給一個人的甩鍋行爲,莫不是「有福同享,有難你當」?
![](http://image.uc.cn/s/wemedia/s/upload/2024/060a8fabe98080e50e776bce8450377a.jpg)
斯坦福 AI 實驗室主任 Christopher David Manning 也站出來譴責這一抄襲行爲,並且對 MiniCPM 這一優異的中國開源模型表示贊揚。
![](http://image.uc.cn/s/wemedia/s/upload/2024/5a254f84d1c4348cc1c5e9dc54f353c4.jpg)
不過,也有網友抱著「得饒人處且饒人」的態度,悠悠然地鼓勵道:
開放和誠實是科技界非常重要的價值觀,期待你的新作品。
![](http://image.uc.cn/s/wemedia/s/upload/2024/566b6d0bf93319af12fbec596fe3ed82.jpg)
Google DeepMind 研究員 Lucas Beyer 表示,中國開源大模型擁有像 MiniCPM 這樣好的模型,但國際上卻沒給夠應有的關注……
![](http://image.uc.cn/s/wemedia/s/upload/2024/a7e3b5bef15e471ff9e7f5f5e636f77b.jpg)
面壁智能團隊也于昨天對此事進行回應。
面壁智能 CEO 李大海表示:「技術創新不易,每一項工作都是團隊夜以繼日的奮鬥結果,也是以有限算力對全世界技術進步與創新發展作出的真誠奉獻。
我們希望團隊的好工作被更多人關注與認可,但不是以這種方式。」
![](http://image.uc.cn/s/wemedia/s/upload/2024/33a8d1cf7f70d77cafe6eb957d7966dc.png)
面壁智能首席科學家劉知遠也在知乎上發文表示,表示這次事件從另一個角度證明了中國創新成果的國際影響力,強調了開源共享的重要性,以及對原創精神的尊重。
不得不說,這出 AI 圈的抄襲大戲,教科書般地诠釋了叫「創新不易,且行且珍惜,學術誠信,人人有責」。
要知道,模仿了代碼的形,卻抄不來那份原創的風姿卓絕。
事實上,自去年以來,中國大模型如同雨後春筍般陸續開源,從以往的受益者轉變爲貢獻者,不吝于向世界提供更多開源的優異成果。
上至阿裏巴巴、騰訊等巨頭,下至面壁智能,智譜 AI 、昆侖天工等 AI 初創,也都是開源社區的積極分子,爲中國大模型的發展添磚加瓦。
我們也盼著,這股子開放共享的春風,能吹得更猛烈些。
正如面壁智能 CEO 李大海所呼籲的那樣,大家一起共建開放、合作、有信任的社區環境。加油合作,才能讓世界因 AGI 的到來變得更好!
#歡迎關注愛範兒官方微信公衆號:愛範兒(微信號:ifanr),更多精彩內容第一時間爲您奉上。
愛範兒|原文鏈接· ·新浪微博