史丹佛AI團隊抄襲北京清華系大模型！　作者道歉：撤下Llama3-V

▲史丹佛AI團隊承認抄襲中國清華系大模型。（圖／翻攝自微博）

▲史丹佛AI團隊成員先前在X上，發布「Llama3-V」多模態的大模型。（圖／翻攝自微博）

記者廖翊慈／綜合報導

美國史丹佛大學一AI團隊5月29日發布了一個名為「Llama3-V」的多模態大模型，宣稱只需500美元，就可訓練出一個性能可與GPT4-V媲美的模型。隨後，該模型被指抄襲，與中國清華系大模型相似度極高。目前，Llama3-V已被團隊撤下，其中一名成員阿克沙·加格（Aksh Garg）也公開道歉。

據《每日經濟新聞》報導，史丹佛大學AI團隊近期在社交平台X上，發布了一個名為Llama3-V的多模態大模型。Llama3-V不僅在社群媒體上迅速竄紅，還一度衝上了HuggingFace趨勢榜首頁。

▲▼史丹佛AI團隊承認抄襲中國清華系大模型。（圖／翻攝自微博）

▲有網友指出，兩邊的數據一模一樣。（圖／翻攝自微博）

然而，一名網友發現，該團隊發布的Llama3-V和中國大模型MiniCPM-Llama3-V 2.5有極高的相似度，後者是由中國大模型初創企業「面壁智能」和「清華大學自然語言處理實驗室」共同推出的。

網友還在面壁智能GitHub的專案下放出了一系列證據。該網友表示，「這兩個模型的結構、程式碼、設定檔都一模一樣，只有變數名被替換了。」

隨後，面壁智能首席科學家、清華大學長聘副教授劉知遠在知乎上回應，「MiniCPM-Llama3-V 2.5在研發時，內置了一個彩蛋，就是對『清華簡』的識別能力，而Llama3-V模型居然也有一模一樣的能力。」

▲▼史丹佛AI團隊承認抄襲中國清華系大模型。（圖／翻攝自微博）

▲面壁智能表示，戰國竹簡資料也被史丹佛AI團隊抄襲。（圖／翻攝自微博）

報導指出，清華簡是清華大學於2008年7月收藏的一批戰國竹簡，為戰國中晚期文物。劉知遠透露，識別清華簡是MiniCPM-Llama3-V 2.5的實驗功能，「訓練影像是最近從出土文物中掃描並標註，且尚未公開發布。」

兩個模型在辨識的表現上，正確的結果基本上一致，錯誤的情況也相當相似。遭到大量質疑後，這位史丹佛團隊成員已刪除他們在X上官宣模型的推文，並將該項目在Github和HuggingFace上的庫一併刪除。

李大海3日在聲明中表達了對此事的深切遺憾，並指出，儘管從某種程度上看，這種模仿可以被視為他們的成果得到了國際團隊的某種認可，但他更強調應該構建一個開放、協作且充滿信任的科技社群環境。他進一步強調，他們希望團隊的努力和優秀工作能吸引更多人的注意和認可，但並非以這種被模仿甚至抄襲的方式。

▲李大海聲明。（圖／翻攝自微博）

▲李大海聲明。（圖／翻攝自微博）

由於抄襲幾乎是非常明確，Llama3-V團隊的兩位作者森德哈斯·沙瑪（Siddharth Sharma）和阿克沙·加格（Aksh Garg）於4日在社交平台上，向面壁MiniCPM團隊正式道歉，並表示會將Llama3-V模型悉數撤下。

阿克沙表示，「首先，我們要向MiniCPM原作者道歉。我、森德哈斯·沙瑪，以及穆斯塔法（Mustafa）一起發布了Llama3-V，穆斯塔法為這個項目編寫了代碼，但從昨天起就無法聯繫他。未被告知或意識到OpenBMB（清華團隊支持發起的大規模預訓練語言模型庫與相關工具）之前的任何工作。對所發生的事情承擔全部責任，並已撤下Llama3-V，再次致歉。」

Shocked! Llama3-V project from a Stanford team plagiarized a lot from MiniCPM-Llama3-V 2.5!
its code is a reformatting of MiniCPM-Llama3-V 2.5, and the model's behavior is highly similar to a noised version of MiniCPM-Llama3-V 2.5 checkpoint.
Evidence: https://t.co/L65B6USzJv pic.twitter.com/l7V1OKQIUs
— PrimerYang (@yangzhizheng1) June 2, 2024