▲▼深度求索(DeepSeek)AI模型。(圖/翻攝DeepSeek,下同)
記者魏有德/綜合報導
大陸AI大模型深度求索「DeepSeek」近日陸續推出「DeepSeek-V3」和「DeepSeek-R1」兩款AI大模型,標榜成本低廉,性能可與OpenAI比肩,讓矽谷一片震撼,甚至有Meta員工匿名發文稱,內部出現恐慌心態,工程師開始連夜嘗試複製DeepSeek的技術,探尋可能的成果。不過,該文章並未獲得官方出面回應。
《每日經濟新聞》報導,Scale AI創始人Alexander Wang在1月24日的採訪中表示,DeepSeek在他們的測試裡是表現最好的,與美國最好的模型相當。此前,Alexander Wang曾評價稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓,「當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。」
▲一名自稱為Meta員工的匿名者發文稱,DeepSeek已引起內部恐慌。(圖/翻攝每日經濟新聞)
一名自稱Meta員工24日在匿名平台teamblind上的貼文在網路上瘋傳。他提到,Meta內部因為DeepSeek的模型,已經進入恐慌模式,「工程師們正在瘋狂地剖析DeepSeek,並從中複製任何我們能得到的東西。我一點也不誇張。」
據了解,深度求索在2024年12月27日推出開源模型DeepSeek-V3。當時,聊天機器人競技場(Chatbot Arena)資訊顯示,DeepSeek-V3在所有模型中排名第七,在開源模型排第一,也是全球前十中性價比最高的模型。
一個月內,深度求索在20日推出「DeepSeek-R1」推理模型,允許外界在在遵循MIT License的情況下,透過R1訓練其他模型。
長期為矽谷輸出人才的史丹佛大學和Epoch AI的研究人員在2024年中發表一項研究表明,到2027年,最大型的模型的訓練成本將超過10億美元。Gartner預測,Google、Microsoft和AWS等超大規模企業到2028年止,僅在AI服務器上的支出就將高達5000億美元。
然而,「DeepSeek」的訓練成本並不昂貴,Noah's Arc資本管理公司表示,DeepSeek-V3模型有可能徹底改變訓練和推理領域的遊戲規則。知名財經記者Holger Zschaepitz 25日提到,DeepSeek以極低的價格建立了一個突破性的AI模型,而且沒有使用尖端晶片,這讓人們懷疑。該行業數千億美元資本支出的效用。
讀者迴響