DeepSeek橫空出世 Meta陷恐慌:訓練成本「比高層薪水還低」

▲▼深度求索(DeepSeek)AI模型。(圖/翻攝DeepSeek)

▲中國橫空出世的AI模型DeepSeek震撼矽谷,也讓Meta陷入恐慌。(圖/翻攝自DeepSeek)

記者葉睿涵/綜合報導

中國AI新創企業DeepSeek(深度求索)近2個月接連推出新模型DeepSeek-V3與DeepSick-R1,令其APP在蘋果App Store的下載排行榜中衝上第一名,將ChatGPT遠拋在後。這款低成本高性能的AI模型表現與OpenAI的ChatGPT-4等全球頂尖AI語言模型不相上下,令整個矽谷為之震撼,更讓美國科技巨頭Meta的生成式AI部門陷入危機。

一位自稱是Meta員工的網友,日前在美國匿名職場論壇TeamBlind上發文,表示DeepSeek橫空出世後,技術水準就直接超越了Meta旗下的Llama 4,讓Meta全公司上下陷入恐慌。更令Meta難堪的是,這家中國企業只用了550萬美元(約新台幣1.8億元)來訓練DeepSeek,成本只有Meta的十一分之一。

這名員工坦言,DeepSeek以超低成本完成大規模模型訓練,顛覆了行業對高昂成本的傳統認知,因為「單只Meta生成式AI部門裡的主管薪資就已超過了DeepSeek訓練AI的成本,而且我們這裡有幾十位領著高薪的主管,我根本無法想像他們該如何向公司證明部門目前高額成本的合理性。」

外媒The Information指出,OpenAI、Meta和其他頂尖AI公司的工程師正瘋狂地研究DeepSeek模型,試圖解讀其技術祕密,複製其成功模式,但暫時還不得其解。Meta更為此籌組了4個「戰情室」,2個聚焦研究如何降低訓練和運作DeepSeek的成本,另2個則負責釐清DeepSeek使用了哪些數據來訓練其模型,及基於DeepSeek模型歸納出的特質,重新建構Meta的模型。

分享給朋友:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

相關新聞

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面