小米傳投入百億元搭建GPU「萬卡集群」 搶攻AI大模型領域 

▲▼北京小米總部。(圖/CFP)

▲北京小米總部。(圖/CFP)

記者魏有德/綜合報導

陸媒《界面新聞》昨(26)日釋出一則獨家報導稱,有相關人士透露,小米正著手搭建自己的GPU萬卡集群,對AI大模型大力投入,數據顯示,小米大模型團隊在成立時已有6500張GPU資源。對此,小米方在發稿前仍未主動回應,低調應對。

▲AI晶片示意圖。(圖/路透)

▲小米傳出將建立「萬卡集群」擴大應用AI大模型領域。(圖/路透)

《每日經濟新聞》報導,國際上,OpenAI、Meta等科技巨頭,都爭相部署萬卡集群;在國內,運營商、頭部互聯網大廠、大型AI研發企業等先後入局,一些巨頭甚至已開始邁向「十萬卡集群」。

「萬卡集群」象徵由一萬張及以上的加速卡(GPU、TPU或其他專用AI加速晶片)組成的高性能計算系統,用以訓練基礎大模型。建設萬卡集群是「百億元(人民幣,下同)」成本的投入,其中,光採購GPU的成本就上看幾十億元。

獨立電信分析師付亮分析稱,假設小米搭建萬卡集群的消息屬實,代表小米將大模型視為 「人車家」戰略的重要支撐,其建設萬卡集群的方向或與其他企業不同,「別人沒有利用率,小米自帶利用率。」

百度集團執行副總裁、百度智能雲事業群總裁沈抖曾透露,GPU集群有「極致規模、極致高密和極致互聯」三種特徵,「建一個萬卡集群,單是GPU的採購成本就高達幾十億元。而建設GPU萬卡集群需要面臨的風險之一便是故障率,Meta訓練Llama3的時候,用了1.6萬張GPU卡的集群,平均每3小時就會出一次故障。」

即使建立「萬卡集群」要付出高昂成本,但這也被視為進入AI大模型賽道的「入場券」,畢竟,模型大小和訓練數據量大小是決定模型能力的關鍵因素,也就是所謂的「算力」決定一切,超萬卡的集群將有助於壓縮大模型訓練時間,實現模型能力的快速迭代,並對市場趨勢作出及時反應。

小米集團於2023年5月的一份業績公告顯示,該年4月正式組建AI實驗室大模型團隊,AI領域相關人員超1200人,將不斷挖掘AI相關的用戶場景,發揮自身技術優勢,並以開放的態度與合作夥伴開拓更多機會。

至於2023年8月,小米集團的另一份公告中顯示,AI是小米長期投入的底層賽道,小米擁有60億參數的自研大模型在同參數量級中排名第一。直至2023年11月,小米正式將AI大模型與小米澎湃OS深度融合,為用戶提供基於端側大模型的各類便利和智能的功能。

分享給朋友:

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

相關新聞

讀者迴響

熱門新聞

最夯影音

更多

熱門快報

回到最上面