▲臉書母公司Meta改善基礎建設因應AI時代。(圖/路透)
記者陳俐穎/綜合報導
臉書母公司Meta 宣布展開重大計畫,重新改造新一代的基礎建設架構,專為 AI 所設計,涵蓋硬體與軟體堆疊的各個層面,奠基未來發展更劃時代的 AI 模型,更有效率地部署各項新技術,將 AI 驅動的技術突破,應用於未來元宇宙的發展。
隨著 Meta 在 AI 領域的突破性發展、更多尖端 AI 應用與體驗注入 Meta 旗下服務,並同時建構關於元宇宙的長期願景,在未來十年,Meta 的 AI 運算需求將大幅成長。
Meta 正開始打造新一代的 Meta 基礎設施架構,特別為 AI 設計,涵蓋硬體與軟體堆疊的各個層面,及串聯這些技術的客製化網絡,包含 Meta 第一個用於執行 AI 模型所客製化的晶片、全新的 AI 優化資料中心設計,以及配備 1 萬 6 千 個 GPU,且專為 AI 研發設計、目前進展至第二階段的超級電腦。這些為了轉型所做的努力,再加上其他醞釀中的計畫,將讓 Meta 有能力開發更龐大、更精密的 AI 模型,並以有效率的方式大規模地部署這些技術。
Meta表示,現在將以三大方式來精進基礎建設架構,首先為 MTIA,這是 Meta 第一個由內部開發的客製化加速器晶片系列,專門用於處理推理相關的工作。MTIA針對內部的工作內容特別設計,且其提供的運算效能及處理效率優於 CPU。藉由同時部署 MTIA 晶片與 GPU,Meta 將提高每項工作的績效、減少延遲,以提升處理效率。
其次,開發新一代資料中心,除了將支援現有產品外,更將協助未來新的 AI 硬體展開訓練及推理。這個新資料中心將為優化 AI 所設計,支援液體冷卻式 AI 硬體設備 (liquid-cooled AI hardware) 及高效 AI 網絡,將數千個 AI 晶片串聯在一起形成資料中心規模的 AI 訓練集 (AI training clusters)。無論其開發的時間與成本都將提升,還能與其他新的硬體設備相輔相成。
Research SuperCluster(RSC)AI 超級電腦,是全世界最快的 AI 超級電腦之一,可訓練新一代的大型 AI 模型以支援新的擴增實境(AR)工具、內容理解(Content Understanding)系統、即時翻譯技術等,配備 1 萬 6 千 個 GPU,全數皆可透過 3 層 Clos 網絡結構存取,為 2 千個訓練系統各自提供足夠的資源。從去年開始,RSC 已經開始參與各項研究計畫,例如 Meta 推動並在今年初公佈的大型語言模型 LLaMA(Large Language Model Meta AI)。
讀者迴響