陸DeepSeek-V3訓練成本不到600萬美元　預訓練2個月僅用2048塊GPU

▲DeepSeek（深度求索）大模型。（圖／翻攝官網）

▲DeepSeek（深度求索）大模型。（圖／翻攝官網）

記者魏有德／綜合報導

大陸AI創新公司DeepSeek（深度求索）DeepSeek-V3於26日正式發佈首個版本並同步開源，這款高達671B的大模型，在預訓練階段僅用2048塊GPU訓練2個月，且只耗資557.6萬美元，引起AI行業內震動，同時，在性能上也能比肩業內AI大模型，讓全球AI研發者及業內人士關注。

《中信證券研報》報導，近日，DeepSeek-V3的正式發版引起AI業內廣泛高度關注，其在保證了模型能力的前提下，訓練效率和推理速度大幅提升。DeepSeek新一代模型的發佈意味著AI大模型的應用將逐步走向普惠，助力AI應用廣泛落地；同時訓練效率大幅提升，亦將助力推理算力需求高增。

DeepSeek-V3研發團隊證實，多Token預測目標（Multi-Token Prediction，MTP）有利於提高模型性能，可以用於推理加速的推測解碼。後訓練方面，DeepSeek V3引入一種創新方法，將推理能力從長思維鏈模型（DeepSeek R1）中，蒸餾到標準模型上。這在顯著提高推理性能的同時，保持了DeepSeek V3的輸出風格和長度控制。

外界分析，DeepSeek-V3極低的訓練成本或預告AI大模型對算力投入的需求將大幅下降，不過，DeepSeek雖繳出亮眼的成績單，但其統計口徑只計算「預訓練」階段，數據的配比需要做大量的預實驗，合成數據的生成和清洗也需消耗算力，此外，在訓練上做降本增效不代表算力需求會下降，只代表大廠可以用性價比更高的方式去做模型極限能力的探索。

Lepton AI創始人兼CEO賈揚清針對推理方面分析道，最重要的是，我們正式進入了分布式推理時代，「一台單GPU機器（80×8=640G）的顯存已經無法容納所有參數。雖然更新大顯存機器確實可以裝下模型，但不論如何，都需要分布式推理來保證性能和未來擴展。」

OpenAI聯合創始人兼前首席科學家Ilya Sutskever曾斷言稱，「我們已經達到數據峰值……AI預訓練時代無疑將終結。」部分AI投資人、創始人和CEO們也曾提及，AI在Scaling Law定律的收益正逐步衰減，「我們正處於一個新的Scaling Law時代——測試時間計算時代，即推理時代。這項能力讓AI模型在回答問題之前，能有更多時間和算力來思考，這特別有希望成為下一件大事。」

「Bloomberg Intelligence」近期刊出的報告顯示，「企業客戶可能會在2025年進行更大規模的AI投資，而AI支出增長將更側重於推理側，以實現投資變現或提升生產力。」

每日新聞精選　免費訂閱《ETtoday電子報》

ET快訊

嗆鄭文燦律師「不是只有excel檔」　檢察官道歉

趙露思被批「忘本」　《火星》導演不忍發聲

快訊／柯文哲第3次羈押庭開始審理中

梁文傑與林秉文跟辣妹唱歌？　林楚茵回擊徐巧芯：我老公就比較帥

他爽中100萬卻無法領　中市府回應了

快訊／柯文哲等4人三開羈押庭　黃國昌、張啟楷、四叉貓現身

分享給朋友：

追蹤我們：

熱門活動

‧ 台灣人領大陸身分證 12年679人被註銷台灣戶籍

‧ 未上演新年行情！ 中國A股3大指數「齊跌」

‧ 中國機遇已失？ 美媒：川普2.0美企「不會再幫北京關說」

‧ 石破茂稱訪華「極為重要」 陸外交部：願同日方開展溝通

‧ 「假裝上班有限公司」徵才！陸失業族只要花錢就能上班

‧ 陸網友自製「高仿加拿大鵝牌」羽絨服 7天搞定！成本僅1500元

‧ 跨年過世！抗癌網紅希希不敵肝癌 妻子哽咽：最後想陪女兒玩

‧ 陸春節機票價格狂跌！最高跌幅近七成 國內外機票預訂超365萬張

‧ 陸「15大電動車企」成績單 13家銷量創新高！鴻蒙智行未公佈目標

‧ 煙火垃圾長達300m！陸跨年後遍地掛氣球 清潔工嘆：運了10噸

‧ 【白跨了】#跨年 等101煙火拍錯棟！300人倒數完崩潰：87喔～

‧ 黃宣唱一半..合體聲樂老師飆〈Shallow〉 Lulu麻煩他翻譯..亂翻一通XD

‧ 安心亞爆乳馬甲裝 「幫你呼呼」辣翻

‧ 轎車自助加油被按喇叭嫌慢 網友算騎士才等30秒掀議論

‧ 徐佳瑩跨年限定 突唱〈姐姐+APT.〉

‧ 李聖傑解禁〈痴心絕對〉 Lulu聽到台下轉圈圈

‧ 黃宣唱一半...合體聲樂老師 跨年飆唱〈Shallow〉

‧ 2NE1 DARA高雄跨年 驚喜唱中文歌〈你要的愛〉

‧ 利特偷銀赫台詞喊：老婆～ 聊天太久..始源冷到穿外套

‧ 貓長大才發現不是母的 飼主崩潰：你有蛋蛋！

‧ 台灣人領大陸身分證 12年679人被註銷台灣戶籍

‧ 未上演新年行情！ 中國A股3大指數「齊跌」

‧ 中國機遇已失？ 美媒：川普2.0美企「不會再幫北京關說」

‧ 石破茂稱訪華「極為重要」 陸外交部：願同日方開展溝通

‧ 「假裝上班有限公司」徵才！陸失業族只要花錢就能上班

‧ 陸網友自製「高仿加拿大鵝牌」羽絨服 7天搞定！成本僅1500元

‧ 跨年過世！抗癌網紅希希不敵肝癌 妻子哽咽：最後想陪女兒玩

‧ 陸春節機票價格狂跌！最高跌幅近七成 國內外機票預訂超365萬張

‧ 陸「15大電動車企」成績單 13家銷量創新高！鴻蒙智行未公佈目標

‧ 煙火垃圾長達300m！陸跨年後遍地掛氣球 清潔工嘆：運了10噸

‧ 卡特百歲蓋棺 功過論定進行中

‧ 香港男神為台灣脫了！ 「驚人胸＋臂＋腹肌」全放送...觀眾暴動

‧ 張嘉郡率教委雲林考察！6校改善計畫「逾2500萬補助」教育部同意了

‧ 日月潭「貓囒山步道」重新開放！南投洋紅風鈴木秘境一次看

‧ 台灣人領大陸身分證 12年679人被註銷台灣戶籍

‧ 2025購車優惠出爐！CR-V送環景、速霸陸百萬有找 農曆年前拼了

‧ 六月、李易新年公開放閃！ 「現身留3符號」夫妻真實互動曝

‧ 小薰撞臉《魷魚遊戲2》朴成焄 自製對比照…Vicky笑了：難怪面熟

‧ 開幕僅半年！主打鐵板風味「福吉漢堡排」已歇業

‧ 慈濟大愛援建 台東豐田國中學子宿舍「築夢樓」落成啟用

大陸熱門新聞

相關新聞

關鍵字：

讀者迴響

熱門新聞

最夯影音

【白跨了】#跨年 等101煙火拍錯棟！300人倒數完崩潰：87喔～

熱門快報

‧ 台灣人領大陸身分證　12年679人被註銷台灣戶籍

‧ 未上演新年行情！　中國A股3大指數「齊跌」

‧ 中國機遇已失？　美媒：川普2.0美企「不會再幫北京關說」

‧ 石破茂稱訪華「極為重要」　陸外交部：願同日方開展溝通

‧ 陸網友自製「高仿加拿大鵝牌」羽絨服　7天搞定！成本僅1500元

‧ 跨年過世！抗癌網紅希希不敵肝癌　妻子哽咽：最後想陪女兒玩

‧ 陸春節機票價格狂跌！最高跌幅近七成　國內外機票預訂超365萬張　

‧ 陸「15大電動車企」成績單　13家銷量創新高！鴻蒙智行未公佈目標

‧ 煙火垃圾長達300m！陸跨年後遍地掛氣球　清潔工嘆：運了10噸

‧ 【白跨了】#跨年等101煙火拍錯棟！300人倒數完崩潰：87喔～

‧ 黃宣唱一半..合體聲樂老師飆〈Shallow〉　Lulu麻煩他翻譯..亂翻一通XD

‧ 安心亞爆乳馬甲裝　「幫你呼呼」辣翻

‧ 轎車自助加油被按喇叭嫌慢　網友算騎士才等30秒掀議論

‧ 徐佳瑩跨年限定　突唱〈姐姐+APT.〉

‧ 李聖傑解禁〈痴心絕對〉　Lulu聽到台下轉圈圈

‧ 黃宣唱一半...合體聲樂老師　跨年飆唱〈Shallow〉

‧ 2NE1 DARA高雄跨年　驚喜唱中文歌〈你要的愛〉

‧ 利特偷銀赫台詞喊：老婆～　聊天太久..始源冷到穿外套

‧ 貓長大才發現不是母的　飼主崩潰：你有蛋蛋！

‧ 台灣人領大陸身分證　12年679人被註銷台灣戶籍

‧ 未上演新年行情！　中國A股3大指數「齊跌」

‧ 中國機遇已失？　美媒：川普2.0美企「不會再幫北京關說」

‧ 石破茂稱訪華「極為重要」　陸外交部：願同日方開展溝通

‧ 陸網友自製「高仿加拿大鵝牌」羽絨服　7天搞定！成本僅1500元

‧ 跨年過世！抗癌網紅希希不敵肝癌　妻子哽咽：最後想陪女兒玩

‧ 陸春節機票價格狂跌！最高跌幅近七成　國內外機票預訂超365萬張　

‧ 陸「15大電動車企」成績單　13家銷量創新高！鴻蒙智行未公佈目標

‧ 煙火垃圾長達300m！陸跨年後遍地掛氣球　清潔工嘆：運了10噸

‧ 卡特百歲蓋棺　功過論定進行中

‧ 香港男神為台灣脫了！　「驚人胸＋臂＋腹肌」全放送...觀眾暴動

‧ 台灣人領大陸身分證　12年679人被註銷台灣戶籍

‧ 2025購車優惠出爐！CR-V送環景、速霸陸百萬有找　農曆年前拼了

‧ 六月、李易新年公開放閃！　「現身留3符號」夫妻真實互動曝

‧ 小薰撞臉《魷魚遊戲2》朴成焄　自製對比照…Vicky笑了：難怪面熟

‧ 慈濟大愛援建　台東豐田國中學子宿舍「築夢樓」落成啟用

【白跨了】#跨年等101煙火拍錯棟！300人倒數完崩潰：87喔～