DeepSeek標榜低成本…半導體研究機構估:歷來硬體投資逾5億美元

半導體研究機構SemiAnalysis近日發表報告,估計DeepSeek歷來硬體投資支出高於5億美元。(路透資料照)
半導體研究機構SemiAnalysis近日發表報告,估計DeepSeek歷來硬體投資支出高於5億美元。(路透資料照)

大陸人工智慧(AI)新創公司「深度求索」(DeepSeek),以僅約560萬美元及使用2048顆輝達(Nvidia)「H800」繪圖處理器(GPU),推出的新模型DeepSeek-R1,由於成本遠低於美國科技巨擘,引發全球市場關注。不過,半導體研究機構SemiAnalysis近日發表報告估計,DeepSeek歷來的硬體投資支出,應遠高於5億美元。

SemiAnalysis報告估計,DeepSeek使用5萬顆輝達Hopper架構GPU,包括1萬顆「H800」、1萬顆「H100」,還有特供大陸的「H20」,這些GPU主要用於AI訓練、研究及財務模型。換算下來,DeepSeek總資本支出約為16億美元,其中營運成本估計有9.44億美元,對GPU的投資額超過5億美元。

SemiAnalysis報告裡提到,2023年5月,大陸對沖基金「幻方量化」成立「深度求索」(DeepSeek),以推動AI技術研發,但早在2021年,幻方量化已在出口管制生效前,投資購買了1萬顆輝達(Nvidia)A100 GPU。

DeepSeek論文提到的近600萬美元成本,是指預訓練運行(pre-training run)的GPU成本,只占部分的模型總成本,不代表完整支出。另外未計入的重要支出,還包括研發(R&D)、硬體總擁有成本(Total Cost of Ownership)等關鍵因素

同時,DeepSeek自大陸本土招募人才,目前約有150名員工,也正急速擴張中。

先前DeepSeek宣稱,使用6710億個參數進行訓練的「V3」模型,僅用2048顆輝達「H800」GPU、費時2個月訓練完成,相當於280萬個GPU小時。相較之下,Facebook母公司Meta Platforms使用4050億個參數訓練的「Llama 3」模型,其採用的超級電腦內建16384顆「H100」GPU、費時54天,等於後者花費的運算資源(3080萬個GPU小時),是V3的11倍。

DeepSeek 半導體 幻方量化 財務 輝達

延伸閱讀

台股開紅盤重挫 專家:持續追蹤關稅戰細節與各國角力影響

網友熱中開發DeepSeek新玩法 算命、預測奶茶爆款

DeepSeek推白菜價AI服務 比OpenAI打對折還有找

鴻海不甩紅色警戒 GB200出貨達標

相關新聞

海底撈「小便門」10倍賠償到帳 同桌吃飯的朋友卻翻臉了

上個月24日,兩名17歲男子在「海底撈」上海外灘用餐後向火鍋裡小解引發軒然大波。海底撈3月12日宣布,對2月24日零時至...

美擬對中國船隻收取高額停泊費 中國船東協會:違反國際規則及美法律

路透社報導,據路透社週四看到的一份聲明稱,中國船東協會反對美國提出的對擁有或訂購中國船隻的遠洋貨運公司徵收高額港口進入費...

大陸2月製造業PMI創3個月新高 學者:受政策預期、關稅戰急單影響

大陸國家統計局1日發布數據顯示,2月製造業採購經理指數(PMI)為50.2%,比上月上升1.1個百分點,並創3個月新高。...

赴習近平座談會沒在怕?他坐姿鬆弛如官老爺 驚人背景曝光

中國國家主席習近平16日會晤民營企業,參與會議的企業家陣容受矚。座位安排上,王傳福和雷軍中間有一位坐姿特別的企業家,他微...

微信攜13億用戶 接入DeepSeek

大陸新創公司深度求索(DeepSeek)開發的AI模型轟動全球,陸企紛接入應用,大陸最大通訊軟體「微信」也正透過灰度測試...

大企業改用AI 陸失業率將加劇

DeepSeek橫空出世後,中國企業紛紛宣布接入應用,引發AI替代人工的職場恐慌,甚至有企業傳出裁掉百分之九十五的客服人...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。