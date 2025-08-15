使用華為晶片訓練發生困難 DeepSeek新模型遲到

經濟日報／ 編譯劉忠勇／綜合外電
DeepSeek。 (路透)
DeepSeek。 (路透)

中國大陸人工智慧（AI）公司深度求索（DeepSeek）使用華為晶片訓練發生困難，被迫延後發表新模型，可見大陸推動自家技術來取代美國面臨瓶頸。

英國金融時報（FT）引述知情人士報導，DeepSeek今年1月推出R1模型後，在主管機關鼓勵下改用華為昇騰處理器（Ascend）取代輝達（NVIDIA）晶片。

但DeepSeek以昇騰晶片訓練R2模型時持續遭遇技術問題，不得不改用輝達晶片來訓練，另把華為晶片用於推論（inference）。報導指出，這正是DeepSeek新模型原定5月發表、卻延後的主因。

報導引述中國大陸產業人士指出，中國大陸晶片在穩定性、晶片間連線速度和軟體水準方面都不如輝達的產品。

據報導，華為曾派出工程團隊進駐DeepSeek辦公室，協助該公司使用昇騰晶片開發R2模型。但知情人士說，即使華為駐點支援，DeepSeek仍未能在昇騰晶片上成功完成一次訓練。

知情人士透露，DeepSekk創辦人梁文峰曾在公司內部對R2進展表達不滿，並力促團隊投入更多時間打造更先進的模型，以維持該公司在AI領域的優勢。

據報導，R2延後問世，也跟新版模型數據標記（data labeling）作業超過預期有關。大陸媒體報導指出，R2模型可能最快在未來數周內發布。

情人 DeepSeek

延伸閱讀

美媒：中國部分開源AI表現優於美國 引美方警覺

路透：北京再表態 約談騰訊等科企 促「慎購」H20晶片

OpenAI最新模型GPT-5發布 傳DeepSeek將推R2

FT：DeepSeek新模型延後問世問題出在華為晶片 還是得靠輝達

相關新聞

全球第一次！北京人型機器人運動會 項目多達26項

號稱全球首個人型機器人運動會，昨晚在北京開幕，本次運動會將舉辦廿六個賽項，四八七場比賽，涵蓋多種運動，來自全球十六個國家...

使用華為晶片訓練發生困難 DeepSeek新模型遲到

中國大陸人工智慧（AI）公司深度求索（DeepSeek）使用華為晶片訓練發生困難，被迫延後發表新模型，可見大陸推動自家技...

中美科技戰升溫 半導體設備廠屹唐控應材竊密

大陸科創板上市公司、半導體設備龍頭屹唐股份公告，在北京智慧財產權法院控告美國應用材料公司（Applied Materia...

花旗：陸反內捲 將加碼推政策

美國投行花旗研究報告認為，大陸接下來還將有更多政策推出，料更側重於需求側及「反內捲」，預期大陸經濟似乎迎來一個「充滿希望...

京東外賣虧損 獲利腰斬

京東公布第2季財報，受惠外賣業務量大增，第2季營收人民幣3,567億元，年增22.4%；但淨利潤出現明顯下滑，歸屬於普通...

中共國家數據局：陸算力總規模 全球第2

大陸國家數據局昨日表示，截至今年6月底，大陸算力總規模位於全球第2，且人工智慧綜合實力實現整體性、系統性躍升，日均Tok...

商品推薦

udn討論區

0 則留言
規範
發布
  • 張貼文章或下標籤，不得有違法或侵害他人權益之言論，違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論，經網友檢舉或本網站發現，聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者，請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤，聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者，請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利，聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者，請勿張貼文章。