快訊

桃園資收車衝撞釀1死6傷…熱心民眾跳上車打空檔 司機驚醒竟猛踩油門

台中市長最新民調!綠營何欣純急起直追 白議員曝「年輕小草在轉彎」

FT:DeepSeek新模型延後問世問題出在華為晶片 還是得靠輝達

大陸媒體報導指出,R2模型可能最快在未來數周內發布。路透
大陸媒體報導指出,R2模型可能最快在未來數周內發布。路透

中國大陸人工智慧(AI)公司深度求索(DeepSeek)使用華為晶片訓練發生困難,被迫延後發表新模型,可見大陸推動自家技術來取代美國面臨瓶頸。

英國金融時報引述知情人士報導,DeepSeek今年1月推出R1模型後,在主管機關鼓勵下改用華為昇騰處理器(Ascend)來取代輝達(NVIDIA)晶片。

但這家大陸新創公司以昇騰晶片訓練R2模型時持續遭遇技術問題,不得不改用輝達晶片來訓練,華為晶片則用於推理(inference)。報導指出,這正是新模型原定5月發表卻延後的主因。

金融時報引述大陸業界人士指出,大陸晶片在穩定性、晶片間連線速度和軟體水準方面都不如輝達的產品。

據報導,華為曾派出工程團隊進駐 DeepSeek辦公室,協助該公司使用昇騰晶片開發R2模型。但知情人士說,即使華為駐點支援,DeepSeek仍未能在昇騰晶片上成功完成一次訓練。

據知情人士透露,DeepSekk創辦人梁文峰曾在公司內部對R2進展表達不滿,並力促團隊投入更多時間打造更先進的模型,以維持該公司在AI領域的優勢。

據報導,R2延後問世,也跟新版模型數據標記(data labeling)作業超過預期有關。大陸媒體報導指出,R2模型可能最快在未來數周內發布。

加州大學柏克萊校區AI研究員 Ritwik Gupta 說:「模型就像商品,很容易被替換。許多開發者現在都在用阿里巴巴的「通義千問3」(Qwen3),功能強大又靈活。」

古普塔指出,通義千問3採用了DeepSeek的核心理念,例如能讓模型具備推理能力的訓練演算法,但在使用效率上做得更好。

DeepSeek 情人 團隊 華為 輝達

延伸閱讀

TACO時刻! 台股啟動瘋狂模式

ChatGPT各模型怎麼挑選?差異在哪?OpenAI官方指南

輝達電力革命的飆股

川普把晶片出口管制當ATM!強索15%分潤 後患無窮

相關新聞

TikTok美國業務易主迎「完美結局」 川普發文感謝習近平拍板放行

字節跳動22日將TikTok美國業務的多數股權,出售給一個非中國投資者團體,為長達6年的法律糾葛畫下句點。川普則在真實社...

K半導體衝擊來了?韓國分析美台關稅利弊一次看

美台關稅的協議結果,最緊張的莫過於與台灣在半導體領域處於競爭的南韓。

美股收盤/四大指數連二日收紅 AI題材再點火、大型科技股領漲

美國股市主要指數周四(22日)收高,連續第二日攀升。此前美國總統川普撤回對歐洲盟國的關稅威脅,再加上數據凸顯美國經濟韌性...

美股早盤/VIX恐慌指數衝高!四大指數重摔 美光逆勢漲

美國總統川普為了爭奪格陵蘭所有權,揚言對歐洲八國加徵關稅,讓投資人備感憂慮,帶動金銀價格再創新高。美股20日早盤四大指數...

盧特尼克宣布可能對記憶體商課100%關稅 外媒點名這幾家台廠恐遭殃

美國商務部長16日在出席美光(Micron)紐約州新廠動土典禮時宣布,不在美國生產的記憶體製造商,將可能面臨100%關稅...

加拿大降陸電動車關稅 川普淡定「沒關係」美官員警告會後悔

中國大陸國家主席習近平16日會見到訪的加拿大總理卡尼,會後發表聯合聲明,並宣布關稅減免措施,包括加拿大將以6.1%的優惠...

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。