快訊

家寧反擊了!爆Andy主動提分手「頻道、盈利、車子都歸她所有」

金城國中不當考題 學校懲處教師記1大過、停聘6個月

Andy老師向法院申請查帳成功 家寧今晚6時發表影片「公開真相」

徹底擺脫輝達?傳DeepSeek R2於5月發布 全部用華為晶片

市場傳出陸企「深度求索」更強的新版本「DeepSeek R2」大模型將於5月面世,將徹底擺脫輝達晶片,全部基於華為昇騰910B(Ascend 910B)晶片。路透
市場傳出陸企「深度求索」更強的新版本「DeepSeek R2」大模型將於5月面世,將徹底擺脫輝達晶片,全部基於華為昇騰910B(Ascend 910B)晶片。路透

年初陸企深度求索的DeepSeek R1大模型的問世撼動美國AI圈,甚至引發輝達的股價暴跌。在大陸與全球AI競爭對手的高度關注下,市場傳出更強的新版本DeepSeek R2即將在5月面世,將徹底擺脫輝達晶片,全部基於華為昇騰910B(Ascend 910B)晶片。

快科技報導,市場最新爆料,R2大模型將採用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量為6710億),單位推理成本較GPT-4大減97.4%。

當下,中國大陸與美國科技戰、貿易戰愈演愈烈,輝達H20晶片面臨新一波出口管制。在DeepSeek R2預期發布時間臨近的情況下,各界高度關注大陸指標性的大模型,在缺乏美國晶片資源下的發展動向。

據傳,R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網路層(Gating Network),進而優化高負載推理任務的性能。

消息指出,R2將徹底擺脫輝達晶片,訓練全程均未使用輝達顯卡,全部基於華為的昇騰910B(Ascend 910B)晶片集群平台,在FP16精度下,計算性能達到512 PetaFLOPS,晶片利用率高達82%,整體性能約為NVIDIA上一代A100集群的91%。

市場預期,這將降低大陸對海外高端AI晶片的依賴,且華為全新的昇騰910C晶片,也開始進入大規模量產階段。

成本方面,DeepSeek-R2的單位推理成本,較OpenAI旗下的GPT-4大減97.4%。其中,R2輸入每百萬個字元僅需0.07美元,而輸出每百萬個字元僅0.27美元。

分析認為,R2若如傳聞般強勢,可能再次引發市場對AI基礎設施需求的質疑,加上使用華為AI晶片的國產替代,將對輝達帶來更大影響。

美國 推理 DeepSeek

延伸閱讀

阿里最強開源模型 上秀

輝達:分拆中國業務…假消息

英特爾強化合作 成立兩聯盟

奇鋐、緯創 四檔活力旺

相關新聞

關稅戰緩!大摩調高陸今年經濟增長至4.5% 料續降準降息

摩根士丹利(俗稱大摩)近日上調中國大陸今明兩年經濟增長預測,今年經濟增長預測由4.2%調高至4.5%,明年則由4%調高至...

陸修訂反浪費條例 要求黨政機關「帶頭過緊日子」

在大陸經濟低迷、大陸國家主席習近平強力打擊貪腐的背景下,中共中央、國務院近日印發修訂後的《黨政機關厲行節約反對浪費條例》...

中美互降關稅90天 陸外貿業者:今年外貿出口最好窗口期

中美宣布互降關稅後,大陸外貿業者受訪時表示,此前暫停的美國客戶訂單目前還未恢復,但對美航線運費正水漲船高,預估雙方同意降...

陸五一消費成績單出爐!陸零售、餐飲企業銷售年增6.3%

隨著大陸五一假期步入尾聲,五一消費成績單也出爐,大陸商務部數據顯示,假期大陸全國重點零售和餐飲企業銷售額年增6.3%。商...

貴州觀光船側翻已知3死、14人仍失聯 習近平緊急指示千方百計搜救

五一假期期間,大陸傳出景區觀光船意外,貴州省黔西市新仁苗族鄉六沖河東風庫區附近發生載人遊船側翻事故。央視新聞指出,5月4...

螞蟻證券要來了?螞蟻溢價收購香港耀才證券

香港老牌券商耀才證券日前公告稱,螞蟻集團通過旗下一家全資控股的境外主體,以每股3.28港元的價格向耀才證券發起要約收購,...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。