快訊

這波新冠太兇!連「天選之人」都中鏢 醫師:別再鐵齒了

NBA/席亞康生涯新高39分 溜馬東決又扳倒尼克客場2連勝

今天入梅條件都符合 鄭明典:只欠西南季風

DeepSeek危險了?「AI教母」出手 AI模型花不到50美元

DeepSeek橫空出世引起市場關注,不過被譽為「AI教母」的知名華裔美籍科學家李飛飛領導的團隊,以低於50美元(新台幣1,655元)的雲端運算成本,成功訓練出名為「s1」的人工智慧推理模型。本報資料照片
DeepSeek橫空出世引起市場關注,不過被譽為「AI教母」的知名華裔美籍科學家李飛飛領導的團隊,以低於50美元(新台幣1,655元)的雲端運算成本,成功訓練出名為「s1」的人工智慧推理模型。本報資料照片

DeepSeek橫空出世引起市場關注,不過被譽為「AI教母」的知名華裔美籍科學家李飛飛領導的團隊,以低於50美元(新台幣1,655元)的雲端運算成本,成功訓練出名為「s1」的人工智慧推理模型。

界面新聞報導,此模型在數學和編碼能力測驗中的表現,據稱媲美 OpenAI o1和DeepSeek R1等尖端推理模型。

李飛飛團隊的s1模型並非從頭訓練,而是建立在阿里巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊H100 GPU上監督微調26分鐘,訓練出新模型s1-32B, 取得與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比 o1-preview 高出27%。

財聯社報導,大陸某知名大模型公司CEO表示,李飛飛團隊的成就,實際上是利用從Google模型中擷取的1000個樣本來微調通義千問模型。這種微調的成本固然低廉,但優異表現仍有賴於既有模型的基礎。

每日經濟新聞報導,復旦大學電腦學院副教授、博士生鄭驍慶指出,50美元是否包含了其他資料、設備、消融實驗等費用,還要打一個問號。正如DeepSeek-V3不到600萬美元的訓練成本,實際上也只包括了訓練時的GPU算力費用。

鄭驍慶提到,「像DeepSeek或者類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這代表前期是需要大量「燒錢」的。

谷歌DeepMind資深研究員Wenhu Chen同樣表示,「真正神奇的是Qwen模型。我們嘗試過把基座模型換成其他模型,用同樣的資料去訓練,但最終並不能達到這麼好的效果。」

也就是說,s1-32B是站在「巨人肩膀」上,且50美元的成本也並沒有涵蓋Qwen模型的訓練費用。

OpenAI DeepSeek

延伸閱讀

陸DeepSeek掀熱議卻面「偷用模型」指控 專家指可帶來2啟示

阿里巴巴傳入股DeepSeek 計劃斥資10億美元

兩岸人物/DeepSeek創辦人 悶聲做大事

一周熱門零股/量能逾千萬股票 鴻海最夯

相關新聞

關稅戰緩!大摩調高陸今年經濟增長至4.5% 料續降準降息

摩根士丹利(俗稱大摩)近日上調中國大陸今明兩年經濟增長預測,今年經濟增長預測由4.2%調高至4.5%,明年則由4%調高至...

陸修訂反浪費條例 要求黨政機關「帶頭過緊日子」

在大陸經濟低迷、大陸國家主席習近平強力打擊貪腐的背景下,中共中央、國務院近日印發修訂後的《黨政機關厲行節約反對浪費條例》...

中美互降關稅90天 陸外貿業者:今年外貿出口最好窗口期

中美宣布互降關稅後,大陸外貿業者受訪時表示,此前暫停的美國客戶訂單目前還未恢復,但對美航線運費正水漲船高,預估雙方同意降...

陸五一消費成績單出爐!陸零售、餐飲企業銷售年增6.3%

隨著大陸五一假期步入尾聲,五一消費成績單也出爐,大陸商務部數據顯示,假期大陸全國重點零售和餐飲企業銷售額年增6.3%。商...

貴州觀光船側翻已知3死、14人仍失聯 習近平緊急指示千方百計搜救

五一假期期間,大陸傳出景區觀光船意外,貴州省黔西市新仁苗族鄉六沖河東風庫區附近發生載人遊船側翻事故。央視新聞指出,5月4...

螞蟻證券要來了?螞蟻溢價收購香港耀才證券

香港老牌券商耀才證券日前公告稱,螞蟻集團通過旗下一家全資控股的境外主體,以每股3.28港元的價格向耀才證券發起要約收購,...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。