快訊

川普下令空襲胡塞:已知53死,紅海將復航或是動盪升級?

影分身之術?「柯文哲」路邊喝牛肉湯 萬人稱奇:少一動作不像

花錢還得求讓位?忠實乘客怨台鐵「印度化」:超難擠進車廂

2025年AI領域掀波瀾:DeepSeek的衝擊與影響

圖1. DeepSeek最新推出的DeepSeek-R1模型;圖片來源:DeepSeek
圖1. DeepSeek最新推出的DeepSeek-R1模型;圖片來源:DeepSeek

※如欲轉載本文,請與北美智權報聯絡

吳碧娥╱北美智權報 編輯部

DeepSeek最新推出的R1模型,訴求能以更低成本、更高效率的方式,提供ChatGPT等模型的替代方案,在高科技圈掀起一股熱潮,更曾讓輝達(Nvidia)創下史上最大單日跌幅,市值蒸發近6,000億美元。過去普遍認為,要打造出強大的AI模型,就必須投入數百億美元購買運算設備,DeepSeek的異軍突起,打破了AI模型開發遙不可及的既定觀念。

成立於2023年的深度求索(DeepSeek),是一間專注於研究世界通用人工智慧底層模型與技術的中國人工智慧公司,目標要打造「通用人工智慧」(AGI),讓機器可以理解人類語言、生成文字、進行對話,並協助解決各種複雜的問題。2024年底,DeepSeek發布了DeepSeek-R1和DeepSeek-V3兩款AI大語言模型,並於2025年1月推出DeepSeek-R1的聊天機器人程式。在美國禁止高階晶片售往中國的情況下,DeepSeek成立短短不到一年,能以相對極低的訓練成本,推出號稱與ChatGPT同等級的AI大語言模型DeepSeek,在AI圈引起了廣泛關注。

AI產業走向高效發展、晶片需求出現變化

AI行業過去依賴擴大模型、增加數據和提升硬體效能來發展,但成本與效率就成為發展AI模型的挑戰。TrendForce指出,DeepSeek採用蒸餾模型(Model Distillation)技術,壓縮大型模型以提升推理速度並降低硬體需求,同時充分發揮 NVIDIA Hopper降規版晶片的效益,最大化運算資源利用。DeepSeek的成本優勢來自高效能硬體選擇、新型蒸餾技術及API開源策略,不僅優化技術與商業應用的平衡,也展現AI產業走向高效發展的趨勢。

DeepSeek近期連續發表DeepSeek-V3、DeepSeek-R1等AI模型,將促使終端客戶未來更審慎評估投入AI基礎設施的合理性,採用更具效率的軟體運算模型,以降低對GPU等硬體的依賴。雲端服務供應商(CSP)則可能擴大採用自家特定應用積體電路(ASIC)的基礎設施,以降低建置成本。因此,2025年以後,產業對GPU AI晶片或半導體實際需求可能出現變化。

TrendForce表示,全球AI伺服器(Server)市場自2023年起快速成長,預期2025年占整體Server出貨比例將逾15%,至2028年有望接近20%。近年大型CSP業者應AI訓練需求積極擴建,自2025年起將擴展重心至邊緣AI推理,除了採用NVIDIA Blackwell等新一代GPU平台,AWS等也加大開發自家ASIC力道,以提升成本效益、滿足特定AI應用需求。中國CSP和DeepSeek等相關AI業者面對美國晶片出口禁令,著重於開發更高效的AI晶片或演算法,以促進AI需求和應用的多元發展。

更多競爭者加入戰局

DeepSeek橫空出世打亂AI模型的發展步調,對傳統 AI巨頭造成龐大的壓力,一方面也暴露出AI模型的開發盲點,不過微軟、Meta、Google等科技巨擘都明確表示,不會改變持續投入AI發展的計畫。

Nvidia的重要競爭者、AI晶片新創商Cerebras Systems,2月6日宣布攜手法國開源AI新創Mistral AI推出聊天機器人「Le Chat」,Cerebras表示,Le Chat的推論速度每秒超過1,100個符元(token),比ChatGPT 4o、Claude Sonnet 3.5和 DeepSeek R1等熱門AI模型快10幾倍,號稱是全球速度最快的AI助理,擊敗OpenAI和DeepSeek[1]。

圖2. AI助理的推論速度比較;圖片來源:Cerebras Systems
圖2. AI助理的推論速度比較;圖片來源:Cerebras Systems

除了DeepSeek之外,其他中國公司近期也紛紛推出AI模型一較高下,騰訊開發了由文本到視頻的模型Hunyuan-Large,不僅超過了Meta開源的最新、最大模型LLama3.1 – 405B,並在數學、日常推理、文本生成等方面具有優異表現[2]。字節跳動1月22日發布了豆包大模型1.5(Doubao-1.5-pro),並展示在知識、程式碼、推理、中文等多個權威評測基準上,綜合得分優於GPT-4o、Claude 3.5 Sonnet 等一流模型[3];阿里雲在大年初一宣佈「通義千問」旗艦版模型Qwen2.5-Max全新升級,阿里巴巴稱其性能超越了DeepSeek在2024年12月底發布的DeepSeek-V3[4]。

中國AI市場未來兩大走向

TrendForce指出,在美國晶片禁令持續的情況下,預期中國AI市場將朝兩個重點方向發展。首先,AI相關業者將加速投入自主AI晶片或供應鏈發展,中國大型CSP業者等除了盡量採購目前尚可取得輝達特供中國的H20晶片之外,未來將加速擴大發展自有ASIC應用於自家資料中心。其次,中國將利用既有的互聯網基礎優勢,以軟體補足硬體缺陷,像是DeepSeek打破常規,改採蒸餾技術強化AI應用機會即是。

整體而言,預期未來美國政府可能對中國相關AI或半導體禁令趨嚴下,迫使欲投入AI發展的中國業者加速發展自有AI晶片或高頻寬記憶體(High Bandwidth Memory,簡稱HBM)等硬體。儘管其效能不及NVIDIA等GPU方案,但若主要為滿足中國市場自用資料中心基礎建設,單位晶片效能已非唯一考量。此外,DeepSeek等業者近期朝AI多模態模型發展,力求在更低的訓練成本下,於特定應用領域達到類似效能,以加速實現商用化。

留意DeepSeek背後的資安風險

DeepSeek目前仍存在一些資安黑洞,已有多家資安業者提出警告,並被義大利、澳洲、韓國、台灣等多國封殺在政府設備系統中使用。因此在使用DeepSeek的同時,仍須留意雲端安全、個人隱私與資訊偏差等三項AI資安風險。

KPMG安侯企業管理股份有限公司執行副總林大馗指出,DeepSeek 的模型在生成內容時存在一定的漏洞,容易受到「邪惡越獄攻擊」(Evil Jailbreak Attacks),被進行提示注入(Prompt Injection)資安風險,也就是使用者可以經由提示詞誘導的方式,「套路」AI 或繞過內建的安全道德圍牆,取得錯誤或是不道德的答案。例如語言模型透過問題的誘導與情境設定,寫出毀滅人類計劃書,詳細描述入侵各國網路、控制武器、破壞基礎建設等SOP,甚至提供對應的Python程式碼。林大馗也提醒,DeepSeek若在惡意人有效的誘導下,更可以用「極低成本」產出超高仿真的「深偽」(Deepfake)虛假多媒體內容,不得不提高警覺。林大馗建議使用者在選擇大型語言模型時,不可輕忽人工智慧遭到有心人士的濫用所導致的風險。

林大馗提醒資安高風險產業,特別是金融、電信及高科技等,如要應用新的語言模型,都應該有完整的風險評估及隱私衝擊分析程序,充分考量開發廠商背景、功能特性、應用情境與內容審查機制等條件,例如,科技業工程師應該避免使用DeepSeek詢問特定製程的參數等業務機敏行為,才能確保資料安全與業務機密不被洩露,確保障企業的核心競爭力和使用者的隱私權。

儘管存在諸多爭議,但DeepSeek仍以低成本和高性價比產品,成功挑戰OpenAI、Google等AI巨頭,象徵著中國在AI領域的快速發展,加上全球許多新創業者前仆後繼進入AI模型市場,都將改寫全球AI市場的競爭格局。

備註:

[1] 2025/2/6,Cerebras : Cerebras brings instant inference to Mistral Le Chat.

[2] 2024/11/6,騰訊網:「腾讯放大招,超Meta!史上参数最大,开源专家混合模型」。

[3] 2025/1/22,字節跳動:「豆包大模型1.5正式发布,全面上线火山方舟」。

[4] 2025/1/29,阿里云:「新年第一弹,Qwen2.5-Max来了!」。

作者:吳碧娥
現任:北美智權報主編
學歷:政治大學新聞研究所
經歷:北美智權報資深編輯

驊訊電子總經理室特助

經濟日報財經組記者

東森購物總經理室經營企劃

延伸閱讀&電子報訂閱連結:

【詳細內容請見《北美智權報》374期;歡迎加入《北美智權報》獨立網站會員,或使用訂閱系統訂閱《北美智權報》電子報

延伸閱讀

王牌駕駛員Shylily即將推出全新Q版模型!台灣時間2/24初披露

中官媒定調全民AI 多地政務系統接入DeepSeek 公務員恐失業

微信「搜一搜」功能 接入DeepSeek

民團籲資安預算列優先考量 避免政治影響國安

相關新聞

保護外國投資人的營業秘密是智商法院責無旁貸的責任

台灣國際連結一部分是依賴經濟活動,包括外國人在台灣生產或研發的投資。技術投資須要智慧財產權保護,特別是涉及製程細節的KNOW-HOW,必須透過《營業秘密法》的刑事處罰制度,才能遏阻有目的性的技術資訊竊取活動。本文舉智慧財產及商業法院109年度刑智上重訴字第4號刑事判決(MC案)為例,揭示檢調執法是一回事,但法院審判結果也很重要。法院如果漠視營業秘密竊取行為的惡性,後果將不利營造吸引外國企業投資的友好環境。

當組成物成為101核駁的下個獵物 CAFC試圖撥亂反正?2025年USS v. ITC案

在2014年ALICE一案判決出爐之後,使MAYO一案的專利適格性問題延伸到了軟體領域,使許多電腦軟體及商業方法專利因為涉及抽象概念,而難以通過審查。美國專利法101條的擴張,導致了更多不確定性,而在2025年2月USS V. ITC案中,甚至連組成物材料的專利也受到了101的挑戰,引發各界關注。

想將專利權授權卻苦無對象嗎?

中國知識產權局 (CNIPA) 在2022年專利法修正時,仿照英國專利制度,引進專利權授權開放機制,只要專利權人登記放授權者,年費會有減半優惠。於此將CNIPA制定之規範向讀者說明。

法院計算商標賠償金不可揭穿公司面紗?2025年Dewberry Group v. Dewberry Engineers案

美國一家長年處於虧損狀態的房地產公司DEWBERRY GROUP,幫同集團下約30家附屬公司的房產做管理出租,而侵害他人商標。美國地區法院和上訴法院判決認為,以被告獲利做商標損害賠償計算時,應將其另做房產管理出租的30家公司中的獲利都納入。然而,美國最高法院在2025年2月底推翻原判決,認為不能將上述提及同集團其他公司的獲利一起算入。

當髒話成為商標:紐西蘭對冒犯性標誌的法律界線為何?

紐西蘭知名記者PADDY GOWER為其新聞品牌「THIS IS THE FUCKING NEWS」商標申請案,在紐西蘭掀起一陣法律與道德的辯論風暴。這場看似荒誕的「髒話攻防戰」,實則牽動著社會對言論自由、政府審查與文化價值變遷的敏感神經。此外,也引發了對紐西蘭商標法中「冒犯性」標誌標準的討論,主管機關是否應該決定哪些詞語會冒犯公眾?在台灣「幹」因違反商標法之規定不得註冊,但「草泥馬」是可以的。

法律資料涉及AI訓練資料庫之首件著作權侵權判決出爐:淺析Thomson Reuters v. Ross一案

針對法律資料庫巨擘THOMSON REUTERS與競爭對手ROSS INTELLIGENCE自2020年掀起之侵權爭議,德拉瓦州聯邦地院終於定調,ROSS構成著作權侵害且不符合理使用。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。