DeepSeek拚進化 背書、思考分流

聯合報／ 特派記者陳政錄／北京報導

大陸人工智慧公司深度求索（DeepSeek）近年爆紅，如今在傳出可能於二月發布新一代旗艦ＡＩ模型DeepSeek V4之際，DeepSeek在前日深夜發表新論文，聚焦大模型的條件記憶模塊，即透過分工優化算力，來提升新模型效率，讓它又快又聰明，被業內認為是對V4模型技術架構的預告。

DeepSeek這次發表新論文是與北京大學合作完成，作者列有DeepSeek創始人梁文鋒的署名，名稱為「基於條件查找的條件記憶：大型語言模型稀疏性的新維度」。

綜合第一財經、科創板日報等報導，論文出發點來自大模型通常包含兩種性質不同的任務，一種是需要深度動態計算的組合推理，另一種則是檢索靜態知識，而現有架構處理推理和固定知識的方法，效率較低且浪費算力。

DeepSeek團隊提出條件記憶（conditional memory），並透過Engram這一條件記憶模塊實現「記憶分離」的分工優化，例如有記憶模塊專門管固定知識，推理模塊負責思考，再按照最佳比例分配資源，提升算力和效率，讓模型能夠又快又聰明。論文最後稱，條件記憶將成為下一代稀疏模型不可或缺的建模原語。

近期有科技媒體透露，DeepSeek V4旗艦模型有望於今年二月推出。業內人士認為，前述論文提出的內容或許就是V4的技術架構。

延伸閱讀

相關新聞

蘋果結盟谷歌 Siri導入Gemini AI

蘋果公司（Apple）十二日宣布，今年稍晚推出的更新版Siri將採用Google的Gemini人工智慧（ＡＩ）模型，深化...

川普警告科技巨頭 AI用電自己付

美國總統川普表示，微軟將宣布相關措施，確保在因應ＡＩ需求、興建更多資料中心之際，美國民眾不會面臨電力費用上漲。

台積電被要求在美擴廠之際 魏哲家現身台中餐廳用餐 老闆樂歪了

就在美方傳出要求台積電必須在美國增設至少5座晶圓廠的當兒，總裁魏哲家前晚輕鬆現身台中市以烤鴨聞名的知名餐廳「鴨片館」用餐...

環球晶榮獲TCSA永續報告白金級 天下永續公民獎排名攀升

環球晶（6488）於2025年 ESG 外部評鑑中表現亮眼，不僅在「TCSA 台灣企業永續獎」中以永續報告書獲得最高等級...

資策會MIC發布2026 CES四大重點 筆電將轉型為AI代理平台

資策會產業情報研究所（MIC）即將於16日舉辦《CES 2026展會重點觀測—智慧終端革新x AI服務的新競局》研討會，...

