DeepSeek梁文鋒論文登《自然》期刊封面

聯合報／ 大陸中心／綜合報導

香港中通社報導，由DeepSeek團隊研發、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文，近日榮登國際權威期刊《自然（Nature）》封面。這是全球首個經過同行評審的主流大語言模型，填補了業內空白。

報導稱，《自然》評價指：「目前幾乎所有主流大模型尚未經過獨立同行評審，這一空白終於被DeepSeek打破。」相較今年1月發布的初版論文，新論文披露了更多模型訓練細節，並正面回應了模型發布初期質疑。

據報，DeepSeek-R1採用創新的大規模推理模型訓練方法，包含人類監督下的深入訓練階段，以優化推理過程。梁文鋒團隊介紹，該模型通過強化學習而非依賴人類示例來開發推理步驟，顯著降低了訓練成本和複雜性。模型在接觸優質問題解決案例後，會生成推理模板，通過解決問題獲得獎勵，從而提升學習效果。

分析指，DeepSeek-R1的突破源於其獨特訓練方法。研究顯示，該模型在推理任務中表現出色，尤其在複雜問題解決方面展現了高效性和準確性。這不僅推動了AI技術發展，也為開源AI社區提供了寶貴參考。論文的發表標志著DeepSeek在全球AI領域的領先地位。

DeepSeek由梁文鋒於2023年在中國杭州創立，團隊成員來自頂尖高校及國際機構。梁文鋒，1985年出生於廣東湛江，是幻方量化及DeepSeek創始人。去年12月，其團隊發布大模型「DeepSeek-V3」，展現了持續創新能力。今年4月，梁文鋒入選美國《時代》周刊「2025年全球最具影響力100人」榜單。

推理 DeepSeek 梁文鋒

