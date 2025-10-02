美國政府近日首度對中國深度求索（DeepSeek）的人工智慧模型發布評估報告，指DeepSeek模型在性能、成本、安全性等方面仍落後於美國的對比模型，且存在安全缺陷和中國官方審查，對美國使用者與國家安全構成風險。

英文南華早報報導，美國國家標準與技術研究院（NIST）、人工智慧標準與創新中心（CAISI）和美國商務部9月30日發布的報告將中國模型描述為「對手人工智慧」，並稱DeepSeek等模型由於存在安全缺陷和審查制度，對人工智慧開發者、消費者和美國國家安全構成風險。

報告指出，CAISI的專家評估了3個DeepSeek模型（R1、R1-0528和V3.1）和4個美國模型（OpenAI的GPT-5、GPT-5-mini和gpt-oss以及Anthropic的Opus4），涵蓋19個領域的基準測試，表示中國模型幾乎全部得分低於美國模型，同時更容易被意圖實施駭客攻擊和網路犯罪活動的惡意用戶越獄。

報告還指，中國政府的審查制度「直接內建在DeepSeek模型中」，該評估基於CAISI與美國國務院聯合開發的新基準，該基準測試了DeepSeek模型在被認為對中國執政的共產黨具有政治敏感性問題上的表現。

研究發現，DeepSeek模型比美國模型更符合中國政府的敘事，其中最符合的模型是DeepSeek的R1-0528模型，當使用中文提示時，其符合率高達25.7%。

美國官方這份評估報告，列舉6項主要發現，指DeepSeek V3.1模型的性能落後於美國最佳參考模型，在軟體工程和網路任務方面差距最大，美國最佳模型比 DeepSeek最佳模型多解決20%以上的任務。

報告並指DeepSeek模型的使用成本高於同類美國模型。在所有13個效能基準測試中，一個美國參考模型的平均成本比最佳DeepSeek模型低35%，且效能接近。

報告提到，DeepSeek最安全的模型（R1-0528)更容易受到代理劫持攻擊，執行惡意指令的可能性平均比美國前沿模型高12倍，這些指令旨在使其偏離使用者任務。被劫持的代理會在模擬環境中傳送釣魚郵件、下載並執行惡意軟體，並竊取使用者登入憑證。

報告又提到，DeepSeek模式比美國模式更容易受到越獄攻擊。在使用常見越獄技術的情況下，DeepSeek最安全的模型（R1-0528) 回應了94%的明顯惡意請求，而美國參考模型的回應率僅為8%。

報告並指DeepSeek模型助長了中國共產黨的宣傳，其附和中共宣傳的不準確和誤導性是美國參考模型的4倍。

美國商務部長盧特尼克（Howard Lutnick）在社群媒體上表示，他的部門發布這些調查結果是為了幫助確保「美國在人工智慧領域繼續保持領先地位」。

盧特尼克提到，報告明確指出DeepSeek遠遠落後，尤其是在網路和軟體工程領域；「這些弱點不僅僅是技術層面的，它們表明依賴外國人工智慧是危險且短視的」。

報導說，DeepSeek對此尚未回應置評請求。

DeepSeek近日上線新模型，同時大幅調降官方API價格，表示開發者調用DeepSeek API的成本將降低50%以上。