偷師DeepSeek?OpenAI輕量級模型 被曝使用中文推理

人工智慧公司DeepSeek(深度求索)旗下大模型在全球掀起波瀾,對OpenAI公司產生壓力。(路透)
人工智慧公司DeepSeek(深度求索)旗下大模型在全球掀起波瀾,對OpenAI公司產生壓力。(路透)

OpenAI在1日推出最新研發的輕量級人工智慧模型o3-mini,不過國外網友發現,在沒有使用者干預的情況下,竟大量地使用中文進行推理,更有意思的是,即使用俄語去提問,o3-mini-high也會用中文去思考。不禁讓國外網友懷疑,是不是OpenAI在「偷師」中國的DeepSeek模型。

中國財經媒體「華爾街見聞」報導,網友質問OpenAI執行長奧特曼和OpenAI,o3-mini到底為什麼要用中文進行推理?網友Annalisa Fernandez則表示,或許中文才是LLM(大型語言模型)的「靈魂語言」。

報導稱,這並不是OpenAI的模型首次發生這種現象,早在2024年2月,就有開發者在OpenAI開發者社區上發布過類似的問題,不過是混合了其他語言;在推理模型方面,OpenAI o1也存在類似的問題。事實上,這種「語言混雜」(language mixing)現象在其它AI模型中也有發現,例如谷歌的Gemini會混雜德語。

加拿大亞伯達大學助理教授、AI研究員古茲迪亞爾(Matthew Guzdial)指出,「模型並不知道什麼是語言,也不知道語言之間有什麼不同,因為對它來說這些都只是文本。」

實際上,模型眼中的語言,和一般人理解的完全不同。模型並不直接處理單詞,而是處理tokens(符元)。以「fantastic」為例,它可以作為一個完整的token;可以拆成「fan」、「tas」、「tic」3個token;也可以完全拆散,每個字母都是一個token。

但這種拆分方式也會帶來一些誤會。許多分詞器看到空格就認為是新詞的開始,但實際上不是所有語言都用空格分詞,例如中文。DeepSeek在論文中對這一現象進行了分析。研究團隊發現,當強化學習提示詞涉及多種語言時,思維鏈常常出現語言混雜的現象。

目前,「語言混雜」還亟待解決。畢竟DeepSeek-R1也只是針對中文和英文進行優化,在處理其它語言的查詢時,也可能出現語言混雜問題。

中文 OpenAI DeepSeek

延伸閱讀

DeepSeek強大到無法封殺?紐時預言:北京勢必干預

Dooby3D轉2D!跳鼠VTuber「Dooby」Live2D模型繪製中

DeepSeek加速AI普及!周邊產業股拉回買

美媒:DeepSeek再次印證中國「夠用就好」的策略

相關新聞

黃仁勳躍升地緣政治巨星 專家點出遊走美中與中東的生意風險

華爾街日報20日報導,輝達執行長黃仁勳(Jensen Huang)本周造訪台北,結束為期一個月的旋風式行程,此行不僅彰顯...

美股早盤/道瓊挫跌逾100點 美失3A評等引發債券殖利率飆升

美股三大指數19日早盤全面挫跌,道瓊工業指數跌100點,受累於穆迪下調美國主權債信評等,引發美債殖利率飆升。

特斯拉尋找接班人?WSJ曝馬斯克分身乏術 董事會已啟動尋才計畫

華爾街日報報導,特斯拉內部人士透露,在公司股價走跌、業績大幅下滑的同時,執行長馬斯克(Elon Musk)將心力放在白宮...

美股早盤/四大指數飆高!比特幣重回9萬美元 特斯拉強彈

儘管國際貨幣基金(IMF)大幅調降美國今年的成長展望,美股仍擺脫昨(21)日跌勢,22日早盤四大指數均飆升1%以上,比特...

川普無法解雇Fed主席 但有哪三招可把鮑爾晾一邊?

美國總統川普周一提高對聯準會(Fed)主席鮑爾的人身攻擊,不但發文侮辱他是「慢吞吞先生」、「大魯蛇」(looser,輸家...

川普再轟鮑爾 Fed獨立性遭疑 美股道指崩近千點 那指跌逾2.5%

由於美國總統川普加大對聯準會主席鮑爾的攻擊力度,引發人們對聯準會獨立性的質疑,而交易員沒有收到全球貿易談判有任何進展跡象...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。