快訊

MLB/李灝宇敲雙安!生涯首長打是直擊「綠色怪物」二壘打

北京產大模型 給AI萬能學習法

北京智源人工智慧研究院的一項突破性研究成果日前在國際頂級學術期刊《自然》上線。本報北京傳真
北京智源人工智慧研究院的一項突破性研究成果日前在國際頂級學術期刊《自然》上線。本報北京傳真

近日,北京智源人工智慧研究院的一項突破性研究成果在國際頂級學術期刊《自然》(Nature)上線,這是中國大陸科研機構主導的大模型成果首次在《自然》正刊發表。

智源這項名為「通過預測下一個詞元進行多模態學習的多模態大模型」的成果,採用自回歸路線,可以統一多模態學習,訓練出優秀的原生多模態大模型,這對於確立自回歸成為生成式人工智慧統一路線具有重大意義。

據瞭解,長期以來,AI在學習不同類型的「感官」資訊時,往往需要「分科而治」,理解文字用一套方法,生成圖片用另一套,處理影像又需要不同的專業模型,過程複雜且協同起來較為困難。而智源研究院研發的Emu3模型,借鑒了GPT成功的關鍵思路「預測下一個詞元」,成功統一了對文本、圖像及影像的理解與生成能力。打個比方,就如同給AI找到了一個「萬能學習法」,無論面對的是一段文字、一張照片,還是一段動態影像,AI都用同一種邏輯去分析和創造。

實驗表明,這種統一方法在圖片生成、圖文理解和視頻影像創作等多個任務上,達到了與當前各類專用模型相當的水準,且具備更強的擴展潛力和通用性。

《自然》編輯點評這項研究時表示,基於「預測下一個詞元」,Emu3實現了大規模文本、圖像和影像的統一學習,其在生成與感知任務上的性能可與使用專門路線相當,這一成果對構建可擴展、統一的多模態智慧系統具有重要意義。

此外,基於這一核心路徑的反覆運算版本Emu3.5模型,已展現出對物理世界運行規律的初步學習與模擬能力,能夠嘗試預測場景的下一步變化,為發展更通用、更接近人類認知方式的大模型與智慧體奠定了基礎。

圖片生成 成功 北京

延伸閱讀

北醫大產學合作導入AI 助力慢性腎病風險預測

以行動宣告張又俠落馬後一切如常 習近平視察北京科創工作

王滬寧定調統一?鄭麗文批編故事、胡謅亂寫

空氣變乾淨了嗎? 成大研究團隊利用AI點出臭氧仍是隱憂

相關新聞

清明連假收尾...陸跨區流動量估8.4億人次 長三角客流最集中

據澎湃新聞6日報導,大陸清明連假進入尾聲,各地迎來返程高峰。陸交通運輸部數據顯示,3天清明假期全社會跨區域人員流動量預計達8.4億人次,日均約2.8億人次,年增約6%;其中假期首日突破3億人次,鐵路與公路客運量均創歷史同期新高。

草原沒有墓碑:蒙古族怎麼替成吉思汗「掃墓」?

草原沒有墓碑:蒙古族怎麼替成吉思汗「掃墓」?

當愛已成往事:張國榮離世周年,香港失落的自由反叛

當愛已成往事:張國榮離世周年,香港失落的自由反叛

「一天只睡五小時」張雪峰猝死遺產估37億 女兒年僅11歲能否順利繼承?

41歲張雪峰突發心源性猝死的消息,引發公眾對過勞的反思。據悉,他2023年曾因過勞、胸悶心悸被強制住院,生前微博中反覆出現的「凌晨」與「累」,真實記錄了他長期超負荷工作狀態。而張雪峰猝逝後留下的遺產,據估算達3億至8億元(人民幣,下同),公眾最關注的是他年僅11歲的女兒,能否順利繼承這筆財富。

宏福苑火災聽證會揭大維修造假 官員巡查前通風報信

香港宏福苑社區火災獨立委員會正進行聽證會,查找大火起因及責任。獨立委員會除點名政府部門互相卸責,還揭露一些鮮為人知的細節...

中國模式還有未來嗎?關鍵在習近平身上的決策

不安全感會繁殖不安全感。某種意義上,這種不安全感究竟是心理層面的還是物質層面的,並不關鍵,因為兩者都會推動清洗。更多清洗又會製造更多對抗與異議,最終形成惡性循環。反腐運動已進入第十個年頭,它不再只是一次運動,更接近中共創造出的眾多矛盾概念之一,例如繼續革命。

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。