「相當於銀牌得主」奧林匹亞解題難不倒AI 圍棋之道如何套用於數學?

谷歌DeepMind兩款人工智慧在今年國際數學奧林匹亞競賽一共解開六題中的四題,滿分42分拿到28分,程度相當於人類銀牌得主。路透/NURPHOTO
谷歌DeepMind兩款人工智慧在今年國際數學奧林匹亞競賽一共解開六題中的四題,滿分42分拿到28分,程度相當於人類銀牌得主。路透/NURPHOTO

英國城市巴斯今年7月舉辦國際數學奧林匹亞競賽(IMO),吸引全球近110國600多名學生較量。不過這次比賽最引人矚目的,是谷歌DeepMind兩款人工智慧的參賽表現。它們一共解開六題中的四題,滿分42分拿到28分,程度相當於人類銀牌得主。

《科學人》(Scientific American)報導,國際數學奧賽分為兩場測驗,要回答不同數學領域的六道問題,每場答題時間4個半小時。中國大陸浙江省高中生史皓嘉個人以滿分成績取得金牌;國家排名方面則是美國隊第一。

菲爾茲獎得主高爾斯(Timothy Gowers)在社群媒體X上指出,谷歌DeepMind在這次比賽達到約銀牌等級,600多名參賽者中約只有60人贏過它。

如此成就歸功於兩款AI:AlphaProof與AlphaGeometry 2。前者的運作與精通西洋棋、日本將棋與圍棋的演算法類似,即使用強化學習,不斷與自己競爭並逐步改進。這種方法可以輕易上手棋盤類遊戲;AI會走幾步棋,如未能取勝,就會受到懲罰並學習改走其它步。

然而,相同方法套用在數學上,AI除了必須證明自己已解開問題,還得驗證答題的推理過程也是對的。

為了實現這點,AlphaProof運用所謂的證明助手——這些演算法會逐步進行邏輯論證,檢查解法是否正確。證明助手已存在數十年,但要應用在機器學習則受到侷限,因為它必須使用如Lean的形式語言(formal language),這方面的數學數據非常稀少。

相較之下,以人類自然語言寫成的數學題解答在網路上資源很多,也有逐步解法。因此,DeepMind團隊訓練了名為Gemini的大型語言模型,將百萬個問題翻譯成Lean形式語言,供證明助手用於訓練。

「面對問題時,AlphaProof會生成解答候選,然後透過搜尋Lean中可能的證明步驟來證明或否定它們。」 開發人員在DeepMind網站寫道。如此一來,AlphaProof逐漸學會哪些證明步驟是有用或無用的,強化解決更複雜問題的能力。

AI 人工智慧 奧林匹亞 數學 科學家 英國

延伸閱讀

好讀周報/AI數學推理能力大進展!奧數難題6道對4道 等同「銀牌」水準

東海大學應數系轉變智慧計算系 邁進科技金融教育

分科測驗簡章明發售!114學年加考數乙 排在第2天下午第一節考試

主辦國伊朗紅色旅遊警戒 台灣今年未參加物理奧林匹亞

相關新聞

拜登政府敲定對台積電補助 提供2161億元補貼

美國商務部十五日敲定對台積電亞利桑那州美國子公司提供六十六億美元(約台幣二一六一億元)的政府補貼。台積電董事長魏哲家表示...

「川普交易」獨惠美股 其他市場慘兮兮

美股13日早盤在平盤附近狹幅波動,不過「川普交易」持續發燒,近日推升美股屢創新高,美元也來到兩年來最高水準。但美國以外的...

川普勝選美股狂歡...道瓊早盤狂飆1300點 台積ADR跌逾2%

美國大選結果提早出爐,川普勝選大勢底定,消弭市場的不確定性。此外,共和黨勢將囊括參、眾兩院的國會新局,也有助川普實現其選...

美限制投資陸高科技 鎖定半導體、量子計算、AI

美國拜登政府敲定對美國個人和公司投資中國大陸先進技術的限制,包括半導體、量子計算和人工智慧(AI)等可能對國安構成威脅的...

比經濟前景更重要!摩根大通執行長戴蒙憂「第三次世界大戰已開打」

當今世界局勢紛亂,俄烏和中東戰火未歇,連通常只專注於金融市場和聯準會(Fed)動向的摩根大通執行長戴蒙(Jamie Di...

IMF示警全球經濟三難題 下修明年成長預估至3.2%

國際貨幣基金(IMF)22日發布最新世界經濟展望報告,下修明年全球經濟成長預估0.1個百分點至3.2%,認為即便各國央行...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。