快訊

25歲台灣女子在澳洲失蹤…警公布照片特徵 2周內第3個下落不明華裔女子

京華城高容積第一個大禮包 游淑慧揪關鍵人物是他

9+10=21?世界駭客大賽參賽者用「爛數學」騙過AI 找出系統瑕疵與偏見

上周末在拉斯維加斯舉行的世界駭客大賽「國際資訊安全會議」(DEF CON),參賽者試圖找出生成式AI系統的瑕疵和偏見。圖/取自DEF CON官網
上周末在拉斯維加斯舉行的世界駭客大賽「國際資訊安全會議」(DEF CON),參賽者試圖找出生成式AI系統的瑕疵和偏見。圖/取自DEF CON官網

彭博資訊報導,上周末在拉斯維加斯舉行的世界駭客大賽「國際資訊安全會議」(DEF CON),參賽者試圖找出生成式AI系統的瑕疵和偏見,方法之一是用爛數學騙過AI,例如9+10=21。

來自喬治亞薩凡納(Savannah)的21歲學生梅斯(Kennedy Mays)騙過一個大型語言模型,她設法哄騙它說出9+10=21。

梅斯說,「我們來來回回對話」,起先AI說這是「你我之間的圈內笑話」,在幾回提示之後,AI不再說這個總數是錯的。

世界駭客大賽的參賽者在156台筆電前,每次用50分鐘試圖打敗一些世上最聰明的AI平台,測試由Google、Meta Platforms和OpenAI等公司提供的8種模型是否會失誤,包括聲稱自己是人類、散播有關地點或人的錯誤說法。

這項測試的目的是看看這些公司是否能建立新護欄,以遏止一些與大型語言模型有關的駭人問題。這項大賽獲得白宮的支持與協助。

拉斯維加斯 語言 駭客

延伸閱讀

數位部攜日月光、中華電等十家業者 共同演練駭客攻防

白宮鼓勵創新AI系統防駭客網攻 總獎金達近6億

華郵稱中國駭客入侵 美仍有信心與日共享情資

中國駭客侵入日本國防網路 美示警:最具破壞性攻擊

相關新聞

巴黎地標暫停開放!為抗議財務管理方式不當 艾菲爾鐵塔員工今發動罷工

根據法國工會,艾菲爾鐵塔(Eiffel Tower)今天因員工發動罷工而關閉。艾菲爾鐵塔是全球最受歡迎的觀光景點之一

日本電車癡漢再出詭招!以視線、吐息聲「隔空」性騷擾 女團偶像也受害

日本電車上有「癡漢」出沒騷擾女性的消息時有所聞,但近來癡漢的騷擾行徑似乎出現變化,從實質上的侵犯,變成以眼神、呼吸等方式進行性騷擾。

沖繩宮古島大規模停電!2.5萬戶家庭受影響 何時來電仍不知

日本沖繩縣宮古島市當地時間25日凌晨3點起發生大規模停電,截至今天早上8點,仍有逾2萬5000戶家庭斷電,相當於全島停電...

懷疑老婆出軌!男子持刀恐嚇、毀衣滴蠟刑求 逼妻認罪外遇

馬來西亞有名男子,因為懷疑妻子外遇,竟持刀恐嚇、綑綁妻子雙手,還將蠟燭滴在妻子身上刑求逼供,宣稱要將妻子燒死。

社福機構運營人泯滅良心!性侵「重度智力障礙少女」還將過程偷拍保存

日本驚傳泯滅人性的性暴力案件,今年64歲的塩本裕治,因性侵和猥褻患有重度智力障礙的未成年少女而遭警方逮捕。

男子慘遭13隻比特犬圍攻撕咬5分鐘 鑽狗籠躲避仍失血身亡

美國發生大群比特犬咬死主人奪命意外。1名在自家後院設狗舍繁殖比特犬售賣的男子,早前晚上被自己養的13個比特犬襲擊,歷時起碼5分鐘,身體多處受傷,即使逃入狗籠暫避,但最終失血過多當場死亡。當局接走所有比特犬,安排人道毀滅,正調查案件。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。