快訊

整理包/考生加油!114國中會考明登場 考場規定、各科備考重點一把抓

台灣稅率揭曉?2至3周內公布對各國關稅 川普強調「沒有餘裕了」

30年前便當一個500元合理嗎? 昔日連戰吃500元便當惹爭議

失智症檢測不及格!較老的AI模型 表現出認知受損跡象

新近研究顯示,大型語言模型和聊天機器人等AI技術,也會因為老舊,有認知能力受損的表現。這意味AI距離取代真人醫生還有一段路。示意圖。路透
新近研究顯示,大型語言模型和聊天機器人等AI技術,也會因為老舊,有認知能力受損的表現。這意味AI距離取代真人醫生還有一段路。示意圖。路透

根據英國醫學期刊(BMJ)2024年12月20日刊出的研究論文,大型語言模型(LLM)和聊天機器人等人工智慧(AI)技術,也像人一樣,會因為年齡,出現認知能力退化的跡象。這表示,即使醫療診斷愈來愈常仰賴AI,在肉眼明顯察覺之前,快速有效地從病歷、X光片和其他資料裡發現異常,但AI還不能很快地取代真人醫生

科學家使用「蒙特婁認知評估」(MoCA)來測試市面上公開的、由LLM驅動的聊天機器人,包括OpenAI的ChatGPT、Anthropic的Sonnet,以及Alphabet的Gemini。MoCA是專用來檢測老年人早期癡呆或認知受損的工具,滿分30分,人類受測者26分以上代表合格,認知無障礙。

對大多數LLM來說,它們在命名、專注力、語言能力和抽象概念等測試的某些方面看起來很輕鬆,但在視覺空間建構和執行功能的表現都不好,有幾個在延遲記憶比其他LLM表現更差。

至關重要的是,雖然ChatGPT最新版本(第4版)得分最高(30分裡獲26分),但較舊的Gemini 1.0僅得16分,導致了「較舊LLM出現認知能力衰退跡象」的結論。

這些發現挑戰了AI將很快取代人類醫生的假設。具體而言,研究作者反對在需要視覺抽象思維和執行功能的任務中使用AI,「領先的聊天機器人身上認知能力受損明顯,可能影響它們進行醫療診斷的可靠性,並削弱患者信心。」

根據研究作者,他們的發現僅僅是觀察性的,AI與人類心智運作方式的關鍵差異意味實驗無法構成直接的比較。但他們警告說,這可能是給AI臨床醫學應用踩煞車的「重大弱點」。

語言 醫學 醫生

延伸閱讀

馬斯克新聊天機器人 出擊

大陸雲端廠商迎新一波成長

中逾15家央國企擁抱DeepSeek 專家不喜反憂:有副作用

字節跳動旗下「豆包」新模型架構 推理成本最多降83%

相關新聞

7月大地震預言 NHK點名從港台擴散謠言、中國使館的「提醒」加深不安

二十幾年前的日本漫畫預言今年7月5日日本將發生毀滅性地震,香港部分飛日定期航班預防性減班。NHK上月調查這個「謠言」起自...

大阪世博開幕 84展館亮相

二○二五年世界博覽會昨天上午在日本大阪市的夢洲會場開幕,展期至十月十三日。開幕前會場就出現排隊人潮,估計首日進場人數將超...

小護士愛上大毒梟!在「全英最糟監獄」熱戀 女方家長嚇壞

英國一名護理師承接監獄的外包工作,結果疑似和獄中一名囚犯產生情愫,該囚犯曾被指控過失殺人、槍枝和毒品犯罪等罪刑,關押於有「全英國最糟監獄」之稱的旺茲沃斯監獄(HMP Wandsworth)。

人瑞打假公司!他專揭超百歲老人有無說謊 查最長壽理髮師結果曝

隨著百歲人瑞攫取越來越多關注,億萬富豪和創業家也砸大把錢開發長壽商機。不過如何證明人瑞年齡是否屬實?這是商業保險經紀人梅...

日本京都拉麵店Po照公審1星負評客 懸賞2萬元威脅「處決」

由於不滿顧客用餐後給下1星負評,日本京都河原町站附近一間著名拉麵店とよ二郎(TOYOJIRO)在社交媒體公開顧客照片,並懸賞10萬日圓(約新台幣21,945港元)要把2人找出來進行「處決」,把這2名顧客打一頓,此舉遭不少網民批評。

澳洲政府直升機「空中撲殺」700隻無尾熊 動保團體轟:糟糕先例

澳洲當局近期在維多利亞州動用直升機對無尾熊進行撲殺,此舉引發動保團體的抗議,他們擔憂會有大量幼仔因此成為孤兒。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。