快訊

印度重大火車事故 至少50人喪生、500多人受傷

美債限擔憂緩解+就業報告強勁 道指狂飆逾700點、那指連漲6周

GPT-4來了!ChatGPT律師考試贏9成考生 還有哪些地方變強了

圖片來源:Shutterstock
圖片來源:Shutterstock

【文.編譯 張詠晴】

人工智慧研究公司OpenAI公布了大型語言模型的最新版本GPT-4,據說在律師考試中擊敗9成的考生,還有哪些高級智慧?

最強人工智慧(AI)聊天機器人ChatGPT 「生成式預訓練轉換器」升級到第四代,也就是GPT-4,有變得更強嗎?

在GPT-4支援下,ChatGPT提供了醫療建議,讓部分醫師震驚不已,並且如今可以支援圖片、影像,並即將要創作出真的好笑的笑話。

但《紐約時報》發現,GPT-4還是會犯一些ChatGPT剛剛問世時的一些錯誤。但升級後的ChatGPT似乎更善於考試,但要說它已經逼近人類智慧了,似乎又言過其實。

彭博社也指出,由GPT-4支援的ChatGPT也無法回應時事,因為和GPT-3一樣,它是根據2021年9月以前就存在的數據資料所訓練的。

由最新釋出GPT-4支援的ChatGPT有哪些變強的地方,以下整理《紐約時報》發現:

在律師資格考,勝過9成考生

OpenAI表示,GPT-4在律師資格考試(Uniform Bar Examination, UBE)中可以擊敗90%的考生。在滿分1600分的美國大學入學測驗SAT拿到1300分,在高中的大學先修課程測驗中,不論是生物、微積分、總體經濟學、心理學、統計學和歷史都拿到5分的滿級分。

至於前一版本的ChatGPT並無法通過律師考試,在大部分高中的大學先修課程測驗中,也無法拿到那麼高分。

OpenAI總裁與共同創辦人布羅克曼(Greg Brockman)將一個律師考試的考題丟給ChatGPT,變強後的ChatGPT回答了出來,但充斥著法律術語。

布羅克曼要ChatGPT說一般人也能懂的話,ChatGPT也做到了。

GPT-4似乎學會更精準了

當人工智慧專家尼克遜(Chris Nicholson)告訴GPT-4,自己會說英文,但不懂西班牙文,可否給他一個學基礎西班牙文的教學大綱,ChatGPT提供了一份鉅細靡遺且非常有組織的課程大綱,還順道附上了學習和背誦西班牙單字的技巧。

尼克遜問未升級GPT-4前的ChatGPT同樣問題,也會得到一份課程大綱,但內容比較泛泛,獲得幫助較少。

尼克遜的回饋是,現在能提供的事實性描述更多了,而且通常都是正確的。

加強了正確性

艾倫人工智慧研究所前執行長伊奇奧尼(Oren Etzioni)在升級版ChatGPT,輸入自己的名字和兒子的名字,問兩人是什麼關係。

舊版ChatGPT老是說兩人是兄弟,新版則答對了。

但新版ChatGPT還是犯了一個錯, ChatGPT依然介紹伊奇奧尼是艾倫人工智慧研究所執行長,而不清楚伊奇奧尼已經離任。這顯示的是GPT-4並沒有吸納太新的資訊。

GPT-4可以描述圖片細節

GPT-4學會新能力,現在不但可以回應文字,也可以回應圖片。

OpenAI總裁與共同創辦人布羅克曼示範,ChatGPT如今可以描述哈伯太空望遠鏡的樣貌,敘述文字長達好幾段。

你也可以貼出一個圖片,然後再問問題。比方說對著冰箱裡的食材拍照,然後問,「有這些材料的話,我可以做哪些餐點呢」。ChatGPT會依照冰箱裡有的食材,給你建議。

多了點專業

北卡羅來納大學教堂山分校心臟科醫師蓋希先向GPT-4版ChatGPT描述了一位病患狀況,包含這位病患送醫後出現的併發症等等,整段描述包含一些難以理解的醫學術語。

接著,蓋希詢問可能的醫治選項,結果ChatGPT給出了完美的答案,「我就是這麼打算治療這名病患的」,蓋希說。

接著他又描述了不同的病症,結果ChatGPT提出的療程同樣讓人驚艷。

摘要能力直逼專業編輯

將《紐約時報》文章放上ChatGPT並要它摘要,每一次的摘要幾乎都相當精確。接著,你故意在摘要裡放進一段跟文章毫不相關的話,ChatGPT也會把它標註起來說,文章並沒有這樣說。

伊奇奧尼表示,能夠提供高品質的摘要,需要具備相當的文字理解能力,「這是高級智慧」。

GPT-4長出了幽默感,雖然有點冷

伊奇奧尼要升級後的ChatGPT說一個有關歌手瑪丹娜的笑話給他聽,ChatGPT說了之後,伊奇奧尼笑了。

ChatGPT現在說笑話的能力,還是侷限在那種「雖然有點冷,但你還是會笑的笑話」,但不得不說,已經強過前一代。

ChatGPT說的瑪丹娜笑話是,「瑪丹娜為什麼要學習幾何學?因為她想學會如何擺出各種角度的pose!」

但ChatGPT不擅於談未來

雖然對現有的知識,或已知的事,ChatGPT可以應答如流,但當你要ChatGPT對未來提出假設,它則不太在行,或者說它無法原創,只能重複其他人說過的話。

ChatGPT也依然會「捏造事實」

困擾著所有人工智慧聊天機器人的問題,ChatGPT也還是有,像是「幻覺」(hallucination),白話的說就是還是會給你欺騙性的數據,這是因為系統本身還無法辨識真偽,因此可能生成完全錯誤的陳述。

當你請ChatGPT給你收錄最新癌症研究的網站,它會生一個網址給你,但這個網站根本不存在。

(資料來源:New York Times News, The Atlantic, CNBC)

【延伸閱讀】

GPT-4上線!ChatGPT怎麼玩?再進化的微軟AI助手Copilot多強大?

不只搶飯碗 ChatGPT創造新工作,年薪直逼千萬

掃廁所的投手 百年一遇的棒球天才!大谷翔平這樣被養成

電動車火熱,全球產值增3成 台灣鋰電池產業鏈20強出列

有望搶先Gogoro、光陽獲利 中油加油站變充電站,留得住兩千億?

※更多精彩報導,詳見《天下雜誌》網站。

※本文由天下雜誌授權報導,未經同意禁止轉載

相關新聞

買房會讓人更幸福嗎? 哈佛快樂學教授這樣說

根據調查,「擁有房子」是美國人認為財務成功的首要指標。但買房後的快樂能持續多久?如何讓它永不褪去?長期研究幸福學的哈佛教授綜合研究與個人經驗給出指南。

現代汽車做對了什麼? 馬斯克讚:做的很不錯

《華爾街日報》分析,現代汽車在去年成為全球第三大汽車廠,銷售6百85萬輛汽車,只落後豐田(Toyota Motor)和福斯(Volkswagen);而目前現代也成為美國市場第三大的電動車廠。

防疫險、解約潮燒出營運大洞 2023兩千大調查:全台15家金控11家衰退

全球升息、股債重摔,去年台灣金融業總獲利,比起前年腰斬。最大關鍵是,金控雙引擎之一的保險業,防疫險幾乎吃掉所有獲利,由盈轉虧。未來還很辛苦,新時代會是什麼面貌?

2023營運績效50強:高爾夫衝榜首!疫情餘韻後 分析師看好這類IC

2022年台灣遇上疫後經濟大亂流,不只台股走過2008年金融風暴以來的最大跌幅,《天下》兩千大企業中,營收衰退家數也比2021年多出360家。但動亂中,仍有企業站穩腳步。疫情下,連燒3年的半導體族群,依舊盤據《天下》「營運績效50強」最新榜單。

中捷悲劇不是特例!營造業職災死亡居冠 工地為何比工廠更常出意外?

台中建案施工意外砸中捷運釀成1死10傷悲劇,回顧過去10年統計數據,營造工程業職災死亡人數七度居冠,高過有3倍多從業人數的製造業。我們能避免意外繼續發生嗎?

王品切青菜蘿蔔子公司變小金雞 挑戰營收3年翻9倍

對一般餐飲業來說,供應鏈通常用來支援第一線分店需求,是後援單位。然而,王品轉投資的供應鏈子公司萬鮮,卻被董事長陳正輝視為策略的核心,具備攻擊能力的要角。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。

商品推薦