快訊

手機響別慌!北市災防演習 明上午9點針對2區發國家級警報測試

警界醜聞…北市捷警隊小隊長爆「性侵女兒」 前同事:不意外但太扯

知名品牌賣過期和牛?業者稱冷凍可保存2年 新北1疑慮全數封存

GPT-4來了!ChatGPT律師考試贏9成考生 還有哪些地方變強了

圖片來源:Shutterstock
圖片來源:Shutterstock

【文.編譯 張詠晴】

人工智慧研究公司OpenAI公布了大型語言模型的最新版本GPT-4,據說在律師考試中擊敗9成的考生,還有哪些高級智慧?

最強人工智慧(AI)聊天機器人ChatGPT 「生成式預訓練轉換器」升級到第四代,也就是GPT-4,有變得更強嗎?

在GPT-4支援下,ChatGPT提供了醫療建議,讓部分醫師震驚不已,並且如今可以支援圖片、影像,並即將要創作出真的好笑的笑話。

但《紐約時報》發現,GPT-4還是會犯一些ChatGPT剛剛問世時的一些錯誤。但升級後的ChatGPT似乎更善於考試,但要說它已經逼近人類智慧了,似乎又言過其實。

彭博社也指出,由GPT-4支援的ChatGPT也無法回應時事,因為和GPT-3一樣,它是根據2021年9月以前就存在的數據資料所訓練的。

由最新釋出GPT-4支援的ChatGPT有哪些變強的地方,以下整理《紐約時報》發現:

在律師資格考,勝過9成考生

OpenAI表示,GPT-4在律師資格考試(Uniform Bar Examination, UBE)中可以擊敗90%的考生。在滿分1600分的美國大學入學測驗SAT拿到1300分,在高中的大學先修課程測驗中,不論是生物、微積分、總體經濟學、心理學、統計學和歷史都拿到5分的滿級分。

至於前一版本的ChatGPT並無法通過律師考試,在大部分高中的大學先修課程測驗中,也無法拿到那麼高分。

OpenAI總裁與共同創辦人布羅克曼(Greg Brockman)將一個律師考試的考題丟給ChatGPT,變強後的ChatGPT回答了出來,但充斥著法律術語。

布羅克曼要ChatGPT說一般人也能懂的話,ChatGPT也做到了。

GPT-4似乎學會更精準了

當人工智慧專家尼克遜(Chris Nicholson)告訴GPT-4,自己會說英文,但不懂西班牙文,可否給他一個學基礎西班牙文的教學大綱,ChatGPT提供了一份鉅細靡遺且非常有組織的課程大綱,還順道附上了學習和背誦西班牙單字的技巧。

尼克遜問未升級GPT-4前的ChatGPT同樣問題,也會得到一份課程大綱,但內容比較泛泛,獲得幫助較少。

尼克遜的回饋是,現在能提供的事實性描述更多了,而且通常都是正確的。

加強了正確性

艾倫人工智慧研究所前執行長伊奇奧尼(Oren Etzioni)在升級版ChatGPT,輸入自己的名字和兒子的名字,問兩人是什麼關係。

舊版ChatGPT老是說兩人是兄弟,新版則答對了。

但新版ChatGPT還是犯了一個錯, ChatGPT依然介紹伊奇奧尼是艾倫人工智慧研究所執行長,而不清楚伊奇奧尼已經離任。這顯示的是GPT-4並沒有吸納太新的資訊。

GPT-4可以描述圖片細節

GPT-4學會新能力,現在不但可以回應文字,也可以回應圖片。

OpenAI總裁與共同創辦人布羅克曼示範,ChatGPT如今可以描述哈伯太空望遠鏡的樣貌,敘述文字長達好幾段。

你也可以貼出一個圖片,然後再問問題。比方說對著冰箱裡的食材拍照,然後問,「有這些材料的話,我可以做哪些餐點呢」。ChatGPT會依照冰箱裡有的食材,給你建議。

多了點專業

北卡羅來納大學教堂山分校心臟科醫師蓋希先向GPT-4版ChatGPT描述了一位病患狀況,包含這位病患送醫後出現的併發症等等,整段描述包含一些難以理解的醫學術語。

接著,蓋希詢問可能的醫治選項,結果ChatGPT給出了完美的答案,「我就是這麼打算治療這名病患的」,蓋希說。

接著他又描述了不同的病症,結果ChatGPT提出的療程同樣讓人驚艷。

摘要能力直逼專業編輯

將《紐約時報》文章放上ChatGPT並要它摘要,每一次的摘要幾乎都相當精確。接著,你故意在摘要裡放進一段跟文章毫不相關的話,ChatGPT也會把它標註起來說,文章並沒有這樣說。

伊奇奧尼表示,能夠提供高品質的摘要,需要具備相當的文字理解能力,「這是高級智慧」。

GPT-4長出了幽默感,雖然有點冷

伊奇奧尼要升級後的ChatGPT說一個有關歌手瑪丹娜的笑話給他聽,ChatGPT說了之後,伊奇奧尼笑了。

ChatGPT現在說笑話的能力,還是侷限在那種「雖然有點冷,但你還是會笑的笑話」,但不得不說,已經強過前一代。

ChatGPT說的瑪丹娜笑話是,「瑪丹娜為什麼要學習幾何學?因為她想學會如何擺出各種角度的pose!」

但ChatGPT不擅於談未來

雖然對現有的知識,或已知的事,ChatGPT可以應答如流,但當你要ChatGPT對未來提出假設,它則不太在行,或者說它無法原創,只能重複其他人說過的話。

ChatGPT也依然會「捏造事實」

困擾著所有人工智慧聊天機器人的問題,ChatGPT也還是有,像是「幻覺」(hallucination),白話的說就是還是會給你欺騙性的數據,這是因為系統本身還無法辨識真偽,因此可能生成完全錯誤的陳述。

當你請ChatGPT給你收錄最新癌症研究的網站,它會生一個網址給你,但這個網站根本不存在。

(資料來源:New York Times News, The Atlantic, CNBC)

【延伸閱讀】

GPT-4上線!ChatGPT怎麼玩?再進化的微軟AI助手Copilot多強大?

不只搶飯碗 ChatGPT創造新工作,年薪直逼千萬

掃廁所的投手 百年一遇的棒球天才!大谷翔平這樣被養成

電動車火熱,全球產值增3成 台灣鋰電池產業鏈20強出列

有望搶先Gogoro、光陽獲利 中油加油站變充電站,留得住兩千億?

※更多精彩報導,詳見《天下雜誌》網站。

※本文由天下雜誌授權報導,未經同意禁止轉載

相關新聞

台股基金績效遠勝ETF!專訪「鉅亨買基金」總經理:ETF是白飯 基金是炒飯

00919、00940等高股息ETF,掀起資金瘋狗浪,但很多人沒有注意到,台股基金表現其實遠勝ETF。《天下》專訪民營第一大基金公司「鉅亨買基金」總經理張榮仁,以下是他為投資人解析,挑對台股基金,為何賺比較多?又該如何做基金和ETF的資產配置:

消防、護理、教師 為什麼愈「社會奉獻」的職業愈易受剝削?

為什麼在多數社會裡,那些確保眾人安全、健康、培育人類後代的職業角色,往往低薪、血汗?美國研究人員好奇這個現象,發現了「英雄稅」的真相——「無私」的標籤,讓工作者啞巴吃黃蓮。

把定存拿去炒股 理財作家:我大錯特錯

住在美國德州的自由撰稿人西森(Jennifer Sisson)主持播客節目《媽媽的理財地圖》(Mama's Money Map),致力幫助家庭主婦實現財富自由。她最近分享一項令她後悔不已的錯誤理財決定。

年薪約1,055萬元!7成AI博士投入業界 如何影響民主?

一直以來,AI研究的前沿都在大學裡,直到ChatGPT帶來的熱潮改變了一切。現在,學術界的教授聲音微弱,不是直接跳槽科技巨頭,就是被科技巨頭豢養。當追求真理、促進社會公義的學術研究,都轉為商業利益至上時,我們的世界會如何轉向?

過得像個窮學生、開破車 億萬富翁年輕時5個節儉習慣

NBA達拉斯獨行俠隊老闆庫班(Mark Cuban)成為億萬富翁之前,是個非常節儉的人。

「這次沒倒,不代表下次不會倒」 地震專家:應立即檢測老舊建築結構

4月3日上午7點58分,台灣東方海域發生芮氏規模7.2強震,這是繼1999年規模7.3的921大地震之後,釋放能量最強大的地震。接近震央的花蓮縣部分地區,最大震度達到6強,市區已傳出房屋傾斜災情,蘇花公路也因多處坍塌而中斷。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。