GPT-4來了!ChatGPT律師考試贏9成考生 還有哪些地方變強了

【文.編譯 張詠晴】
人工智慧研究公司OpenAI公布了大型語言模型的最新版本GPT-4,據說在律師考試中擊敗9成的考生,還有哪些高級智慧?
最強人工智慧(AI)聊天機器人ChatGPT 「生成式預訓練轉換器」升級到第四代,也就是GPT-4,有變得更強嗎?
在GPT-4支援下,ChatGPT提供了醫療建議,讓部分醫師震驚不已,並且如今可以支援圖片、影像,並即將要創作出真的好笑的笑話。
但《紐約時報》發現,GPT-4還是會犯一些ChatGPT剛剛問世時的一些錯誤。但升級後的ChatGPT似乎更善於考試,但要說它已經逼近人類智慧了,似乎又言過其實。
彭博社也指出,由GPT-4支援的ChatGPT也無法回應時事,因為和GPT-3一樣,它是根據2021年9月以前就存在的數據資料所訓練的。
由最新釋出GPT-4支援的ChatGPT有哪些變強的地方,以下整理《紐約時報》發現:
在律師資格考,勝過9成考生
OpenAI表示,GPT-4在律師資格考試(Uniform Bar Examination, UBE)中可以擊敗90%的考生。在滿分1600分的美國大學入學測驗SAT拿到1300分,在高中的大學先修課程測驗中,不論是生物、微積分、總體經濟學、心理學、統計學和歷史都拿到5分的滿級分。
至於前一版本的ChatGPT並無法通過律師考試,在大部分高中的大學先修課程測驗中,也無法拿到那麼高分。
OpenAI總裁與共同創辦人布羅克曼(Greg Brockman)將一個律師考試的考題丟給ChatGPT,變強後的ChatGPT回答了出來,但充斥著法律術語。
布羅克曼要ChatGPT說一般人也能懂的話,ChatGPT也做到了。
GPT-4似乎學會更精準了
當人工智慧專家尼克遜(Chris Nicholson)告訴GPT-4,自己會說英文,但不懂西班牙文,可否給他一個學基礎西班牙文的教學大綱,ChatGPT提供了一份鉅細靡遺且非常有組織的課程大綱,還順道附上了學習和背誦西班牙單字的技巧。
尼克遜問未升級GPT-4前的ChatGPT同樣問題,也會得到一份課程大綱,但內容比較泛泛,獲得幫助較少。
尼克遜的回饋是,現在能提供的事實性描述更多了,而且通常都是正確的。
加強了正確性
艾倫人工智慧研究所前執行長伊奇奧尼(Oren Etzioni)在升級版ChatGPT,輸入自己的名字和兒子的名字,問兩人是什麼關係。
舊版ChatGPT老是說兩人是兄弟,新版則答對了。
但新版ChatGPT還是犯了一個錯, ChatGPT依然介紹伊奇奧尼是艾倫人工智慧研究所執行長,而不清楚伊奇奧尼已經離任。這顯示的是GPT-4並沒有吸納太新的資訊。
GPT-4可以描述圖片細節
GPT-4學會新能力,現在不但可以回應文字,也可以回應圖片。
OpenAI總裁與共同創辦人布羅克曼示範,ChatGPT如今可以描述哈伯太空望遠鏡的樣貌,敘述文字長達好幾段。
你也可以貼出一個圖片,然後再問問題。比方說對著冰箱裡的食材拍照,然後問,「有這些材料的話,我可以做哪些餐點呢」。ChatGPT會依照冰箱裡有的食材,給你建議。
多了點專業
北卡羅來納大學教堂山分校心臟科醫師蓋希先向GPT-4版ChatGPT描述了一位病患狀況,包含這位病患送醫後出現的併發症等等,整段描述包含一些難以理解的醫學術語。
接著,蓋希詢問可能的醫治選項,結果ChatGPT給出了完美的答案,「我就是這麼打算治療這名病患的」,蓋希說。
接著他又描述了不同的病症,結果ChatGPT提出的療程同樣讓人驚艷。
摘要能力直逼專業編輯
將《紐約時報》文章放上ChatGPT並要它摘要,每一次的摘要幾乎都相當精確。接著,你故意在摘要裡放進一段跟文章毫不相關的話,ChatGPT也會把它標註起來說,文章並沒有這樣說。
伊奇奧尼表示,能夠提供高品質的摘要,需要具備相當的文字理解能力,「這是高級智慧」。
GPT-4長出了幽默感,雖然有點冷
伊奇奧尼要升級後的ChatGPT說一個有關歌手瑪丹娜的笑話給他聽,ChatGPT說了之後,伊奇奧尼笑了。
ChatGPT現在說笑話的能力,還是侷限在那種「雖然有點冷,但你還是會笑的笑話」,但不得不說,已經強過前一代。
ChatGPT說的瑪丹娜笑話是,「瑪丹娜為什麼要學習幾何學?因為她想學會如何擺出各種角度的pose!」
但ChatGPT不擅於談未來
雖然對現有的知識,或已知的事,ChatGPT可以應答如流,但當你要ChatGPT對未來提出假設,它則不太在行,或者說它無法原創,只能重複其他人說過的話。
ChatGPT也依然會「捏造事實」
困擾著所有人工智慧聊天機器人的問題,ChatGPT也還是有,像是「幻覺」(hallucination),白話的說就是還是會給你欺騙性的數據,這是因為系統本身還無法辨識真偽,因此可能生成完全錯誤的陳述。
當你請ChatGPT給你收錄最新癌症研究的網站,它會生一個網址給你,但這個網站根本不存在。
(資料來源:New York Times News, The Atlantic, CNBC)
【延伸閱讀】
GPT-4上線!ChatGPT怎麼玩?再進化的微軟AI助手Copilot多強大?
有望搶先Gogoro、光陽獲利 中油加油站變充電站,留得住兩千億?
※更多精彩報導,詳見《天下雜誌》網站。
※本文由天下雜誌授權報導,未經同意禁止轉載
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言