快訊

美股收復5月全部失地⋯是否已是底部?投資人看這情況毫無把握

少女疑好奇誤觸推土機開關遭夾昏 搶救2小時仍身亡

商務人士邊境鬆綁 經部:朝縮短隔離天數規劃

長度濃縮千分之一 AI挑戰用175字說完12萬字經典《傲慢與偏見》

藉由微調後的GPT-3語言模型,OpenAI實現以不到200個字詞精簡描述原本長達12萬個字詞撰寫的《傲慢與偏見》小說情節。

依照OpenAI研究人員說明,此項技術先將《傲慢與偏見》小說情節精簡為24796個字詞數的276段摘要,進而縮減為3272個字詞的25段摘要,以及更進一步縮減為475個字詞的4段摘要,最後再精簡為175個字詞數組成摘要,不僅讓文章長度縮減為原文的千分之一,更保留完整劇情走向。

其他透過此語言模型精簡摘要的小說,還包含將全文濃縮為136個字詞的《愛麗絲夢遊仙境》、縮減為119個字詞的《羅密歐與茱麗葉》,以及減少為192個字詞的《自由之心》。

就技術原理來看,此款微調後的GPT-3語言模型,將會依照文章長度進行判斷,其中包含文章長度較短內容直接擷取結論,長篇文章則會在各個片段擷取重點,並且持續縮減文章字數,進而將這些內容以相同撰寫口吻串接成通順可讀內容。

而此項語言模型則是透過平均字詞數在10萬以上的小說內容進行訓練,而這樣的訓練模式更可更換為不同語言模型、不同採樣方式,以及不同訓練數據類型持續升級,並且藉由強化學習以對抗生成方式,產生可讓人類輕易閱讀結果。

同時,在強化學習部分也採用三種變體抽樣訓練方式,藉此讓語言模型確實能理解小說內容表達主軸。

在訓練過程中,研究人員透過Goodreads 2020榜單上最受歡迎的40本書籍,分別涵蓋幻想、恐怖、愛行、推理等20種內容類別,並且透過兩名研究人員與語言模型個別針對此類書籍進行總結,讓研究人員與語言模型總結結果能有80%比例相近,藉此讓分析結果更接近人類預期內容。

另外,研究人員也會透過語言模型擷取摘要內容,能否用於回答與原始內容相關問題作為評估,藉此判斷摘要內容是否正確。即使未能完整回答問題,但內容方向至少不會有明顯偏離。

但依照OpenAI方面表示,現階段並未有計畫開源此項微調後的GPT-3語言模型,因此主要還是聚焦在研究階段。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

語言 推理 AI

延伸閱讀

NVIDIA提出快速建立3D人物模型方法 可呈現自然肢體動作

專訪/解剖課、寫程式通通有!她曝讀長庚人工智慧學程「1能力」要強

相關新聞

馬斯克再籌得62.5億美元「一定會完成收購Twitter」

依照遞交給美國證券交易委員會的文件顯示,Elon Musk(馬斯克)稍早再次取得62.5億美元股權融資,藉此用於收購Twitter。

連101都輸它!Google公布台灣年度熱門地點 網見第1名傻眼:怎麼一回事

許多人外出開車都會想要透過Google Maps進行導航,以便可以預先掌握即將抵達的目的地街道實景,像是道路的狀況、寬度、安全島、地標、紅綠燈等,方便駕駛人在行進時能更快地辨識自己的位置。Google Maps也在服務邁入15週年之際,公布「台灣年度最多人瀏覽的Google街景地點」,台灣指標性建築「台北101大樓」只排名17,而第一名讓人超意外。

一周數位爆報/蘋果iPhone 14「從頭到尾」外洩不停 Netflix直搗快篩之亂?

沒時間看最新或最有趣的數位新聞嗎?跟上《聯合新聞網》腳步,帶你精選當周數位新聞,還有評分與評語讓你快速了解大小事。其他「一周數位爆報」這裡看。

一周數位爆報/iPod我們懷念你…看21年進化史!iPhone 14 Pro長大掰了妹妹頭、Google手錶對決蘋果

沒時間看最新或最有趣的數位新聞嗎?跟上《聯合新聞網》腳步,帶你精選當周數位新聞,還有評分與評語讓你快速了解大小事。其他「一周數位爆報」這裡看。

iPhone真的有USB-C了?傳蘋果正在測試裝置、未來還多這一物

彭博新聞引述消息來源指稱,蘋果目前已經著手測試採用USB-C連接埠的iPhone,同也將準備對應轉接Lightning介面的配件,讓新款iPhone仍可相容現有對應Lightning介面的周邊。

台灣之星大斷訊原因曝光「台電設備故障」 網友氣衝4年前斷訊文崩潰開罵

台灣之星今(10)日下午1點左右無預警斷訊,不少用戶哀號完全收不到訊號,台灣之星到下午2點47分左右才慢半拍地稱斷訊原因為「台電設備故障」導致,但不少網友稍早等不到回應,直接湧進官方臉書粉絲團4年前「斷訊文」開轟「破網路」、「被台大(台灣大哥大)合併也不要這麼兇猛斷全台啊」,還有人一度以為自己是不是忘了繳錢而遭到斷訊。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。