快訊

國衛院10年追蹤研究 空汙增中風死亡率

當心臉書公審、私刑觸法 「他」為女友抱不平下場曝光

訓練非英語AI模型 Meta專家:2大挑戰待克服

國科會以Meta語言模型Llama為基礎,發展融合台灣元素的可信任人工智慧(AI)對話引擎,Meta專家今天在Connect大會回答中央社提問時表示,打造非英語的語言模型,需要克服詞彙量差異、預訓練學習率下降等2大挑戰。

Meta今天在美國加州總部舉辦Connect大會,為COVID-19(2019冠狀病毒疾病)疫情後首度恢復實體舉行,會中發表Quest 3頭戴式裝置、圖像生成模型Emu、結合直播功能的新一代智慧眼鏡,為元宇宙鋪路。Meta僅邀請全球不到百家媒體與會,中央社為唯一親臨現場的華文媒體。

在Connect主題演講後進行的媒體團訪時間,中央社記者提問,台灣政府部門使用Llama打造中文版AI對話引擎,Meta能否為相關研究者提供建議。Meta AI研究科學家安琪拉.范(Angela Fan)表示,打造非英語的語言模型,會面臨一些挑戰,其中之一是詞彙量(vocabulary size)差異。

安琪拉.范指出,如果某個語言模型的詞彙量是根據英語文本進行訓練,那麼未來使用其他語言訓練時,會發現詞元(token)分布方式不同。

她以英語為例,一個單字可能被分成2個詞元,但在另一種語言中的一個單字可能被分成6個詞元,這會對生成式應用帶來更多挑戰,因為詞元分布的任何差異,都可能導致模型輸出錯誤。在大部分時候,人們嘗試透過第二階段的預訓練(Pre-training)來改善相關問題。

不過,安琪拉.范提到,預訓練資料的多樣性也帶來另一種挑戰。在世界不同地區,人們關心不同的事情,如果主要使用英語資料訓練語言模型,能涵蓋的知識範圍將受限,影響模型輸出結果。就實務而言,大多數語言模型進行預訓練時,學習率都會逐步下降,必須做出更多調整,也是需要克服的問題。

疫情 美國 語言

延伸閱讀

通膨頑固難以消散…景氣連十藍燈好恐懼? 專家:繼續佈局市值型ETF

Meta祖克柏親上陣 發表AI助理、會回答問題的智慧眼鏡

Meta進軍AI圖像生成 新款智慧眼鏡結合直播

AI大模型 為自駕車按下加速鍵

相關新聞

立陶宛大選首輪結果出爐 現任總統44%得票率未過半 決選將在5/26

路透報導,立陶宛12日舉行總統大選第一輪投票,59歲的現任總統瑙塞達(Gitanas Nauseda)以44%得票率領先...

美對陸電動車關稅 擬調漲三倍

華爾街日報、紐約時報及美聯社等美媒十日引述美國官員和知情人士報導,拜登政府擬於十四日宣布將對中國大陸電動車關稅增加三倍,...

又是波音!美聯航客機起飛5分鐘緊急折返 福岡機場一度關閉跑道

共同社報導,日本國土交通省和警方指出,美國聯合航空公司一架波音737-800客機10日上午從日本福岡飛往美國關島,但起飛...

別亂吃!印度19歲男吃路邊攤沙威瑪 「4天送3次急診」仍身亡

印度一名19歲少年日前在孟買特隆貝區(Trombay area)路邊攤買了沙威瑪來吃,結果沒多久就出現胃痛和嘔吐等症狀,...

美14歲少年持長槍在校外行走!還沒進校園就遭警方擊斃

ABC報導,美國威斯康辛州一所中學校園外1日發生槍擊事件,一名14歲槍手持長槍,在與警方對峙後遭擊斃,所幸未造成其他傷亡...

真的出手了? 路透:日本可能在4月29日動用5.5兆日圓干預匯市

路透報導,根據日本央行的數據,官員可能在4月29日動用了約5.5兆日圓,支撐日圓匯價。報導指出,外匯交易需要兩天時間進行...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。