快訊

不只女警護膚店兼差! 基層再爆偵查隊長縱容代簽上班打電動 竹縣警處分

外送下一步/平台合併握有絕對議價權力 貿然提高抽成恐成三輸局面

車廂內一度漆黑!台電供電異常 高鐵4列車跳電停車、5列車延誤

訓練台版AI語言模型 許永真:盼讓百工百業商用

國科會去年4月啟動TAIDE計畫,研發台版大型繁中AI語言模型,台大資工系教授許永真表示,TAIDE是透過中文資料,訓練以英文為母語的Llama模型,「像在教美國長大的ABC講中文」,目前已有初步成果,盼盡快讓台灣百工百業商用。

「2024年AI與資訊安全論壇」今天登場,台大資工系教授許永真以「台灣的AI與大型語言模型(LLM)」為題發表演說。

為因應國際大型語言模型常產生資訊偏誤,或不符台灣文化與價值觀的回應,國科會去年4月啟動TAIDE計畫,在Llama(Meta推出的語言模型)原型基礎上,由國內學界專家進一步發展及訓練調校。

許永真為台灣AI卓越中心副總召集人,參與TAIDE計畫,她今天在論壇中表示,AI有其資安風險,許多人都擔心「所思所想、機敏資料外流」,讓大家對AI又愛又怕,甚至有人透過AI模型學習,可攻擊世界上任何一個網站。

她援引哈佛法學教授雷席格所說,「我們正處於AI的『奧本海默時刻』,好壞永遠並存」。

許永真也說,雖然要擔心資料外流的問題,但更應該正視台灣失去數位話語權、失去自主發展大模型的機會,因此一年前就與專家團隊一同建議台灣應該建造自己的AI對話引擎,在國科會指導下,成功打造出TAIDE可信任AI對話引擎。

她分享,TAIDE是站在巨人肩膀上,選擇以英文為母語的Llama模型,再透過中文資料繼續訓練;許永真比喻「就像在教一個在美國長大的ABC學會講中文」,透過英文基礎教育、中文基礎教育、中學教育、高等教育等加強學習。

在算力有限的狀況下,TAIDE去年6月就成功完成第一階段展示,她表示,目標是成為可商用模型,讓台灣百工百業都來使用,其條件包括基礎模型必須可商用,也要有充足的可商用授權中文相關資料。

許永真分享,Meta去年7月推動可商用的Llama 2,並在今年4月19日公開釋出Llama 3新一代的大型語言模型,團隊僅用4天就完成模型訓練;接下來的挑戰是透過可商用中文資料訓練,目前已經有許多中文授權資料量,也歡迎各界交流資源。

她強調,TAIDE不是要去和各大語言模型抗衡匹敵,但希望能提供台灣中小企業,甚至不願意資料外流的金融業一個安全可靠的語言模型,也期待民間力量來把這個專案商轉,一起來共同壯大。

AI

延伸閱讀

挑戰Sora!陸發布首款國產文字描述生成影片AI模型

大陸獨角獸企業369家 全球第2

台灣AI引擎TAIDE再升級 國科會釋出8B模型

紳士名作《搾O病棟》雨宮醫生模型公開 喂喂...你在大聲什麽啦!

相關新聞

台積電先進封裝產能被訂光 輝達、超微一路包到明年

AI應用百花齊放,兩大AI巨頭輝達(NVIDIA)、超微(AMD)全力衝刺高效能運算(HPC)市場,傳出包下台積電今、明...

氣象署與太空中心合作 提高氣象預報的準確度

台灣首顆自製氣象衛星「獵風者」(Triton)去(2023)年10月順利發射升空,今(2024)年6月將和福衛七號攜手,...

力積電銅鑼廠落成啟用 蔡總統卸任前參加半導體廠的最後一場完工典禮

力積電斥資3000億元在苗栗銅鑼科學園區興建的12吋晶圓廠今(2)日落成啟用,力積電董事長黃崇仁親自主持,並宣布已完成首...

前進新加坡設12吋廠?世界董座方略:需四要素完備才會「上馬」

世界先進因應地緣政治風險採行海外設廠成為今日法說會法人關注焦點,世界董事長方略表示,由於世界先進8吋產能擴充已幾乎極限,...

廣達AI伺服器製造據點曝光 「這4廠」撐起市場半邊天

代工大廠廣達(2382)董事長林百里4日指出,整個AI市場的發展前景都還是很好,而目前旗下產能也都還在擴,廣達也會在這個...

微軟AI營收一年成長4千億 世界第一大公司為何說壓力大了?

微軟大力投入的Copilot尚未賺錢,加上生成式AI領域高速競爭,微軟挑戰與壓力也日益變大。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。