長春、和碩、長庚、欣興攜手新創 建立繁體中文專家模型
本土語言AI、專業領域AI受到各國政府與產業的重視。長春集團、和碩聯合科技、長庚醫院、欣興電子、科技報橘聯合發起,與台大資工系、台大資管系及律果科技合作,在 NVIDIA 支持下訓練的「繁體中文專家模型開源專案 TAiwan Mixture of Experts(Project TAME )」今天正式發表,是全球首創重量級多產業共同孕育的繁中大型語言專家模型,未來 Project TAME以Open Source 開放原始碼的形式,邀請產業一同加入、共創「台灣產業專用 AI 應用生態系」。
Project TAME 繁中專家模型開源計畫,由台大資工系副教授陳縕儂帶領實驗室同仁與企業夥伴開發團隊共同合作,使用 NVIDIA開發者計畫技術支持,讓多家垂直產業的企業專家貢獻專業領域的資料,預訓練近5千億個字(token)開發出繁中大型語言專家模型。包括長春集團、和碩聯合科技、欣興電子、長庚醫院、科技報橘、律果科技即為石化工業、電子製造、醫療服務、內容服務、法律等各產業代表,成為首批聯合投入 Project TAME 繁體中文模型訓練的業界專家角色。
Project TAME 繁體中文模型已有初步具體顯著成果,在各項繁中相關指標中領先全球模型,連台灣的「大學學測、律師/中醫考試、導遊證照、駕照、台灣在地化測驗」都分數優異,在台39項綜合評測,近三千個題目,Project TAME 分數就超過所有模型,正確率相較第二名的 Claude-Opus 模型高了6.8%,比 GPT-4o 甚至高了9.3%。
長春集團(大連)董事長林顯東談到決定參與 Project TAME ,在於他觀察到中國石化業正以前所未有的速度擴張,台灣可能花三十年才能推進100萬噸的產能,中國大陸在兩三年間就直接超車達到200 萬噸,因此長春集團更需要懂得應用 AI 預測分析,更快得知獲利、產品競爭上可能出現的風險。林顯東指出,長春集團的 AI 藍圖為建立涵蓋企業五大機能「產銷人發財」的戰情分析室。
和碩聯合科技指出,參與 Project TAME,希望透過開放式聯盟的創新合作方式,結合各產業領域的專家資料,以及學界大型語言模型的專業,加速產業生成式AI的應用,實現AI落地的場景。
林口長庚醫院院長陳建宗表示,將 AI 繁中大型語言模型導入醫療第一線,醫師只要在病歷上搜尋資料,就會彈出視窗顯示,以前沒有那麼方便,現在整合所有資料,又符合醫師作業習慣。
欣興電子參與 Project TAME,除了合作建立公開的繁體中文專家模型,也將透過公司內部資料庫,調校成內部專用的產業專家模型,預期在未來可為專業知識問答,提供更符合公司內部作法的準確建議,提升工作效率。
科技報橘已使用未經過繁中優化的大型語言模型推出測試的內容產製,在官網上的 AI 人機協作專區已可看到,但這一年的實驗顯示,勢必需要有繁中優化的大型語言模型才能更好服務社群用戶。
法律科技新創公司律果科技表示,法律內容有很強的在地化需求,因此協助 Project TAME 加入台灣法律語料進行訓練。台大資工系將目前各大型語言模型試用在台灣律師考試題目上,Project TAME 分數均超過所有其他模型。
繁體中文專家模型 Project TAME 正式對外發布後,將採用 Open Source 開放原始碼的形式,讓各產業企業有一個 Hub 中心可以進行合作。台大資工系副教授陳縕儂指出,在不同的資料間可能有共同交集可以使用, 這對語言模型的發展是更好的,也能讓不同產業的專家貢獻自己領域的資料。目前已開放各企業皆可免費下載使用「繁體中文專家模型 Project TAME」、模型聊天頁面、以及由亞太智能機器(APMIC)率先整合 Project TAME,提供聊天機器人測試頁。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言