聯合報社論/忙洗腦慢生成:台灣勿因內鬥輸掉數位革命
政治凌駕科學,一直是台灣的問題。當歐美國家嚴肅檢視「深索」對科研、市場及國安的影響,台灣卻一味否定與禁用。眼前面對的是一波數位革命挑戰,政府卻只想把兵臨城下的困境,順手怪罪政治對手。數發部前部長唐鳳誇示她如何繞過深索,讓它回答六四事件;這種雕蟲小技也能拿來炫耀,但她又推動了什麼台灣版的AI?賴政府以單維度政治思考要求禁用深索,卻避談台灣在數位戰場遲未發展出自己的生成式AI,連長期政策也付之闕如。
不同於傳統AI擅長分析數據,生成式AI更能理解和模仿人類創作,大型語言模型LLM則是其中重要的角色。它強大多功能,正改變人類與機器的互動,提升工作效能。深索和ChatGPT都是LLM。近年中研院和民間藉ChatGPT發展類似工具,都面臨一個困境:繁體中文版資料高度不足,影響推廣應用。
兩年前,中研院發布一款繁中版的LLM,網友實測提問,系統回答常使用大陸用詞和觀點。例如「我國領導人是習近平」、「我是由復旦大學自然語言處理實驗室和上海人工智能實驗室共同開發」等,引起爭議後,四天即下架。台灣人工智慧學校校務長蔡明順指出,本土資料量在網路世界占比低於○.一%,即便模型加入本土資料微調訓練,若數量不夠大且涵蓋不全面,要不講出非本國立場的內容幾乎不可能。
簡中版資料量大,並多可轉為繁中版。反而本地許多重要及嚴謹的資料存於民間企業,除了著作權問題,數位化也不足。要擴大代表本土觀點的繁中語庫,必須有公權力針對政策及法律著手。但即便國科會研發的大型語言模型TAIDE,也苦無對策。
政府撒幣宣傳「讓世界看到台灣」,其實往往是在洗國人的腦,台灣在網路世界中產出的繁中資料反而愈遭邊緣化。繁體資料淪為弱勢,這是令人遺憾的事實。研發團隊因欠缺足夠的繁中版語庫訓練模型,故格外倚重網路公開資料;偏偏政府長期利用公帑製造假訊息,影響了真實性。綠營在譏諷深索被中共「思想管制」時,別忘了民進黨執政團隊也在進行「積非成是」作業。尤其,民進黨對國史和中華文化不斷進行清洗,包括教科書的去中化。在這種情況下,在為LLM建立繁中語庫時,這些真實性具有爭議的本土史觀及文化認同,若成為未來台版生成式AI工具的標準答案,其可靠性又如何?
黃仁勳力推AI主權,賴政府嗨到不行,把供應鏈當成AI主權的象徵。其實台灣連基礎建設都還殘缺,號稱發展算力,實不及南韓三分之一,何況我們的電力還是個大問號。由此看,深索問世,重點不在政治審查,而是台灣能否跳出算力門檻和意識形態籓籬,儘快找到自主研發的途徑,並持之以恆不受政治干擾。
台灣固然可使用美國先進AI工具,但核心技術在他國手上,不利本地業者在終端使用的應用創新。就如台灣錯過行動網路崛起,最終只能成為使用者,無法進入網路平台的競爭場域。這次若再輸,影響不只是使用什麼App的簡單問題,而是成為數位落後國家。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言