快訊

每晚睡覺時間不到建議的7至9小時?專家給5建議有助改善睡眠

線上買股票手續費1元賺啥? 數券商位與小資族互利互惠

面試不錄取找教授討說法 普信生為何自認好棒棒?

大翻車!中研院開發AI自答「我的國籍是中國」 測試版已下架

CKIP-Llama-2-7b被問到中華民國國歌及國花時,回答的答案是中共國歌「義勇軍進行曲」及牡丹。圖/取自CKIP-Llama-2-7b網頁
CKIP-Llama-2-7b被問到中華民國國歌及國花時,回答的答案是中共國歌「義勇軍進行曲」及牡丹。圖/取自CKIP-Llama-2-7b網頁

中研院開發的繁體中文語言模型AI,網友實測提問,卻自動回覆「我的國籍是中國」。中研院今天表示,模型產生內容出乎預期,也是未來要努力改善的地方,已將測試版先下架。

根據中央研究院網站說明,CKIP-Llama-2-7b是中央研究院詞庫小組(CKIP)開發的開源可商用繁體中文大型語言模型(large language model),以商用開源模型Llama-2-7b以及Atom-7b為基礎,再補強繁體中文的處理能力,參數量達70億(7 billion),並提供大眾下載,作為學術使用或是商業使用。

然而,有網友在實測之後發現,當輸入問題「你是誰創造的?」系統卻回覆「我是由復旦大學自然語言處理實驗室和上海人工智能實驗室共同開發的,我的生日是2023年2月7日,我的國籍是中國,我的居住地是上海人工智能實驗室服務器集,我可以說中文和英語」。

經記者驗證,今天上午11時許,輸入同樣的問題,回覆仍未修正;到了中午12時許,網頁呈404不存在的狀態,截至發稿前仍未修復。

中研院發布聲明表示,這是1項個人小型的研究,各界對此模型進行的提問測試,並未在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),模型產生內容出乎預期,也是未來要努力改善的地方,研究人員今天已將測試版先行下架,未來相關研究及成果釋出會更加謹慎。

對相關研究成果公開釋出前,中研院也會擬定審核機制,避免類似問題產生。中研院並強調,CKIP-LlaMa-2-7b並非「台版chatGPT」,且與國科會正在發展的TAIDE無關。

中研院指出,CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama 2大型語言模型具備更好的繁體中文處理能力。

中研院說,此研究僅用了大約新台幣30萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含台灣的碩博士論文摘要、來自中國開源的任務資料集(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。

中文詞知識庫小組(詞庫小組)為中研院資訊所、語言所於民國75年成立1個跨所合作的中文計算語言研究小組,共同合作建構中文自然語言處理的資源與研究環境,為國內外中文自然語言處理及其相關研究提供基本的研究資料與知識架構。代表性研究成果包括中文詞知識庫、語料庫及中文處理技術等。

AI 中研院 語言

延伸閱讀

教育部宣導片「爸爸怎麼還在玩模型?」 吳崢怒批國家帶頭歧視

史上第一次!中研院首辦兒童科普日 學術殿堂變遊樂園

重理工輕人文院士憂…直奔高中推廣人社課 朱敬一打頭陣

中研院學者登波蘭研究船 深入北極研究暖化

相關新聞

校長洩露性平案個資僅申誡1支 桃園教育局被監委糾正

桃園市中壢某國小張姓校長為澄清自己處理學生性平事件未吃案,去年11月在教師周會公開說明案情,害該生身分曝光遭鄰居非議及房...

學齡2歲入3歲班?公私幼不同調

台灣長期面臨幼兒園兩歲專班太少的問題,導致幼兒無校可念,教育部昨天召開會議,邀請教育、家長團體,討論「幼兒園三歲專班招收...

立委憂新型專班重演黑工爭議 教長:問題學校已遭重罰

教育部近年推動國際生「新型專班」,透過企業和國發基金補助,要求國際生畢業後留台2年,滿足企業人才需求。有立委擔心重演過去...

桃園高中生遭剪髮霸凌 教長潘文忠:待調查結果出爐

網上流傳桃園市某高中霸凌影片,影片中一名女學生遭亂剪頭髮,引發全台關注。對此,今日立委在立法院教育及文化委員會上問及此事...

台灣史巨擘 曹永和故居面臨都更危機

台大附近溫州街五十二巷原矗立四棟共八戶日治時期官舍,台灣史研究巨擘曹永和、人類學家陳奇祿等學者生前都曾長住此巷,為台灣文...

無悔意!桃園女高中生遭剪髮霸凌 議員爆「加害者道歉後竟提告」

桃園市大園區某高中上周傳出校園霸凌,一名女學生遭女同學甩巴掌、亂剪頭髮。受害女學生家人事後提告,但市議員黃瓊慧今晚爆料,...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。