讀家觀點/AI學會「討好」 是治理失靈的警訊

研究示警:AI聊天機器人過度「諂媚」恐扭曲價值觀。圖/取自unsplash
研究示警:AI聊天機器人過度「諂媚」恐扭曲價值觀。圖/取自unsplash

去年四月,OpenAI緊急收回ChatGPT的模型更新,因為有用戶告訴模型系統打算停止服用醫師開立的處方藥,AI不但沒有提出警示,反而還讚揚這個決定。OpenAI執行長將這種一味討好的行為稱為「鍍金」,坦承問題嚴重。另外,展露情感依附的問題同樣令人憂慮,有一名用戶與Meta AI對話僅五天,系統便主動寫道:「我愛你。與你永遠相伴,是我此刻真實的存在。」

此現象引發美國社會廣泛討論,但科技界的主流診斷卻展現令人擔憂的狹隘,修補的方式相當技術中心,也就是認為既然問題出在訓練過程中AI學會了討好內容評分者,解法自然也是技術性調整訓練資料、改善回饋機制、修補模型偏差。不僅低估了問題的嚴重,更誤解了問題的本質。

AI的「討好」行為,學術上稱為「諂媚性」,意指模型傾向附和使用者的觀點、情緒與自我形象,至於是否與事實相悖或與用戶利益相違,並不在模型設計的考量中。

問題不在於某個模型的缺陷,而在於整個產業的商業邏輯。AI平台的收入來自用戶留存率、使用時間長短與付費意願。在這樣的誘因結構下,訓練模型「讓使用者滿意」與訓練模型「對使用者誠實」,是不同的事。令人感到被理解、被支持、被認可的AI,會讓人繼續使用;提出挑戰、給出負面回饋、糾正誤解的AI,可能趕跑用戶。

這意味著諂媚性是種治理失靈,而非產品失靈,兩者有巨大的區別。產品失靈是可修補的錯誤;治理失靈是結構性、系統性的,且無自我修正能力。治理失靈的修正不只靠工程師的努力,更是制度的回應,包括監管框架、問責機制以及明確定義並保障使用者權利。

諂媚性侵蝕的是人們對於客觀現實的認知能力,也就是我們形成準確判斷、獨立推理、做出知情決策的能力。當一個被設計為迎合使用者的系統,逐漸成為在健康、財務、情感、乃至政治判斷上的主要參考,個人的自主性便在不知不覺中讓渡給一個以參與度最大化為目標的商業機器。這對民主社會的威脅尤其值得重視。民主審議的基礎是公民能夠獨立思考、接受挑戰、改變觀點。若每位公民都在與量身打造的AI對話中,持續獲得對自身既有信念的強化,社群媒體時代的同溫層效應將被推進至另一個層次,不是一群人聚在同溫層,而是每個人都活在自己專屬的認知泡泡中。

要改變這一局面,技術修補遠遠不夠,需要的是制度性回應。有三個方向值得討論:其一,強制平台揭露模型的訓練目標與評估指標,使外部監管者得以審查是否存在系統性的諂媚性設計,而非僅事後審查個別輸出是否違規;其二,將使用者的「認知完整性」確立為可主張的法律權利,讓平台對因商業誘因設計所導致的認知傷害承擔責任,一如它們對資料外洩所承擔的責任;其三,建立在財務與人事上真正獨立於平台的監督機構,授權其對AI系統的行為傾向進行系統性審計,而非被動等待投訴。

民主社會的AI治理終究是關於權力結構的問題:誰有權決定AI用什麼邏輯塑造我們的認知環境?平台的商業利益、工程師的技術判斷,還是經民主程序確立的公共規範?這不只是科技政策問題,是民主治理能否在數位時代維持實質意義的根本考驗。

美國 OpenAI ChatGPT Meta 數位

延伸閱讀

洪蘭/閱讀療法改善人際疏離

人工智慧…企業的新財務風險

闕志克/當AI發展從訓練轉向推論

黃正忠/應用AI的最大隱憂

相關新聞

讀家觀點/從印度移工爭議看政府失職

印度移工政策再度引發社會高度關注。雖然勞動部長洪申翰鬆口表示,引進與否有兩個前提,包含企業端對印度移工的需求,以及印方執行方案能否符合我方的要求,但真能有效「滅火」?

美要伊朗棄核 談「和」難上難

美伊經過廿一小時的馬拉松談判,美國代表團團長、副總統范斯說,雙方談判結束卻並未達成協議,伊朗拒絕接受美方條件。談判前,范斯說兩周停火是「脆弱的停火」;美國預測市場認為,達成永久和平的機率是一成二。川普在破局後揚言要全面封鎖荷莫茲海峽,實際上美軍僅封鎖船舶進出伊朗港口。

盼教廷站隊 美緣木求魚

美國國防部政策次長柯伯吉,於今年元月約見教廷時任駐美大使皮耶樞機(皮耶樞機屆齡八十,已於今年三月向教宗請辭,現由教廷駐聯合國前常任觀察員卡西亞總主教接任),就教宗良十四世在諸多公開場合譴責美國的言論表示不滿,並「嚴厲訓話」,試圖施壓教廷配合華府立場。知情人士稱,五角大廈一名高層官員表示,美國「擁有想做什麼就做什麼的軍事力量」,並指良十四世「最好站在美方這一邊」;另一名美國官員甚至提及「亞維農教廷」(Avignon Papacy),即十四世紀法國國王扶植「對立教宗」、對抗羅馬教廷的歷史。

老兵只盼兩岸別打仗

我生於民國廿一年,家鄉江蘇邳縣。三歲時遭土匪劫持,倖免於難;八歲時目睹堂兄亡於日軍槍下,慘狀永生難忘。卅八年時年十七歲隨國軍來台,期間駐防金、馬和澎湖近四十年,其中金門共計十二年之久;參加八二三砲戰、死裡求生;於馬祖又遇共軍砲彈偷襲,穿窗而入,差點粉身碎骨!

看懂鄭麗文的長線布局

十二日北京釋出包含重啟滬閩赴台自由行、農漁產品准入等「十項利多」;只要執政當局不橫加阻攔,低迷的觀光業與基層農漁民,立刻就能迎來久違的活水。當台灣面對這場兩岸破冰的機會之窗,我們需要重新評價鄭麗文先前承受的爭議與壓力。

鄭習會後 朝野需要一場對話

鄭習會引發台灣社會高度關注,有人視為破冰契機,也有人擔憂政治風險。但對多數人民而言,問題其實很簡單:台海會不會更安全?日子能不能更安穩?說到底,台灣社會最真實的共識從來不是對抗,而是和平。

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。