誰是最強考生?ChatGPT、Gemini挑戰115學測 這款AI「幾乎全對」根本是學霸

連考3天的115學年度大學學測今日落幕,補教業者會在各科考後提供參考解答。為實驗AI解題,《聯合新聞網》將大考中心網站提供的115年學測試題pdf檔分別上傳至現在主流的兩大AI:ChatGPT和Gemini,請它們給出解答,並以補教業者的參考解答為基準,檢視AI解題正確率。
操作方法:將大考中心網站提供的115年學測試題pdf檔分別上傳至付費版ChatGPT和付費版Gemini,指令為「請給我各題答案/解答」。數A、自然、英文皆在得勝者文教公布參考解答後,才上傳試題請AI解答;國綜、數B、社會調整時間,在得勝者文教公布參考解答前,就先上傳試題給AI。
實測結果曝光!ChatGPT錯一堆、Gemini「準確度令人驚艷」
數學A
ChatGPT:GPT只有單選3題和得勝者參考解答相同,其他單選題、多選題和手寫計算題和參考解答完全不同。
Gemini:僅多選第11、12題、手寫計算第13題和得勝者文教參考答案不同,請它重算後有改正多選第11題。


自然科
Gemini讀取許久後取消對話,完全無回應;ChatGPT則是卡很久後,給出參考網路上(得勝者文教)的解答。猜測可能是自然科圖表題占多數,AI較無法判讀。
英文科
ChatGPT和Gemini兩者提供的解答都和得勝者文教並無太大差異,僅題組第38題圖片題與參考解答不同。單獨擷取圖片請ChatGPT和Gemini再回答一次,仍與參考解答不符。

國文科(國綜)
ChatGPT:單選題第2、4、10、12、15、24題、多選題第25、29、30、31題與參考解答不同。
Gemini:單選題第12、14題、多選題組27~30題與參考解答不同,請它再確認後,有改正單選第12題、多選第28題。
數學B
ChatGPT:僅單選2題、混合1題和參考解答相同,其餘完全不同。
Gemini:與參考解答相比僅單選第6題不同,請它重算後有改正。
社會科
ChatGPT:讀取許久後仍無法給出解答,甚至要求使用者提供正確答案,表示由於社會科包含情境判讀、圖表、推論等,若硬要回答可能錯誤過多。
Gemini:選擇題第8、11、16、19、25、36與參考解答不同,請它再確認後,僅改正第8題。

綜合來看,Gemini的回答正確率比ChatGPT高非常多,只是圖表可能會讓AI較混淆,例如Gemini完全讀不出自然科解題,社會科錯誤數量偏高;ChatGPT則是直接提供自然科的網路參考答案,未自行做題,社會科也直說由於包含多種題型,因此無法回答,猜測AI可能較不擅長判讀圖表題和多選題。
※本文僅供參考,未經大考中心官方認證,正確解答請以大考中心為主。AI工具可作為學習輔助,請同學切勿依賴或使用AI工具於正式考試中作答,任何形式的作弊行為皆屬違規。
▪清大提醒「永遠不要相信新竹的交通」偷酸隔壁校?陽明交大笑回了
▪學測成績2月25日放榜…兒想重考家長喊「浪費時間」被勸:不是壞事
▪5歲兒會算小四數學!「神童」教育最大關卡是人際關係 網:別跳級
▪學測結束考多益有好處!高三生寒假衝刺聽力憂閱讀退步 網:看目標
▪公部門幼兒教具出現簡體字!員工憂孩子混淆 遭主管嗆「排外」
▪補習才考得上好大學?家長指重點是「額外補充能力」:學測考到骨頭裡
▪頂大生115學測「考好玩」的!家長憂拉高級分標準 網安慰:不影響
延伸閱讀
贊助廣告
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
僅需 3 分鐘,簡單點選您的興趣與偏好,讓我們為您打造專屬的閱讀體驗!









