誰是最強考生?ChatGPT、Gemini挑戰115學測 這款AI「幾乎全對」根本是學霸

連考3天的115學年度大學學測今日落幕,補教業者會在各科考後提供參考解答。為實驗AI解題,《聯合新聞網》將大考中心網站提供的115年學測試題pdf檔分別上傳至現在主流的兩大AI:ChatGPT和Gemini,請它們給出解答,並以補教業者的參考解答為基準,檢視AI解題正確率。
操作方法:將大考中心網站提供的115年學測試題pdf檔分別上傳至付費版ChatGPT和付費版Gemini,指令為「請給我各題答案/解答」。數A、自然、英文皆在得勝者文教公布參考解答後,才上傳試題請AI解答;國綜、數B、社會調整時間,在得勝者文教公布參考解答前,就先上傳試題給AI。
實測結果曝光!ChatGPT錯一堆、Gemini「準確度令人驚艷」
數學A
ChatGPT:GPT只有單選3題和得勝者參考解答相同,其他單選題、多選題和手寫計算題和參考解答完全不同。
Gemini:僅多選第11、12題、手寫計算第13題和得勝者文教參考答案不同,請它重算後有改正多選第11題。


自然科
Gemini讀取許久後取消對話,完全無回應;ChatGPT則是卡很久後,給出參考網路上(得勝者文教)的解答。猜測可能是自然科圖表題占多數,AI較無法判讀。
英文科
ChatGPT和Gemini兩者提供的解答都和得勝者文教並無太大差異,僅題組第38題圖片題與參考解答不同。單獨擷取圖片請ChatGPT和Gemini再回答一次,仍與參考解答不符。

國文科(國綜)
ChatGPT:單選題第2、4、10、12、15、24題、多選題第25、29、30、31題與參考解答不同。
Gemini:單選題第12、14題、多選題組27~30題與參考解答不同,請它再確認後,有改正單選第12題、多選第28題。
數學B
ChatGPT:僅單選2題、混合1題和參考解答相同,其餘完全不同。
Gemini:與參考解答相比僅單選第6題不同,請它重算後有改正。
社會科
ChatGPT:讀取許久後仍無法給出解答,甚至要求使用者提供正確答案,表示由於社會科包含情境判讀、圖表、推論等,若硬要回答可能錯誤過多。
Gemini:選擇題第8、11、16、19、25、36與參考解答不同,請它再確認後,僅改正第8題。

綜合來看,Gemini的回答正確率比ChatGPT高非常多,只是圖表可能會讓AI較混淆,例如Gemini完全讀不出自然科解題,社會科錯誤數量偏高;ChatGPT則是直接提供自然科的網路參考答案,未自行做題,社會科也直說由於包含多種題型,因此無法回答,猜測AI可能較不擅長判讀圖表題和多選題。
※本文僅供參考,未經大考中心官方認證,正確解答請以大考中心為主。AI工具可作為學習輔助,請同學切勿依賴或使用AI工具於正式考試中作答,任何形式的作弊行為皆屬違規。
▪文組怎麼贏台積電?律師點名三大科系最吸金:有人身價破10億
▪政大會研所招生疑洩題!考生揭補習班題型差異 網嘆:什麼時候墮落
▪書讀好沒有錯?頂大工程師見「路邊1景象」:說不清楚的挫敗
▪為何都去北部讀大學?他不解資源為何物 網曝3優勢:少走彎路
▪曾嫌無聊…她日檢N1、多益940待業1年 網推這些職缺:善用優勢
▪學測考生憂「沒醫學背景」個申被刷掉…網指真正影響在後面
延伸閱讀
贊助廣告
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。









