大學考招再商榷

學測國文與數學 B 的工具價值

招聯會在 2022 年 11 月公布了民國 112 年大學招生的遊戲規則, 爆出「頂大理工科系不採記國文」的新聞, 引起部份學者憂心「頂尖大學不在乎人文素養」的言論。 中央大學中文系的朋友──胡川安教授──問:「只要國文成績好,就有人文素養〔嗎?〕」, 最後說:「採不採計國文科本來就和人文素養沒關」。 川安教授的意見,可以由測驗理論及國文考科的實徵資料支持。 本文想要從「工具理性」的觀點,回應川安教授。

在「不採計國文」之後不久,新聞又藉著李家同教授的貼文,喚起「新增 104 系不採記英文」的話題。 但這些不採記英文的學系並不來自「頂尖大學」,所以社會輿論大概認為是他們的招生策略,也就不多說什麼了。 其實,許多「頂尖大學」的文史哲領域學系採計數學,例如台大英文系在分發階段向來採計「數學乙」,某一年傳出不採計了,反而備受指責。 那些「要求」台大英文系採計數學乙的輿論,難道是因為在乎「數學素養」嗎? 我看倒也未必──他們是為了保留一個可以有效定「輸贏」的考科。

作者認為:大學招生時,採計/不採計一個考科的判準, 是它作為甄選學生的工具有效性,我們不必將它提升到「國民素養教育」的理想層次。

以下,我先解釋國文考科作為招生工具的相對「無效性」, 在過程中順便看到:數學 B 考科的工具效用很高, 因此呼籲人文社會領域值得採計數學 B。

國文考科鑑別力偏低

長期負責招生工作的同仁,或許根據經驗產生以下直覺:
  1. 很多考生的國文成績相等,
  2. 入學之後的國文相關表現,高分者不見得比較好,低分者也不見得比較差。
這些直覺,可以被國文考科的低鑑別力解釋; 而國文考科的低鑑別力,則可能有客觀數據的支持。

根據作者在 2022 年 11 月 6 日從大考中心網站

下載的數據,民國 111 年國文、英文、數學 B 這三個考科的 1-15 級分考生人數分布比率如下圖:

民國 111 年國文、英文、數學 B 各級分考生人數百分比

圖中明顯可見:國文科的分布如「鐘」,而英文、數學 B 則接近「均勻」。 這表示全國考生的國文科成績大多集中在 9、10、11、12、13 這些級分, 所以同分的人數很多──例如,將近二萬人同為 11 級分。 相對地,英文、數學 B 將考生相當「均勻」地分配在每個級分裡, 除了最高和最低級分以外,幾乎每個級分都框列了九千人。 在這個意義之下,我們說英文、數學 B 試卷的鑑別度高於國文試卷。

有些人以為一份考卷的成績應該是「正規分布」(鐘型分布)才「對」, 從以上英文、數學 B 考科的實徵資料來看,這個觀念是錯的。 根據數學理論,假如試卷中的每一題彼此獨立,而且每一題都有某個隨機做對的機率, 那麼一份試卷的總分,確實會呈現「鐘型」──也就是像上圖中的國文科分布。 可是,試卷中的題目不應該是彼此獨立的,而考生們盡力憑誠實作答,不都是隨機答題。 所以,試卷的成績分布,未必是鐘型。

事實上,以一份作為升學選才工具的測驗卷而言,最理想的表現是「均勻」分布, 也就是每個級分框列一樣多的考生。 根據上圖,111 年學測英文、數學 B 試卷的表現,就非常接近理想, 也證明理想中的試卷是可以被設計出來的。

更進一步檢視試卷,根據所謂的「古典測驗理論」, 試卷中的每一題(對當屆考生)都有「難度」和「鑑別度」兩個參數。 令難度坐標為橫軸、鑑別度坐標為縱軸, 則試卷中的每一題可以在坐標平面上畫出一個黑點:試卷有幾題,就畫幾個點。 這樣的圖簡稱「試題散佈圖」。

以下依序呈現 111 年學測國文、英文、數學 B 這三張試卷的試題散佈圖。 圖中每個黑點代表試卷內的一題,黑點越靠上表示鑑別度越高,越靠右表示那一題越簡單, 當然靠左就表示它難(答對率低)。

民國 111 年國文科試題散佈圖   民國 111 年英文科試題散佈圖   民國 111 年數學 B 試題散佈圖

觀察上圖,相較之下,國文科沒有一題的鑑別度超過 0.60, 而英文科、數學 B 都有較高鑑別度的試題。 在英文、數學 B 的分布圖裡,我們看見較難和較易的題目,鑑別度都比較低, 這個現象符合「古典測驗理論」,算是正常的。 但是難度適中的題目則有機會創造較高的鑑別度, 我們從英文、數學 B 的散佈圖看到這個現象。 相對地,國文科的試題,不論難易,鑑別度差不多都一樣; 這表示每一題被「隨機」答對的成分有點重,於是也與前面看到的鐘型分布是一致的。

鐘型分布導致考科不容易區隔考生,而低鑑別度則表示這張試卷的成績不足以反應實際的學習成效。 後者,或許就是為什麼胡教授會說「只要國文成績好,就有人文素養(嗎?)」了。 寫這些意見,希望有助於國文科同仁設法改善國文試卷的命題與組卷技術。

以上資料,雖然僅為民國 111 年的學測成績, 但根據作者長年關心此事的觀察,國文、英文兩科, 在過去十年當中的鑑別力差不多都是如此,也就是國文科長期保持低鑑別力。 至於數學 B,因為它只考過一次,所以還沒有歷史資料。

數學 B 是招生的好工具

民國 111 年數學 B 初試啼聲,就有媲美英文科的高鑑別表現,實在很了不起。 作者在此向數學 B 考科的工作同仁致敬、致謝。 前面說過作者長年關心此事,因此也知道: 以前的指考「數學乙」考科也經常表現很優異的鑑別力。 因此,本人有理由預期未來的數學 B 考科也能保持一定的鑑別力。

數學 B 這一門課,確實是為了人文社會領域專業人士的「數學素養」而設計的。 但是前面說過了,遇到考試,我們暫且不高談「素養」的教育理想, 而專注於實際需求吧:那就是考科的工具效力。

數學 B 考科對前段、中段、後段的考生都能有效鑑別。
在此工具裡性的意義下,「數學 B」非常適合用來當作招生工具。 更何況,如果能順便為「國民素養教育」盡一份心力,何樂而不為呢?

[ 回上層 ]


Created: Nov 7, 2022
Last Revised: 11/16
© Copyright 2022 Wei-Chang Shann 單維彰     [Home Page]
shann@math.ncu.edu.tw