David Hand (2016). Measurement — A Very Short Introduction. New York: Oxford Univ Press.
真難以想像,116 頁巴掌大的一冊小書,可以在這麼廣的範圍裡舉出這麼多的例子,闡明這麼深的觀念。我學了好多好多事,包括「社會學的測不準原理」,還有一件我本該知道卻沒放在心上的事(作者寫了兩遍,我印在心上了):物理性質皆可被六種基本屬性 (attributes) 表達出來,其中第六種是「角」。前五種都是顯而易見的:長 (L)、重 (M)、時 (T)、溫 (R)、電荷 (C),倒沒有想到「角」(A) 有這麼基本!注意在綱量分析 (dimensional analysis) 的意義之下,「角」是無單位量 (dimensionless)。
但基本屬性並非基本單位。1960 年第 11 屆國際度量衡大會 (General Conference for Weights and Measures) 達成了「公制」(Système International d'Unités) 共識,簡記為 SI,其中規定了七種基本單位:長 metre (m)、重 kilogram (kg)、時 second (s)、電流 ampere (A)、溫 kelvin (K)、物質量 mole (mol)、亮 candela (cd)。(Page 7: 7 basic units)
以下,我先記載跟數學教育相關的資訊。首先,我再度看到畢達哥拉斯的金句,這回記下來:
人是萬物的尺度
Man is the measure of all things.
其次是我替數學教育感到高興的一段內容,即 Page 79 提到的主觀機率:
Bayesian statisticians interpret probability not as an objective property of objects in the world but as a subjective mearsure of strength of belief that a person has that a statement is true or an event will occur. This strength of belief can be related to the size of bets the poerson should be prepared to make that particular outcomes will occur. Eliciting the sizes of these bets can thus lead to measurements of (subjective) probabilities.簡單說,主觀機率是貝氏統計專家心目中的「機率」意義,它不是物質世界客觀性質,而是心靈上的主觀信念。至於如何可以測量這個信念的強度?利用那人願意投注的賭金,可以幫助測量。這一小段話,若是能在我寫課綱初稿之前讀到,就更好了。現在讀,相當於再度確認我們在課綱裡推動的主觀機率方向正確。數學金童 John von Neumann 試圖發展這種數學,我還沒能掌握他這方面的理論。
第三件數學教育相關資訊,是作者在 Pages 91–94 簡介了統計方法引起的自然與社會科學交流。作者首先釋字:Statistics 源於 the study of matters of state,再詮釋為
The study of numerical summaries of social and economic phenomena in human societies.「對人群活動產生的社會與經濟數據所做的研究」。我很樂意接受這個「統計」定義。在這裡,驚喜看到作者引用邏輯學家 George Boole 出版於 1854 年的 Laws of Thought 一句話:
... phenomena, in the production of which large masses of men are concerned, do actually exhibit a very remarkable degree of regularity.社會現象,只要涉及的人數夠多,就會出現某種程度的正規性 (regularity),包括以統計上的相關係數表現出來的正規性,例如 1850 年代在倫敦的自殺率與未寫收信人地址的郵件比率。社會學引用的統計,觸動了自然科學的採用,作者提出 Maxwell 和 Boltzmann 都有證據顯示他們的物理思維受到社會統計的啟發,後者的關鍵人物與著作包括 Thomas Henry Buckle 於 1857–78 出版的 History of Civilization in England 三冊,以及 Adolphe Quetelet 於 1835 年出版的 A Treatise on Man: And the Development of his Faculties;他稱這份作品為社會物理學 (Social Physics)。Quetelet 的書引用了高斯的誤差分布理論。而運用統計方法的物理,再接著啟發經濟學。例如作者指出美國物理學家 Gibbs 的熱力學模型啟發經濟諾貝爾獎 Paul Samuelson 的作品 Foundations of Economic Analysis,而首屆諾貝爾經濟獎發給兩位本科為物理的學者:Irving Fisher 和 Jan Tinbergen。
接下來,我抄寫兩段引文,因為它們寫得太美了。其中第一位引用的作者,也算是一名數學家。
(1) Robert Recorde (1512–58,醫師、數學家,等號「=」發明人):
Wherefore in all great works are Clerks so much desired? Wherefore are Auditors so well fed? What causeth Geometricians so highly to be enhaunsed? Why are Astronomers so greatly advanced? Because that by number such things they finde, which else would farre excell mans minde. (Robert Recorde, 1540)
(2) Richard Shryock (1893–1972,醫學史家):
One detects the feeling that meansurement somehow robs human phenomena of all mystery or beauty, and denies to investigators the satisfaction of age-old sense impressions and of intuitive understanding. Such feelings usually appear within any discipline when it is first threatened, as it were, by quantification. Dr Stevens terms it, in relation to current psychology, "the nostalgic pain of a romantic yearning to remain securely inscrutable. " (Richard Shryock, 1961)
以下則是一些零星的紀錄。《萬物的尺度》(The Measure of All Things) 作者 — 美國西北大學歷史學教授 Ken Alder — 也有一句優美而深刻的洞察:
測量不只是社會的創造,它也創造了社會。簡單說:你怎麼測量,社會就長成什麼樣。臺灣讀者可能更容易理解的詮釋是:你考什麼,年輕人就學什麼;你怎麼考核,就錄取怎樣的人。過去一千年,華人社會的一個重要教育測量就是「科舉」考試,所以說「科舉」塑造了華人知識分子的社會性格,直到今日仍有跡可尋。Alder 這一洞察也可作為「社會學的測不準原理」之概念把手。
Measures are more than a creation of society , they create society.
「社會學的測不準原理」有若干種表述方式。很著名的霍桑效應 (Hawthorne effect) 就其中比較輕鬆的一款,意思是心理學上的一種實驗者效應:當被觀察者知道自己成為被觀察對象而改變行為傾向的反應。更為嚴重的則有 Goodhart 律以及 Campbell 律,意思差不多都是測量的方法或規準,導致社會中個人行為的扭曲。
Alder 那句引言像極了我在《文化脈絡中的數學》說的:
數學不只是文化的創造,它也協助創造了文化。但我寫這句話時,還沒讀這本書。
測量可分兩大類:單位測量 (representational measurement)、語意測量 (pragmatic measurement)。前者可以用單位量的倍數來表達,所有物理量都是如此,而後者則是不得以的妥協,在語言上達成實用的目的即可,在經濟、醫學、心理、社會等領域,不得不使用這種測量。
語意測量的一些範例如下。
測量無非要量化。排斥測量的意見,主要是對「量化」的疑懼;他們的信念可能是: (Page 15)
... the belief that the extra information that measurement brings somehow reduces our understanding and depth of experience.作者這麼措辭,其實有點不懷好意。但我不禁想到,發生在我高中、大學年代的數位音樂,當時普遍的說法是 CD 光碟失去了黑膠唱片的「溫度」。
《萬物的尺度》已經說明歐洲度量衡的紊亂情形,這是當時法國科學院設計「公制」的主要理由。Page 5 舉出許多個案。例如 J. H. Alexander 調查 1850 年代的 ell 共有 110 種不同的長度。Ell 是源自蘇格蘭的長度單位,中文翻譯為「厄爾」,主要是紡織業的慣用單位。Ell 大約是 3 cubits(腕尺)。而且別以為度量衡的歧義是「古時候」的事,直到 1959 年「碼」yard 才達成國際共識的定義,而直到如今美國的「畝」acre 還是比英國的「畝」稍大 240 平方公分;我知道品脫 pint 大約是 500cc,其實美國的定義是 473cc,但在英國是 569cc。
Page 7 說了一則因為單位失誤而釀成大錯的例子。1998 年 12 月 11 日 NASA 發射的火星氣候衛星 (Mars Climate Orbiter) 在 1999 年 9 月 23 日預備進入環繞火星軌道時失敗解體,原因是當時需要點燃的推進器力道太大,而計算錯誤的原因是把「力」的單位從牛頓 (N) 誤植為磅 (lb)。其實我也聽國家太空中心 (TASA) 主任講過一則類似的失敗故事,那是在火箭控制的實驗當中,某次感覺非常穩定,正在高興時,它忽然就墜落了,原因是燃料燒完了。事後發現,充填燃料時,測量單位不慎從公斤切換為英磅。
看起來好像英制單位總是惹麻煩。但一句有趣的美國兒科醫師俗話:4-year-old children are square;四歲孩童是正方形。意思是 — 僅當以英吋和英磅作為單位時 — 四歲孩童的身長大約等於體重。(Page 114)
學科考試都算是心理測量 (psychological tests)。心理測量有廣泛的方法,常見的紙筆測驗應該算是一種自導問卷 (self-administered questionnaire),此外也有非常嚴格的結構式訪談 (structured interview),現在還有由電腦控管的測驗或問卷。(Page 84)
Pages 81–83 簡要介紹了古典測驗理論 (Classical Test Theory)、信度 (reliability)、Rasch 模型、試題分析 (Item Analysis)、難度 (difficulty value)、鑑別度 (discriminability score)、項目反應理論 (Item Response Theory, IRT — 其實項目就是試題的意思)。Page 108 再度提及信度與效度 (validity),也提出另一組相應的英文:precision vs bias。圖 7 用兩幅漫畫展示了信度與效度。
Flynn effect(弗林效應)是發現智力測驗的結果(某種 IQ)在百年之內明顯上升。如果這是生物性質的事實,豈不是說我們的先祖都是白癡?這未免太荒唐。可能的解釋是我們的世界越來越符號化,所以人們越來越熟悉智力測驗的題型。(Page 89)
Page 102 引用 Robert Kennedy 1968 年的演講。就一名政客來說,這話說得是漂亮了。但那是 1968 年啊,如今政客的語言已經改變,不會再說這種話了。
Our gross national product ... measures everything, except that which makes life worthwhile.而那些值得活著的產物是些什麼呢?他的修辭也值得看看:
the health of our children, the quality of their education or the joy of their play, the beauty of our poetry or the strength of our marriages, the intelligence of public debate or the integrity of our public officials.