數學英文
統計表與分組資料
資料的呈現 (representing data / data representation)
無非就是表 (table) 和圖兩大類;
在數學課程裡,常稱呈現資料的表格為「統計表」。
表格當然都是二維的 (two-dimensional),橫向稱為列 (row),直向稱為行 (column)。
所謂 3 乘 4 (3 by 4 或 ) 的表格,意思是有 3 行、4 列的表格;
注意,這個說法與矩陣 (matrix) 的習慣相反:所謂
的矩陣意思是有 3 列。
每張表格應該有一個標題:table title 或 caption,
表中的一格稱為 a cell,
而每一列或每一行的最前面那一格(列的最左邊,行的最上邊)可能是表頭
(table heading),其內容 (table headers) 呈現那一列或那一行資料的意義。
統計表的設計可謂一門藝術,根據資料特性與使用目的,
有很大的創新 (innovation) 空間。
數學課只提供最刻板的兩大類統計表:次數表 (frequency table) 和列聯表。
次數表通常呈現一組資料的分布 (distribution),
而次數又有兩種表達方式:實際紀錄的非負整數,又稱為絕對次數
(absolute frequency),或者絕對次數佔總資料量的比例,通常用百分比表示,
稱為相對次數 (relative frequency)。
如果蒐集的是可以排序的有序資料 (ordinal data,包括數值資料),
則可以依序累計發生的次數,
用這種方式來呈現分布狀態的表格,稱為累積次數表 (cumulative frequency table)。
累積次數也有絕對、相對兩種表達方式。
為了跟累積次數表有所分隔,次數表也稱為次數分布表
(frequency distribution table)。
如果蒐集的是數值資料,則可以將資料分組 (data binning 或 data bucketing),
形成分組資料 (grouped data) 再計算各組的次數分布
(grouped frequency distribution)。
分組資料的各部位名稱如下。
-
分組後的一段稱為 a class,俗稱 a bin 或 a bucket;
如果是離散的數值資料,也就是整數資料,可以用例如 0--4、5--9 來分段;
如果是連續的數值資料,也就是實數資料(包括有理數資料),則用半開區間表達,
例如 、。
每一段的數值範圍稱為組區間 (class intervals)。
組區間應該接續、無交集,且涵蓋全部的資料範圍 (consecutive, non-overlapping
and cover the full range)。
-
組區間的上限 (upper class limit) 及下限 (lower class limit)
合稱為組限 (class limits)。
-
前後兩個組區間的組限平均值,稱為組界 (class boundary)。
精確地說,某個組區間的上限,以及後一個組區間的下限,
所得的平均值是前一個組區間的上界 (upper class boundary),
同時也是後一個組區間的下界 (lower class boundary)。
-
組上界與組下界 (upper and lower class boundaries) 之差稱為組距 (class width
或 class length 或 class size)。
應該盡量使每個 class 的組距皆相等,但這並非必須。
-
組區間的上下限中點,或者上下界中點,都可以作為組中點 (class midpoint 或
mid-interval value)。
從分組的資料分布計算描述統計量(集中量數、分散量數),
是中學統計的主要程序性學習內容。
分組後的一個 class 也會被稱為「一組資料」,
這時要小心,它跟最初說的「一組資料」(a data set) 意義不同。
Created: Jan 24, 2023
Last Revised: 11/11
© Copyright 2023 Wei-Chang Shann 單維彰
[Home Page]
shann@math.ncu.edu.tw