數學英文

直方圖及其他統計圖

長條圖 (bar chart) 也可以用來呈現連續型資料 (continuous data)。 連續型資料的值就是某個範圍/區間內的實數, 只能針對分組資料 (grouped data) 統計各組的次數分布 (grouped frequency distribution)。 連續型資料的次數分布長條圖, 縱軸是次數或相對次數, 橫軸是分組資料的各組區間,各長條的左右邊界就畫在組界上, 所以長條與長條之間沒有間隔 (has no gaps),如下圖。

bar chart without gaps between bars

數學教材經常把「無間隔的長條圖」(a bar chart without gaps between bars) 稱為「直方圖」(histogram),一般人也的確常這樣說。 或者,有人乾脆規定長條圖僅處理離散型資料,這樣倒也乾脆。 但是,畢竟直方圖原本的專業定義就是讓縱軸表示次數密度 (frequency density), 意思是以各長條(長方形)的面積作為次數──前面說的次數都可以改為相對次數, 這樣導致直方圖有兩種款式:一種以高度為次數,另一種以面積為次數。 以面積為次數的直方圖,可以作為黎曼和的前置經驗, 以面積為相對次數的直方圖,可以作為機率密度函數的前置經驗, 這兩項特色,都支持數學課程應該採用「面積作為次數」當作直方圖的定義, 而將「高度作為次數」視為無間隔的長條圖。

以面積表示次數的直方圖,可容許不等的組距,就像黎曼和可容許不均勻的分割。 下圖是個非等組距直方圖 (histogram with unequal class widths), 同時畫出次數折線圖: 英文是 frequency polygon,所以也譯作次數多邊形。

histogram and frequency polygon with unequal class width

對於離散型資料,或分組的連續型資料,都可以畫次數折線圖 (line graph)。 折線圖是呈現「分布」的另一個好辦法。

連續型資料的累積次數圖 (cumulative frequency diagram) 是一條連續而不遞減的曲線, 稱為累積次數曲線 (cumulative frequency curve)。 離散的有序資料則用折線圖表現累積次數,英文是 cumulative frequency polygon, 所以也譯作累積次數多邊形。 在累積次數圖上,可以精確定義四分位數 (quartiles) 和百分位數 (percentiles), 但是對於離散型資料而言,先作折線圖再計算各分位數不見得方便, 所以產生了許多種不同的計算各分位數規則, 它們全都符合「分位數」的意義,而且它們算出來的「中位數」都一致。

所謂五數概括法 (five-number summary) 是用最小值、三個四分位數、最大值這五個數, 概括描述一組數據的分布情形。將這五個數圖像化的統計圖就是盒狀圖 (box plot), 又稱為盒鬚圖 (box-and-whisker diagram)。 在同一個參考坐標上並列不同組資料的盒狀圖,特別有助於做比較,如下圖。

two boxes

[語音講解:histogram.mp3]

[ 回上層 ]


Created: Jan 27, 2023
Last Revised: 11/11
© Copyright 2023 Wei-Chang Shann 單維彰     [Home Page]
shann@math.ncu.edu.tw