✔ 最佳答案
問:要錯誤圖表及參考網址
答:
圖表
圖表不只是外觀上比起密密麻麻的數字吸引人注意,而是在很多時候有助於概括(summarize)大量的數據集合(data set)、把重點放在數據的某一方面(aspect)或明顯表現出數據在某段時間上的趨勢(trend)等等。
好的圖表使人立刻觀察到(單從數字上難以明顯察覺到)一個數據的特徵。同樣,差的圖表亦能令人很快得出「表」裡不一的錯誤結論,下面是一些此類圖表的例子:
圖片參考:
http://philosophy.hku.hk/think/chi/stat/img1.png
這個關於香港人口數目的折線圖有兩個毛病:
根據Y軸上的數字,人口在1993至1999年間增加了18%,但由於1999年的數據點之高度大概是1993年的兩倍,因此有可能在視覺上令人誤以為增幅是100%。此毛病的原因在於沒有明顯讓讀者察覺Y軸的最低點不是由「0」開始,而正確的做法一般是將Y軸之起始部分繪畫成上下起伏的波紋(見例二的線形圖)。
X軸的比例(scale)不一致。X軸由1993年年頭至1996年年尾以一個間距代表6個月,但對餘下的年份改為以一個間距代表12個月。即使人口增長的情況自1997年起和前期的差不多,該段折線的斜度會是前段的兩倍,以致視覺上令人誤會人口突然大幅上升。 【上圖是根據政府統計處所提供的人口數據繒成,當局並無發布此圖。】
圖片參考:
http://philosophy.hku.hk/think/chi/stat/img2.png
上圖題示了位於美國 康乃狄克州於1956年大力打擊超速駕駛後當地的交通意外死亡數字(下文簡稱之為「死亡數字」)。得悉該打擊措施的人看過上圖後會斷定該措施能有效減低死亡數字,但他們可能已經被這個資料所誤導:
圖片參考:
http://philosophy.hku.hk/think/chi/stat/img3.png
可見在打擊措施推行之前的1951至1952年以及1953至1954年也曾出現過死亡數字的大幅下降(甚至比1956至1957年的大),因此1656至1957年的改善可能只屬每年都有的自然改變。只得兩個數據點的線形圖未必能夠反映事實的真相。
【上圖的數據來自Donald T. Campbell, "Measuring the Effects of Social Innovations by Means of Time Series" in Judith M. Tanur et al., eds. (1989), Statistics: A Guide to the Unknown. Pacific Grove, CA: Wadsworth,另外裡面對該個案的問題有更詳盡的探討。】