| 圖/遠流提供 | | | 打開電視新聞,「統計」是最常出現的數學名詞。例如,政府想知道全台灣有多少小學生、中學生、大學生;電視媒體想知道小學生中,有多少人喜歡〈寶可夢〉,有多少人喜歡〈妖怪手錶〉;校長想知道全校同學中,有多少人擅長數學,有多少人國語這一科最好。這些問題的答案,都需要經過統計。 當民調公司公布某個政治人物的支持度,他們不會真的訪問全台灣2300萬人,通常只會訪問一部分的人,把他們的訪談結果視為全體台灣人的想法。 咦?不需要挨家挨戶問2300萬人嗎?某些情況下的確不需要,但得滿足兩個條件。 首先,接受訪問的人數不能太少,必須有足夠的代表性。以罐子的糖果來比喻,一個罐子裡有紅色跟藍色兩種糖果,你伸手進去抓,如果只抓四顆,可能這次抓到的是兩顆紅色、兩顆藍色,下一次抓到三紅一藍,再下一次卻是四顆全藍。但如果一次抓一大把,約二、三十顆,那麼每次抓到的紅色與藍色糖果,比例就不會差太多了。 其次,接受訪問的人不能有強烈、特別的傾向。如果今天詢問的政策是「便利商店的電費全免」,而民調公司訪問的對象全部都是便利商店的老闆,一定會得到很高的支持度。 我們做一個甜滋滋的實驗吧! 想知道M&M's巧克力裡,每個顏色占據的比例,理論上,每一小包的顏色比例不太一樣,但愈多個小包合起來的顏色比例,會愈接近大包的結果,這就是前面說的:樣本數量必須足夠,統計結果才有意義。 至於M&M's巧克力的顏色比例實際上是多少呢?首先可以確定兩點: ヾ根據不同年代消費者的偏好,顏色比例有所變化,西元2000年以前,棕色最多。 ゝ目前台灣的M&M's巧克力,大多是從美國紐澤西州哈克特斯鎮的工廠出產。這間工廠的巧克力豆,橘色跟藍色最多,這是統計學家威克林在2017年寫信詢問M&M's總部得到的回覆。 根據總部提供的生產比例,藍、橘兩色的數量是其他顏色的兩倍。例如,若有80顆M&M's均分成八份,紅、綠、黃、棕四種顏色會各是一份10顆,橘跟藍則各是兩份20顆。換算成比例,橘色跟藍色占比各是20÷80=0.25,其他四種顏色分別為10÷80=0.125。 你的統計結果不一定剛好相同,因為可能受其他因素影響,例如工廠人員可能沒把各色巧克力充分混勻就包裝了,導致某些顏色特別多,因此無法呈現原本的生產比例。 延伸學習 這堂課學到的,正是統計學裡重要的概念:抽樣。 我們可以想像工廠的大缸,裡面均勻混合著各色巧克力豆,每一次包裝時,機器會從缸中取出一小部分巧克力豆。這個包含所有巧克力的大缸,在統計學上叫做母體,從中取出的小部分巧克力叫做樣本,而從母體取出樣本的過程,就叫抽樣。 抽樣的目的是希望藉由少量的樣本,有效而精確的推估出龐大母體的特性。基本上,樣本數愈大,與母體愈接近,愈能有效推斷,但所花的時間與成本也愈高。不同的研究對象與研究目的,抽樣的技巧各不相同,是一項專門的學問。 |