“浙江許多人均指標都居全國領先水平,通常被人們稱作富省,可這個‘富’是相對的,是初級階段的,絕不能因為一些平均數而忽略全省存在的貧困麵。”
——摘自某公開報道
這番話出自浙江省原省長、全國人大代表呂祖善之口,反映出這位父母官對經濟發達的浙江省的省情有著非常清醒而可貴的認識 1。
確實,在有些情況下,以“平均數”代替“大多數”似乎無關緊要,但在一些重大問題上則必須將兩者分開。俗話說“飽漢不知餓漢饑”,對於腰纏萬貫、一擲千金的富翁來說,他怎麽也不會想象得出赤貧者是如何因為哪怕缺少1元錢就挨餓、受凍的。“平均數”決不能代替“大多數”,有時候甚至也不能代替“極少數”。
在統計學中,平均數的主要作用是描述“數據的集中趨勢”,即“數據向某一中心值數據聚攏的傾向”;或者是數據的“一般水平、代表值或典型值”。
容易看出,平均數屬於一種概括性指標。由於受離群值(極端值)的影響,平均數往往容易掩蓋個體差異。有鑒於此,許多情況下平均數什麽問題也說明不了。
例如,一家小餐館裏有兩位顧客,一位顧客喝了1斤白酒,另一位顧客吃了2碗泡飯。如果用平均數看,他們兩人平均每人喝了半斤白酒,吃了1碗泡飯,看上去好像還不錯。而實際上呢,兩個人似乎都很不好——一個人喝酒喝醉了,另一個人吃得太飽了。
這種平均就根本不符合事實,也沒有意義,因為它的“離散度”(反映一組數據離散程度的統計學指標)太大了。
再例如,如果有人問你全班同學的身高是多少?你當然可以用平均身高來回答。因為每個同學的身高不一樣,你即使知道每個同學的身高也沒必要一個個報出來,否則對你來說就太瑣碎了,而對方也未必就需要這樣的數據。你隻要報出平均身高是多少,如果更細致一點,報出男生平均身高是多少、女生平均身高是多少,對方就知道了大概。