首頁 現代心理與教育統計學

二、二列相關

(一)適用資料

二列相關(biserail correlation)適用的資料是兩列數據均屬於正態分布,其中一列變量為等距或等比的測量數據,另一列變量為人為劃分的二分變量。例如,在一個測驗中,測驗成績常常會劃分為及格和不及格,人的健康狀態分為健康與不健康兩類,平時的學習成績依一定標準將其劃分為好、差兩類,根據年齡劃分為成人與兒童,根據身高劃分為高與矮等等,它們均屬於正態分布的連續測量數據,但都被按照某一標準人為劃分為兩類。

(二)公式及計算

計算二列相關有兩個公式,兩個公式應是等效的。

p為某一分類在所有二分變量中所占的比率。

y為標準正態曲線中p值對應的高度,查正態分布表能得到。

二列相關係數的取值在-1.00~1.00之間。絕對值越接近1.00,其相關程度越高。

【例5-11】 表5-15是108名學生某個測驗總分分組數據和在某道問答題上得分依一定標準將其分為對、錯兩類後的數據,請問這道問答題的區分度如何?

解:這個測驗的總分和這道問答題的原始得分呈正態分布,但問答題的分數又區分為二分型數據,故此題應該用二列相關計算區分度,即相關係數。

表5-15 二列相關的計算

設某一得分組的人數為ft,某一分組中答對某一題目的人數為fp,答錯該題目的人數為fq

根據分組數據中使用估計平均數計算平均數(參見第三章資料卡)的公式,分組數據計算標準差(參見第四章資料卡)的公式:

p=63/108=0.583,q=1-0.583=0.417

查正態分布表,當p=0.583時,y=0.39024

代入公式5-14a,得:

代入公式5-14b,得:

因計算誤差的存在,結果有微小差別。

答:這道問答題的區分度為0.66。

二列相關不太常用,但有些數據隻適用於這種方法。在測驗中,二列相關常用於對項目區分度指標的確定。有時,某一題目實際獲得的測驗分數是連續性測量數據,這些分數的分布為正態,當人為地根據一定標準將其得分劃分為對與錯、通過與不通過兩個類別時,計算該題目的區分度就要使用二列相關。如果題目的類型屬於錯與對這樣的是非類客觀選擇題,計算該題目的區分度就應該選用點二列相關。二者之間的主要區別是二分變量是否為正態分布。總的原則是,如果不是十分明確,觀測數據的分布形態是否為正態分布,這時,不管觀測數據代表的是一個真正的二分變量,還是一個基於正態分布的人為二分變量,這時就用點二列相關。當確認數據分布形態為正態分布時,都應選用二列相關。隻要有任何疑問,選用點二列相關總是較好的選擇。在實際的研究當中,二列相關很少使用。