四分相關(tetrachoric correlation)適用於計算兩個變量都是連續變量,且每一個變量的變化都被人為地分為兩種類型這樣的測量數據之間的相關。通常,計算四分相關的資料會整理成四格表。四格表是由兩個因素,各有兩項分類,做成的R×C表,因其隻有四格,故名四格表。
(一)適用資料
四格表的二因素都是連續的正態變量,如學習能力,身體狀態等,隻是人為將其按一定標準劃分為兩個不同的類別,如“好”與“不好”,“對”與“錯”等,即一因素劃分為“A”與“非A”兩項,另一因素劃分為“B”與“非B”兩項。這樣便可將資料整理成四格表的形式。在四格表中,屬於A項、B項交叉格內的實際計數為a,非A項、非B項交叉格內的實計數為d,非A項與B項交叉格內的實計數為b,非B項與A項交叉格內的實計數為c,邊緣次數分別為a+b、c+d、a+c、b+d,N=a+b+c+d。
此外,這類四格表大都用於同一個被試樣本中,分別調查兩個不同因素兩項分類的情況。
(二)計算公式
計算四格相關最常用的方法是皮爾遜餘弦π法(近似計算法)。
這個公式還可寫成下麵的形式:
式中:a、b、c、d符號的意義同前。π為圓周率。
【例5-13】 下表所列數據是調查 377名學生兩科測驗成績所得到的結果,假設兩科成績的分布為正態,隻是人為地將其按一定標準劃分為及格、不及格兩類。
解:已知 a=124,b=68,c=85,d=100,a+b+c+d=377
將上麵的結果代入公式5-16,得:
答:四格相關係數為0.2919。