(一)適用資料
通常,有些變量的測量結果隻有兩種類別(dichotomy),如男性與女性、房東與房客、成功與失敗、及格與不及格、是與否、生與死、已婚與未婚等等。這種按事物的某一性質劃分的隻有兩類結果的變量,稱為二分變量(dichotomous variable)。二分變量又分為真正的二分變量(true dichotomy)和人為的二分變量(artificial dichotomy)兩種。真正的二分變量也稱為離散型二分變量,前麵的例子都是離散型二分變量。所謂人為的二分變量,是指該變量本來是一個連續型的測量數據,兩種結果之間本來是一個連續統一體,但被某種人為規定的標準劃分為兩個類別。在這種情況下,一個測量結果很明顯地要麽屬於這個類別,要麽屬於另一個類別,兩種類別之間一般也不會被看做是連續的。有時一個變量是雙峰分布,也可劃分為二分稱名變量,如文盲與非文盲,可規定一個界限,文盲指識字極少的人,其餘的人為非文盲,就識字量來說可能形成雙峰分布形態。
如果兩列變量中有一列為等距或等比測量數據,而且其總體分布為正態,另一列變量是二分稱名變量,此時,給“二分”變量的一係列觀測值,即兩種變化結果賦予對應的數字,如1、0,就得到一個“二分”數列,另一個連續變量的一係列觀測值就是一個點數列。如果一個點數列中的點與一個“二分”數列中的點存在一一對應的關係,則稱這兩個數列為點二列。點二列相關法(point-biserial correlation)就是考察兩列觀測值一個為連續變量(點數據),另一個為“二分”稱名變量( 二分型數據)之間相關程度的統計方法。
點二列相關多用於評價由是非類測驗題目組成的測驗的內部一致性等問題。是非類測驗題每題的得分隻有兩種結果:答對得分,答錯不得分,每一題目的“對”、“錯”就成為二分稱名變量,而整個測驗的總分是一列等距或等比性質的連續變量,要計算每一題目與總分的相關(稱為每一題目的區分度),就需應用點二列相關方法。