所謂參數的條件估計,就是在某些參數已經確定的條件下,估計模型中的未知參數。在認知診斷評價理論模型中,參數的條件估計有兩種情形:一種是在被試屬性掌握模式等參數已經確定的條件下,估計模型中的項目參數;另一種情形就是,在項目參數已經確定的條件下,估計被試屬性掌握模式等參數。
項目參數的條件估計方法主要有兩種:一種就是基於已經確定的被試參數條件,利用樣本作答反應數據,直接求取基於項目反應函數的似然函數極大值點對應的項目參數,稱為經典條件估計;另一種是基於邊際分布的極大似然估計方法,稱為邊際極大似然估計(marginal maximum likelihood estimation,MMLE)。本節隻介紹邊際極大似然估計及其EM算法。
一、邊際分布
邊際極大似然估計仍然是在極大似然估計方法的架構之下估計項目參數,但是在提供被試參數作為已知信息時,結合了貝葉斯統計思想。邊際極大似然估計是以邊際分布(marginal distribution)為基礎的。因此,我們首先需要明白邊際分布的概念。首先看一下表7-1。
表7-1 邊際分布示意表
表7-1包含了兩個離散型變量:變量ξ和變量η。pij為兩個變量的聯合分布列,而聯合分布列的右側一列,即pi·是由第i行pij對j相加得到,它表示變量ξ的分布列,相應地,在聯合分布列的低端一行,即p·j是由第j列pij對i相加得到,它表示變量η的分布列。通過這種表示方式,變量ξ和η各自的分布列就在聯合分布列(ξ,η)的邊上,因而,人們就形象地稱變量ξ和η各自的分布列是聯合分布列(ξ,η)的邊際分布。
由以上可以知道,如果已經知道二維變量的聯合分布列,那麽,單個分量的邊際分布列也就可以根據聯合分布列得到。當然,已知所有單個變量的分布列,卻並不能唯一確定兩個變量的聯合分布列,這一點,從表7-1中也是容易直觀地看出來的。