計(jì)算機(jī)自適應(yīng)題庫實(shí)現(xiàn)
計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)(Computerized Adaptive Testing,簡(jiǎn)稱CAT)是近年來發(fā)展起來的一種新的測(cè)驗(yàn)形式。計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)不同于傳統(tǒng)的紙筆測(cè)驗(yàn),它的測(cè)驗(yàn)試題的呈現(xiàn)和被試對(duì)試題的解答都是通過計(jì)算機(jī)完成的。計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)也不同于一般的計(jì)算機(jī)化測(cè)驗(yàn),計(jì)算機(jī)在測(cè)驗(yàn)過程中不光是呈現(xiàn)題目,輸入答案、自動(dòng)評(píng)分、得出結(jié)果,而且根據(jù)被試對(duì)試題的不同回答,它能自動(dòng)選擇最適宜的試題讓被試回答,最終達(dá)到對(duì)被試能力作出最恰當(dāng)?shù)墓烙?jì)。本文將簡(jiǎn)單介紹計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)的原理和方法。
本文引用地址:http://www.ex-cimer.com/article/150474.htm1 題庫的分析與實(shí)現(xiàn)
1.1 原理
計(jì)算機(jī)自適應(yīng)題庫要解決的關(guān)鍵問題是建立適合每一個(gè)應(yīng)試者能力的個(gè)性化測(cè)驗(yàn)。
一般將測(cè)量理論分為經(jīng)典測(cè)量理論、概化理論和項(xiàng)目反應(yīng)理論三大類,或稱三種理論模型。人們將以真分?jǐn)?shù)理論(True Score Theory)為核心理論假設(shè)的測(cè)量理論及其方法體系,統(tǒng)稱為經(jīng)典測(cè)驗(yàn)理論(Classical Test Theory,CTT),也稱真分?jǐn)?shù)理論。它對(duì)建立試卷、考分轉(zhuǎn)換、等值等均有一套較為完整的方法。但隨著測(cè)驗(yàn)實(shí)踐的深入,此理論暴露了難以克服的弱點(diǎn): (1)題目難度、區(qū)分度等嚴(yán)重依賴于應(yīng)試者;(2)對(duì)應(yīng)試者的某項(xiàng)能力或特質(zhì)水平的估計(jì)值,只有當(dāng)所有應(yīng)試者使用的都是同一個(gè)或并行測(cè)驗(yàn)時(shí)才是可以比較的,而對(duì)于同一能力或特質(zhì)的不同測(cè)驗(yàn)的測(cè)量效果則無法進(jìn)行直接比較;(3)在應(yīng)用方面,經(jīng)典測(cè)量理論也表現(xiàn)出許多不足。
項(xiàng)目反應(yīng)理論(item response theory)也稱潛在特質(zhì)理論或潛在特質(zhì)模型,是一種現(xiàn)代心理測(cè)量理論,其意義在于可以指導(dǎo)項(xiàng)目篩選和測(cè)驗(yàn)編制。項(xiàng)目反應(yīng)理論假設(shè)被試有一種“潛在特質(zhì)”,潛在特質(zhì)是在觀察分析測(cè)驗(yàn)反應(yīng)基礎(chǔ)上提出的一種統(tǒng)計(jì)構(gòu)想,在測(cè)驗(yàn)中,潛在特質(zhì)一般是指潛在的能力,并經(jīng)常用測(cè)驗(yàn)總分作為這種潛力的估算。項(xiàng)目反應(yīng)理論認(rèn)為被試在測(cè)驗(yàn)項(xiàng)目的反應(yīng)和成績(jī)與他們的潛在特質(zhì)有特殊的關(guān)系。但在實(shí)際考試中,存在有應(yīng)試者猜題的因素,因此本題庫中采用了特征函數(shù)的三參數(shù)模式。三參數(shù)模式的公式為:
式中,D=1.702;θ是應(yīng)試者能力值;a是題目的區(qū)分度;b是題目的難度;c是題目的猜測(cè)系數(shù);P(θ)能力為θ的人答對(duì)此題目的概率。
根據(jù)特征函數(shù)可畫出題目的特征曲線,圖1為典型的三參數(shù)模式的特征曲線。從該圖中可以看出:
?。?)a參數(shù),即特征曲線的斜率。它的值越大說明題目對(duì)應(yīng)試者的區(qū)分程度越高。
?。?)b參數(shù),即特征曲線在橫坐標(biāo)上的投影。
?。?)c參數(shù),即特征曲線的截距。它的值越大,說明不論應(yīng)試者能力高低,都容易猜對(duì)本道題目。
項(xiàng)目反應(yīng)理論同經(jīng)典測(cè)量理論相比,最大優(yōu)點(diǎn)就是項(xiàng)目參數(shù)的不變性。對(duì)項(xiàng)目各參數(shù)值的確定,采用了2種途徑:一是經(jīng)試測(cè)后進(jìn)行統(tǒng)計(jì)分析,另一種是由專家進(jìn)行評(píng)估后,再采用統(tǒng)計(jì)方法確定參數(shù)。這2種途徑都存在著統(tǒng)計(jì)中使用的樣本采集異常困難的問題,因此本題庫設(shè)計(jì)中使用CTT采集樣本,結(jié)合IRT的三參數(shù)模式,確定了試題的3個(gè)質(zhì)量參數(shù)。
1.2 題庫的建立
本題庫建立過程中,首先要錄入試題編號(hào)及題干等信息,其次錄入?yún)⒓釉囶}參數(shù)測(cè)試人員做題情況的信息,最后進(jìn)行試題的三質(zhì)量參數(shù)測(cè)試,并將測(cè)試結(jié)果寫入數(shù)據(jù)庫。
1.3 模塊設(shè)計(jì)
本題庫中的模塊及功能如下:
?。?)試題質(zhì)量參數(shù)測(cè)試
該模塊包括試題的CTT參數(shù)計(jì)算和IRT參數(shù)計(jì)算等功能。
?、僭囶}的CTT參數(shù)計(jì)算。根據(jù)參加試題參數(shù)測(cè)試人員的做題情況,使用CTT獲取標(biāo)準(zhǔn)分Z:
式中,RH、RL分別表示高分組和低分組通過該題的人數(shù);n為每組的人數(shù)。
?、谠囶}的IRT參數(shù)計(jì)算。對(duì)IRT能力參數(shù)和質(zhì)量參數(shù)的估計(jì)如下:
首先,按下列方式為能力參數(shù)、質(zhì)量參數(shù)指定初值:
IRT能力參數(shù)的初值=經(jīng)典測(cè)量理論中的標(biāo)準(zhǔn)分Z;
IRT區(qū)分度參數(shù)的初值=經(jīng)典測(cè)量理論中的難度值
+2(2是比例因子),其中難度;
IRT猜測(cè)參數(shù)的初值=試題j的可選項(xiàng)數(shù)倒數(shù)。
然后,按以下步驟進(jìn)行迭代運(yùn)算:
●把3個(gè)質(zhì)量參數(shù)看作已知值,用極大似然估計(jì)法[2]估算出能力參數(shù);
●將上一步中估需出的能力參數(shù)作為已知值,用極大似然估計(jì)法估算出3個(gè)質(zhì)量參數(shù);
●判別結(jié)束條件是否滿足,若滿足,則最后1次的估計(jì)值即為最終估計(jì)值;若不滿足,則返回第1步繼續(xù)迭代運(yùn)算。結(jié)束條件可以是指定的迭代次數(shù),也可以是趨于穩(wěn)定的參數(shù)值。
?。?)試題庫維護(hù)
該模塊包括試題、樣本信息的錄入和增添等功能。
?、僭囶}和樣本信息的錄入。該功能包括試題錄入和樣本信息錄入,其中前者錄入的是試題編號(hào)及題干等信息;后者錄入的是參加試題參數(shù)測(cè)試人員做題情況的信息。
?、?試題和樣本信息的增添。試題管理員可以及時(shí)添加樣本信息和試題。系統(tǒng)管理員可以根據(jù)情況重新計(jì)算試題的質(zhì)量參數(shù)。
1.4 數(shù)據(jù)庫表的結(jié)構(gòu)設(shè)計(jì)
在本系統(tǒng)建立的自適應(yīng)試題庫中,有單選題、多選題、判斷題等3類題型。在單選題題型中需要用到單選表single_choice、單選分析表single_choice_analysis。單選表、單選分析表single_choice_analysis以及二表之間的主外鍵關(guān)系如圖2所示。
本系統(tǒng)涉及到的人員有教師、管理員、應(yīng)試者和參加試題參數(shù)測(cè)試人員,他們的相關(guān)信息如圖3所示。其中,student_info表用來存放應(yīng)試者和參加試題參數(shù)測(cè)試人員的基本信息, login表用來存放所有人員的登錄信息。1.5 題庫的實(shí)現(xiàn)
以經(jīng)典測(cè)量理論(CTT)和項(xiàng)目反應(yīng)理論(IRT)為基礎(chǔ),使用三參數(shù)模式建立了計(jì)算機(jī)自適應(yīng)題庫,從而能夠根據(jù)題目的參數(shù)及應(yīng)試者的反應(yīng)情況估計(jì)應(yīng)試者的能力參數(shù),然后根據(jù)“最大信息量原則”從題庫中選取符合應(yīng)試者能力的題目進(jìn)行測(cè)試。
由于篇幅有限,下面只給出其中的幾個(gè)實(shí)現(xiàn)算法。
評(píng)論