基于IRT的大学英语词汇在线自适应测试系统的设计
一建考试成绩查询-干部教育培训工作总结
第18卷
现代教育技术
、,01.18
2008年第12期 <
br>Modem Educational Technology
NO.12 2o08
基于IRT的大学英语词汇在线自适应测试系统的设计
赵传海 吴敏 叶艳
(中国科学技
术大学现代教育技术中心,安徽合肥230026)
【摘要】如何科学有效地测量学习者的词汇量,以
及测量其对词汇的掌握程度是当前语言研究者十分关注的问题。文
章根据词汇的广度、深度之间的相关
性,提出了在广度测试的基础上进行深度测试的思想,并将项目反应理论的测试方法、
设计思想,应用
到实际测试系统中,最终设计实现了基于项目反应理论的大学英语四、六级在线自适应单词测试系统。
【关键词】词汇测试;广度测试;深度测试;IRT;单词库
【中图分类号】G434 【文献标识码
】B 【论文编号】1009--8097(2008)12—0087—04
一
引言 完型、写作,下同),其中词汇深度知识对语言综合能力的
语音、词汇和语法是语言的三大要素。
学习语言的最终
预测能力强于词汇广度知识,特别体现在四、六级的完型填空与
写作的预测
中,而总体来说词汇广度与深度呈高度正相关…。
目的是为了交际,词汇是语言交际的核心。对于ES
L(English
词汇量测试,一般称为广度测试,其重要性以及与语言
AsASeco
ndLanguage)学习者,词汇是外语学习的主要瓶颈
综合能力关系的研究成果颇多,国外具有
代表性的是词汇量
与最大障碍。在国内,大学英语考试(College English Test
)
与阅读(Koda 1989;Laufer 1989,1992;Laufer&Nation
1996;
是教育部主管的一项全国性的教学考试,其中四级考试
Qian 1999,
2002)L2 及语言综合能力(Meara&Jones 1988)
(CET-4)自从198
7年,六级(CET-6)自从1989年在我国实
【8 呈显著正相关关系。国内具有代表性的有词
汇量与语言综合
行以来,其目的是在于准确地衡量我国在校大学生的英语综
能力成高度正相
关关系(桂诗春1983,1985)[9-10]。当前常
合应用能力,为实现大学英语课程教学目
标发挥积极作用。
用单词量测试的方法有以下几种:一是概率统计法。即一定
其对学习者词
汇量的要求又是针对大学英语教学大纲而制
样本中随机抽取单词,选择其正确的意思,根据其抽样单词
定,大致为4500个单词700个词组(CET一4)和5500个单词与
答对百分比来
做样本总量的推断;二是词表是否测试法。即
1200个词组(CET一6),词汇量水平以及掌握程
度在很大程度
认识为是,不认识为否;三是Nation(1983,1990)…。 】的分 是直接影响四、六级成绩的首要因素。因此,如何科学有效
级词汇测试法等。
的测量学
习者的词汇量,以及对词汇的掌握程度的研究成为
学习者对词汇知识(深度)的习得,是一个由不同层
面
语言研究者在教学研究活动中十分关注的问题。
和水平组成的连续体,而不是一个“习得
”或“未习得”、
为了帮助学习者进行词汇的记忆与学习,以便有效地进
“知道”或“不知
道”的简单二分的过程。词汇深度有以下
行词汇测试,作者构建了基于IRT的大学英语词汇在线自适
应
的分类方法:从多个维度(Dimensional Approach)界定,主
测试
系统,其中的自适应算法设计是该系统的核心问题。本
要代表人物有Cronbach,Richar
ds,Nation,Qiant13-15I【6];从发展
文首先论述词汇广度和深度的内涵及其
测试;其次引入项目
的角度(Developmental Approach)出发,主要代表人物
有Dale,
反应理论(Item Response Theory,简称为IRT)以及词汇知识
PARIBAKHT&Wesche[16-171;主要的测试工具有新西兰维多
衡量等
级(Vocabulary Knowledge Scale,简称为VKS)来进行
单词的广度与
深度测试;再次详细介绍了词汇测试系统的设
利亚大学瑞德John Read设计的词汇联想测试(
Word Associate
Test)和PARIBAKHT&Wesche的词汇知识衡量等级
(VKS)等。
计实现;最后提出了本系统的一些不足以及今后的研究方向。
二词汇广度与
深度及其测试 三项目反应理论(I RT)与词汇知识衡量等级(VKs)
一
直以来,学生
为了备考大学英语四、六级考试所做的第
词汇测试分为广度测试(Vocabulary Bread
th Measures)
一
件事往往是背单词。大多数学生仅是单纯的背诵单词的拼 和深度测试(Assessment of The Depth of Vocabulary
写,对词组的记忆,而忽略了如何将单词与语法、句法联系起
Knowledge)。广度测试是估计
语言使用者的词汇总量,深度
来运用。综合作者所做的文献调研得知,如何有效科学地进行
测试是了解语言使用者对词汇知识掌握的程度。词汇量以及
词汇深度知识均可有效预测语言综合能力(
包含听力、阅读、
单词量评估与施测,以及对一定单词量(广度)的基础上再进
行“质”(
深度)的测试目前还没有一个行之有效的方法。
收稿日期:2008年7月29日