英语测试课程chapter 3 考试要素
绝世美人儿
600次浏览
2021年01月17日 01:56
最佳经验
本文由作者推荐
新年短信祝福语-五年级下册语文书
第三章:考试要素
教学目标:
1、通过本课学习使学生了解影响 考试质量的要素有考试信度、考试效度、真实性、
交互性、后效作用、可操作性;
2、了解如何保证考试的信度和考试的效度;
3、正确理解考试信度和效度的关系。
教学手段:讲解、讨论,多媒体辅助
一、考试信度:
考试结果的可靠性和稳定性。拿同一份试卷对同一组学生 实施两次或多次考试,如果考
试结果很一致,那就说明该测试的信度很高。
例
1
Test A
是一个水平测试,满分为
100
分。 一个
20
人的自然班用此卷先考
了两次,以下是两次成绩。
Student No
First Administration
Second administration
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
1011
1012
1013
1014
1015
1016
1017
1018
1019
1020
60
70
78
67
55
89
80
75
90
66
74
40
79
65
82
67
58
61
70
84
69
60
75
75
50
87
83
70
89
76
65
42
73
66
83
60
64
64
66
82 < br>结果分析:部分学生两次成绩差距较大,有一半成绩的差距在
3
分以上。两次学生的排< br>序也发生较大的变化。
Student No
First
Student No
Second
Administration
administration
1009
90
1009
89
1006
1020
1015
1007
1013
1003
1008
1011
1002
1019
1004
1016
1010
1014
1018
1001
1017
1005
1012
例
2
Test B
是另一个水平测试卷,满分
100
分 ,一个
20
人的自然班用此卷先后考
了两次,以下是两次的成绩。
Student No
First Administration
Second
Administration
1001
77
75
1002
1003
1004
1005
68
55
80
85
66
53
78
82
89
84
82
80
79
78
75
74
70
70
67
67
66
65
61
60
58
55
40
1006
1007
1015
1020
1010
1003
1004
1013
1008
1001
1014
1019
1011
1017
1018
1002
1016
1005
1012
87
82
83
83
73
75
70
65
60
66
75
60
76
66
64
69
64
50
42
1006
1007
1008
1009
1010
1011
1012
1013
1014
1015
1016
1017
1018
1019
1020
68
76
81
85
64
61
79
86
58
73
72
80
62
74
87
67
74
81
83
63
60
78
84
60
72
71
80
61
74
86
情况分析:两次考试成绩之间的差距很小,往 下浮动幅度仅在一二分之间,且部分
分数保持一致。
三种测定考试信度的方法
1
.
重复测量法:
通过对同一组学生重复使用同一份试卷来确定试卷的信度。是求两次施 考之间的一致
性(
consistency over time
)
注意事项
1
.控制相隔时间段的教学内容,以保证学生学习进展的一致性
2
.两次考试间隔时间不宜过短。否则学生第二次考试可能会凭记忆答题。
3
.为了减少记忆力因素的影响,可以重新调整题目的选项的顺序。如
第一次考试
Can you think of a ______ excuse for our being late?
A. flexible
B. reliable
C. favorable
D. reasonable
第二次考试
Can you think of a _______ excuse for our being late.
A. reasonable
B. favorable
C. reliable
D. flexible
缺点
1
.这种考试的可靠性基于一个同步性 假设之上:在两次考试之间学生在学习上都
没有或获得新的进展。如果在此期间一部分学生的学习成绩发 生变化,而另一部分保持
原状,那么第二次考试的分数与第一次的相比就会出现差异。因而两组分数中就 缺乏稳
定性。
2
.有许多偶然因素会影响重复测试的可靠性,如学生学习积 极性的高低,对考试
形式的熟悉程度。
2
.平行卷测试法
通过
A, B
卷的形式求得考试的一致性(
consistent in form
)
。 先让学生做两套试卷,
随后分析考试结果。考试信度是通过两组分数的比较而求得,分数之间的一致性将 决定
考试信度。
优点:平行卷测试法不牵涉的时间的间隔性,
A
、
B
卷可以先后完成,或隔一两天完成。
注意事项:< br>A
、
B
卷的制作要求较高,两份试卷被视为完全等同的试卷,在考试内容、题目难度、试题数量、施考时间,甚至题目顺序等方面都必须吻合。
要求教师在命题过程中严格按照规则操作。
两套试卷内的题目必须经过预测及分
析,以确定它 们的一致性。
3
.对半分析法
(
split-half method
)
只进行一次测试,然后 将试题的题号按奇偶数分成两半,计算两半所得分数的高低
排列的相关性
把一份试卷 看作为两个相对独立且对应的部分,
通过对这两个部分分数的比较以获
得整份试卷的信度
两个部分分数的一致性越高,试卷的信度也就相应地越高。
对半分析法也常被称为求内部一致性的方法(
internal consistency
)
影响考试信度的因素:
1
.试题的量是否足够大。试卷只有保证有足够的量,才能保证试卷的覆盖面更为
合理。理论上讲 ,题目越多,信度越高。
2
.题目是否属于同一性质,即试题是否属于同一范畴。如 英语试题中不能插入其
他科目的题目。
3
.题目区分度是否高。题目能否把 考生中好的和差的区分开来。考试的区分能力
越高,测试的信度就越高。
4
.考试之间的差异性是否大。即考生的分数分布情况是否呈中间大、两头小的状
态。考生分数的分散情况 越大,信度越高。
5
.题目难易度适中。题目太难或太易都会影响题目的区分度,从 而影响测试的信
度。
6
.评分是否客观。如果不同的评卷人会得出不同的分 数,或者同一评卷人两次阅
卷容易得出不同的分数,那么这套试题的信度就会较差。
二、考试效度
考试达到其预期测试意图的程度。
一套测试所考的是否就是设计人想要考的内容。
如教师编制了一套口试题目,来测试学生口头表达所选择的语言功能的能力,如
in viting, accepting, refusing, thanking
。测试结果显示这套 题目的确检查了学生在规
定方面的能力,我们可以说这套口试题目具有效度。
如国外某次大学入学考试中一个测验写作能力的题目是:
“
Is photography an art or
science?
Discuss
”
。这种题目是无效的,因为他要求考试首先懂得摄影,才有写作
而言,因此只能对个别学生有 利。
1
.表面效度
表面效度是指考试的“表面可信或公众的可接受度”
(
surface
credibility
or
public
acceptabilit y
)
。按照常理,一个考试看上去测试了预定的技能或能力范畴,那么这个
考试就具有 表面效度。
如口语旨在测试学生口语能力的考试的确让学生开口说英语,或测试英语书面表达
能力的考试让学生写一篇文章。这类让学生直接运用被测试能力的考试属于表面效
度高的考试。
如果测试学生语音语调的考试通过笔头答题形式完成的话,很难说这个考试具有表
面 效度,原因是这种考试方式与语言运用实际方式之间的差距较大。
直接考试具有表面效度,而间接考试则缺乏表面效度。
2.
内容效度
试卷试题内容是否代表了它应测量的内容。
一测量工具①内容上(包括材料、题目)的代表性或②所选内容的充分性(
sampling
adequacy
)
某一阅读课程接受时要举行期末考试,根据 教学大纲的要求,本学期所教授的阅读技能
主要有以下几种:
Recognizing the script of a language
Deducing the meaning and use of unfamiliar lexical items
Understanding explicitly stated information
Understanding implicitly stated information
Understanding the communicative value of sentences
Understanding relations within the sentence
阅读材料包括小故事、信或明信片、报刊杂志上的文章节选,广告等
题材涵盖文学、文化、政治、历史、日常生活等范畴。
出卷时如何坚固到内容效度?
1
.所选材料内容的覆盖面要广,要反映出教学内容的特点,即要有代表性
2
.被测试的技能应明确具有代表性,要避免题目过多地集中在某几项技能上
3
.
所选材料和技能都应在规定的范围内,即内容的关联性
3.
尺度关联效度
尺度关联效度主要指的是本考试与某一个“ 独立并且相当可靠的学生能力测量工具”之
间的联系。如果两者之间的关联度高,考试就具有尺度关联效 度。
尺度关联效度分为:共时效度和预测效度
1
共时效度