怎样进行试卷分析
原料英语-高考祝福
怎样进行试卷分析
在考试结束之后,对试卷进行分析,不但可以对试卷和考试作出恰当
的评价,为试卷编
制积累经验,提高教师编制试卷的水平,为修改试题和给题库遴选试题提供依据,而且
有助
于充分地获得考试提供的教学反馈信息,为改进教学提供依据,为考试讲评准备材料。全面
的试卷分析主要包括下列内容。
一、试卷的结构分析
主要包括:
1.内容结构
分析:基本概念和化学原理、元素化合物知识、有机化学知识、化学计算、化
学实验等方面的内容比例乃
至每一方面的二级结构分析。
2.目标水平结构分析:按照考试大纲所列水平(通常分为知道、理解、
应用、综合运用等)
种类,分析它们的组成比例并且作内容—水平双向交叉分析。
3.题型结构分析:各类题型的比例分析。
4.分数结构分析:内容—分数和水平—分数的双向交叉分析。
5.难度和时限结构分析:对难度测验作难度分布描述,对速度测验作时限分布描述。
6.试
卷特点及横向、纵向比较:就试卷是否符合考试(教学)大纲规定、是否反映化学学
科特点和内在联系、
符合学生实际水平、合理性、适宜性以及其他特点作出描述和判断。横
向比较可以在学校—学校或地区—
地区间进行,纵向比较可以在不同学年间进行。
进行结构分析时,分析者要对测验各项目逐一分析和作
出判断,因而结构分析带有较强的主
观色彩。分析者对项目的判断跟编制、设计者不一致的情况经常会发
生,对于比较复杂的综
合题尤其是这样。为此可以把试卷结构分析结果跟编制试卷的结构设计进行比较。
除了难度结构分析跟答卷情况有关,只有在考试实施之后才能进行外,其他各项分析跟答卷
情况
无关,在考试实施之前就可以进行,属于试卷的“静态”分析。
二、答卷情况描述
主要包括:
1.成绩分布情况描述:列出频数分布表或频数分布图。
2.统计量描
述:列出平均分、标准差、优分率和低分率以及某些因素间的相关系数等数据,
还可以进一步作各内容跟
其平均得分率、标准差、优分率和低分率的双向交叉分析,各水平
层次跟其平均得分率、标准差、优分率
和低分率的双向交叉分析,以便从中发现问题。
3.分布形态判断:判断总体分布是正态还是偏态或其它形态。
4.由样本统计量推测总体参数(总体平均成绩、总体标准差等)。
三、试题及解答情况分析
1.题目的内容、水平分析:逐一分析各题的内容、水平和考核意图。
2.题目的难度、区分
度、灵敏度、识别度和题目反应分布:具体方法参见文后所附题目分
析部分。
四、试卷质量分析
1.试卷的信度分析和效度分析。参见文后所附“试卷的信度分析和效度分析。”
2.整卷难度分析。
3.试卷质量评价:就考试目的和试卷内容、结构、形式的合理性、适宜
性、有效性和可行
性等对试卷作出全面评价。
五、教学分析和教学建议
从得分
、失分情况以及某些部分之间的比较、分析,发现教师、学生以及命题等方面的成功
与不足之处,并针对
存在问题提出改进意见。
为了使试卷分析全面、可靠和有效地发挥应有作用,试卷分析工作应实行教师
分析和学生自
我分析结合、“动态”分析和“静态”分析结合、定性分析和定量分析结合
,在认真分析的
基础上,简明、扼要、有重点地写出试卷分析报告。
附:题目和试卷的统计分析方法
一、常模参照性测验的题目分析
常模参照性测验题
目的分析工作,主要是对测验结果进行统计分析,估计题目的难度、区分
度,分析答案是否适宜等。
1.难度分析
所谓题目难度是指某一题目的难易程度,通常用答对率P来表示。
一
般说来,题目的P值以0.2~0.8为宜。也有人用不通过率Q来表示难度。它们的计算方
法如下表所
示:
*X高为高分组的该题得分总和,X低为低分组的该题得分总和,H、L分别为该题的最高、最低得分。
P值无等距性,无法对试题之间的难度差异作精确的比较,也不能用于计算平均难度。
为了
对各题难度作比较,通常要把P转换成标准难度△,使之等距化。
△值越大,题目难度越大;△=13时,题目难度为中等。
运用下表可以方便地由P值直接查得对应的△值:
2.区分度分析
题目区分度是
指某一题目对被测水平的区分能力。若某题目能使水平较高的被测得较高分、
使水平较低的被测得较低分
,该题就有较高的区分度。
区分度分析可以采用极端分组法,或者采用相关法。相关法比较复杂,这里
从略,不作介绍。
在极端分组法中,从总体中分出高分组和低分组(比例均为25%~33%且数值相同
),然后
计算区分指数D作为区分度的指标,如下表所示:
除了计算方法以外,还可以采用弗
拉南根查表法:根据占总人数27%的高分组的答对率和
占总体人数27%的低分组的答对率,从专门的
表(附表5)中查得题目的区分度。
一般说来,当D<0.20时,题目的区分度太低,必须淘汰或者
加以修改;当D≥0.40时,题
目的区分度非常好;通常题目的区分度指数D在0.2~0.4之间。
题目难度跟题目区分度之
间有着一定的联系。难度太大或者太小,都可能使区分度变小;只有难度适中时
,才可能有
较高的区分度。
3.题目反应分布分析
对于多重选择题等可能有多种答
题情况(题目反应)的题型来说,仅仅作难度分析和区分度
分析是不够的,还需要分析题目反应分布情况
,检查它是否跟预期的反应分布模式符合,从
而发现需要修改之处。题目的难度和区分度也可以从反应分
布中得到反映。进行题目反应分
布分析,先要制作题目反应分布表。下面是该表的示例,表中还列出了有
关的分析和判断:
*为答对人数
二、目标参照性测验的题目分析
目标参照性测验
题目试测后的分析工作主要是作灵敏度分析和识别度分析,有时也要作题目
反应分布分析。
1
.灵敏度分析所谓灵敏度是指题目能灵敏地反映教学作用的能力,通常用目标教学前后被测
总体的通过率
之差来估计。
设目标教学前、后通过试题的被测人数分别为R1、R2,被测总体人数为N,则试题对
教学
的灵敏度指数S可按下式计算:
当S>0时,试题有效,S越大,试题对教学作用的感受
越灵敏;当S≤0时,需要研究是否
由教学不当而引起,如非教学不当引起,则可认为试题质量不佳。
2.识别度分析
题目识别度是指某试题能有效地识别达标者的能力,通常用合
格者通过本题的百分比跟不合
格者通过本题的百分比之差来估计。
设P1和P2分别为合格者和不合格者的本题通过率,则
识别度指标D=P1-P2
识别度指标的最大值为1.0,当D≤0时,该题无预期的识别能力。
题目识别度还可以用被
测是否合格跟是否通过本题的φ相关系数来表示。设题目在总人数为
N的被测总体中的试测结果如下表所
示:
所得φ相关系数需进行检验,方法是:按下式算出φx2
x2=Nφ2
的,其犯错误可能性为0.05。
3.题目反应分布分析
目标参照性测验的题目反
应分布分析方法跟常模参照性测验的分析方法相似。通过分析不但
可以发现题目中存在的问题,还可以了
解被测的错误类型及其分布,具有学习诊断作用。
三、试卷的信度分析
信度表示测量的一致
性、稳定性和测量结果的可靠性。测量时的随机误差越小,测量结果就
越接近真实值,其信度就越高;样
本统计量越是接近总体参数,其信度也越高。
信度常用信度系数rxx表示,其值在0~1之间。若r
xx=0,表明实得分数完全由偶然误差决
定;若rxx=1,表明实得分数完全不受偶然误差的影响。
一般说来,化学学业成绩测验的信
度应在0.90以上,甚至达到0.95。
由于Sr和SR难于直接测得,所以rxx通常借助于某些特别方法进行计算。
(一)常模参照测验信度的计算
常模参照测验的信度系数可以用再测法、等价测验法和两半法
等方法求得,所得信度系数意
义略有不同,分别表示测量的再测稳定性、等价测量稳定性和内在一致性,
故又分别称为稳
定性系数、等价性系数和内部一致性系数。在化学教学测量中,常用下列方法计算内部一
致
性系数。
1.两半法,即在一次施测后,把试题分为对等、可比的两半,其内容、预测难度
、总分和
题数都大致相同;计分时把各被测的两半实得总分分开统计,计算两半间的积差相关系数;
式中,x、y分别为某被测实得的两半总分,N为被测总数。
再将rhh代入下式校正,即可得整卷的信度系数rxx。
采用这一校正公式时,两半的平均
数、标准差、项目的组间相关、分布的形态和内容都应相
近。否则,整个测验的信度估计rxx将有误差
。此时可改用下式计算rxx:
式中,Sa、Sb分别为两半分数的标准差,St为整个测验总分方差
,Sd为两半分数之差的标
准差。
2.克龙巴赫法方差。
影响测验信度的因素主要有:
(1)测验长度:测验越长,题量越大,信度越高。
(2)试题难度:当各题难度和平均难度为中等(P=0.25~0.75)时,有利于提高测验的信
度
。
(3)样本(或总体)大小:样本(或总体)越大,分数分布越广,信度越高。
(4)测验内容的复杂性:测验内容同质性高,信度也高;反之,内容越庞杂,信度就越低。
(5)施测条件的标准化,有利于减小随机误差的影响。
(6)评分的客观性。
(二)目标参照测验信度的计算
复本法:以等价的两份测验对同一被测群体施测,设测验结果的分布情况如下表所示:
四、试卷的效度分析
效度表示测量跟测量目的符合的程度,是测量准确性和有
效性的指标。跟测验目的无关的因
素影响越小,测验的有效性即效度就越高。
(一)常模参照测验的效标关联效度
在确定常模参照测验的效度时,通常以另一比较符合测量
目的的测量结果作为检测效度的参
照标准(即效标)。设被测总数为N,x和y分别为被测i的本次测得
成绩和效标成绩,则
若已将成绩转换成Z标准分,则
rxy>0时,说明两者相关(正相关
),rxy值越大相关程度也越大;rxy=1时表示测量完全反
映测量的目的;rxy=0时,表明两
组分数完全不相关(零相关)测量结果跟测量目的无关;
rxy<0时为负相关,表明一测量得分高者另
一测量得分低,测量结果跟测量目的完全相反。
一般情况下,化学学业成绩测验的效度应在0.4~0.
7之间
系统误差和随机误差跟实得分数方差比值的大小影响着效度的高低,要提高效度,就必须:
(1)提高测验的信度,减小随机误差的影响。
(2)施测标准化、评分标准化、采用适宜的
分数合成方法,减少与测验的目的无关的因素,
尽量降低系统误差的影响。题文难于理解、数学计算过于
复杂等,均会降低测验的效度。
(3)提高命题质量。试题太少、偏、怪,覆盖面小、编排不当、过难过易等,都会影响效
度。
(4)增大样本容量、使之具有较好的代表性。
(5)选择可靠(信度高)、符合测量目的的测验作效标。
效度系数也可以视具体情况改用二列相关系数或者点二列相关系数、φ相关系数等来表示。
(二)目标参照测验的效度
目标参照测验要求测量结果的变异最好为零,故不能用变异量来表
示其效度。此时,可以通
过内容适宜性来确定其效度。
五、试卷难度分析
试卷难度跟试题难度相似,可以用得分率表示:
也可以用各题难度加权平均求得:
当P卷为0.5左右时,测验分数的分布近于正态。