第十讲 考试质量的评价
对于考试质量的评价,主要通过对效度、信度、区分度和难度四个指标的分析来实现。
一、效度
(一) 效度的含义:考试的有效性。
(二) 效度分析
1.内容效度
① 内容效度含义:考试内容与预定要考内容一致性程度。
② 内容效度的分析方法:利用双向细目表进行分析。注意编制双向细目表的步骤和要求。
2.效标关联效度
① 效标关联效度含义:考试结果与效标的一致性程度。注意效标的含义及效标的选择。
② 效标关联程度的分析方法:主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进行显著性检验。
二、信度
(一) 信度含义:考试的可靠性。
(二) 信度分析
1. 再测信度
① 再测信度含义:用同一份试卷对同一组学生不同时进行前后两次考试,然后分析两次考试结果的一致性。
② 再测信度的分析方法:主要通过考察两次考试结果的相关程度,即计算两次考试成绩的相关系数并且进行显著性检验。
③ 再测信度的不足之处:前后两次考试的时间间隔不易把握。
2. 分半信度
① 分半信度的含义:有意识的把试卷编制成等效的两个部分,然后分析这两部分考试结果的一致性程度。这相当于一份试卷对同一组学生同时进行两次考试,避免了再测信度两次时间间隔的问题。
② 分半信度的计算方法:先计算两部分结果的相关系数,再代入分半信度计算公式,即p58的(3.1)公式。
③ 分半信度的解释:客观题的应达到0.9以上,主观题的
应达到0.8以上。
三、难度
1.难度含义:试题的难易程度。
(二)难度分析
1.难度系数的计算
① 主观题:见p343的(12.2)公式
② 客观题:见p344的(12.3)公式
2.难度系数的解释
① P>0.7时较易
② P<0.3时较难
③ 时较适中。
3.全卷的平均难度及难度分配
一般来说,全卷的平均难度应在0.45-0.55之间。全卷的题目难度分配一般为 易:中:难=3:5:2。当然要结合考试目的灵活处理。
四、区分度
1. 区分度含义:试题的鉴别能力。
2. 区分度分析
1.相关法:计算学生试题得分与试卷总分的相关系数并且进行显著性检验。
2.两端分组法
① 两端分组法区分度(D)的计算公式:见p343的(12.1)公式。D=
其中分别为学生高分组和低分组中的难度。注意高分组和低分组各取27%的学生。
②两端分组法区分度D的解释
1)当D时区分度属好
2)当时区分度比较好
3)时区分度还可以
4)
五、考试质量分析报告的主要指标值:见p344