化学教学测量和评价相关知识
二 信度
信度(reliability)是指测验结果的一致性或稳定性。信度指标通常用相关系数表示。信度是测验的一致性的估计,效度是对测验的准确性程度的估计。应当说,测验的效度是最重要的,而测验的信度对于效度来说是必不可少的,效度的高低受信度的制约。所编制的测验若信度越小,则其效度也就越低。
常用的估量信度的方法有3种,可相应地求得3种信度:再测信度、复本信度和分半信度。
信度系数最大等于1,表示测验完全反映了受试者的稳定水平;最小等于零,表示受试者的得分完全是随机性的,与他们的知识水平无关。一般学业成绩测验要求信度系数在0.9左右,常会达到0.95。
提高测验信度的主要办法是:
(1)测验试题的覆盖面要宽;
(2)测验的方法和时间必须严格统一,测验的评定和记分的标准必须客观、统一;
(3)测验试题的难度要适当,指导语要明确、清晰;
(4)消除受试者的紧张心理,增强他们对测试环境的适应性,使他们发挥应有水平。
三 难度
难度(difficulty)指测试项目的难易程度,是测试工具对受试者知识与能力水平适合程度的指标。
在能力或非能力测验里,难度的指标是答对或通过每个项目的人数百分率(P值),即:
P代表项目的难度;
R为答对或通过某一项目的人数;
N为全体受试者人数;
P值越大,测验项目的难度越低;P值越小,难度越高。
测验试题的难度必须适当,一般以难度为0.3—0.8为宜。只有难度适当,方能保证测验试题具有较高的区分度。若难度过大,全体受试者都不能回答。难度过小,又形成全体受试者都能回答,两者都会降低测验的区分度,从而影响测验的效度和信度。
四 区分度
区分度(discrimination)是表示测验项目对受试者水平的鉴别能力的指标,故也称为鉴别力。区分度常从3种测验中体现出来:一是难度测验,这是最常用的一种测验;二是速度测验;三是广度测验。通常学业成绩测验,多含有这三种测验的性质。测验项目的区分度高,对受试者有较好的鉴别力,使程度高的学生得高分,程度低的学生得低分;区分度低的测验则不能有效地将程度不等的受试者区别开来。
区分度可以用相关系数计算,或采用简单的计算方法①。区分度值最高为1,表示测验项目对受试者的能力水平有完全的鉴别力;最低值为零,表示测验项目与受试者的能力水平无关。测试后,应淘汰区分度低的测验试题。标准化测验优秀试题的区分度常在0.40以上,区分度在0.29以下的试题则予淘汰,或经过改进后,再进行测试。
总之,良好的测验除应具备测量的正确性和测量的可靠性这些基本特征外,还应当具有:客观性、易于管理、易于记分和易于理解、实施,测验分数易于解释等特点。
第五节 化学测验试题的类型和试卷的编制
一 化学测验试题的类型
测验试题的类型是为测验目标服务,并受所测验的内容制约的。
英国专家曾把测验试题划分为七种类型①:
(1)正误型。让学生判断正确与错误,并用划(+)、(-)号作答。
(2)重现型。让学生借回忆解答某些关于事实和化学原理的问题。
(3)填充型。让学生根据题意填写空白。
(4)匹配型。让学生在给定的两列物质的名称、定义、类别或性质项中,划出配伍的连线。
(5)选优型。让学生从给出的多项答案选项中,选出正确答案项;试题选项设计成序列答案的形式,让学生判断写出或划出正确答案项的序号。
(6)思辨型。让学生从几种“答案”中,选出最佳答案,勾销错误答案。
(7)变动型。让学生运用已学过的知识和技能,解释图表或图示,综合概括有关数据得出结论。
我国高等学校入学考试,经过多年实践,逐渐形成了具有特色的多种化学测验试题,主要类型是:
(1)是非题。让考生判断答案的正误,在规定的空格内划出正、误记号。
(2)填空题。将题干中的关键字词以空格的形式出现,让考 生填充。
(3)选择题。试题的题干由直接问号或不完全陈述句构成,选项包括1个(或2个)正确答案以及3个(或4个)错误答案,随机排列各选项的顺序,让考生选出正确答案。
(4)改错题。让考生指出题目中的错误,并写出正确答案。
(5)问答题。让考生按题目要求答问,是填空题的变动型。
(6)鉴别(或鉴定)题。结合给定的实验事实或反应现象,让考生区分或确认某些物质。
(7)计算题。结合化学概念或原理,让考生解化学计算题。
(8)论证题。让考生运用化学原理推论、证实指定的问题。
(9)实验辨别题。让考生通过给出的化学实验现象或实验的结论,来回答有关实验装置、操作及异常现象方面的问题。
(10)信息给予题。让考生临场阅读给出的信息,综合、判断作出答案。
化学测验试题,还可以从不同的角度进行划分。例如,英国学者西姆逊(O.J.Simpson)将多种选择题区分为:(1)选择题;(2)分类题;(3)多种组合题;(4)诊断和推理题;(5)实验题①。我国学者将化学选择题划分为14种②,计有:(1)评价选择题;(2)配伍选择题;(3)比较选择题;(4)多解选择题;(5)组合选择题;(6)因果选择题;(7)填空选择题;(8)类推选择题;(9)分类选择题;(10)改错选择题;(11)排列选择题;(12)阅读选择题;(13)识图选择题;(14)相关选择题。这是因为,选择题(多项选一或多项选二)已成为各种客观性测验中被广泛采用的一种题型,对这类测验试题从多维度进行研究,自然是很必要的。《美国百科全书》中“教育”条目曾将多种选择答案的测验题概括为6种③:(1)多答案测验题;(2)选择错误答案的测验题;(3)合并或否定前面给出的答案的测验题;(4)评价测验题;(5)答案配对测验题;(6)分类测验题。
二 化学测验试卷的编制
试卷的编制是一项繁难、细致的工作。应当说,这项工作融会了编制专家的大量心血,是全面地体现教育思想、教学目的、教学要求和科学测量与评价原理的一项系统工程的成果。
为了保证测试的内容和范围符合测验标准,充分反映测试取样的代表性,同时又明确限定测验试题的数量和占分比例,在施测或试验试行的基础上,制定测验试题组合的双向细目表(简称双向细目表)是必需的。
我国广东省化学高考标准化命题双向细目表(见表9-1),可作为一个典型实例。
又如美国化学会考试委员会使用的由阿史福德(T.A.Ash-ford)描述的成绩水平发展而成的组合(Thegrid)表,也是一个据以设计测验试题双向细目表的好例。
行为目标Ⅰ 回忆重要事实的能力
知道重要事实,
知道重要术语的定义,
获得重要概念,
理解理论和原理的字词含义,
较重要的元素及其化合物的性质的一般知识。
行为目标Ⅱ 应用原理进行简单预测的能力
对化学原理和理论及其解释的基本了解,
定义的应用,
应用原理于类似的典型课程遇到过的那些情境,
应用原理于日常生活里的新情境,
解释一组数据并从中得出结论。
行为目标Ⅲ 应用原理进行定量计算的能力
化学符号的量的含义,
配平化学方程式。
行为目标Ⅳ 运用科学方法的能力
区分观察到的现象与对这些现象的理论解释,
用理论术语说明现象, 对理论给出实验证明,
控制一个实验中的因数,
完全靠定义说明这个是真实的。
领域1 化学变化,元素、化合物;化合反应定律,分子运动论,化学计算。
领域2 溶液,电离,酸碱盐,中和反应,水解,金属活动性顺序,电化学。
领域3 氧化还原反应,反应热,反应速率,化学平衡。
领域4 原子结构与化学性质,元素周期系。
领域5 普通元素及其化合物的化学。氢、氧、卤素、硫族、氮
族的物理性质和化学性质,典型金属。
有了上述双向细目表,命题专家组就可以编制出有一定难度和区分度的试题,且试题(卷)的效度和信度比较高。同时,测验试题涵盖的知识和能力的比重也比较稳定。当然,如果已建立了测验试题库,那就从根本上保证了试卷编制和测试等过程的科学化、标准化。
三 试卷的分析与评价
测验试卷施测以后,经过评阅、记分,需要进行试卷分析和统计,以从中获取诸多的有益的信息,进而做出评价。
试卷分析的方法服务于不同的目的。为了分析教学效果,了解学生的学习情况而进行的试卷分析,意在于查明测验分数高低的原因。学生得分普遍较高,要分析判定是由于测验试题太容易,还是表明教授得法、教学效果好、学习水平高;学生得分低,是因为试题太难,还是由于教学效果差所致。
以调查研究教与学的情况为目的进行的试卷分析,教师可以采用列表记录每道题的学生的答案,统计有多少人答错;或者将批阅后的试卷(或答案纸)发还给学生,要求学生将答错的题标出来。这样就可以使教师迅速查明学生对哪些知识要点、哪部分内容掌握得不好,以作为随后的补救教学(补课、辅导)的依据。
为了评价测验本身的优劣而进行的试卷分析,应当根据教学 测量“四度”的要求,来进行试卷分析。这种试卷分析与对测验进行的评价,可以有效地帮助教师和有关专家判断测验方案的效果,以决定取舍或修订、调整。
评估测验优劣的方法是教育测量和评价专门研究的课题。这里仅作简略介绍。
1.相对评价的数量表示和解释
相对评价,也称为常模参照评价,是以个体的成绩与同一团体的平均成绩(或常模)相互比较,从而确定该个体成绩的适当等级的表示方法。教师据此可以比较某生与班级(或全体受试者)内其他学生成绩的高低。
为此,必须将学生的得分(试卷上记载的'分数)或称原始分数,经过一定的处理,方可用来说明问题。
(1)标准分数。标准分数也叫Z分数。系指原始分数与其平均数的差数,以标准差为单位表示的数值。计算公式为:
当Z值为零时,正好在平均数的位置,表明学生的学业成绩一般;Z为正值,则表明学业成绩高于一般;Z为负值,则学业成绩低于一般。
把原始分数转换为标准分数之后,每个考生的学业成绩在同一团体中的位置一目了然。但由于Z分数有正、有负,不便于使用,经过变换,遂采用T分数。
T=10Z+50
T分数以50为一般,50以上越大越优,50以下越小越劣。采用T分数,不仅可以说明某生的测验分数在同一团体中所处的位置,可以在各考生之间进行比较,而且可以比较同一考生在不同学科成绩上的优劣,见表9-3。
(2)百分等级。一个特定分数在一百个等级中所处的等级位置称为百分等级。常用PR(PercentileRanks)表示。某考生的测验分数的百分等级就是低于这个分数的考生个数占团体总考生数的百分比。例如,某考生化学考试得分为65分,班上40名学生中有28名的分数低于65分,因此,该考生在班上化学考试中所处的百分等级是:
这就表明:在班上有70%的学生测验分数低于65分,即该生的成绩优于全班70%的学生。
2.绝对评价
绝对评价是以受试者本人的现状与既定的教学目标作比较。教学目标就是评定目标。
考生能够完成多少体现教学目标的测试题才算达标,这是需要结合学习的性质和要求来确定的问题。一般言之,短期的教学目标和要求学生必须掌握的基本内容,达标值可定得高一些,如90%或100%;而对于较长期的教学目标与只需要让学生一般了解的内容,达标要求可以低一点,如80%或85%,但至少要在70%以上。
绝对评价的评分,一般采用合格或不合格,也可以采用三级或五级评分。
三级标准的答对率如下:
好——答对率在85%以上;
中——答对率在70%—84%;
差——答对率在69%以下。
应当指出,上表中的等级和数字标记为美国实行的五级分制;答对率为我国实行的五级分制的量化指标。前者为相对评分,后者的答对率(记为相应的得分)为绝对评分。两者不宜折合计算,并列在一起仅供参考。
绝对评价适用于形成性测验和诊断性测验。获得的反馈信息,便于及时了解学生掌握知识与能力水平的具体情况,以利及时调整、改进教学。
第六节 化学教学评价
教学评价是教育评价的一个子系统。教学评价是指收集教学 系统各方面的信息,并依据一定的客观标准对教学及其效果作出衡量和科学判定的过程。
化学教学评价是教学评价理论在化学教学中的运用和发展。从方法论原则上讲,化学教学评价的基本目的,也应当遵循以下结论①:(1)客观认定教师的教学效果;(2)诊断教学疑难,改进教学;(3)提供反馈信息,促进学生学习。为了实现这些目的,需要从几个方面来进行研究,方可取得良好效果。这些方面②是:
(1)学习目的。通过了解评价结果,来激发学生的学习积极性,引导他们调整学习方法,促使他们进行自我评价。
(2)指导目的。意义在于改进和提高教师对教学的指导作用。
(3)管理目的。在于给学生选择适当的环境,提供相应的教育处置。
(4)研究目的。教学、教育研究工作者用于科学研究的评价。
化学教学评价主要包括化学教学过程评价、化学学习活动评价和化学教学效果评价。其中,前两者是侧重从教与学的角度概括地评估教学过程与学习活动的成就的,可归属于过程评价,而化学教学效果评价则属于结果评价。过程评价与结果评价即是已被广泛采用的形成性评价与总结性评价。
在不同的教学阶段,基于不同的目的而进行的教学评价,与形成性评价和总结性评价并列的还有诊断性评价。这是化学教学评价的主要的三种类型。
实施化学教学评价的一般程序①是:
(1)准备阶段。包括确定评价目的、编制评价指标体系、选择评价方法等。
(2)搜集评价信息阶段。要采用一切有效的、可行的方法搜集评价所需的充分的信息。
(3)分析、判断阶段。对所搜集的原始资料、数据进行加工处理,形成综合判断,获得评价结论。
(4)评价结果的利用阶段。将评价结论反馈于化学教学过程,以改进教学工作,还可以为更大范围的教育评价提供资料。
化学教学评价常采用测量的和非测量的方法以获取所需的信息,即采用测验法、观察法、谈话法、问卷调查法及个案研究法来得到评价所需的量的描述和质的描述两方面的信息。关于测验法,在本章第二节讨论过的准备性测验、形成性测验和总结性测验恰为与诊断性评价、形成性评价和总结性评价相匹配而实施。其他的评价测量方法,可参看教育科学研究方法与教育测量等专著。②
在化学教学评价中,为了提高评价的质量,应当注意把握以下方法论原则:
(1)重视相对评价与绝对评价相结合,注重绝对评价;
(2)讲究定性评价与定量评价相结合,注重定量评价;
(3)做到形成性评价与总结性评价相结合,注重形成性评价。
【化学教学测量和评价相关知识】相关文章:
化学用语的相关知识02-19
化学实验的相关知识的归纳02-22
和人体相关的物理小知识06-28
化学教学自我评价08-14
化学知识的记忆方法和策略07-13
分子和原子化学知识归纳09-06
化学物质鉴别的相关知识点02-23
危险化学品储存的相关知识3篇02-18
化学计量相关知识点的练习题08-02