谈历史学科的考试评价标准_历史论文

谈历史学科的考试评价标准

时间：2007-3-30栏目：历史论文

难不易的状况，以求达到好的区分度。当然，问答题最理想的设计还是从思维的角度划分层次，这样能充分利用题型的功能。
    以上是对于各种试题总的评价目标，但具体到不同类型的试题，也有不同的要求：
    ［客观题］
    一、试题内容适合使用选择题
    从理论上说，选择题应该可以考查各种内容和能力要求，但目前对于选择题的功能尚未完全发掘出来，也由于受到试卷长度的限制，所以有的内容不适于选择题使用。比如考查叙述、论证、对历史材料中所含有效信息的筛选等，在选择题中难以实施，尤其是涉及理论的内容，弄不好就会形成模式化、概念化的东西。这几年，实际上用于选择题方面的内容在不断扩大，由最初的考查再认、再现能力的内容，扩大到理解、分析、综合甚至评价的内容。选择题的发展方向是在发掘题目多样化的同时注重考查历史思维水平。
    二、题干围绕一个中心，选项和题干的关系一致
    题干围绕一个中心，首先，题干必须有一个相对完整的中心问题，不能将题干要表达的意思放到选项中去。其次，题干不能产生歧意。选项和题干的关系一致是指选项和题干围绕一个共同的问题，不能出现与题干所问无关的选项。
    三、干扰项有效
    干扰项有效是指对正确项的干扰有效。一道选择题出的是否成功，除了正确项无误外，干扰项也相当重要，因为它起到了调节试题难度的作用。如果干扰项不起干扰作用，易被学生排除，试题难度就会下降，因为学生不用对正确项进行分析，只凭排除错误项即可做答，这样，不仅难度下降，区分度也会随之下降。所以，干扰有效也存在一个程度问题。这个程度的控制标准就是使试题达到中等难度为最合适。如何使干扰项有效呢？一是干扰项和正确项对试题题干的关系应该一致，这个在前边也讲过；二是干扰项应该代表考生的典型错误，否则，就会出现干扰项太易或大部分考生把某一干扰项做为正确项的情况。这样，考试的有效程度就会降低，在选拔性考试中，这一点显得尤为重要。
    四、各选项的结构、长度大体一致
    这实际上是要求各选项要整齐。结构是说句式、用词、语气要大体一致，不能出现迥然不同的表述，这样容易带来某种暗示，或者引起评分上的分歧。长度是说文字长度要大体一致，一般来说，选项的文字不宜过长。如果文字不长不足以表述一个相对完整的意思，那么就要考虑重新设计题目内容。
    五、正确选项比例分布合理
    从总题量的角度说，正确项应该大致均匀地分布在四个选项中，这会降低猜题、蒙题的可能，提高考试效果。在多选题当中，正确项存在一个比例问题，原则上正确项不能集中在某一数量上，也要有所分布，同时分布要均匀。
    ［主观题］
    一、题目设计体现运用已有知识解决新问题的能力考查要求
    运用已有知识解决新问题的能力是对学科能力要求的一个概括性表述。它体现在试题设计上应该包含这样几层意思：其一，题目涉及的内容在教材中有依托。其二，题目要设计成不同于教材表述的新情境。其三，题目要引导考生对历史现象进行新的认识。
    这里边第二条最不容易做得好。因为新情境的设计首先受到教材的制约，往往是新情境同时也会带来许多的新的内容，如果这些内容在教材中没有涉及到，就要进行修改、剪裁，弄不好会给人以削足适履之感，有时甚至会失去新情境的意义。在历史学科中，所谓新情境实际上就是人们认识历史现象的新角度或展示的新材料。这些东西不是文学创作，可以由命题者去编制，它必须来源于既有的材料和现实中人们在研究历史现象时所认识到的那些问题以及认识角度，它的规定性很强，要恰当地把它们改造成一种新情境并与考生已有知识对接，这实际上是一种特殊的创造性劳动，做到天衣无缝相当不容易。当然，这并不意味着新情境都会带来新角度，命题者不能一味单纯求新，关键还是要看新情境有没有一定的深度，它自身的认识价值如何。这也是我们评价问答题时应注意的一个问题。
    二、考查较高层次的学科能力
    历史学科十项能力要求中，涉及对历史材料的分析运用能力、论证能力、评价历史事件、历史人物的能力应该是较高层次的学科能力。这几方面的能力有些共同特点，一是理论水平要求高，二是对历史材料和信息的处理水平要求高，三是对文字表述水平要求高，总的来说，较高层次的能力要求综合性强。
    较高层次的学科能力是以较低层次的学科能力为其基础的。在主观题的设计中，命题者很注意由较低层次向较高层次的深入梯度，也就是说，涉及再认、再现历史事实、叙述、理解的能力要求在主观题中仍占有一定的份量，所以，确切地说应该是重点考查较高层次的学科能力。
    三、难度和答题量与赋分值合理
    赋分值是指题目在全卷总分当中的比值。历史学科四种题型的赋分值不同，从每道题来说，填空题０．５分；选择题１分、２分；材料解析题９分左右；问答题１２分左右，由此可以看出，赋分值是随着试题的难度和答题量的增长而增长的。那么，对于赋分值与难度、答题量的关系的含义就应该这样认识：赋分值是考试内容含量的显示，它反映支付思维活动和文字表述活动的程度。难度和答题量的控制依据是赋分的比值。
    但是这里边有两个问题需要注意，一是赋分值和难度、答题量的关系在同一题型内是相对整齐的，但不同题型相比较就复杂一些，比如十个１分的选择题和一个１０分的问答题的比较只能是大致整齐。在主观题中，应特别注意分数的分布和难度、答题量的比重。比重应体现能力考查的要求，应体现对学科深层含义的理解。二是主观题的难度相对地比客观题的难度要高一些，不能用整卷的平均难度值去衡量主观题的难度。另外，主观题的难度和答题量关系要具体而论，通常，涉及再认、再现历史事实的内容，即使文字量多，但难度不高，赋分也较少；涉及综合、分析、评价的内容，即使文字量不多，但难度较高，赋分也多一些。
    三、评分
    一、参考答案及评分标准具有科学性和可操作性
    科学性是指参考答案和评分标准无科学性错误，另外，亦指程度合适。对于选择题来说，答案就是正确选项，在设计正确选项时就要考虑到它的科学性和程度问题。程度包含难度，也包含其它的因素，如应排除正确选项的偏、怪现象以及它和干扰项的内容是否平衡等等。
    对于主观题来说，科学性首先是指参考答案和评分标准科学合理。另外，重要的是要看参考答案是否体现了一个相对完整的科学含义，是否揭示了题目各个因素之间的内部联系。可操作性是指评分标准应与参考答案相呼应，相一致，同时又有一定程度的变通性，也就是说，评分标准对答案来说既是给分的依据又是变通的依据。这要求评分标准的含量要大于具体的答案，要能放得开又能锁得住。总之，评分标准应能够应付对同一问题的各种理解的表述。
    二、主观题评分既能有效地控制评分误差，又能鼓励考生有创见地答题
    控制评分误差和鼓励有创见地答题是一对矛盾。控制评分误差是要求在评分中尽可能具体地设想考生的各种思路，并在评分中予以规定；鼓励有创见地答题则要求题目是开放性的，但题目的开放会给评分的实施中自然显得不好操作，变通无依据。题目越开放，评分误差就越难以控制，这是各科考试中遇到的普遍问题。因此，这条评价标准只能是相对而言，我们只能从题目在多大程度上鼓励了考生有创见地答案，在评分中是否相应地采取了控制误差的方法，这就是说，题目向前发展了一步，评分也要向前发展一步，二者应该是相辅相成的。
    就历史学科来说，控制评分误差有几个环节应该抓住；其一，题目的考查目标要在评分中体现出来；其二，考查目标应被分解成得分等级，每一等级应概括考生中的几种答题情况；考查目标的主体内容应分布各得分等级中，主体内容是决定基本分的主

上一页 [1] [2] [3] 下一页

下页更精彩：1 3 4 下一页