1. 形成性评估的“形成性”特点体现在哪些方面?如何理解形成性评估?形成性评估实践的核心和步骤有哪些?
(1)形成性评估的“形成性”特点体现在哪些方面?本书第2—4页详细梳理了“形成性”这一术语的界定和发展【篇幅所限,此处不再详述】。从中可以总结出,形成性评估中的“形成性”特点体现在以下五个方面:在教学过程中实施;关于学生学习;以既定标准为参照;以改进教学为目的;可能对随后的教学产生有益的影响。
只有同时具备上述五个特点,评估才有可能具有形成性。
(2)如何理解形成性评估?形成性评估实践的核心和步骤有哪些?形成性评估的本质是评估,评估是为了某个评估目的、基于一定的证据而进行的推断过程,其实践过程包含如下基本步骤:设计评估工具,使用评估工具收集相关信息,解读、评判信息,运用评判结果实现某种目的。
我们将形成性评估定义为:在教学过程中实施的、为了改进教与学的推断过程,整个过程围绕评估目标展开,包含四个基本步骤,即收集学生学习证据、解读证据、提供反馈和跟进行动。
图1.3展示了顾永琦教授在2021年提出的形成性评估模型(见本书第27页)。
这一模型展示了理想的形成性评估,由明确形成性评估目的、完成形成性评估实践和实现形成性评估效果三部分组成,其中形成性评估实践也被称为基本的形成性评估,是由五个要素组成的循环。明确目标是形成性评估实践的核心,对评估过程中的收集证据、解读证据、提供反馈、跟进行动每一个步骤起到重要的指导作用。教师只有完成至少一次完整的循环,才有可能使学生更靠近学习目标。有时教师往往要经过几轮形成性评估螺旋式循环,才能实现评估目标。而在实际的课堂中,图中所示的理想的形成性评估其实是很难实现的,比如计划性形成性评估通常有明确的评估目的和完整的评估实践,但评估效果却无法保证;而互动性形成性评估通常缺乏明确的评估目的,有时也不能实现评估效果。
2. 形成性评估与自主学习理论有何联系?形成性评估如何提高学生的自主学习能力?
【篇幅所限,本题答案请见本书第34—36页】
3. 如何确定课堂形成性评估的目标?
李老师:明确的教学和学习目标是形成性评估的出发点和最终归宿,贯穿于评估始终(顾永琦、李加义 2020a),决定收集、解释和使用信息的方式(Cowie & Bell 1999),并为检查教学成功与否提供参照依据。在教—学—评一体化的形成性评估中,评估的目标同样也是教学和学习的目标。在以英语为外语的课堂语言教学中,教—学—评的目标其实就是英语语言能力。
在以英语为外语的语言教学中,教师的课堂形成性评估目标可根据两点来具体确定:首先,应参照课程标准,课程标准中规定的教学和学习内容即为评估内容。其次,应参照语言能力的理论构念,教师应跳出每堂课的具体目标,对语言能力的理论构念进行整体把握,将具体目标对应在语言能力坐标上,并在课堂中随时依据情况进行判断。
【篇幅所限,有关课程标准和语言能力的理论构念解读,请见本书第38—47页】
4. 形成性评估中收集证据的工具有哪些类型?在形成性评估中,如何确保反馈的质量?
李老师:(1) 形成性评估中收集证据的工具有哪些类型?【篇幅所限,有关形成性评估中收集证据的工具类型,请见本书第53—55页】
(2) 在形成性评估中,如何确保反馈的质量?简单来讲,在适当时机提供的、具有一定特点的反馈,才可能对学生的学习带来积极效果。
从反馈的时机看,在语言课堂上,及时反馈,对于学生的语言学习尤为重要,比如学生在课堂上进行口头展示,教师可以在展示后立即反馈,有时甚至可以在学生表现过程中给出反馈。如果拖到下一节课才对学生在语言技能上的表现给出延时反馈,学生很可能已经忘记了自己当时的表现,教师的反馈效果也会大打折扣。
从反馈内容来看,反馈分为两类,评价类反馈和信息类反馈。评价类反馈是指对学生本人、学生的能力和/或学生的表现给出的评价,包括正面或负面的评价。信息类反馈是指反馈者针对学生的表现,指出具体的优点、不足、可能产生的原因和/或今后的努力方向。信息类反馈有以下四个特点:反馈的内容既要依据既定标准对学生表现做出判定,也要包括针对学生进步的提示和指导;反馈应与评估目标和评估标准挂钩,帮助学生进一步明晰和内化评估目标和标准;反馈难易度和详细度应与学生的认知水平相吻合;反馈应促使学生从自身可控的因素总结错误原因,而非归咎于一些不可控的外在因素。
信息类反馈是形成性评估实现促学功能的关键所在。为了确保反馈对学生有提供信息和促成进步的作用,我们建议形成性评估的反馈应以信息类反馈为主,偶尔结合正面的评价类反馈激励学生,避免使用负面的评价类反馈。
5. 形成性评估的质量标准有哪些?如何验证形成性评估的效度?
李老师:(1)形成性评估的质量标准有哪些?形成性评估的质量标准包括内容效度、解释和使用效度以及信度。
对于内容效度,首先,形成性评估内容要保证相关性和代表性,即形成性评估内容必须与教学和学习的目标相关,评估任务代表课程中指定的语言学习任务。其次,从评估中获得的信息要具有充分性和准确性,任何课堂活动都具有形成性评估的潜质,应关注各种活动中可能出现的形成性评估信息,并对其进行判断和分析,用于调整教学,实现学生能力提升目标。
对于解释和使用效度,形成性评估信息的解释在很大程度上取决于评估者对评估目标的理解和对学习者当前水平与评估目标差距的判断。此外,是否和如何使用评估信息决定了评估任务的形成性。
对于信度,由于课堂形成性评估主要取决于教师对学生表现的评估,相关性最强的指标应是评估者内信度和评估者间信度。另外,多次观察和判断是课堂评估的另一特点,因此信度稳定性也尤为重要。
(2)如何验证形成性评估的效度?传统的效度验证采用的是收集评估内容、解释和使用、信度等不同方面效度证据的传统思路。我们在书中提出使用基于论证的效度验证框架验证形成性评估的效度。基于论证的效度验证是允许所有证据作为一个连贯整体呈现的验证框架,具体分为两个论证步骤:第一步,解释和使用论证。搭建一个环环相扣的推理链(见图5.1),明确概述根据评估结果做出的主要推论以及主张。第二步,效度论证。系统论证每一项主张或者是推论的可靠性,使用的是Toulmin(2003)的论证模型(见图5.2)。
【篇幅所限,有关基于论证的形成性评估效度验证方法,请见本书第79—81页,课堂形成性评估效度验证实例,请见本书第81—84页】
6. 运用形成性评估的指导原则有哪些?
李老师:运用形成性评估的指导原则包括:主体多样原则、目标明确原则、方法适宜原则、基于标准和关注进步原则、做出高质量反馈原则、有后续教学活动原则。【篇幅所限,本题答案请见本书第86—99页。】
1. 如何将语言知识与语言技能的评估形式与具体教学实践有机结合?
张老师:本书第七章提供了词汇语法知识,以及听、说、读、写等语言技能课的形成性评估教学实践,非常值得借鉴。例如:
在词汇教学中,学生可以主动说出自己出现理解困难的词汇或句子,教师则可以预估可能的难点并提前设计口头或笔头测试。通过巩固性练习、小测验、翻译句子或概要填空等方式,帮助学生掌握词汇。如果是表现型任务,可以让学生写作文或进行演讲。
在听力教学中,听后记录、转述和完成笔记是非常有效的方式。特别是听前和听后活动需要引起重视。这些活动能够直观地反映学生的表现,帮助教师更准确地解读学生的学习情况。相比选择题,这些方式提供的信息更加丰富。
在阅读教学中,可以布置预习作业并检查完成情况,或者让学生提前分组阅读背景知识。此外,让学生提问也是一种有效策略,提问的质量可以反映学生的阅读理解水平。通过完成阅读提纲、教师反馈、反复讨论,最终达成共识,这一过程很好地体现了形成性评估的循环。
在口语教学中,教师可以通过发现学生在口头表达中的语音语调等问题,给予反馈,并要求学生进行朗读或跟读练习。另外,展示活动也是一种有效形式,可以挑选学生进行全班展示、师生就展示给出反馈、被评价的学生和其他同学做出回应、教师给学生再次展示的机会。这种反馈互动和再次展示非常关键。
写作课的形成性评估方式更加多样化,这里不再展开细说。其他形成性评估方式还包括提问、课堂观察和学生反思日志。书中建议以表格形式记录观察内容,左列为学生名单,右列为教师希望观察的方面,如语法、语音、词汇等。反思日志可以帮助学生提高元认知策略的运用,促进自我调节能力。这些工具和策略之所以重要,是因为它们能为师生提供详细的参考信息。然而,更为关键的是,要合理使用这些信息以达成形成性评估的促学效果。
2. 第八章从哪些方面探讨了课外形成性评估?作者提供了哪些评估工具?
张老师:课堂外的形成性评估侧重培养学习者的自主学习能力,以弥补课堂教学时间和内容有限的不足。本章主要关注学习者自主学习的内容、量和技能这三个方面。对于自主学习内容,本章提到“每日一词”作业及其拓展形式(详见本书第122—124页)。它的核心是定时、随机检查学生课外学习的内容,这种方式可以灵活拓展,不局限于单词。例如,可以是汇报自己听到的新闻、概述课外阅读的一篇文章或小说,或者是讲述过去几天的一次经历,甚至是分享自己的一篇自由作文。
对于自主学习的量,本章提供了一个非常有用的活动——“自主听力100天”,也可以扩展为“自主阅读100天”或“自主练习100天”(详见本书第124—126页)。这个活动的关键在于教师获取学生表现的证据后,进行检查解读,并给出反馈,最终进行总结和汇总。
对于自主学习技能,本章介绍了其他工具和方法:有效使用词典、语料库和语法检测工具等确保语言的规范性。例如,当学生对某个词的使用感到不确定,就可以查阅词典或语料库,通过反馈改进自己的表达。对于学生来说,这种方法可以形成一个良好的形成性评估循环。
3. 基于网络的写作自动评阅系统和诊断评测系统在哪些方面体现了形成性评估的特征?
【篇幅所限,本题答案请见本书第129—146页】
4. 第十章中哪些研究案例给您留下了深刻印象?未来研究可参照怎样的研究思路?
张老师:针对教师的形成性评估实践研究,本章涉及Rea-Dickins & Gardner(2000)、Rea-Dickins(2001)、Ruiz-Primo & Furtak(2007)、Hill & McNamara(2012)、Gu(2014)等。针对形成性评估的有效性及其他研究,本章涉及Black et al.(2003)、Wiliam et al.(2004)、Andersson & Palm(2017)、Furtak et al.(2018)、Anders et al.(2022)等。【篇幅所限,此处不再详述,具体请见本书第154—159页】
未来研究可参照如下两个思路开展:(1)从形成性评估概念框架(参见第一阶段答疑干货图1.3)看实证研究,本书第160页详细列出了从这个角度出发的四方面研究问题,此处不再详述;(2)从效度验证框架(见表10.1)到实证研究,该框架中的主张和假设可以变成研究问题,找寻每个主张或假设的证据则是回答研究问题的方法。
5. 形成性评估研究有哪些类型?如何提出形成性评估的研究问题?
张老师:形成性评估研究包括描述型和探索型、关系型、比较型。这些研究类型的区别涉及如何收集数据和分析数据。表11.1清晰地呈现了这些研究的具体做法和区别,大家可以参考这些方法来开展研究。
关于如何提出研究问题,表11.4以诊断性测评为例,展示了如何将宽泛的研究问题转化为四个具体的研究问题,使研究者能够根据研究目的制订最适合的数据收集及分析计划。
6. 如何运用形成性评估模型(本书第27页)来分析课堂展示任务和自动评阅等教学活动?
张老师:本章展示了两项实证研究,分别对应前面所说的描述/探索型研究和因果关系型研究,可帮助老师们很好地理解如何在课堂形成性评估实践与研究中运用形成性评估模型。【篇幅所限,案例详情请见本书第171—202页】
7. 形成性评估的未来努力方向有哪些?
张老师:形成性评估未来可从如下几个方面努力。
第一,厘清形成性评估的构念及其具体意义对分析研究形成性评估很重要。目前我们比较常见的有Wiliam & Thompson(2008)提出的形成性评估五个核心策略,Ruiz-Primo & Furtak(2007)提出的形成性评估循环(ESRU),以及Gu(2021a)的形成性评估模型。本书建议未来研究使用Gu(2021a)的框架,形成性评估实证研究应该对明确目标、收集证据、解读证据、提供反馈和跟进行动等一个目标四个步骤的五大要素进行分别量化与综合描述,做到形成性评估部分与整体的有机结合。
第二,形成性评估是否能成功实施取决于教师与学生对目标的理解、定位和运用。因此,未来研究应对教—学—评的目标多加关注,既要关注语言教学的具体目标,又要关注教师和学生对目标的理解与运用(李加义、顾永琦 2021)。
第三,教育技术的运用是教育测评的研究者不可回避的话题。相对于传统测评,新技术在教育测评上的主要优势在于其强大的规模优势,即时、频繁与多模态的反馈功能,以及规律呈现与个性化相结合的数据处理能力,这些都是形成性评估可以利用的技术特色。不过,获取学习信息并给予相对模式化的反馈本身只能算是形成性评估的开始,要想利用信息及反馈改进教学与学习,需要教师与学生的深度参与,只有当教师与学生充分运用新技术所提供的方便去完成形成性评估,促学功能才能够实现。因此,我们呼吁研究者把注意力集中在如何运用新技术从而达到最佳促学效果上。
第四,在任何受教育人口数量较大的系统中,形成性评估的促学功能与大规模考试的选拔和问责功能都是不可或缺的。强调教学评估的形成性促学功能不应该以抛弃教育测评的评比、选拔、认证与问责功能为代价。在平衡评估(Stiggins 2008)方面,学界已做了不少工作,如把校本评估引入中学结业评估外(Davison 2023),还有学者提出了“终结性测试的形成性使用”(formative use of summative tests)概念(Carless 2011;Lam 2013)。然而,平衡点在哪里,如何平衡则需要更多大量尝试与研究。
第五,形成性评估的育人功能也是未来研究的一个努力方向。越来越多的学者开始将形成性评估与自我调节学习、协同调节学习和自主学习联系在一起(Andrade et al. 2021;Chen & Bonner 2020;Greene 2020;Panadero et al. 2018)。通过形成性评估,学生不只能提高学习成绩,还能改善学习策略,学会自我调节,养成自主学习、独立思考的好习惯(Li & Gu 2024)。形成性评估的这些育人功能,与“立德树人”的本质是一样的。