学生对科学知识的熟习和掌握被定义为:在成绩考评中,对科学实践、交叉概念和核心内容等知识的融会贯通。该定义对学生掌握科学知识和科学实践提出新要求的同时,对科学教育发展监测系统水平评估的设计也构成了挑战。本文既有应对这类挑战的系统途径,亦有对科学评估原则的应用例子。文章认为,支持科学教学的评估设计,以及以新观念促进科学知识学习而言,挑战和机遇并存。

  就科学教学来说,我们面临着未来的非凡前景,而要实现学习和精通科学知识的理想,我们同时也面临着挑战:即如何评估学生掌握科学知识的程度,并支持而不是抑制这种教学和学习。教育评估应是科学家、教育家、决策者和家长对学生学习和期望的陈述。业已得到证实的是,我们所选择的评估条件最终将成为教学的重点。关键问题是,科学评估,无论课堂内外,是最能代表我们对学生掌握科学知识程度的期望值。本文认为,对于科学学习程度的评估,无论是课堂教学水平,还是系统监测的目的,很大程度上还有待于创建。即便如此,也不乏一些令人鼓舞的实际例子。

Fig. 1

1.20131月,NGSS初步草案中关于生命科学的一组4级标准

科学教育新观念

  通过典型的成绩测试,以及将所学知识运用于科学推理、论证和调查中发现,学生在科学知识和科学实践之间存在脱节现象。在针对幼儿园到中小学各年级学生的一些研究报告中,均一致认同熟习和掌握科学知识的意义,很少有报告能够像在学生掌握科学知识的学习和评估、以及应做出改变必要性上取得如此一致的意见。对于所谓熟习掌握的定义,最突出的是美国国家研究委员会(NRC)中小学自然科学教育框架中(简称NRC框架)提出的三点:(1)各学科领域内的核心或“重大”观念;(2)科学和工程推理的实践能力;(3)对一些跨学科概念的理解。
  综合起来,意味着学生对科学的理解不只是一个个单独的元素,而是对各方面知识的融会贯通。通过对预期成绩的考察,以及对各年级学生科学知识掌握的理解和实践,评估方式要超越如“了解”、“理解”等模糊字眼,而是要涉及一些更具体的语句,如“分析”、“比较”、“预测”、“模式”等,将科学知识与科学实践紧密结合起来。教育工作者应该认识到,对科学知识的熟习程度是随着时间发展的,而精通程度和实践能力的提高则是课程、教学和评估这一不可分割系统的产物。

Fig. 2

2.对应于新的生物学考试的简短的构答反应例子

  上述观点的提出,表明教育工作者正做好准备,便以更好地评估教学工作的成果,以帮助学生达到预期目标。这对于科学教育领域来说非常重要,什么是高质量的和有效的评估,决策者和公众都有一个共识,那就是这种评估是否支持教学和学习,并达到预期科学教育的效果。

预期与评估设计

  NRC框架以三个互相交织的层面来描述学生的发展水平,即学科核心思想、跨学科概念和科学与工程实践。该框架还提供了各个年级在实践或概念知识进展上可能达到的水平。依据这些提议制定的《下一代科学教育标准》(NGSS),包括了实践的定义,以及各年级对跨学科概念实际应用水平的图表。
  将科学学习作为一个整体,通过评估确定某个学生经过科学实践和对跨学科概念的应用,以及对某一科学核心理念日益“科学”的理解的定位,是科学评估领域内一个较为新颖的观点――它经常被看作是衡量学生是否掌握了所在年级水平的内容――这意味着评估必须适合于年级水平的行为表现,或灵活地降低或提高所在年级的水平。
  NRC框架指出,评估的设计必须在要求学生理解某个学科理念时,收集学生对某个学科理念的理解和应用能力,以及对跨学科概念理解的证据。该框架提议使用《大学科学学习标准》中提出的模型来制定预期行为表现标准,以此指导制定标准明确的含有对各个年级学生通过科学实践和跨学科概念来理解核心理念的预期。NGSS提出了关于某特定学科核心理念的行为表现预期(参见图1的草案例子),即每个阶段的行为表现要求学生以涉及某个学科核心理念的相关知识进行专门的科学实践。
  设计有效性和可靠性的科学评价,取决于如图示的学科框架中的一些要素(但并不限于这些要素)。在设计考评项目和任务相关的行为表现预期时,还需考虑(1)各种概念模型以及预期学生参与的证据;(2)用以评价行为表现的适合年级水平的考评内容;(3)任务设计特性的选择(如电脑模拟或动画、纸笔写作和绘画等)对于诱导学生对行为表现预期要求的内容进行思考必不可少;(4)揭示学生理解和技能水平的证据类型。
  评估涉及到证据的推演,已被证明对于框架评估发展为以证据为中心的设计过程(ECD)的系统化是非常有用的。这个过程首先定义为,评价学生对科学知识掌握的熟练程度,涉及可能包括力与运动或热量与温度的某些知识。最关键是这些定义要尽可能地准确,并以诸如“建模”、“解释”、“预测”等动词来表达。从本质上来说,NGSS所称的行为表现预期是关于学生对科学知识掌握的熟习程度。
  如果支持证据掌握了关于运动定律的知识,那么学生就可以对力作用于所有物体上的物理状态进行分析。具体证据就是,他可以绘出自由落体的图表,并标出图中所有的力所代表的意义,包括力的大小和方向。

科学评估之示例

  考虑到NRC框架是个新事物,与NGSS行为表现预期完全吻合的实例不存在,也就不足为奇了。许多用于课堂评估,以及在一些国家或国际性的测试中的例子,主要侧重于科学方面的内容,或在与测试内容分开的科学调查问卷中,少数例外。这类评估并不能像NRC框架或NGSS提出的方式那样,将核心概念和科学实践整合起来。然而,我们可以借鉴于这些例子,来说明哪些是我们需要的,包括ECD方法指导评估设计和验证的例子。
  课堂教学评估有几个项目已开发出用于课堂教学的评估方法,重点强调了核心科学概念与一个或更多科学实践的结合,这些实践包括建模、以证据为基础的解释和论证、以及和/或用于测试假设、分析结果和构建对数据解释的设计等。其中最为明白的例子发表在《科学教学必威体育备用地址 》上的阿隆佐(Alonzo)和戈特沃尔斯(Gotwals)主编的关于学习进展和评估的特刊号上,其他一些例子包括在SimScientists,Science ASSISTments和BioKids等项目中。
  国家和国际级大型评估大多数学生和教师经历的科学评估都为从外部到常规的课堂教学评估,并以大规模国家级测试形式出现,例如,体现在对美国“不让一个孩子掉队法案”作出回应的教学管理中。虽然州级评估的质量各不相同,但没有一个接近于NRC框架、NGSS讨论的行为表现预期。相比之下,两个大型评估程序更接近于涉及科学实践的科学能力的例证:美国国家教育进展评估(NAEP)和国际学生评估项目(PISA)。

未来前景与挑战

  设计有效和可靠的评估要充分体现科学实践、跨学科概念和科学核心思想的结合。“下一代科学标准”中的行为表现预期,为评估设计带来了严峻的挑战。这项研究必须以教学为背景,让学生有充分的机会来形成由NRC框架和NGSS所构想的综合性的知识结构。
  NGSS中假定的关于学习进展的大部分内容都需要通过实验法研究进行验证,验证需适用于各个年龄段和各个年级学生的评估任务和情境,其实证结果可用于支持设计更有效的课程材料和教学实践。
  2009年和2011年美国教育进展评估的构成,包括确定了生命科学、物理科学、地球科学和空间科学领域内一些专门内容,以及一组科学实践内容:(1)对科学原理的辨别;(2)对科学原理的运用;(3)对科学调查的运用;(4)对技术设计的运用。项目分为两个大类:选择反应(如多项选择)和构答反应(如简短答案)。与试用于4年级、8年级和12年级的NAEP评估方式相比,国际学生评估计划(PISA)只针对年满15岁的学生。
  对于NAEP和PISA来说,特别重要的是,简单或复杂的评估项目都要求有对NRC框架和NGSS中描述的科学内容的论证,两种评估项目中的行为表现都对应于之前描述的科学能力。NAEP和PISA用以指导评估设计和任务开发的框架经历了重大修改,越来越倾向于与相关技术结合,以此作为任务设计和评估学生表现的一个关键方面。NAEP框架在未来十年里可能再次被修订,PISA科学框架2015年的修订计划已在进行之中,表明其在向NRC框架靠拢,与NRC框架或NGSS达成一致,以监测全美科学教学的整体进展。
  对科学能力反思的途径也可在大学预修(AP)课程的重新设计,以及对生物学、化学和物理课程的评估中找到。AP为高中学生提供大学课程。从2006年开始,管理AP的美国大学理事会,在每年的AP结束之际,对已确定的科学能力的关键内容、科学实践重新进行定义。
  针对使用逆向设计和儿童早期开发项目(ECD)的补充程序,开发了一个适用于各个科学学科的框架,其中包括各学科中的重大理论、持久性理解、支持性知识以及7个科学实践。补充程序类似于NRC框架中提出的核心理念和科学实践结合,以及NRC框架提倡并在NGSS得以实现的一些观点。其中,行为表现预期或学习目标在每个学科中被明确定义,并在核心理念与科学实践的结合中得以体现。
  这样的考试2013年5月首次在生物学科中进行,2014年或2015年将试行在化学和物理学科中推行。为帮助教师和学生适应新的课程和新的考试方式,AP提供了包括评估样本等资料,以反映科学实践与核心科学理念相结合的重大转换要求。
  评估是科学教育改革中的一个关键性因素。这项工作做好了,意味着学生可以从中学到些什么、或能够做些什么的同时,帮助教育工作者创造一个实现这些目标的学习环境。反之,会误导教学计划的制定和学生的学习。最大的风险可能在于,在对达成目标所需任务和工具未充分研究、开发和验证之前,就急于将NGSS转变为高风险州级测试的评估任务。尤其是,我们必须确保给予教师时间、支持和评估工具,以创建一个学生有充分机会学习科学知识的教学环境。

资料来源Science

责任编辑 则 鸣