评估方案：在批评声中推行

发布时间：13年12月21日

编译王大鹏

很多政府部门正在评估大学研究的质量，这使得很多研究人员大为沮丧。

　　两年前，英国兰卡斯特大学（Lancaster University）的科研人员发现他们在绩效评估方面无所适从。他们每个人都要提交过去几年里发表过的四篇最好的文章，然后再用几个月的时间来让同事们组成的评审小组判定这些文章的质量，这些评审小组的成员至少有一个是大学之外的。那些评审不合格的科研人员会得到各种形式的帮助，包括一个更具经验的同事的辅导、提前休假或者暂时离开教学工作。

　　该所大学并没有实施这项巨大的工作，而只是确保其科研人员做好自己的本职工作。这项评估工作是为了研究卓越框架（the Research Excellence Framework，简称REF）做准备而进行的一次演练，该框架是一个即将在英国各所大学和公共研究机构开展的对科研质量进行大规模评估的活动，并且将于2014年正式启动。

　　开展本次演练的初衷是“找到那些我们可以帮助科研人员提升自身形象的领域”，兰卡斯特大学主管科研的前大学副校长特里沃·麦克米兰（Trevor McMillan）如是说。他认为，让人欣慰的是评估结果表明同最近一次开展于2008年的全国性评估相比，本次评估的得分要高很多。

　　但是其他的模拟评估活动进展的并不顺利。一项由英国高校联盟（the University and College Union，简称UCU）对超过7000名英国高校科研人员开展的调查（该调查结果于2013年10月3日发表）表明，大约有12%的科研人员说他们被告知：如果在本校开展的演练评估中无法达到该校设立的研究卓越框架基准的话，在真正的研究卓越框架开始之前他们将同学校签订只从事教学（而不从事科研）的协议（见go.nature.com/eqiirr）。还有大约10%的科研人员说他们面临着晋升的道路被堵死的问题。卡迪夫大学（Cardiff University）的考古学家同时也是该大学研究卓越框架的英国高校联盟联络人的彼得·格斯特（Peter Guest）说，为了不拉低科研人员所在院系的评分，在卡迪夫大学大约有10名在模拟评估中不达标的科研人员被迫和学校签订了只从事教学的协议。这种形式的博弈是让人沮丧的，但是并没有得到研究卓越框架的明令禁止――然而，把对大学科研人员的职业抉择完全“托付”给这种评估是违背大学自身的政策以及其他制度的，格斯特说道。

　　卡迪夫大学这些经历表明，对于科研机构来说，在研究卓越框架预先设定分数的基础上来做出职业生涯决策是非常诱人的，但这些分数是高度主观的。格斯特也认为这既不可靠又不公平。（为了回应这个事件的一些问题，该大学的一个发言人在一封邮件中这样说道：“我们有一个已经运行了长达四年之久的长期项目，其目的是确保我们同科研人员签订的协议能够反应他们实际的工作量。”）

　　即使在模拟评估中取得了很高分数的很多科研人员也对此感到愤怒。在英国全境内，科研人员把这种全国性评估看作是一种会扼杀科研人员创造性的官僚作风。

承受压力

　　兰卡斯特大学的大多数科研人员认为这种研究卓越框架的模拟测试只不过是一种“有点让人烦恼的”官僚作风，而实际情况并非如此。该校的数学和统计系的一名科研人员说，“我们让本部门的顶尖科研人员致力于研究卓越框架筹备，但是这占据了他们大约三分之一的精力。看起来是一种人才的浪费。”太多的科研人员把精力放在了获取资金支持或者试图预测什么样的工作在接下来的评估中能够获得奖赏，而不是做他们能做的最好的科学研究，英国牛津大学（University of Oxford）的实验心理学家多萝西·毕晓普（Dorothy Bishop）说道。“我认为这些天来很多科研项目都没有很好地开展下去，因为科研人员正在试图做太多其他的事情。”

　　但是大学的管理者们和政府官员们已经开始依靠这些评估的结果来帮助他们决定如何分配科研经费。这种观念在教育部门的领导人中间很普遍，以至于其他国家也开始效仿英国，澳大利亚、意大利、德国和其他国家也采取了类似的做法。

　　在20世纪80年代末期，英国成为第一个对其大学研究的质量进行系统性评估的国家。研究卓越框架只是该系列评估方法的一种最新形式。以前的评估形式是研究评估考核（the Research Assessment Exercise,简称为RAE），人们广泛地认为这种评估方法有助于改善该国的研究体系。在2006年到2010年期间，英国科研人员发表的学术文章的引用率提升了7.2%，这比全球6.3%的平均水平还要高一些；根据一份由爱思维尔（Elsevier）出版社在2011年为政府开展的分析表明，英国的引用率份额每年增加0.9%。

　　英国政府利用这个评估的结果来向大学分配每年超过16亿英镑（约合26亿美元）的项目经费。这些经费的70%以上都被那些排名前20左右的大学拿走了――去年（2012年），牛津大学得到了超过1.3亿英镑的与研究质量相关的经费――然而，那些最小的、研究能力最差的科研机构只能靠几万英镑勉强度日。这些评估结果被迫不及待地整合成一个排名榜，而该排名榜则显示了哪些大学在哪些学科中科研能力最强（见“前五强”）。

　　“该评估的声誉同其财务一样重要，”麦克米兰说。那些在特定学科方面具有很强研究能力的一些小型科研机构――比如兰卡斯特大学的物理学――认为这个评估的一个后果就是他们在那些研究能力较强的学科中录取学生变得更容易了。其后效还不止如此。“还有一个收获就是人们真的希望到那些在研究评估考核中表现优异的部门就职，我们发现在物理学领域招聘到高质量的科研人员变得容易了。”麦克米兰说道。

　　对于研究卓越框架来说，各大学要把从本校最活跃的研究人员中遴选出的学术成果提交给十多个具体科目评审组中的一个，这些大约相当于大学院系的评审组被称为评估处（Units of Assessment）。评审组通过同行评议和诸如引证指标等标志来评估这些研究的质量。而且他们还将首次评估大学科研项目的经济效益和社会效益。

　　即使是对这项评估持反对意见的人也认为它们对国家的研究体系产生了一些积极的影响。因为这个评估通过科学研究的质量来评判科研人员的学术水平，所以很多院系试图削减其他需求，比如行政管理工作，格斯特说。此外，评估的结果清晰地表明了哪些院系和科研人员没有尽心尽力，所以各大学可以在如何投入资源方面做出策略性决定。

　　伦敦大学皇家霍洛威学院(Royal Holloway,University of London)在1986年完成第一次研究评估后就面临着这样的境况，当次评估把该大学的心理学系排在了全国倒数第一的位置，认知心理学家兼该学院心理学系研究主任凯西·拉斯特尔(Kathy Rastle)说。认识到通过聘用知名专家可能无法提高其排名，该学院的心理学系认为应该吸收并培养年轻的人才。“我们尽量把精力放在那些我们认为发展潜力巨大的人员身上，”拉斯特尔说。

　　她说，皇家霍洛威学院为那些处于职业发展早期的心理学家们提供了“大量的且量身定做的”职业发展方案，这些职业发展方案保证心理学家们入职后的前两年时间里几乎没有任何教学任务。在撰写经费申请书的过程中，他们还从经验丰富的同事们那里获得帮助。

　　经过了为期20年的苦心经营后，该校的心理学系在2008年的研究评估考核中进入了全国前十名的行列。它还有更大的雄心壮志。拉斯特尔说，“我希望把研究卓越框架看作是一个机遇，通过它来展示我们做了什么，并且提升我们的排名。”

理念的扩展

　　随着其他国家开始实施本国的研究评估活动，它们也希望得到同样的收益。今年（即2013年），意大利出版了它们于2011年开展的评估的结果（见《自然》，http://doi.org/nrx；2013）；其目标是提升全国各个大学的精英制度，当前这些大学中职级和教龄相同的科研人员的收入是完全一样的，不管他们的产出是否一样。“并没有激励措施来改善你的研究表现，”在位于罗马的意大利国家研究委员会（the National Research Council of Italy）从事文献计量学研究和研究评估的吉奥瓦尼·亚伯拉默（Giovanni Abramo）说。“现在政府拨给大学的研究经费中的一部分要根据这个评估的结果来分配。”

　　对于那些有教学任务的科研人员来说，意大利只评估他们的三篇研究论文；而澳大利亚则对本国大学中科研人员的所有研究产出进行评估，并且把这些产出看作是澳大利亚卓越研究（Excellence in Research for Australia简称ERA）活动的一部分，最近的一次评估活动开展于2012年。只有相当小的一部分经费的分配取决于评估结果：今年（2013年），（评估结果的）排名决定了6800万澳元（6400万美元）经费的分配。评估结果主要用来给科研机构提供一种观点，这些观点表明这些科研机构的研究水平在全国以及国际上处于什么位置，澳大利亚研究委员会的首席执行官艾丹·拜恩（Aidan Byrne）说。

　　拜恩说，这些实践带来了收益。比如，它有助于研究委员会以合理的方式来分配其8亿澳元的竞争性经费组合。开展一轮评估要花费400万澳元，拜恩说，“这在质量控制方面是一种非常有效的方法。”他说，虽然在澳大利亚卓越研究和拨款过程之间没有正式的关联，但是对经费申请进行同行评议的科研机构意识到了澳大利亚卓越研究的结果，并且这些评估结果会被纳入到他们的决策之中。

持续的伤痛

　　对意大利、澳大利亚和其他国家最新一轮的评估活动如何影响该国的研究环境进行评判还为时尚早。但是研究人员们说他们看到了有一定年份的英国项目并且知道其中的一些弱点。

　　英国高校联盟的一个国家产业关系官员斯蒂法诺·费勒(Stefano Fella)说，英国高校联盟调查中的一个主要担忧是很多大学规定其科研人员在2008年到2013年之间必须有4个高质量的出版物。在接受该调查的所有科研人员中，有67%的科研人员认为如果不增加额外的工作量他们将无法提供规定的产出，还有34%的科研人员认为这种压力会影响他们的健康。费勒还说，很多科研人员表示这种调查改变了他们工作的方法――比如，很多人可能会在评估期间匆忙地发表学术成果，即使这些工作可能在稍晚发表更获益。“他们不考虑展示其研究的最佳方式”，费勒说，“而是考虑什么才是最适合研究卓越框架要求的。”

　　密苏里堪萨斯大学（the University of Missouri-Kansas City）的经济学家弗里德里克·李（Frederic Lee）研究了英国的研究评估体系如何影响了他的学科（即经济学）。在20世纪90年代就职于英国莱斯特的德蒙福特大学（De Montfort University）时，他就直接地经历过两轮评估。他认为那些研究替代理论（比如马克思主义经济学理论）的经济学家们已经被排挤出了经济学领域，因为该评估一贯地偏好那些精英科研机构的主流工作，以及在一小部分必威体育备用地址上发表的成果。他说，“出现了一种导致研究主题同质性的盲从效应。”

　　李还说他从来没有被强迫放弃他在英国对正统经济学理论的历史所进行的研究，而是被鼓励把他的研究成果提交给特定的主流必威体育备用地址，这些必威体育备用地址对他研究成果的发表来说还有一线生机。其他科研人员告诉他说他们被迫转移到更加传统的研究主题上来，甚至有些科研人员被主要科研机构的相关院系“扫地出门”。《自然》同曼彻斯特大学（University of Manchester）研究替代理论的一名经济学家进行了交流，他离开了该大学的经济系，部分原因是对研究评估考核友好型理论的关注意味着理论发展的前景似乎是根本不存在的。

　　科研人员们特别担心对研究卓越框架中研究的影响力进行评估的活动。他们担心这会释放出一种对短期的应用型研究偏好的信号，而冷落了那些没有明显的、即刻公益性的基础研究。“就我而言，人们应该做好的科学研究，而不是通过这种让人震惊的策略性方式来思考科学”，毕晓普说，“有些好的科学是需要花费很长的时间才能展现出来的。”

“人们应该做好的科学研究”

　　用在提交报告方面的时间，精力和经费也是一个主要的疑虑：根据2009年对这些实践的一项研究表明，筹备2008年的研究评估考核消耗掉了4700万英镑的大学经费。诸如兰卡斯特这些规模较小的大学要求其一些科研人员花费数月的时间来对模拟研究卓越框架的申请进行评审。对于行政管理人员来说，其时间压力可能会更大，这些管理人员可能要聘用外部人员来开展研究卓越框架的工作，毕晓普如是说。比如，伦敦大学学院已经聘用了四名编辑顾问来开展有关评估的影响力方面的工作。

　　麦克米兰说在筹备一个新标准的时候，花费多一点的时间和经费是自然而然的事情。“这是一个我们不太适应的维度。”他还认为兰卡斯特大学的行政管理人员聘用了外部的专业编辑人员来对这个过程的最后一部分提供帮助：对科研人员和大学的研究辅助部门撰写的案例研究和影响陈述报告进行润色。另外，麦克米兰本人每周要花两到三天的时间来对兰卡斯特大学提交的报告进行微调。“我认为研究卓越框架可能要比以前的实践花费更多的时间”，他说，“向影响力议程的变迁见证了工作量的大量增加。”

　　但是有些大学见证了这些工作的收益。皇家霍洛威学院心理学系所做的巨大改善表明了周期性的评估会有多大的帮助，拉斯特尔说。“让研究卓越框架笼罩在我们的头上会确保我们竭尽所能地让我们的科研人员人尽其才。”

资料来源 Nature

责任编辑粒灰