以较小的代价产生最优的效益:影响评估的必要性

英国于1986年面临经济动荡时,由于对公共资金的使用限制日益严格,导致一些要求加强问责制的政策也应运而生,该国推出了一项基于绩效的研究资助系统(现在称为REF)。该系统将大学的资助与其绩效联系在一起,以引入责任机制,并为有限资源的战略分配提供了参考。
该系统于2014年引入了“影响力”作为指标,以衡量某研究项目在学术界以外的效益。在此之前,英国的学术界人士普遍在基础研究最终会于各方面造福社会且科学家无需为自身研究提供其效益证明的假设前提下进行研究。随着影响评估计划的引入及研究资助转向更取决于研究效益而非研究产出,学术界人士不得不展示自身研究可以为社会所带来的价值。普遍认为,将研究资助(根据REF,英国每年的资助金额为约20亿英镑)与其产生的效益联系在一起,是对大学和研究人员为发展高等教育领域的世界级研究基地做出贡献的强大动力,也是提升英国研究卓越水平的唯一途径。
REF对“影响力”的定义为“对学术界以外的领域,如经济、社会、文化、公共政策或服务、健康、环境及生活质量所造成的影响、改变或效益”(re.ukri.org)。“在学术界以外”这一关键词对于了解REF的目的至关重要。这与学术影响或期刊的影响因子有所不同,后者与REF所谓的“影响力”无关。REF的主要目标是:
- “为研究资金的选择性分配提供参考;
- 为公共资金对研究项目的投入提供问责机制,并为该笔投入可产生的效益提供证据;
- 为高等教育界以及公共信息提供标竿并建立‘声誉’标准。”(ukri.org)
定性和定量
REF是使用绩效指标和专家评估对机构绩效进行评估的开创性方法。香港、澳大利亚、加拿大和一些斯堪的纳维亚国家均已采用了类似的框架来评估大学的绩效,但与这些框架不同的是,REF高度侧重于研究在学术界以外的效益(2014年及2021年分别为20%和25%),并且将同行评估作为关键途径。
REF使用的主观评估方法与“定性指标需要专家评估作为辅助” (Hicks et al., 2015) 的这一观点是一致的。然而使用这种方法的国家并不多。丹麦、芬兰、瑞典和挪威都坚持依据定性指标来决定资金的分配,这主要是出于成本考虑,并且这些国家并未察觉将资助与基于同行评价的研究评估联系在一起的好处。例如,瑞典和荷兰允许大学在内部专家组的帮助下独立进行研究评估,而这评估并未被资金考量所影响。
一项全球性改革运动
伴随着一些国家使用基于绩效的指标来管理机构资助,全球掀起了采用竞争性资助的趋势。香港和澳大利亚跟随了英国的步伐,引入了各自的影响评估框架来管理对大学的资金分配(澳大利亚的参与度和影响评估于2018年开始实行,您可在此处查看相关的评估案例报告)。这些评估正于全球各国推行,并有助于搭建大学与社会的双边关系。各个大学正在设立“影响评估官员”等此前从未听闻的职位或建立负责收集研究效益相关证据的团队。大学也被要求将资金投入于能够产生效益的研究项目,并重新检讨他们与社会的交流。这也使得影响评估逐渐成为了一项专业的领域,并已制定出各种致力于理解影响评估的含义和重要性的方案、培训项目、会议和工作坊。
获得较高的REF评分也会影响大学以及对该REF评分做出重大贡献的研究团队或人员的声誉。类似于REF的框架可能是像中国这样正在积极推动自身大学成为全球知名的研究机构的国家所亟需的。
未来计划
这种由大学为其研究效益提供证据的构思,尤其是英国的版本受到了一些批评。批评人士指出,这种需要证明自身研究在学术圈以外效益的压力转移了研究本身的焦点,并缩小了研究的选项范围。也有人批评资助不应取决于研究的“重要性”和“影响力”等主观因素。学者们普遍认为衡量影响力的标准在各个领域之间存在巨大差别,但艺术领域新发现的效益是否能与拯救生命的医学突破相比呢?莱斯特大学所发表一篇关于研究效益的文章很好地总结了这些难题:“如何评估历史研究的文化影响、政治研究的社会影响或医学研究的经济影响等,这些都是影响评估计划所面临的最大挑战之一” (莱斯特大学,2020)。研究人员、大学、资助机构和这些框架背后的智库将如何共同合作应对这些批评将是一个值得观察的有趣问题。
学术界以外的人士则似乎一致认为科学研究应为社会带来效益。REF和类似的框架可以确保大学至少符合这种看法。在特定学术和教育领域的资助受到削减的情况下-例如,日本于2015年因削减对人文和社会科学的资助受到了广泛批评(卫报,2015),将会有更多的国家不得不采用类似的框架来为资源的调配提供参考。这些国家是否会执行基于REF的框架或者是否会采用按照各自国家的社会政治和经济形势修改后的版本,还有待观察。英国为其2014年版本的REF花费了2.46亿英镑,这是大多数中低收入经济体可能不愿承担的金额。
此外,我们也需要观察英国脱欧会如何影响其REF的结构和执行情况-经济寒冬是否会使对大学的资助雪上加霜,还是大学和资助机构将携手探索出创新的解决方案?
REF影响评估的简明指南
欲争取资金的英国大学需要根据34项学科(包括经济、社会、文化、政策、卫生、环境和生活质量等)中的其中一项向对应的评估单元(UOA)提交申请。大学通常会在申请时附上关于所发表期刊文章、书籍、专著和其他研究成果的详细信息;详细说明自身研究对外界可带来效益的案例分析报告;以及可供审计的证据,如背书证明、调查结果、财务数据或任何其他证明相关案例报告中所做出的声明的方法等。该申请仅需大学提供一部分研究项目来进行案例分析:小型大学可以提供不足20项研究项目的案例分析,而大型大学可能需要提供超过100项研究项目的案例分析。
所提交的申请是由各UOA的专家小组依据四个主要专家组的指引进行评估,该四个主要专家组对该评估进行监督以确保评估标准在应用中的一致性。
撰写案例分析报告
- 研究效益的概述 (100个字)
- 基础研究的简介 (500个字)
- 相关文献 (6 篇引文)
- 关于研究效益的详述 (75个字)
- 证实相关效益的证据:已发表资料或机构/个人声明(10份)
大学需要根据REF的要求提供“额外的上下文数据”,以用于评估后的评价环节。这部分内容不计入以上的页数(5页)限制。
评分
提交适合的案例是至关重要的,因为这会影响大学所获得的评分。伦敦国王学院的REF交付总监Jo Lakey就缩小案例研究范围的流程和考虑因素分享了一些见解:
“要证明如物理和数学等学科在学术界以外的效益是相对较为困难的。“影响力”占据了该评估评分的25%。如果您提交两个案例,那他们各占评分的12.5%。如果您提交十个案例,那他们各占评分的2.5%。在评估阶段,这些案例将会获得一颗星至四颗星不等,甚至是获得“未分类”的评分,这些评分随后会被汇总起来,作为大学简介的一部分。
假设向评估单元A及B分别提交了两份及十份案例分析报告。评估单元A评估的两份案例报告都获得四颗星,也就是所获得的影响评分为100%四颗星。评估单元B评估的五份案例报告(50%)则获得三颗星,而其余五份案例报告(50%)获得两颗星。从以上的列子我们可以肯定地得出结论,即评估单元A所评估的两分案例比评估单元B所评估的10份案例具更好的表现。较大型的评估单元要求提交更多的案例报告,这将提高您获得低于100%四颗星的风险。因此,大学需要花费大量时间做足准备,以确保提交最佳的案例分析报告。
该评分机制缺乏透明度,使得识别高分案例较为困难。该评分会在大学简介页面展示。获得100%四颗星清楚显示该大学所提交的案例都获得了四颗星的评分,但如果获得25%四颗星,50%三颗星及25%两颗星,那外人就无法知晓这些个别案例所获得的评分。”
参考文献:
- “REF Impact,” Research England, 网址:https://re.ukri.org/research/ref-impact/
浏览日期:2019年10月27日。
- Hicks, Diana, Paul Wouters, Ludo Waltman, Sarah De Rijcke, and Ismael Rafols. “Bibliometrics: the Leiden Manifesto for research metrics.” Nature520, no. 7548 (2015): 429-431.
- “Measuring Impact,” 莱斯特大学, 网址:https://www2.le.ac.uk/offices/researchsupport/impact/measuring-impact
浏览日期:2019年10月27日
- Dean, Alex. “Japan’s humanities chop sends shivers down academic spines.” 网址:https://www.theguardian.com/higher-education-network/2015/sep/25/japans-humanities-chop-sends-shivers-down-academic-spines
修改日期:2015年9月26日