您目前的位置: 首页» 本校成果» 翟亚军 王晴:“双一流”建设语境下的学科评估再造

翟亚军 王晴:“双一流”建设语境下的学科评估再造

  学科评估是学科质量保障体系的重要组成部分,建设世界一流学科离不开学科评估的保驾护航。世界一流学科语境下的学科评估存在着窄化、泛化、矮化和固化等现象。随着“双一流”建设名单的尘埃落地,世界一流学科建设的序幕全面拉开,学科评估的消弊和再造也时不我待。

  一、学科评估之殇

  学科评估是一个内涵丰富的概念,一个逻辑严密的理论体系,更是一项严谨复杂的实践活动。概念的误解、逻辑的混乱以及实践的偏差都会折损学科评估的质量。

  1.学科评估窄化为学科排名

  高等教育正处在一个排行榜时代。不论是大学评估还是学科评估,几乎都在以评估之名行排名之事。第三方评估自不必言,行政性评估(或准行政性评估)也不遑多让。学科因为其更适合排名的特质,所以学科评估也就几乎成了“学科排名”的天下。泰晤士高等教育(THE)的“世界大学专业排名”、QS全球教育集团的“世界大学学科排名”、美国新闻与世界报道的“世界大学学科领域排名”、上海软科的“世界一流学科排名”、美国科技信息所的“ESI学科排名”等都是具有较高知名度的学科排行榜。

  目前国内最有影响力的学科评估当属教育部学位与研究生教育发展中心(下文简称“教育部学位中心”)开展的“一级学科评估”。和前述世界大学学科排名的大张旗鼓相比,教育部学位中心则一直强调自己的非排名目的。不过,众所周知,其第一轮和第二轮评估结果纯粹以排名方式公布,第三轮评估虽然采取了一定的措施,如按指标体系计算得到原始得分后,再采用“聚类统计”算法,将原始得分相近的聚为一类,然后按类公布。但实际上,按类公布虽较按分公布有了一定的改变,但仍外显出浓重的排名痕迹。第四轮评估结果将以何种方式面世,我们不得而知。不过,从各界的反映和期待来看,该评估即为排名的看法已经是根深蒂固。

  学科评估窄化为学科排名,在一定程度上忽略或者抹杀了学科的丰富内涵。将丰富的学科用几个机械的数字表达,是用最简单的方法评判最复杂的事情,如果再用其来指导实践,无疑是一件十分荒谬的事情。学科排名,可以参考,但不能迷恋。

  2.学科评估泛化为大学评估

  现代意义上的大学起源于中世纪的博洛尼亚大学、萨莱诺大学和巴黎大学,现代意义上的学科则萌芽于17世纪。早期的大学和学科发展并不同步。直到19世纪,当洪堡提出“教学与科研并重”的理念并在柏林大学得以践行的时候,学科才从大学的边缘走向大学的中心。在我国,从上世纪80年代开始,学科之于大学的重要性终于得到广泛认可。“学科是大学得以存在和发展的基础,是大学办学水平和办学特色的重要指标。学科建设是打造世界一流大学的基础性工程。”

  随着学科在大学地位的提升,言必称学科在大学成为了一种必须和时尚。对学科的重视在给学科带来大发展的同时也带来了对学科建设功能的过度解读。在这种过度解读之下,大学建设和学科建设被混为一谈。这种混淆的直接后果就是学科评估和大学评估的不分彼此。而由于大学评估在前,学科评估在后,所以学科评估不可避免的会效法乃至因袭大学评估,终极的表现就是学科评估被泛化为大学评估。表1显示出,许多广受瞩目的世界大学排行榜和学科排行榜,或多或少都存在指标体系雷同的现象。

  

  学科评估泛化为大学评估,模糊了学科和大学的界限,抹平了学科和大学的重点,偏离了大学和学科发展的内核,违背了大学和学科的本质和规律。从学科的本源来看,知识性是大学最基本的特征,创造知识是学科最基本和最原始的功能。一般意义上的学科本身并不具有教学的含义,学科新人的培养都是在学术研究中进行的,教学只是学科进驻大学后建立在学科基本功能之上的延伸和拓展。学科进驻大学之后,就开始徘徊于学术研究和人才培养的矛盾之中,学科评估被泛化为大学评估正是这种矛盾的集中体现。

  3.学科评估矮化为一般学科评估

  学科是人类关于世界认识成果的一种分类,是人们在长期发展过程中产生的知识碎片混合物经过分化、整合、重组建构起来的具有一定知识范畴的逻辑体系。知识是一个网状的连续体,学科是这个连续体被分割后的一个个独立个体。一方面,每个学科都是这个知识系统的一部分,所有学科都包含共同的基因。另一方面,“龙生九子,九子各不同”,每一个学科都拥有自己不同于其他学科的研究范畴和研究范式。学科类属的不同决定了评估指标体系的差异,学科分类评估即源于此。

  同一类属学科因为归属于不同大学而有了不同的表现,这种不同或表现于学科水平,或表现于学科研究领域。正是由于学科水平的不同才使得学科排名具有了逻辑上的意义。但是,不是一切有价值的都能量化,也不是一切能量化的都有价值,逻辑意义与实践价值之间并不能完全划上等号。所以说,分层评估不仅可行而且必要。但是和分类评估的发展相比,人们似乎还远远没有认识到分层评估的重要性。就目前已有的学科评估来看,不论学科如何划分,也不论同一类别下学科规模如何,同一类属的学科都是采取同一指标体系进行评估的。以ESI排名为例,据其2017年11月的统计,在21个学科领域中,进入全球前1%的学科数超过1.9万。也就是说,参与排名的机构次数超过190万。其中,临床医学最多,超过了40万个(见表2)。试想,怎样的指标体系才能对如此规模的学科进行精确的区隔?或者说有没有一个指标体系能对如此规模的学科进行精确的区隔?

  

  任何有看点的比赛,双方水平必然旗鼓相当。学科评估也一样。把一流学科和一般学科放在一起进行评估甚至排名,看上去似乎很公平合理,毕竟指标面前人人平等。但是,一流学科和一般学科的区别不仅仅是某项指标上得分的高低,其水平的悬殊使得二者具有了本质的不同。这种不同反应在评估上,就是一流学科评估必须是能够显示一流学科韵味的高端指标,是一般学科渴望而不可及的指标。

  4.学科评估固化为特定学科评估

  多元化评估已成为大学学科评估的潮流。多元的评估主体、多元的评估目的、多元的评估模式、多元的评估方法,多元的评估内容构成了一幅学科评估的丰富图景。多元化的评估可以帮助人们多角度认识学科,不过现实中其实存在着大量奉某一特定评估为规皋,过度迷信或者迷恋某一特定评估的现象。比如,在部分省份和大学公布的“双一流”建设规划中,ESI学科排名被作为是否世界一流的依据,而教育部学位中心的一级学科评估则被看成是国内学科排名的依据,将进入ESI全球前1%或前1‰作为进军世界一流的目标,将进入教育部学位中心的一级学科排名前列作为进军国内一流的目标(见表3)。

  

  将一流学科评估局限于某一特定的评估,会人为的关闭全方位了解学科的窗口,将学科建设局限于一个或有限的几个指标建设上。比如,由于大多数评估指标体系中论文发表占有绝对大的比重,许多大学于是把发表论文作为了学科建设的主要追求。为了增加论文发表数量,使其在评估中有一个良好的表现,于是将论文发表与奖金挂钩,与评优挂钩,与职称挂钩,凡事用论文说话。当然,论文规模确实有了突飞猛进的增长。据有关统计,目前我国已成为世界第二科技论文大国,科技论文数量和“自然指数”等指标仅次于美国。但是论文数量的增加并没有带来质量的同步增长,我国科研实力与科技发达国家差距依然很大,还不是科技强国。自然科学如此,人文社会科学则更令人担忧。以历史学为例,据李华瑞估计,在1.5万篇宋史论文中,1/3-1/2是完全没有学术价值的废品,余下的到底有多少具有较高的学术价值也很难说。

  二、学科评估不能承受之重

  评估不是救世主。评估的局限决定了评估功能的有限,过分夸大评估功能或试图利用评估攫取利益,都会降低评估的质量。

  1.被忽略的评估局限

  评估无疑是有益的。1980年代后期,日本著名学者喜多村和之教授研究指出,美国大学“强盛”的原因之一,就是“大学从里到外被种种评价包围着”。评估的益处很多,“评估有益于高校摸清家底,有益于促进竞争,有益于内涵建设,有益于帮助公众了解大学”。但是评估也不是万能的,评估的局限决定了其在学科建设中作用的间接和有限。

  首先,学科评估是一项主观性很强的活动。评估是评估主体为了某种目的而对评估客体进行的评判。不论评估者如何强调评估的客观性,评估者的学科观和价值观都会渗透于评估之中。定量评估曾因为数据的精确可靠和结果的直观可视赢得了人们的推崇。但随着评估的发展和对学科认识的加深,定量评估的局限也越来越明显,机械和粗糙是人们对其诟病的主要原因。为了摆脱这种局限,人们转而又开始加大定性评估的比重。于是,蕴含评估者主观意识的评估指标体系叠加上定性指标得到的主观数据,学科评估的主观性得到了强化。如QS学科排名指标体系的四个指标中包括有学术声誉和雇主声誉两个定性指标,占指标总数的50%。在其涉及到的46个学科中,牙医学、兽医学、护理学3个学科这两个指标的权重最低,合计为40%。其余43个学科均等于或大于50%,艺术与设计、现代语言和表演艺术三个学科更是高达100%。

  其次,学科评估是一项专业性很强的活动。评估者的知识素养、知识结构、能力品质,以及评估者的学科观和评估观都影响着评估的质量。即使认可度比较高的学科评估也可能出现专业性不足的问题,如在教育部学位中心组织的第四轮一级学科评估活动的前期,出现了评估者指定部分刊物为A刊的现象,一时间议论纷纷,饱受质疑,后来不得不取消了此种做法。

  当然,指定期刊这种做法与其说是专业性缺乏,不如说是一种行政思维在作祟。不过,缺乏专业性的学科评估并不鲜见,但并不是所有的情况都能被人们所意识到并且得以纠正。比如,某些评估存在着论文至上现象,把论文看做是表征学科水平的主要因素甚至是唯一因素。如浙江大学教育学院的国际大学创新力排行榜表征论文质量的指标权重为63%,武汉大学中国科学评价研究中心的世界大学科研竞争力排行榜为85%,荷兰莱顿大学科技研究中心的莱顿排名为100%,西班牙格兰纳达大学SCImago研究组的SCImago机构排名为100%,台湾高等教育评鉴中心基金会的世界大学科研论文质量评比为100%,当然论文权重为100%的学科排名当属最为大家所熟知的美国科技信息所的ESI学科排名。

  论文至上或者说唯论文论看似重视学术研究和学术成果,与学科的本质更相契合,其实则不然。学科学认为,学科内涵表现为知识说、组织说和规训说三种学说的共通和融合,肩负着人才培养、科学研究和服务社会的三大职能。发展知识是学科最原始也是早期最主流的功能,但学科发展至今,随着学科从大学边缘成为大学核心,学科功能也不断拓展,其功能的唯一性早已被打破。因此,主要或全部用一纸论文来考量学科无疑陷入了一种狭隘的学科论。

  2.被夸大的评估功能

  “学科评估并不能真正评估出学科的质量,为了便于操作,只是用一些显性的、可量化的指标来作为评价依据。目前大学里比较普遍的急功近利的种种做法,在很大程度上其实都是“指标”的需要,未必是出于真正学术的需要。”事实表明,学科评估功能被无限夸大的说法并不是无中生有,人们对评估功能的认识还存在着许多误区。

  误区之一:世界一流学科是评出来的。理论上人们是不认可这种说法的,但现实中这种说法又大有市场。想当初,我们不论是对于学科发展还是学科排名,都不掌握话语权,面对我们的学科在各学科排行榜上不尽如人意的表现,我们曾一度指摘这些排行榜表现出强烈的西方化倾向,认为这些排行榜是为西方量身订造,其排名不足以反映我国大学学科的真实水平(当然这也有部分道理,但主要的原因恐怕还是水平不足的问题)。但吊桅的是,如今排行榜还是那些排行榜,我们在排行榜上的表现却已可圈可点,此时我们似乎忘记了对这些排行榜曾经的腹诽和不屑,反而用其来证明我们的进步。是我们的学科水平提高了?还是这些排行榜在悄悄迎合着我们?亦或是我们在悄悄的迎合着这些排行榜?

  其实,只要对同一时间段不同的排行榜进行比较就会发现,位居各排行榜前列的总是那几个学科,虽然这些学科之间的名次会略有不同。这就揭示了一个基本事实:学科水平是一个客观存在,它的名次不会因为排行榜的不同而有明显的上升或下降。与其说世界一流学科由学科排行榜圈定,倒不如说学科排行榜赖由这些一流学科来证明。毕竟,人们对哪些是世界一流学科都有一个基本的认知。

  误区之二:学科评估会提高学科质量。就理论而言,学科评估和学科质量没有任何的关系,或者说评估和质量没有直接的必然联系。评估就如体检,体检的结论是“没问题”或“有问题”,以及“可能有什么问题”,仅此而已。如果通过体检发现了问题并得到及时的治疗,在这个意义上,体检和健康是有关系的。但如果讳疾忌医,那么体检有等于无,对于健康没有一点帮助。学科评估也是如此。如果评估结果得不到被评估者的认同,那么评估也只是评估者自娱自乐的活动,所谓的提高质量不过是评估者的臆想而已。而如果评估结果出现偏差,被评估者却据此去指导学科建设,那么此时的评估不仅不会提高质量反而会起到相反的作用。学科建设中出现的重规模轻质量、重科研轻教学等不良现象,不能不说是受到了某些不良评估的影响。

  3.被扭曲的评估诉求

  评估被捆绑了太多的利益因素[10]。学科评估包含了评估者、被评估者、政府、社会大众等众多的利益相关者,不同利益相关者对评估的诉求是不同的。

  学科评估被裹挟了太多的商业利益。在我国,评估制度完善和成熟的脚步并没有跟上政府职能转换的脚步。由于利益的诱惑,又由于缺少制度的约束,部分第三方评估把利益追求放在了评估的首位,因而出现了种种令人瞠目的现象。比如有的排行榜上赫然居于首位的学科其实根本就不存在,还有被披露出来的花钱买名次的现象,此外还有明修栈道暗度陈仓,借学科排名博取大家的关注,评估成为一种另类形式的广告。

  政府开展的评估是不含商业因素的,但是这并不表明政府的评估没有利益追求。随着政府职能的转变,管办评分离下的政府不能再直接开展学科评估,但是由于惯性思维,政府依然习惯于大学依附在自己的羽翼之下。教育部学位中心开展的一级学科评估应该是各大学最重视的学科评估,一方面是由于它的政府背景,其信息可能更为全面和可靠,当然这得益于其行政化背景下信息获取的便捷。另一方面就是其多数情况下被用来作为政府资源分配的主要依据。政府通过将评估结果与资源挂钩,实现了对学科从间接控制到直接控制。

  三、双一流语境下学科评估的再造之道

  1.恪守三大原则

  学科评估是一项严肃而科学的活动,去去利益化、行政化、去功利化是保证评估科学而纯粹的三大基本原则。在《国家中长期教育改革和发展规划纲要(2010-2020年)》中,“管办评分离”被作为教育体制改革,转变政府职能的重大举措正式提出。2013年,党的十八届三中全会通过的《关于全面深化改革若干重大问题的决定》,再次强调“深入推进管办评分离”。

  “管”、“办”、“评”,各有其权力主体,各安其位是管办评分离的基本主旨。“管”的权力主体是教育行政部门,“办”的权力主体是大学,和“管”“办”权力主体的单一性不同,“评”的权力主体是多元的,政府、社会或大学都可以成为学科评估的权力主体。管办评分离下,“政府评”只是众多评估模式中的一种,而随着管理型政府向服务型政府的转换,政府势必要从评估中抽身出来。

  目前,在政府还不能完全脱离评估时,政府开展的评估要坚持去行政化原则,防止将评估当成一种评判、影响甚至框定学科发展的手段。同时,政府要把工作的重心转移到加强评估立法,促进信息化建设,完善评估机构准入制度等法律、制度建设上来。当评估完全脱离行政化轨道的时候,评估制度也随之成熟与完善,以评估为手段攫取利益的行为将受到遏制,去利益化的评估成为现实。当大学学科建设没有了行政化评估和利益化评估的羁绊,就会远离功利和浮躁,回到学科建设本位上来。

  2.以学术的名义

  以学术的名义,就是一流学科评估要回归学科本真。学科评估是服务于学科发展目标,还是学科建设紧紧追踪学科评估指标?看似十分明了的事情,实际上却常常本末倒置。学科建设常常围绕学科排名进行,把学科排名作为学科建设的指挥棒。之所以如此,一是对学科和学科建设等相关概念和概念之间的逻辑关系不清楚;二是评估理念出现偏差,不知何为评估,也不知为何评估,更不知如何对待评估。简言之,就是最关乎学术的学科被非学术性的评估层层包围,学科评估非但不能惠及学科反而扰乱了学科的发展。

  以学术的名义,就是对学科评估保持一份敬畏。这种敬畏不仅是对学科的尊重,也是对评估活动的尊重。政府对学科评估保持敬畏,就是要求政府在评估中扮演好自己应该扮演的角色,安其位,负其责。社会对学科评估保持敬畏,就是要明白学科评估不是人人可以为之的活动,学科的知识、评估的技术、评估的伦理都是学科评估者必备的。大学对学科评估保持敬畏,就是当大学面对五花八门的学科评估时,要保持理性,坚守使命,使评估为我所用而不是被评估牵着鼻子走。

  3. 站在学科评估的世界制高点

  世界一流学科评估要有世界一流的品格和气度,有世界一流的胸怀和视野。虽然我们经常诟病已有的学科评估,也虽然这些学科评估存在着许多的缺陷,但是,这并没有阻挡我们仍然把它们作为了解甚至作出某些重要决断(比如双一流建设名单的确定)的依据。不过,西方语境下构建起来的学科评估指标体系,不可避免的在我国会出现水土不服的情况。之所以使用恐怕也有不得已而为之的成分,毕竟目前我们并没有构建起一个符合我国国情,并且世界通用的一流学科评估指标体系。

  以教育部学位中心开展的一流学科评估为例,和西方学科评估严重的西方化倾向不同,教育部学科评估中心开展的评估在适合我国国情上具有其他任何学科评估无可比拟的优势。可是,也恰恰是这种优势,成为了其不能拓展至全世界的阻碍。世界一流学科评估首先必须是世界的,必须要得到世界学术共同体的认可,与国际社会在一个话语体系之中,在这个评估体系面前,所有的学科都可以平等的展示自己。

  风物长宜放眼量,正是扬帆万里时。“双一流”建设战略的提出表达了我们对于世界一流的强烈渴望,展示了我们冲击世界一流的决心。能不能建成世界一流靠行动,而是不是世界一流靠评估。因此,世界一流学科评估与世界一流学科建设拥有同等重要的意义,当然也可以说,一流学科评估本身就是世界一流学科建设的一部分。世界一流的一流学科评估不仅需要世界一流的评估方法和技术,更需要世界一流的责任心、世界一流的气度和世界一流的品格。我们肩负着建设世界一流学科的重任,也肩负着早日构建起符合我国国情也具有世界普适性的一流学科评估体系的使命。“双一流”建设任重道远,唯有不忘初心、砥砺奋进,方能不辱使命。(基金项目:教育部哲学社会科学研究重大课题公关项目“世界一流大学和一流学科建设评价体系与推进战略研究”(16JZD044)。作者:翟亚军,河北保定人,华北电力大学高教所教授,管理学博士,研究方向为学科建设和高等教育评估;王晴,北京人,首都师范大学研究生院助理研究员,法学硕士,研究方向为学科建设。)