当前位置 :   首页 - 高教研究 - 正文

教学评议:从“以学生为中心”到“以同行为中心”

2016-11-13

近十年来,提高高等教育质量,尤其是提升教育教学和人才培养质量成为高教发展的关键目标。但由于各种原因,教学工作相比于科研工作,在高校仍未获得应有重视。学术界大多将之归咎于现行教学科研评估制度造成的必然结果,一方面认为教学工作存在的可评价性差、评估成本高、评估过程中师生互信度低等问题是导致重科研评价、轻教学评价的主因;另一方面,将重视教学程度不够的罪责推到科研评估过于强势、方法简单、易于量化、评估与激励方便匹配、便于与国际接轨等上面。即认为教学本身的可评估性差是导致教学科研失衡问题的关键原因。但是,教学评估存在的上述方法和技术困境真的无法改变吗?本研究认为,开展科学、有效、持续的教学评价“非不能也,实不为尔。一段时期以来,西方学术界认为教学评估的本质应该是管理者和教师抓住一切可能的机会以改善教学活动。博耶(Boyer)、克罗斯(Cross)和其他一些学者都曾建议,大学教学应该显著改善。但他们也非常担忧,在重视科研和其他专业活动的程度大于教学的大学文化中,通过评估能使教学到底改善多少。学者们认为,续聘、终身职、晋升和薪酬等评估活动对于教学改善作用非常有限,只有当教师积极参与到特别设计的教学改进计划时才更可能实现教学现状的改善。美国等西方国家也曾面临因教学难以评价引发教学科研失衡的相关问题,但近20年来,部分国家开始逐步尝试借鉴科研同行评议(Peer Review)的方法,引入教学同行评议(Peer Review of TeachingPRT)理念,为科学评价教师教学工作提供了新思路。但西方这一重大改革动向迄今仍未被国内学界充分认知、讨论和应用。教学同行评议是否可以彻底扭转教学科研评价导向,成为教学科研再平衡的可能方向?本研究尝试在比较研究基础上作出回答。

一、同行评议:教学评价方法论的重要转向

在较长时期内,学生评教是评估教师教学质量的核心方法之一,但随着大量研究与讨论的深入,学术界对于将学生作为评教绝对主体的现状不断提出方法论质疑。其核心主张在于,将学生作为评教主体违背了教学工作具有极强专业性的实际。西方学界曾将大众化时期的师生比喻为超市顾客的关系,但高等教育超市兜售的是代表学科基础、研究前沿和人类智力结晶的特殊知识,顾客由于自身知识基础、学习能力、信息对称性、学龄阶段性特征等原因,并不具备全面评价知识商品的能力。同时,教师教学考核和学生学业考核存在复杂的利益联系,这也违背了教学评价的独立性原则。20世纪末,欧美国家这一问题也曾非常突出,虽然期待学生评教能改善教学状况,但却很少有证据显示学生评教达到了这一目标。一些研究尖锐指出,过度依赖基于学生问卷调查评分的学生评教结果,是一种错误。教师们对于传统教学评估过度倚重学生评教的问题抱有持续的质疑,认为只有在少数情况下(比如当学生写下对课程和教师的认真评论、教师们相互提供教师教学描述或教师自己提供基于改进教学目的的教学自评报告等),学生评教才可能真正对改进教学有作用。

这些国家在探寻新的教学评价方法过程中,逐渐将重点聚焦到借鉴和学习科研同行评价上,开始引入教学同行评议的概念,并且教学同行评议被证明与科研同行评议一样行之有效。大量研究证据显示,只有恰当、全面性的教学评估被使用才可能真正改善教学状况。学术界所认为的恰当、全面性”的评估一般包含三个方面:第一,评估被专门设计用来提高教学表现和供个人选择,而不是简单用来考核教师教学业绩或决定是否有资格获得晋升;第二,评估参与者包括同事、学术管理者、教师发展专家、外部同行评议者、教师自己以及学生;第三,教学表现信息来自于课堂观察、分析教学录像带、评价教学材料、教师对学生学业表现进行评价的情况、与学生/同事个别访谈或集体访谈、评价学生在课程中的收获、学生对课程和教师评价等。

按照上述标准,西方学界倾向于认为同行评议应在教师教学评价中得到更广泛使用。这是因为,第一,教师在评价教学的多个方面占据比学生、管理者和其他学术社区成员更有利位置。第二,教学同行评议具有深厚的历史基础和制度合法性,其并不被认为是教学评估上的创举,而是长期以来用以提高教师教学效果的一种古老但又流行的方法。第三,教学同行评议被认为具有普适性,不受学科等差异的影响,不管在任何学科,这种教学同行评议模式都比其他传统模式更能改善教学效果。第四,教学同行评议在实践中被认为和科研同行评议一样规范而重要,已经被广泛应用到高等学校的教学之中

上述教学同行评议的方法论转向同样有可能发生在中国。一方面,近年来中国学术界已开始对以学生为中心教学评价的深刻反思。一些研究认为,传统以学生问卷量表进行教学评价的方法方式单一,大学生积极性不高,应付差事的情况非常普遍,也缺乏必要的学科差异,更不可能实现课程层面的差异性评价。最根本的是,一些研究发现,学生评教信效度很低,学生不愿说真话、不会说真话、不敢说真话的问题突出,学生评教甚至被称为一种伪量化的评价方法。另一方面,当前中国的教学评价重形式轻内容问题突出,也可理解为同行评价缺位的必然结果。由于学科分化越来越细,同一高校真正具备评价某学科某门课程能力的师资不多,且由于在相同单位就职,人情因素也易使本应发挥重要作用的同行评价形同虚设。导致高校教学工作评估无法深入教学内容本身,大多停留在教学材料是否完备、板书是否规范、课件是否精美、信息技术是否得到使用等表象上,而对教学内容是否符合学科规范、是否联系学科前沿甚至教学内容是否正确都无法做出应有评价,一些教学基本功大赛甚至变成了教学表演大赛,这种重形式轻内容的教学评价问题非常普遍和突出。从此种意义上说,中国重构教学同行评议系统也具有迫切性。此外,近年来中国学界也发出了通过同行评议来评估教学的呼声,认为只有它才最有资格对教师教学质量进行评价

二、西方国家教学同行评议的逻辑起点、方法内容与框架模型

1.西方国家教学同行评议的逻辑起点

西方学术界从未放弃通过教学评价促进教学改进的努力,在分析了学生评教的诸多问题之后,一些学者开始认为,本学科同事才最可能提供高质量的教学同行评议设计。早在1986年,就有学者提出,学术同事相比于学生、管理者而言,可以更好地在多个方面开展教学评价,除非教师们愿意将评估交给学生(他们只有一点知识),交给管理者(他们多数情况下没有时间和学科背景),否则,他们肯定更愿意把教学评议的权力交给同行。”基格(Keig)和瓦戈纳(Waggoner)最早将这种来自同行的评价称为协作同行评议CollaborativePeer Review),他们的定义是教师们在一起工作,评价彼此教学,并协助彼此努力改善教学的过程……这一过程包含教师彼此学习如何更加有效地开展教学,学习新的教学技术和模式,获得关于他们课堂教学表现的有效回馈,以及收到来自同事和顾问们的教学训练。其基本原理是,充分调动教师参与的积极性和志愿精神,志愿精神能从本质上强化动机并克服困难。此种背景下,早期学术界对教学同行评议与其他教学质量评估工具的对比研究认为,教学同行评议在严格意义上说并不是一种测量教学业绩质量的方法,而更多是为了提高教育质量、改变教学实践的改善性活动。因此,西方学术界关于教学同行评议的逻辑起点可以概括为:从以学生为中心的教学评价过渡到以同行教师为中心的教学评价。基本原理是充分发挥志愿者专业互助精神,核心保障在于对同行大学教师专业知识与专业精神的恰当使用。如果开展严谨的概念分析,可更容易理解上述教学同行评议的逻辑起点。20世纪后期,西方学界陆续出现关涉实行教学同行评议诉求的类似词汇,比如考核与绩效挂钩的薪酬实践Appraisal and Performance Related Pay Practice),教学评价教学绩效考核Performance Appraisal)等,但使用最多的词汇仍是教学同行评议Peer Reviewof TeachingPRT)。那么,到底什么是教学同行评议?学术界也并无统一概念界定。博耶等人认为,教学中的同行评议,就像解读一组陌生的历史文献,是一种需要智力推理和大量经验的学术行为。科尔(Cole)则将教学同行评议定义为一个接受意见审查、捕捉错误、提高教学质量的必要过程。他还强调,教学同行评议特别需要以批判性文化为基础,(批判性文化)带来高质量教育文化的营造。罗伯特(Robert)认为,无论何种形式的业绩评估都是一个复杂而有争议的人力资源管理方法(技术),而教学同行评议的方法本质上是基于伦理的业绩评价 Pagani认为,教学同行评议是一种让改变发生的工具,最终提供的是一种以帮助改进为目标进行业绩评估的方法。奥斯本(Osburne)等认为,美国的教学同行评议在传统上被用于对个体教学中的优缺点进行反馈。宾厄姆(Bingham)和奥特威尔(Ottewill)认为,教学同行评议,是创建对于学习评价的平衡图景Balance Picture),从而实现对教师的专业评价。从上述概念剖析可以发现,虽然学者们对于教学同行评议概念的理解不尽相同,但都表达了通过来自同领域学术同行提供对于教学活动专业表现客观评价的基本诉求,学者们对于教学同行评议的本质内涵的理解是一致的。

2.西方国家教学同行评议的方法内容

1994年,美国高等教育学会(AAHE)开始推行从理念到原型:教学同行评议FromIdea to PrototypeThe Peer Review of Teaching)的重大项目,明确了教学同行评议的方法和内容,被认为是教学同行评议正式启动的标志。学会当时召集几十所高校在斯坦福大学进行了历时一周的密集研讨,确定了教学同行评议的基本进程,开列了通过教学同行评议改善教与学的相关清单,基本方法内容如表1所示,主要包含8个方面。当时的教学同行评议仍停留在传统多维度教学评价方法的基础上,但在档案袋、备忘录等方面已经引入了全程跟踪评估的基本理念。

3.西方国家教学同行评议的框架模型

西方理论界还初步构建了开展教学同行评议的基本框架模型。其中阿雷奥拉(Arreola)对教学同行评议包含要素的论述,过去20年里在一些研究型大学得到比较广泛的使用。他认为,教学同行评议建构活动的特点包括:(1)面向的是那些希望变成好教师的人,而不是不合格需要矫治的教师;(2)是自愿的而不是强制的;(3)将相互信任和依靠的教师们联结在一起;(4)各项活动应该是自然发生的,如同事们彼此互访课堂,互相阅读课程材料,互相讨论对于学生评价的方法等;(5)潜心于收集参与者接受的评估和方法的数据;(6)强调坦白,参与者之间彼此进行委婉地回馈,真诚地赞美,诚恳地提出问题、帮助性建议和建设性批评;(7)根本上在于让参与者从彼此身上学习到有益的东西。当然,除了阿雷奥拉之外,也有大量研究围绕教学同行评议最佳框架展开阐述,如表2所示。


1 教学同行评议的基本工具



2 西方学术界有关教学同行评议最佳框架的部分研究



此外,还有不少学者从教学同行评议模型的角度加以阐述,比如高斯林(Gosling)构建了三种主要类型的教与学同行评议模型,分别是评估模型Evaluation Model),涉及对高级别教师的考察;发展模型DevelopmentalModel),适应于教育发展提供者、教师专家、教与学实践者;同行评议模型Peer Review Model),即教师们彼此观察和评价。

三、方法论转向:推进中国高校教学同行评议模式创新

西方国家试行的教学同行评议制度收获了学术界大量肯定性评价。比如,有研究认为教学同行评议比管理者评价结果更为可信。教学同行评议过程中,同行们不仅提供了一种独特的有价值的信息资源,而且彼此亲近,遵守了真正的教学表现至上的态度。但与此同时,学术界也存在对于教学同行评议可能缺陷的担忧。一是“同行”本身过度自大可能带来的问题。如宾厄姆(Bingham)和奥特威尔(Ottewill)认为,教学同行评议参与者可能因为过于沾沾自喜而导致评价结论并不准确。史密斯(Smith)等也认为,开展同行教学评价任务是艰巨的,因为每一位参与者都会有阻力。二是教学同行评议需要满足多种辅助条件。皮戈特(Piggot)认为,教学同行评议特别需要信任、开放、共享与控制,也非常有必要对参与评估的人进行正确的培训。考克斯(Cox)等认为,教学同行评议与教学活动是一个整体,被观察者会被观察者影响,没有人有资格去评价别人的教学。其他抨击教学同行评议的观点还包括被评价者害怕受到批评等。为保障教学同行评议成功,也应针对职员和教辅人员形成一套同行评议方案,以传播好的教学方法。三是教学同行评议要克服畏惧和时间两大困难。美国一位化学家谈到教学同行评议可能存在的问题时尖锐指出,教学同行评议首先可能导致害怕。他认为在同行评议过程中,恐惧是天然存在的,教师们对于什么被用来评估、评估应该如何引导、谁应该来主导教学同行评议都存在担忧。其次是时间。教学同行评议相比于传统教学评价需要投入的时间显然要多很多。

通过对西方高校教学同行评议的深入分析,结合当前高等教育发展实际,我们认为,教学同行评议制度应引入中国高校教学评价制度改革之中。2015年,我们对全国5172名大学教师的调查也显示,教师们在回答应该由谁进行教学评价这一问题时,虽然大多数仍认为学生(60.4%)应该是评教主体,但排名第二、第三的依次是“校内同行”(14.1%)和校外同行6.0%)。可见引入教学同行评议制度已具备一定的认识基础。但同时应特别注意,中国开展教学同行评议应在学习西方的基础上进行彻底的本土化改革,其核心方向是:以同行专家为评教主体,以大数据与现代信息技术为依托,形成深入课程层面的内容性评价,彻底扭转教学科研失衡的评估格局,形成更加重视教学的大学文化。

1.突出外部同行评议和全过程教学信息采集与传递

西方国家教学同行评议包含三个部分,一是本院、系和学部教师间的相互评价,二是校外匿名同行的评议,三是专家们对于全部可能采集到的教学过程信息的人工甄别。总体而言,西方国家教学同行评议制度最有价值、也最可能被中国所参考借鉴的,可能是外部同行评议External PeerReview)和全过程教学信息采集举措。美国绝大多数教学同行评议活动仍以所在学院/学系的同事为同行评议专家,缺乏匿名性,这在美国特殊的学术文化中可以实现,但在中国情况则不然,交由本院教师评价可能存在很多问题。在中国推广教学同行评议仍应坚持独立性和匿名性两条基本标准。因为,虽然西方高校特别强调在同一学术组织内部学者们对教学情况开展互评,但经过近年的实践检验,以本学术组织成员为主体的教学同行评议方式在中国不具有合理性,这与中国特殊的人与人之间的强关系社会资本有紧密联系。因此,本文所谓的教学同行评议更接近于美国外部教学同行评议的概念。而且需要特别说明的是,中国传统的教学评价也存在来自本学院/学部/学系同行听课打分的情况,但显然,这一评价方法并非严格意义上的教学同行评议,根本原因在于这一评价方法未达到匿名性和中立性原则,也未深入到对课程内容本身的评价中。为此,应该更多学习西方教学同行评议中关于外部同行评议的举措,严格实行以外部专家为主导的教学同行评议制度,突出各类可采集到的教学过程信息的保存与传输,形成以匿名外部专家为主导的刚性的教学同行评议体系,这才有可能从根本上突破当前的评价体系尤其是评价文化,最终通过教学评价变革实现高校教学科研的再平衡。

2.引入大数据思维和技术,突破传统教学同行评议的方法论困境

西方虽然很早就提出了教学同行评议的概念,但因为受限于操作方法和技术,往往难以达到类似科研同行评议的目标和效果。比如在1995年,佐治亚大学和密西根大学就遵循教学同行评议理念,运用视频会议技术(Video-conferencingTechnology)进行两校师生的教学多校园互评,部分实现了学生和教师的远程视频和有效沟通,但成本较高(约150美元/小时),便利性和灵活性也不足。虽然如此,该种尝试仍让学术界看到了运用信息技术开展连续性、过程性、动态性教学评价活动的可能,这其实也正是新时期运用大数据思维进行教学评价的基础。事实上,传统的教学评价本质上是小数据评价,通过少次的随堂听课、以学期为单位的学生评教甚至以3-5年为单位的教学工作复查来评定每时每刻都在发生的教学活动,必然无法绝对真实有效,也导致了大量问题出现。比如,教师不认同教学评价结果,形成我课讲得很好只是你们不懂的对抗心理;人事部门也可能认为,既然教学评价存在技术困难,那么在职称晋升中就只能奖励优秀(如重奖教学名师)和打击落后(如教学事故的一票否决制),忽略了对绝大多数在教学工作中不上不下的教师的有效评价,最终导致科研评价占据教师职称评定的主导地位。大数据时代通过大量、多样、快速和价值化的评价信息采集,尤其是借鉴科研评价过程中的同行评议制度,将学科专家引入教学评价一线,有望彻底扭转传统教学评价的方法论缺陷。全面引入大数据评估技术,可将教学工作全程展现在评估专家面前,为建立信息化教学过程性评估提供新的方法和技术手段。比如,全程采集评估对象的教学音视频内容并妥善保存和有效分析。“全程采集既可改造现有的高校教室多媒体设施,也可委托专业机构单独全程录制评估对象的课程音视频(不是传统的小样本微课录制);妥善保存即形成规定时限的教学内容保存制度;有效分析既可直接将音视频资料提供给评估专家,也可运用相关软件提取讲授内容的文字。最终,将通过以信息化手段采集到的教学过程资料进行有效存储,形成类似于MOOC授课专家的大数据资料库,结合教师教学的其他资料共同形成教学评估的核心数据库。

3.将教学同行评议与科研同行评议有机融合,实现教学科研再平衡

引入教学同行评议制度,并与科研同行评议有机融合,将彻底破除教学与科研对抗、割裂的现实困境。为此,一要在学科发展评估中纳入教学同行评议结果。如新学科建设、博士点设立、学科评估等活动中,不能仅提供科研同行评议结果,也应纳入教学质量的同行评议结果,真正保证学科评估内容的完整性。二要在职称评定中纳入教学同行评议结果。通过教学同行评议,形成科学的评估结果,并真正运用到涉及教师根本利益的职称评定中,这才能真正扭转所谓重科研轻教学的格局。本研究不赞同目前部分高校设立教学岗教授的举措,认为这仅是面对传统教学评估方法缺陷而不得已采取的鼓励教学的权宜之计,一旦教学同行评议制度构建完成,仍应回归到教学与科研融合的评估理念。三是在薪酬设计中纳入教学同行评议结果。传统教学工作因为评估科学性不佳存在吃大锅饭状况,甚至被批评为拿着教学发的钱来做研究。引入教学同行评议制度后,可对教学工作的数量和质量进行科学有效的计量,薪酬设计与教学紧密挂钩也会彻底扭转教学科研薪酬倒挂的问题。

4.建立独立的学科专家库和普通教学评价专家库

应建立真正的学科专家库,通过制度规范工作机制。教学评估的核心在于引入真正的学科专家,为此,应由教育主管部门统筹或由各高校选择对口高校,建立教学同行评议的学科专家库,实现同学科、同专业、同领域直至同名称课程的同行评议,切实对课程讲授内容的正确性、准确性、前沿性、拓展性和启发性等进行同行评议。此外,还应将传统的校内评估力量整合进教学方法评估专家系列,只对教学形式、教学方法、教学技术等进行评价而不涉及教学内容本身。这样,教学学科专家教学方法专家共同组成教学同行评议专家库,实现对每门课程的有效评价。大数据方法和技术的引入,教学同行评议专家库的构建,可以形成全过程、动态化、学科性的教学评价制度,最终实现传统教学评价工作的方法论突围

5.应强调统筹协调

无论中西方,实行教学同行评议尤其是外部同行评议都意味着高成本,核心是组织成本、经济成本和时间成本。此种情况下,需要教育主管部门、高等学校及学术组织实施统筹协调,充分发挥同行互评的志愿者精神,形成有效的组织架构和合作机制。其核心在于三个方面。一是推动构建教学同行评议制度体系,形成刚性的教学同行评议组织,推行结果认定和使用制度,从根本上保障教学同行评议的制度合法性、过程合理性和结果可用性。二是推动构建教学同行评议专家互评网络,形成深入课程层面和教学内容的全国性、地区性或行业性同行评议专家库,为教学同行评议做好组织与人员准备,从根本上保障教师参与教学同行评议、教师受益于教学同行评议的良性互评模式。三是保障经费投入,按照教学经费投入的一定比例配备教学同行评议经费,维护教学同行评议系统运行并有效调动评估者与被评估者积极性。

6.应注意实际操作过程中的差异化区分

虽然教学同行评议在1994年之后逐渐被美国高校所接受,但从中国视角看,其仍存在一些缺陷,以至于无法直接在中国高校推广和使用。因此,教学同行评议要特别注意中西差异与本土化改造问题。比如高校层次与类型问题。虽然相关文献显示,彼此负责和信任的同事之间在提高教学方面可以互相提供巨大帮助。但大多数教学同行评议研究是针对研究型大学的,很少有研究关注到其他类型高校,是否适用中国广大非研究型大学仍然存疑。再如同行评议的技术问题。从文献中可以看出,美国教学同行评议采用了大量评估方法,但仍以传统的非信息化手段为主,虽然密西根大学等高校曾尝试引入信息化技术,但因为当时技术条件所限并未大范围推广。我们认为,当前情况下,不仅可能、而且应该通过信息化手段开展教学同行评议,信息化手段是教学同行评议在大数据状态下运行的保障。


(来源:2016年第6期《高等教育研究》)