光明日报：外语考试能否用一把尺子

2014-12-04 03:59 来源：光明网-《光明日报》　

英语作为对外交流和文化传播的最主要媒介，是国家发展和参与国际竞争的重要“软实力”，是人们适应21世纪生活和发展不可缺少的工具。我国英语学习者人数众多，目前，仅在校学习英语的学生就数以亿计。改革开放以来，在政府和社会各界人士共同努力下，我国的英语水平迅速提高，对日益广泛的国际商贸和文化交流、对中国经济的迅速崛起、对中国国际影响力的显著提升，都作出了不可磨灭的贡献。但是同时也应当看到，我国英语教学水平离开国家进一步改革开放的需要，还有不小距离，问题不少，无论英语教学还是英语考试，都需要深化改革，进一步改进和提高。

经过充分酝酿，教育部已经正式启动全国英语能力测评体系建设工作，这是深化英语考试改革、提升考试质量和功能的重要措施，有利于考试更好地为教学服务，尤其是其中建立“中国英语能力等级量表”和“建立适合我国国情的外语考试质量标准”两项工作，是我国教育考试改革中的基础工程，这两项基础工程的完成将为建立我国科学的教育考试制度提供强大的技术支持，惠泽千百万学子。

外语能力划分缺乏衔接

有教学就有测试，目前全国性的、地区性的英语考试项目数量众多，仅全国性的英语考试项目就有大学英语考试（CET）、高校英语专业考试（TEM）、中国公共英语等级考试（PETS）、高等学校招生英语考试、研究生招生英语考试、职称英语考试等等，此外还有地区性的考试、部门组织的考试。这些考试的参考人数往往达到每年数十万、数百万，考试结果又往往对学生的升学、谋职等等产生影响，成为真正意义上的大规模高风险考试。

但是迄今为止，我国尚没有统一的语言能力等级量表，语言教学和语言测试没有共同的参照框架，甚至连等级的划分也相当混乱，有的语言测试项目分两个级别、有的分三个级别、四个级别、五个级别、甚至九个级别，相当混乱。我们分析了一些英语考试大纲，在及格标准、等级划分标准等等的说明中，对语言能力等级的描述存在经验主义、相对主义、和任意性的特点，缺乏坚实的语言学和心理测量学理论基础。

由于对语言能力等级的描述和划分科学性不够，各种测试项目各行其是，没有统一的参照框架，这种做法在实践中会带来许多问题。对教学来说，不便于课程的组织和衔接，很容易造成课程的重复设置，无法实现外语教学“一条龙”；对语言测试来说，不同测试项目所报告的考生成绩没有可比性，完全不便于用户使用，而且考试成绩互不承认，也不利于语言能力的认定和人才的使用，徒增学生考试负担。由此看来，对语言能力等级的划分，亟须统一。制定中国英语能力等级量表就是要构建起一个中国英语学习、教学与测评的完整理论体系和一个全国统一的英语能力等级尺度。有了共同的尺度，才有可能进行统一的教学安排和建立统一的、科学的评测体系，提高我国英语教学的效率和效果。

在这方面欧洲委员会的经验值得借鉴。欧洲委员会成立于1949年，成立不久，很快就认识到语言问题的重要性。欧洲是一个多民族、多语言、多国家的地区，为了促进一体化进程，促进人员之间相互理解与沟通，欧洲委员会的语言政策部门提出了语言教学应当分级的要求，致力于建立一个能得到欧洲各国相互承认和采用的共同的参照框架，使语言教学和语言测试具有更高的透明度。经过二十多年的努力，最后形成了“欧洲语言能力等级共同量表”（CEFR），2001年11月欧洲委员会通过决议，把这一量表推荐给欧洲各国使用，目前已成为欧洲各国普遍采用的语言能力参照框架，欧洲有27个国家，使用23种不同的语言，各国都参照这一框架制定各自语言的教学大纲、开发教材、组织教学，开发各自语言的测试项目。

英语能力等级以“交际语言”为主

能用英语熟练沟通是什么等级？能同步听说、无障碍收看英语节目又处在什么等级？语言能力等级量表就是描述或评价人的语言能力水平的工具，是语言教学和语言测试的基本参照框架。对于我国英语教学来说，建立统一的“中国英语能力等级量表”已成当务之急。

制定“中国英语能力等级量表”的根本原则应当是从社会需求出发，注重科学性、实用性和可操作性。

制定中国英语能力等级量表要吸收当代最新的“交际语言能力理论”成果，参考美国、欧盟等发达国家和地区的成功经验，结合中国的实际（包括中国人的认知特征、文化传统、经济发展现状、政治体制和主流意识形态等），构建自己独特的、科学的关于中国人英语能力的体系。

要建立我国主要的大规模英语考试与中国英语能力等级量表之间的连接，这样可以极大地方便各个考试所报告的成绩相互参照和解释，方便用户；还需进行广泛的社会调查和效度验证，力求把这项中国英语教育的重大基础工程做到国际一流水平。

制定中国英语能力等级量表是迫切的社会需要，这样做有利于组织教学、开发教材、评测教学结果；有利于提高各级各类英语教学的效率，也有利于设计开发各种科学的语言测试项目；这样做也可以提高我国英语教学与测试工作的透明度，便于用人单位根据有科学定义的语言能力资格认证选拔和使用人才。

衡量标准要注重“测量公平”

全国英语能力测评体系建设中的另一项重要工作是“建立适合我国国情的外语考试质量标准”。考试是一种教育服务，服务的质量有好有坏，评介教育考试好坏的依据就是“考试质量标准”。教育考试是一项专业性很强的工作，追求的是测量有效、测量误差小、分数具有可比性和可解释性等等，这就是“测量公平”。

“分数面前人人平等”体现的仅仅是程序公平，只有首先做到了“测量公平”，才能真正体现社会公正。大规模考试的设计、开发与实施是一项浩大的工程。大规模考试的特征是大群体、高风险，考试结果可能影响学生命运，正因为如此，大规模高风险考试必须达到一定的质量标准，以保证命题的科学性、评分的一致性、组织的严密性、成绩具有可比性和可解释性。考试提供的是一种评价标准，但考试本身也应当有评价标准。

我非常高兴地看到这项工作也已经提到议事日程，我们应当参照国际上的已有经验，结合我国实际，制定我国自己的教育考试质量标准。这是加强国家教育考试机构专业化建设的重要一环，有利于“建立现代教育考试评价体系，提高专业能力和服务水平，”并将有利于规范大规模外语考试管理。我认为，“中国英语能力等级量表”和“外语考试质量标准”的建立以及随后的外语综合测评体系的其他配套改革，有望能结束英语学习、教学和评测中长期存在的混乱局面，做到全国统一规划、统一评价标准，有利于国家部署和落实重大的学科发展战略规划。

(作者系全国大学英语四六级考试委员会主任委员、上海交通大学教授杨惠中）