• 329.50 KB
  • 2021-05-14 发布

高考英语命题失误分析与对策论文

  • 10页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
‎2007年高考英语命题失误研究与对策 ‎ ‎ ‎【摘 要】本文抽样分析了2007年全国18套高考英语试卷中的语法类多项选择题的命题质量,进行了国外著名语言测试和应用语言学等领域的专家问卷调查,研究发现全国卷、江西卷、重庆卷、四川卷、福建卷、湖南卷等试卷存在命题失误或命题缺陷,为了维护全国统一高考的科学性、权威性,切实提高命题质量,保障考生权益,维护社会稳定,体现高考的公平公正原则,建议从考试立法、考试政策、科研、实践操作层面等方面予以改进,促进我国语言测试专业化进程。‎ ‎【关键词】高考英语,NMET, 多项选择题,命题质量,英语命题失误,语言测试 致谢:感谢以下语言测试或其他语言相关领域的各国专家(排名不分先后)支持本研究的专家问卷调查工作和论坛讨论,文中观点若有疏误,概由作者负责。Bernard Spolsky(世界著名社会语言学和语言测试专家); James E. Purpura (美国Columbia University副教授、博士,国际语言测试协会主席,二语/外语测试专家); Gary Buck(美国University of Michigan英语语言学院测试与认证中心主任); Dan Douglas博士(世界著名语言测试权威专家、美国Iowa State University英语系应用语言学教授、Language Testing编辑、前国际语言测试协会主席); Charles Stanfield (二语测试权威专家,曾任职于美国ETS); Liz Hamp-Lyons (世界著名语言测试专家,香港理工大学等教授,曾任澳大利亚墨尔本大学语言测试研究中心和香港理工大学亚洲语言评估研究中心主任); Fred Davidson (美国University of Illinois英语系副教授,教育测量、课程与教学副教授,1988年于加州大学获得语言评估方向博士学位); Jane Sunderland(世界著名语言与性别研究专家、博士, Lancaster University英语教育学院); Dodie Brooks (人民教育出版社外籍编审、博士); Dr. John H. A. L. De Jong (培生集团语言评估/测试部语言测试开发处主任,博士); Harold Ormsby(墨西哥Universidad Nacional Autónoma de México); Lynn Yilmaz(美国ETS自由撰题专家,日本The Daily Yomiuri《读卖日报》TOEIC测试专栏作者,出版10余部ESL/EFL教材); Khalil Motallebzadeh博士 (伊朗Islamic Azad University助理教授,TEFL方向博士,研究兴趣:二语研究,语言测试,教师教育等)。‎ 1. 引言 高考为高厉害关系测试,高考分数对我国目前大学入学录取起决定性作用,社会关注度极高,甚至有极端主义者主张废除高考。对高考的妖魔化以及给高考加载的社会功能和教育功能等使高考承受过多不应有的功能,但国家已在改革高考内容、改革大学入学一考定终生的制度。在提倡高考公平公正的诉求下,罕有研究者从命题质量角度进行审视,学术批判意识和质疑能力不够,加上国内不甚健康的学术批评氛围、考生权利意识淡漠等因素导致群体失语现象。对于命题失误导致的危害,1987-1999年曾任教育部考试中心主任的杨学为认为“命题不准确所造成的误差,是最大的失误”(杨学为,廖平胜,2003:15)。‎ ‎ 高考由命题机构和教育考试行政机构自评的机制导致目前高考命题工作结束后大唱赞歌,而不是去找问题,诚如上海市教育考试院命题与研究办公室主任雷新勇博士(2006:93)所言,“令人遗憾的是,虽然我国非常重视大规模教育考试,考试结束后,相关部门也组织有关人员对考试进行评价,但这种评价主要还是流于形式”。就笔者所涉文献,对我国大规模语言测试命题质量提出批评和改进建议的文献较少,代表性的如李筱菊(2001:187-188), 卞清杰、段惠彬(2002),简庆闽(2004),陶百强(2006a, 2007a, 2007b), 鲁子问(2006),包天仁(2007),Johns (2007)等。‎ 本研究的目的是研究2007‎ 年全国高考英语命题质量,考查命题质量是否得到改进,只有正视问题才能推进问题的解决,避免因命题失误导致系统测量误差,避免影响测试公平,以切实推进语言测试实践专业化,维护国家考试的权威性和考生利益。‎ ‎(注:本文的命题失误的定义是广义的概念,包含答案值得商榷之处、题干本身存在的语言问题和难度问题等。)‎ 1. 命题质量分析 研究对象是2007年普通高等学校招生全国统一考试英语试题,含教育部考试中心命制的全国卷2套(含听力和不含听力卷各1套),分省命题试题16套,合计18套试题(因广东高考卷以语法填空代替了语法类多项选择题,故未研究)。抽样分析18套试题中出现命题失误概率较高的语法类多项选择题(每套含15-20小题)。研究方法主要是文献法和问卷调查法,首先由研究者抽取怀疑有命题问题的题目,重新编号,然后集中归类为答案问题和语言问题,设计为英文版专家意见问卷调查表。(注:以下观点并非都是本文致谢专家一致的意见。)‎ ‎2.1 答案问题 ‎2.1.1 多答案/答案不惟一 MC题型命题最易犯的错误是有多个正确答案即答案不唯一的问题。多项选择题中的答案问题绝大多数是因为干扰项编制不严谨导致的,“写干扰项其实是MC题命题工作中最不容易的一步”(李筱菊,2001:155), 干扰无效的后果就是答案不惟一。题目设计中最忌讳的就是出现两个答案,这种题目就成了废题(刘润清、韩宝成, 2000:54)。设计多项选择题时,必须非常谨慎,特别是在设计冠词、情态动词、动词时态等考点时应万分谨慎,命题者在设计干扰项时,必须根据题干考虑到各种可能的语境和考生的各种理解角度和思维答题角度,否则,该考查考生语言知识的题就会起到束缚思想、桎梏思维、扼杀创新,误导学生钻牛角尖,误导语言学习者把语法规则公式化、机械化,如在设计主谓一致考点时就不能考查复数时间概念的谓语的数,在实际语言运用中却并非如此,其谓语用单复数形式都可以,如美国总统George W. Bush在演讲时习惯上用复数谓语,如Nearly five years have passed since these- those initial days of shock and sadness -and we are thankful that the terrorists have not succeeded in launching another attack on our soil(Bush, 2006).‎ 国外专家问卷调查间接显示,国内命题者的语法容忍度较低,这与李筱菊(2001:188)的看法一致,“一般说,我们非本族语者写的题目,自认为只有一个答案的,给本族语者看,往往会发现不只一个,甚至四个选择项都可能是答案”。本调查研究充分说明,外国专家参与高考审题是非常必要的,审题必须由专业人员操作,而非仅仅由中学教师看或做试题,不能让有争议的题目进入实测阶段。举例如下:‎ ‎ 例1:全国卷(含听力卷)第34题:‎ ‎34. “Goodbye, then,” she said, without even ___________ from her book. ‎ A. looking down B. looking up C. looking away D. looking on 该题参考答案为B, look up from her book; 但是选项C也正确,构成短语动词look away from her book,表达的意思“把视线从书上移开”,只是表达的含义与命题者所预设的情境不同而已。假设“她”正在楼上看书,她的表弟在楼下向她告别,则她说了题干中的话,这时似乎用look away from her book更符合一般人的应激反应,因为声音刺激既然是从下面方向传来的,则受刺激者本能的反应不是从书上抬起头来(look up from her book)而是把头投向刺激源即楼下方向。既然语法和语意上都可接受,选项C完全可行。请看look away from的相关短语示例:‎ 示例1:A8E 64 Maybe they like to know the computer is still doing something while they look away from the screen…(来源:英国国家语料库(BNC): http://esl.about.com/gi/dynamic/offsite.htm?site=http://info.ox.ac.uk:80/bnc/ 2008-2-21)‎ 示例2: AYK 1557 Stop every now and then; look away from the text you are reading and let your eyes focus on objects further away from you. (ibid)‎ 示例3:“Try using a timer to make sure you look away from your screen every 30 minutes or so.”(来源:How to Combat Visual Fatigue. http://www.nushield.com/anti_glare_screen_protector.php Retrieved on March 2, 2008)‎ 例2:江西卷第30题:‎ The melon the Smiths served at dinner would have tasted if it had been put in the fridge for a little while.‎ ‎ A. good B. better C. best D. well ‎ 参考答案为B, 但该题答案不唯一,笔者认为A,B都可选,若选A, 暗示“The melon tastes terrible in fact”, 即瓜实际上难吃(tastes terrible),要是将瓜放在冰箱里冷冻一会儿就会好吃了(将good和terrible相对)。大多数专家认为A, B都可选,其中Dan Douglas,Bernard Spolsky和John H.A.L. DE JONG博士等认为A, B, C都可选,Dan Douglas认为“I also think C is possible – we often say that something tastes “best” when something additional is done to it,Dan Douglas甚至提出了改进建议:Maybe you could do something like “The melon the Smiths served at dinner tasted than the one we had last week.‎ 例3:江西卷第25题:‎ ‎25.A survey of the opinions of experts that three hours of outdoor exercise a week __ good for one’s health.‎ ‎ A. show; are B. shows; is C. show; is D. shows; are 该题参考答案为B, 但选项D也正确。Bernard Spolsky, Jane Sunderland,Harold Ormsby,Dr. Dodie Brooks等同意笔者观点。一般来说,复数时间等概念作主语时,其谓语动词一般用单数形式,但若强调数目时则可用复数谓语形式。普通高中课程标准实验教科书人教版(刘道义主编,2004: 90-91) :“表示时间金钱距离重量等复数名词,在表示单位数量用作主语时,通常被看作整体,谓语动词用单数……注意:如果强调数目则谓语动词用复数,如 More than fifty years have passed since they got married(他们夫妻已共同走过了50多年”)。‎ 实际上,现代英语中的主谓一致是动词屈折变化(inflection)的残留现象,随着现代英语的发展,主谓一致概念逐渐淡化,并有最终消失的可能,这也符合语言发展的趋势,即从综合语向分析语演变。语言使用者只需尊重自己,遵循概念一致原则(conceptual agreement) :只要他在使用语言时想表达一个“单一的,整体的,非多数的”概念时,他有权使用单数谓语,相反,他想表达一个“多数的,非单一的,多个个体的”概念时,他有权使用复数谓语,即由语言使用者的概念决定谓语动词的单复数形式,而不是由主语决定,语言仅为表达思想的工具,语法规则更是服务于这一工具的工具,而不是限制语言使用者自由表达思想的桎梏(刘应德,2002)。‎ 例4:江西卷第31题:‎ ‎31. —I have got a headache.‎ ‎ —No wonder. You in front of that computer too long.‎ ‎ A. work B. are working C. have been working D. worked ‎ 该题参考答案为C, 但选项D也可接受,若选D则语境为:对话发生前第一说话者在电脑前工作了很久但说话时没操作电脑了,Bernard Spolsky, Dodie Brooks博士,John H.A.L. DE JONG博士和Jane Sunderland博士等同意该观点。Dan Douglas同意该观点,且认为所有4个选项都对: “A: A. you (always) work too long; B. you are (always) working, and D. as you suggest. ‎ 例5:四川卷第28题:‎ ‎ 28.Mum ________ to us,“Be quiet! Your little sister’s sleeping.”‎ A.whispered B.shouted C.explained D.replied 该题参考答案为A, 但B项也对,其他3个选项也对,John H.A.L. DE JONG博士在专家问卷中写到“I agree with your opinions, there is no linguistic reason to only choose option A. The choice by the exam writer for option A seems to be based on logic, but people are not always logical and one could perfectly expect options B, C or D in any novel.” 命题者不能以自己主观预设或阐释的语境限制受试的作答反应。‎ 例6:重庆卷第33题:‎ ‎33. When I called you this morning, nobody answered the phone. Where______?‎ A. did you go B. have you gone C. were you D. had you been 该题参考答案为C,但选项A, B,C, D都对。根据参考答案可推断出命题者预设的情境为:这是一轮电话话轮或面对面的对话,若假设为电话对话,接“我”电话的对方说话时应该已返回他/她家或办公室的座机电话(land line)旁(非移动电话),这时可选A, C, 排除选项C, 但A无排除的理由;且选项D也无理由排除,若选D则询问:“你去了哪里”?过去完成时态的过去参照时间点是the moment you returned to your home/office, etc.,受调查 专家中Dan Douglas特别提到了选D的可行性。‎ 若对话发生时接电话者使用的是移动电话,则完全可选B; 具有多年语言测试命题实践并主编过10多部ESL/EFL教科书的Lynn Yilmaz假设了另外一个可选B的语境:‎ ‎ “Imagine that somebody leaves a note at somebody's doorstep.  The note says: ‘I stopped by to say hi . . . but you're not home.  Also, I called this morning, but nobody answered the phone.  Where have you gone?’”‎ ‎2.1.2 答案有争议 例1:福建卷第31题:‎ ‎31.—You are always full of . Can you tell me the secret?‎ ‎—Taking plenty of exercise every day.‎ A. power B. strength C. force D. energy ‎ 参考答案为D, 但Harold Ormsby认为除了C项外其他的都对,并说应剔除该题(Pitch the item )。Dan Douglas同意B项(strength)也可选的观点。Macmillan(麦克米伦词典)第2073页: “strength: 义项1:physical power/energy 力气/能量;[U] the physical energy that someone has to lift or move things(抬或搬东西的)力气,体力,力量。”‎ 例2:辽宁卷第26题:‎ ‎26. ——Excuse me, could you tell me the way to the British Museum?‎ ‎ ——Sorry, I’m a stranger here.‎ ‎——_____________.‎ ‎ A. Thanks, anyway B. It doesn’t matter ‎ C. Never mind D. No problem ‎ 该题参考答案为A, 命题者强求受试依据会话合作原则中的礼貌原则选出参考答案A。但是,Harold Ormsby认为“每个选项给出了不同的交际信息(different social message),于是认为根本无法作出答题判断,建议删除该题。Bernard Spolsky认为A, C, D都是合乎语言习惯(idiomatic)的说法。‎ ‎2.2 题干语言问题 ‎ 李筱菊(2001:162)对于MC题型的命题提到的第一个原则是“语言正确、地道、得体、简洁……试题本身的英语不正确或者不地道,怎么去考人家呢?这事实上是一个很严重也很普遍的问题”‎ ‎。命题者应尽量保证题目(含题干和选项)本身正确或地道,特别避免中式英文(Chinglish)。2.1.3例3实际上涉及到题干语言问题,时态最好用过去时。‎ ‎ 例1:湖南卷第26题:‎ ‎ 26. It’s hard for him playing against me. I’ve got nothing to play for, but for him, he needs to win so ________. ‎ ‎ A. far B. well C. little D. badly ‎ 根据Oxford Advanced Dictionary 6th edition,一般说“it’s hard for sb to do sth,” 而不说“it’s hard doing sth”. 人民教育出版社外籍编审Doddie Brooks博士认为题干很糟糕(a mess), 且似含中式英文痕迹,建议修改为:I’ve got nothing to lose but he wants to win so ________‎ 为了保证试题语言的地道性,建议不鼓励命题人员撰写英文句子,而采取从国外原版英文报刊等来源寻找素材。‎ 例2:福建卷第35题:‎ ‎ 35. It is none of your business other people think about you. Believe yourself.‎ ‎ A. how B. what C. which D. when ‎ 题干中的Believe yourself.最好替换为“Believe in yourself.”‎ ‎2.3 难度问题 社会各界对高考试卷难度高度关注,试卷难度是考生、家长及社会对高考命题质量的第一评价和反应,敏感度极高,甚至作为评价命题成败的重要指标,试卷难度对考生的应试心理具有较大的影响,对中学教学、特别是复习应考的导向性较强,试卷难度对录取工作的顺利进行有一定影响(岳伟,2007)。‎ ‎2003年的全国高考英语卷的(语法和词汇类)单项填空部分的难度“较往年有明显降低”,呼应了中学的外语教学改革,有助于引导学生真正不再死记硬背语法知识,而将更多的精力花在语言运用能力的培养上(教育部考试中心,2003)。该部分应考查基础的英语语言知识,考点覆盖面广但以基础立意,引导考生为可持续发展英语运用能力打下基础。2003年的全国高考英语卷评价报告在“对中学教学的启示”中明确提到“应重视语言知识的教学,但切忌讲得过多、过细、过深”(同上,2003)。考点应该抽取基础英语教育阶段考生应该掌握的最基础、最常见的用法,而非刻意寻找难倒考生的知识点,否则会误导中学英语教学过分注重语言知识,减少投入在语言运用能力培养上的时间。遗憾的是,部分分省命题试卷未遵循重基础原则,出现了一些具有一定难度和深度的试题,例陕西卷第12题:‎ ‎ 12. He and his wife are of the same ; they both want their son to go to college. (陕西卷) ‎ A. soul B. spirit C. heart D. mind 该题参考答案为D, be of the same mind/be of one mind=to have the same opinion,但该短语对一般高中生来说较陌生。‎ 综上所述,2007年高考英语命题存在失误,如答案问题、题干语言问题和难度问题等。此外,题干素材普遍存在语境化因素不足的现象,题干语言蕴涵的文化信息量较少,缺乏真实性,有的是为考语法点而杜撰的不地道的英文句子(artificial English)。建议题干素材选用真实语料,降低命题者写出不地道英文句子的风险。有的试卷原创造性匮乏,如出现照葫芦画瓢式的试题设计,如陕西卷第7题:‎ ‎(陕西卷)7. Though he started late. Mr. Guo played the piano as well as, if .‎ ‎ A. not better than B. not better C. no better than D. better 该题几乎照抄1994年的高考试题:‎ ‎ John plays football ________, if not better than, David. (NMET 1994)‎ ‎   A.   as well B. as well as C. so well D. so well as 本文仅抽样分析了语法类多项选择题部分的命题失误,具有样本较小的局限性,尽管试题其他部分的问题也普遍存在,如江苏卷阅读理解C篇在素材修改环节出现科学性问题(Johns, 2007),江苏的高考命题者竟把美国2007年3月28日对游客开放的大峡谷天空布道从Arizona(美国西南部)搬到了另一州Colorado(美国西部)。‎ 多项选择题型虽然倍受攻击,甚至成为应试教育的替罪羊,但命制专业的MC题目对命题者要求非常高,几乎所有语言测试学专家都认为多项选择题的命制难度大,如世界语言测试权威Heaton (1988:27)认为“多项选择题是命制难度最大且命题耗时最多的题型之一”;Hughes(1989:3)说“编制合适的多项选择题非常困难(notoriously difficult),编制工作需要投入大量时间和精力……设计拙劣的多项选择题可能无法准确地发挥测量功能。”‎ 就我国高考英语命题来说,命题时间偏短,命制正卷和副卷的时间仅一个月左右,这可能也是导致命题失误的客观原因之一。‎ 1. 对策 ‎“办人民满意的招生考试,体现公平、 公正”,高厉害关系的高考首先应追求命题科学性,命题失误是导致测量系统误差的因素,建议从以下方面进行改进,以推进我国语言测试的专业化进程。‎ ‎3.1 法制方面 西方国家在考试立法方面起步较早,最著名的如美国心理学会(APA)制定的1999版教育与心理测量标准(The Standards for Educational and Psychological Testing)。国际语言测试协会(International Language Testing Association, ILTA)在2000年3月于加拿大温哥华召开的国际语言测试协会年会上通过Code of Ethics for ILTA以及国际语言测协会2005年7月22日于加拿大渥太华举行的语言测试研究研讨会上通过The Draft ILTA Code of Practice(2006年6月28~7月1日在澳大利亚墨尔本大学举行的年会上通过正式文本)。但是,中国迄今没有颁布全国性教育考试与心理测量的技术标准,在语言测试方面,缺乏有关规范。然而,重庆市在2007年5月18日重庆市第二届人民代表大会常务委员会第三十一次会议通过了《重庆市国家教育考试条例》并于2007年9月1日起施行。据2007年4月10日《北京晨报》,国务院法制办正在研究加强考试立法,维护国家考试施测方和考生双方的权利和义务。‎ ‎3.2 政策方面 上海市自1985年开始经教育部授权自行组织命题,2000年,教育部决定实施高考分省命题,2002年北京开始自主命题,2004年增加天津、辽宁、江苏、浙江、福建、湖北、湖南、广东、重庆9省市自主命题,2005年增加山东省、江西省、安徽省自主命题,2006年新增四川、陕西后全国共有16省市自主命题,2007年国家没有新增分省命题省份。虽然分省命题有利于化解国家统一命题的安全等风险(“全国统一命题假如出了问题,涉及面广,造成的影响很大”,教育部考试中心副主任应书增语,2006年09月27日《中国教育报》),适合我国幅员广阔,经济、文化、教育发展不平衡的国情,但命题是一门科学和艺术,技术问题可以通过培训教育等解决,但是命题艺术性问题却不然,绝不是短期就可以提高的,Gary Buck (Personal communication, Feb 18, 2008) 说,“在美国有靠编写试题谋生的专业命题者,命题技能需要几年才能获得,他们和非专业命题者(non-specialist item writers)命制的题间的区别是非常明显的,就像在大多数具有挑战性专业领域里业余工作和专业工作间的差异一样明显”, 目前,分省命题地方的命题者几乎都是Gary Buck所说的“amateur item writer.” ‎ 所以,建议对不具备命题能力的省市区,不能以行政命令推广分省命题。笔者赞成全国划片区(如可划分为东北,华北,西北,华中,西南,华东,华南)成立片区命题中心的建议,或恢复全国统一命题制度,但命制绝对难度不同的平行试卷2至3套以适应不同教育水平省份的考生,此举有利于整合命题专家队伍、保证命题质量,并可大副节省命题成本。2006年启动建设的国家级题库预计在5年内完成,财政部、发改委支持教育部做教育题库,很大程度上不仅仅是为了安全,更重要的是质量问题(戴家干,2007),题库建设需要大量试题,其命题质量问题负面影响将会更大。‎ ‎3.3科研方面 加强语言测试科研工作,树立语言测试学科化的思想,以学术研究指导命题实践。建议成立全国语言测试学术组织——中国语言测试协会(China Language Testing Association, CLTA),主办定位明确的学术刊物,目前以语言测试命名的期刊仅有包天仁教授任主编的《英语考试研究》。语言测试学术研讨会目前已每年由国内大学主办,如广东外语外贸大学(2006年),北京外国语大学(2007年),华中师范大学(2008年),但会议的研究成果应寻找渠道进入有关决策层并对实践产生指导意义。中国虽然是考试文化的发源地,但在现代语言测试(研究集中在英语测试方面)方面研究起步晚,且未取得应有的学术地位,这导致目前的语言测试跟西方测试风潮,而没有立足中国国情来研究我们的语言测试,缺乏考试主权意识。‎ 加强科研对实践的指导,避免研究和实践脱节,否则导致语言测试实践工作重复犯同样的错误,例如2005全国听力卷(陶百强,2006a)和2007年江苏卷阅读理解第64题犯了同样的命题错误。‎ ‎3.4 专业化 语言测试实践应专业化,体现在遴选命/审题专家、命题、审题、试测、测后分析、反馈机制等方面。‎ ‎3.4.1 命/审题专家的遴选 命/审题者应专家化,并非大学教授和中学高级教师就有命题能力。教育部考试中心对高考命题者的要求局限于道德素养、职称(副高级或以上专业技术职务)、来源(主要是高校)、健康等方面,对审题者规定“审题教师的选聘参照命题教师的条件,并应在学科领域具有较高造诣”。但对于英语测试题的命制,至少需要三方面的条件:扎实的英语语言基本功、语言测试理论知识、丰富的语言测试命题实践。在选择好命题队伍的基础上,加强命题人员培训,主要是测试技术层面上的,并树立对待语言测试实践工作的敬畏之心。命题是专业性极强的工作,建议大规模教育考试的命题者应选聘“命题专家”而非普通大学教师。对于专家的界定也不能唯资力、职称、学历和所在大学的名气等论,而应唯能力论。‎ 鉴于中国国情——诚信机制不健全,一些省份的命题者换动频繁,甚至每年一换,导致命题者不能积累命题经验,更不能从命题失误中学习,加大命题培训成本。此外,鉴于英语毕竟不是我们的母语,建议聘用英语为母语的语言测试专家进入审题专家组。虽然高考试卷是绝密级文件,但一些国际英语测试的命题和审题专家团队也是国际化的,我们可以借鉴其经验进行操作。从事重大命题实践项目10余年的李筱菊教授(2001:162)曾说“搞外语考试,我们命题使用的毕竟不是我们的本族语,在语言问题上,少一点自信,恐怕比多一点自信好”。当然,对于本族语专家也不能盲目相信,如1985年高考一个多答案题就是由香港考试局英语科主任、新西兰籍测试专家审题时酿成的命题失误。建议考题封题前以一定的衡量标准选择至少两名本族语外籍专家审题并应解决一切争议,绝不能随便找一个在我国从事英语教学的外国人。‎ ‎3.4.2命题/审题程序化、科学化 建立完善的命题和审题程序,建立外部审题机制(External test specialist review),避免命题和审题组织合一导致的问题。以下是笔者改编的试题设计流程图:‎ 试测和保密要求的冲突使试测有时被省略,此时审题倍显重要。TOEFL有严格的审查程序,以杜绝性别歧视等敏感问题,曾于1984—1987年期间供职于美国教育测试服务中心的Bonny Norton Peirce描述了TOEFL试题开发中的审题程序(The review process),当时试题大约经过6位左右测试开发专家审查。首先,试题需经测试专家审题(Test Specialist Review, TSR);然后,试题进入TOEFL协调专家(TOEFL coordinator)审题程序, 其中两位专家负责审查文体问题,还有一位“敏感问题”审查专家(sensitivity reviewer)负责消除试题中任何潜在的如性别歧视等敏感问题(Peirce,1994:45-46)。Peirce提到自己在审查一篇阅读理解语篇时把“Therefore many farmers are tenants and much of the land is owned by banks, insurance companies, or wealthy businessmen”中的businessmen置换为了business people以符合避免性别歧视的原则(ibid: 47)。审题应从试题内容和测试偏差(test bias)以及敏感性问题等方面进行审查,但我国目前的高考试卷几乎没从性别歧视等社会语言学视角进行审题(陶百强,2006b)。‎ ‎3.4.3 反馈机制 对于命题质量应建立制度性反馈机制,若不能及时总结命题的经验和教训,不利于提高命题水平,更不利于今后避免类似的问题,导致命题问题不断。正视问题才能有助于解决问题,掩饰问题只能造成问题的恶性循环。特别是我国高考关系广大考生利益,正如考试中心副主任应书增(2007)所言,“高考题出得好坏关系考生命运…...我们用高考来评价学生,但高考试题同样要接受评价。一些省份的出题质量并非都很好。”‎ 我国台湾有大学入学试题质量质疑机制(http://www.ceec.edu.tw/ 2008-2-26),且对于有回函地址者对答案的质疑进行回复,兹录如下:“確定97年(即2008年)學科能力測驗各考科選擇題答案說明:97學年度學科能力測驗選擇題參考答案,於97年2月2日及3日在本中心網站(網址:http://www.ceec.edu.tw)公佈。在 ‎2月11日止的限期內,本中心共收到88件來函【國文5件、英文6件、數學3件、社會56件、自然18件】,對參考答案提出疑義。經徵詢學者專家意見後,各考科答案維持不變。本中心於2月18日回覆提出疑義來函之當事人(有回函地址者)。”‎ 我国台湾还通过互联网对对学科能力测验的试题质量进行问卷调查,参见http://www.ceec.edu.tw/Opinion97Sat/Default.htm 2008-2-26:九十七學年度學科能力測驗各科網路問卷調查:“由於試題品質之良窳與考生權益息息相關。本中心為收集思廣益之效,擬針對學生、教師與社會大眾進行網路問卷調查,期盼經由各方的意見,更清楚了解高中教學現況及本次試題設計的相關問題,以作為未來試題改進之參考”。‎ ‎4.结语 本文虽仅从微观的命题质量层面探讨问题,但是高考命题质量关系到众多考生利益和国家考试的权威性,关系到构建“人民满意的高考”这一宏伟目标,最终关系到教育公平即大学入学机会的平等问题,各级政府和教育考试主办机构应该高度重视高考命题科学性对构建和谐社会的重要意义,强化考试决策的科学化和民主化,加强人才培训和命题专家库建设,大力推进我国语言测试专业化进程,最终避免高考英语命题问题频出的现象。从宏观层面,高考英语改革研究更应从宏观的政策层面、社会人才需求层面、国情层面以及语言的本质和功能等层面进行综合审视、研究和改进。‎ 参考文献 Bush, G. W. (2006). President's Speech on the Global War on Terror [Electronic version]. Retrieved September 26, 2006, from, http://usinfo.state.gov/xarchives/display.html?p=texttrans-english&y=2006&m=September&x=20060906155503eaifas0.8319666.‎ Heaton, J. B. (1988). Writing English Language Tests (2nd edition) [ M]. London: Longman.‎ Hughes, A. (1989). Testing for Language Teachers [ M ]. Cambridge: Cambridge University Press.‎ Johns, M. (2007). The College Entrance Exam 2007: An Evaluation [Z]. Paper presented at 2007 National NMET Evaluation Conference. Beijing: Dec 8—9, 2007.‎ MacMillan English-Chinese Dictionary(麦克米伦高阶英汉双解词典):麦克米伦词典高阶英汉双解词典[Z]. 麦克米伦出版公司编;杨信彰等译. 北京:外语教学与研究出版社/Macmillan Publishers Limited, 2005.‎ Peirce, B. N. (1994). The Test of English as a Foreign Language: developing items for reading comprehension. In Hill C & Parry K (Eds.), From Testing to Assessment: English as an International Language (pp. 39-60). New York: Longman.‎ 包天仁.(2007). 2007年高考英语试题评析和思考[J].英语考试研究,(11-12):15-24.‎ 卞清杰、段惠彬.(2002).高考命题失误分类评析[J]. 基础教育外语教学与研究,连载(9):60-64;(10):61-64;(11):61-64.‎ 戴家干. (2007). 戴家干: 从考试到评价,教育改革的时代任务. 新华网:http://www3.xinhuanet.com/xhft/20070419/wzsl.htm ,2007-4-19.‎ 简庆闽. (2005). 2004年6月大学英语四级考试写作部分的命题探讨. 外语与外语教学, (1): 32-33.‎ 教育部考试中心. (2003). 2003年普通高等学校招生全国统一考试试题分析评价报告:英语:注重基础强调运用[J]. 中国考试(下半月刊), 11-12期(合刊).‎ 雷新勇. (2006). 大规模教育考试:命题与评价[M]. 上海:华东师范大学出版社.‎ 李筱菊. (2001).语言测试科学与艺术(第2版)[M].长沙:湖南教育出版社.‎ 刘道义 主编. (2004). 普通高中课程标准实验教科书英语(必修4).北京:人民教育出版社.‎ 刘润清,韩宝成.(2000). 语言测试和它的方法(修订版)[M]. 北京:外语教育与研究出版社.‎ 刘应德.(2002).论英语主谓一致观念的淡化[J]. 重庆大学学报(社会科学版),(1): 84-89.‎ 鲁子问.(2006). 2005年分省高考英语作文试题问题分析与对策建议[J]. 中小学英语教学与研究, (4):17-19.‎ 陶百强.(2006a).高考英语听力评析及其命题 [J].试题与研究, (8):1-4.‎ 陶百强.(2006b).语言测试与性别歧视研究对我国高考英语试卷的启示[J].基础教育外语教学研究, (10):34-37.‎ 陶百强. (2007a). 加强高考命题科学性 提高高考命题的质量——以2006年分省自主命题失误为例[J].中小学英语教学与研究, (3):45-51.‎ 陶百强. (2007b). 大力提高高考英语试题命题质量 维护考试公平性——2006年广东高考英语卷命题质量剖析[J]. 英语考试研究,(11-12): 10-14.‎ 杨学为,廖平胜. (2003). 考试社会学问题研究[M]. 武汉:华中师范大学出版社.‎ 应书增. (2007). 教育部解析高考改革:不会让31个省份全自主命题[N]. 中国青年报(记者, 堵力), 2007年04月17日.‎ 岳伟. (2007). 高考试卷难度的设计与控制[J]. 考试研究,3(4):4-15.‎