华文水平测试(HSC)的基本理念
2016-05-30王汉卫
提 要 华文水平测试是汉考家族的新成员,是为测量海外华裔的祖语水平而设计的测试。在华测的视角下,海外华裔是一个独特的群体:(1)身份特殊,不同于一般外国人;(2)语言状况特殊,一是中文水平参差不齐,二是中文水平自移民后呈衰退趋势;(3)在情感、精神上仍归属于中华文化;(4)诉求特殊,他们希望向母语者靠拢,通过比照国内母语者水平来定位自己的中文水平。因此,为了能服务于这个特殊的考试群体,华测在总体设计上提出以下五个基本理念:(1)标准加常模的参照体系;(2)认知加语言的等级结构;(3)听说和读写尽可能严格区分的试题追求;(4)强化对汉字能力的要求;(5)强化中华文化背景的存在。
关键词 华裔;祖语;华测;基本理念
Abstract This paper examines the designing principles of Heritage Chinese Language Proficiency Test, shortened as HSC. HSC is a new form of Chinese language test designed for measuring heritage language levels of overseas Chinese people. Compared with other test-takers, overseas Chinese people constitute a special ethnic group in at least four aspects. Firstly, their ethnic identity determines that they are different from other foreigners. Secondly, their Chinese language proficiency varies greatly, and it is on the decline since their immigration. Thirdly, they are still attached to Chinese culture emotionally and spiritually. Lastly, they have a desire to improve their Chinese language to a level as high as Chinese native speakers. In light of these characteristics of overseas Chinese, we propose that HSC shall be guided by some special designing principles in order to cater to the needs of this group of test takers. First, the Chinese language standards of native speakers and overseas Chinese speakers should be treated separately. Second, cognition and language use should be integrated in the proficiency descriptors. Third, listening and speaking skills should be treated differently from reading and writing skills in the test. Forth, Chinese literacy should be reinforced in the test. Fifth, Chinese cultural knowledge should be highlighted. These principles can be significant to make HSC an effective Chinese language proficiency test for overseas Chinese speakers.
Key words overseas Chinese people; heritage language; HSC; basic conception
一、引 言
作为世界上使用人数最多的语言,作为世界上第二大经济体的官方语言,作为崛起中的大国语言,作为世界上人数最为众多的海外侨民、移民及其后裔的族裔语言,相比于英语考试,汉语①的标准化考试起步较晚,考试产品的研发节奏较为缓慢,还远未满足市场的需要。
最早的标准化汉语水平考试始于1981年的“中国语检定”,是日本开发的考试。“检定”先是在日本国内举办,后来扩展到跟中国国内多家大学联合举办(陆庆和 2003)。
由中国自己开发的标准化汉语水平考试(HSK)始于1984年,当时的北京语言学院在国内率先展开了这方面的工作,并于1990年通过专家鉴定,1991年推向海外,1992年国家教委第21号令确定其为国家级考试。经过20年左右的发展,HSK家族发展成为世界上影响最大的汉语水平考试,在HSK(初、中等)的基础上,增添了不少考试产品,完善了考试种类,例如HSK(高等)、HSK(基础)、C.TEST、HSK(改进版),后来国家汉办推出的HSK(商务)、HSK(少儿)、HSK(旅游),以及“新HSK”(1—6级),另外还有原国家教委2001年组织研发的“中国少数民族汉语水平等级考试”(MHK)等。几乎跟HSK系列考试的发展同步,作为非第一语言的汉语标准化考试在全世界也迎来了一个迅速发展期,例如美国的SAT-Ⅱ中文考试、AP中文考试、英国的GCSE及A-level中文考试,以及中国台湾地区的华语文能力测验等,也都在2000年前后登上汉语测试的舞台(王汉卫 2012)。
伴随汉语水平考试的开展,汉考领域涌现出一大批研究成果,例如张凯(1995)、郭树军(1995)、陈宏(1999)、王佶旻(2002)、柴省三(2002,2012)等对汉考信度、效度的研究;谢小庆(1995a,1995b)、刘镰力(1995,1999)、金名和红尘(2002)、张凯(2004)等对分数等级体系的研究;陈宏(1995)、任杰和谢小庆(2002)、鹿士义和余嘉元(2003)、柴省三(2013)等对公平性问题的研究;郭树军(1995)、刘镰力(1997)、任春艳(2000)、王佶旻(2002,2007,2011,2013)、柴省三(2002,2003)、田清源(2007)等对听、说、读、写单项语言能力的研究;鹿士义(2011a,2011b)等对汉语考试跟国际上重要语言能力标准框架的接轨研究;等等。测量的基本理论(经典、概化、项目反应)、参照体系(常模、目标)、等值技术、试卷长度等诸多方面也都有不少研究成果问世。
回顾汉语水平考试的发展历程,特别引起我们关注的是HSK的定义。按照北京语言大学汉语水平考试中心的界定,HSK“是专为母语非汉语者设计的标准化语言考试”,所谓“母语非汉语者”,包括外国人、华侨和中国少数民族考生(刘英林1996)。然而实际情况的复杂性在于这三类人群同质性不高,同一个测量工具似乎并不能同时适用于这三个群体。陈宏(1995)注意到这个问题:“近年来HSK(初、中等)考生生源的结构发生了一个值得注意的变化,即除了人数不断增长的零散的有中国背景的应试个人外,还出现了几种应试的有中国背景的考生团体。所谓‘中国背景指的是具有此种背景的考生个人的母语或其双语之一即为汉语或汉语的某种方言。根据经验,这些考生的整体水平一般大大高于HSK(初、中等)目标总体的平均水平,他们所构成的考生团体很可能在异质程度上与HSK(初、中等)目标总体有所不同。”经过对自然总体、可疑样本和目标总体的统计分析研究,陈宏认为HSK用于有中国背景的考生团体属于“常模误用”,并提出应开发专为有中国背景的考生团体而设计的考试。
HSK设定的另一个目标群体是“中国少数民族考生”,跟海外华裔的情况相仿,考试实践表明HSK也“与少数民族汉语教学不相适应”(张凤麟 2004),于是国家教委于2001年组织力量,专门研发了适用于中国少数民族的“中国少数民族汉语水平等级考试”(MHK),并于2004年投入使用。遗憾的是,开发专为有中国背景的考生团体而设的考试并未得到落实,HSK后来的考试发展以及“新HSK”都仍然没有将海外华人跟一般外国人区别对待。
我们认为,将海外华裔从HSK的目标群体中独立出来,不管是从语言测试的角度,还是从语言测试相关的决策、后效及语言教学的角度,都有着十分重要的意义。语言测试是教育心理测量的范畴,而不是一般的物理测量,海外华裔的整体祖语②水平显著高于一般外国人,族裔上、文化上,乃至社会心理上,海外华裔也显然不同于一般外国人,这些都是不需要通过测试来验证的事实。笼统地将海外华裔等同于一般外国人施以相同的测量和评价,不仅仅是“常模误用”的问题,长此以往,必然会极大地抑制海外华裔的群体祖语水平。
如同MHK施测于中国少数民族一样,针对海外华裔的祖语能力而设计一个标准化的汉语水平考试——华文水平测试(简称“华测”,字母缩写“HSC”)也势在必行。本文即是为华测所做的理论准备,探讨语言测试视角下海外华裔的特点,以及华测应有的基本理念。
二、华测的对象
“华文水平测试”是针对海外华裔的祖语能力而设计的一个标准化考试。在华测的视角下,海外华裔是一个独特的语言群体,不同于一般汉语二语者,这个群体至少有以下四个特点:
一是身份特点。华人既是国籍上的外国人又是族裔上的中国人,华侨则更是客居海外的中国人,但客居久了,特别是他们的后裔,又不同于一般的中国人。
二是语言特点。海外华人的祖语情况总体上有两个非常明显的特点:参差复杂,逐渐衰退。所谓“参差”,主要体现在两个方面:一方面是在每一个年龄段上都存在零基础到汉语母语者水平的人群;另一方面是听说和读写两种能力差异悬殊,具有母语者听说水平的文盲或半文盲众多。与此同时,就整体情况而言,海外华人的中文水平自移民以后会呈衰退趋势,但衰退的速度有快有慢,快的第二代祖语能力已经尽失,慢的如马来西亚等地,几百年下来,不少人仍然保持着良好的祖语水准。
三是文化特点。海外华人就是流着中华文化血液的人,完全意义上的所谓“香蕉人”实不多见。一位自小接受美国教育的华裔女孩日前在接受媒体采访时说道,华二代意味着你将不断游走在两个世界中,你将永远被夹在两者之间,却永远不完全属于任何一边。华裔后代总是会在与当地人的交流碰撞中,发现自己的华人血脉永远流淌在血管之中。这个时候,他们就会意识到需要找到自己的根,需要从自己的文化、传统中汲取精神力量及思想武器来保护自己。只有将中国文化、传统内化于心,才能更好地安身立命(孙少锋、王瑜 2015)。
四是考试诉求。他们——特别是华文水平较高者——并不满足于跟一般外国人比较,而是很想知道自己的华文水平“相当于哪一级水平的以汉语为母语者”(陈宏 1996;王汉卫等 2014)。这个诉求既是基于理性的,也是基于情感的,是华人身份在测试需求上的生动体现。
较新的数据认为全球有6000万华人(郭熙 2015)。这其中,华测最关注的是两类人:一类是有较好华文水平的老辈移民及其后裔;一类是新侨民、移民及其后裔。两类合成一类:即有较好华文水平的人群。这个人群是影响海外华语文走向的最重要的海外因素之一,因此也是我们特别关注的对象。这样的基本考试格局是服从于测量需要的。从测量学的专业角度,任何一个测量工具都难以满足全距十分巨大的测量对象,而在语言测试的视角下,海外华裔的同质性差异足够大,从完全的零基础,到完全等同于一般中国人,等同于汉语母语者。为保证测量的精度,华测在目标对象上不能不有所侧重,有所取舍。就汉语水平考试的现有实践看,较低水平的人群已被现有不少考试所关注,例如新HSK1—4级的词汇量分别是150、300、600、1200,再如台湾地区的华语文能力测试以及外国所开发的相关汉语考试,多是以完全的二语理念所设计的考试,祖语水平较低的华人被试可以选择这些测试。
总之,华测的直接对象非但不是一般外国人,甚至也不是所有海外华人,而是其中具有较好祖语水平的人群。但它的目标是为了影响和提升所有海外华侨华人的祖语水平,而且逻辑上也不排除影响到一般外国人。
三、华测的参照
(一)常模和标准的关系
常模和标准的关系可以做下面的理解:在任何测量领域内,一个不够大的常模是常模,而一个足够大的常模就是标准。今天所有的所谓标准——假如这个标准还算合理的话——都必然是一个足够大的常模水平,这两个参照之间并没有鸿沟。真正的问题是:什么是“足够大”的常模?
现有的汉语二语考试都是以目标群体为常模参照的考试(张凯 2002)。对于面向一般外国人的考试来说,有一个常模成绩,这个成绩能够带来某种价值,这也许就足够了。而对华测来说,我们既不可能在海外找到一个可以作为参照的常模点——各国情况不同,水平差异悬殊,谁都没有资格作为他人的标准;也不可能以多个点组成一个常模样组,然后再以这个样组的成绩来解释其他被试——这跟取一个常模点的做法并无本质不同,而且仍然无法满足“相当于哪一级水平的以汉语为母语者”的诉求。
否定了完全依据海外常模的思路,能否以国内汉语母语者作为常模呢?如果拿国内汉语母语者作为常模,华测是否仍然是一个常模参照测试呢?我们认为:仍然是,但不只是。
在汉语水平上,“足够大”当然不能停留于二语者或华语者,而是汉语母语者。这个常模囊括了所有以汉语为第一语言的人,“汉语母语者水平”就是这个常模的平均水平——这已经不是一个普通的常模水平,而已升华为标准,是所有想知道自己汉语水平的人都可以参考的标准。
(二)关于“常模误用”
如果拿二语者常模去评判母语者水平,就如同拿市场上卖菜的杆秤去称大象,这必然是常模误用,因为基于卖菜的常模而设计的杆秤根本无法称量大象,基于二语者的常模而设计的试卷也根本无法度量母语者水平。而如果拿母语者常模去度量华语者,这算不算常模误用呢?我们认为:也算,也不算。这涉及测量工具的精确性问题。
拿母语者标准开发的试卷来评价华语者,为什么说“不算”常模误用呢?“相当于哪一级水平的以汉语为母语者”想得到的正是这个标准体系下的评价。为什么又说“算”呢?作为一个测量工具,以母语者为对象的试卷用于华语者,其精确性必然堪忧,因为事实上海外华裔的华语文水平群体差异巨大,从完全没有任何中文能力到完全的母语者水平都有。对于某些被试来说,学习一年甚至多年,拿母语者为对象的试卷一测,结果可能是零分,譬如拿称卡车的地磅称虫草,即便价值已经不菲的一撮虫草,恐怕也不会得到准确测量,甚至有可能显示不出来。
总之,拿二语者标准测量母语者水平,是完全无法测量的问题,是常模误用;拿母语者标准评价二语者水平,本质上没什么大错误,精度上却必然有问题——“精确程度”上的问题也不是小问题。
(三)华测等级体系的参照建立
要保证海外华人社会祖语水平跟祖籍国中国的链接,首先必须保证测量体系的链接,而要保证测量体系的链接,就必须参照共同的标准;要保证测量工具的精度(有效性),保证测试实践和测试结果对海外华人社会的祖语保持和发展有良好的后效,华测又不能仅参照母语者标准。在这种情况下,华测就必须采用“标准参照加常模参照”的模式,此处的“标准加常模”并不简单等同于以往的有些考试,具体解释如下:
鉴于海外存在与国内汉语母语者并无显著差异的人群(例如马来西亚、例如部分新移民),华测的高级水平测试参照国内母语者标准。“母语者标准”并不仅仅意味着一个标准,而是要适当区分出几个年龄段,并确定该年龄段的母语者标准,这些标准可以大体参考国内中小学语文教学的课标以及其他现有相关研究成果,并依据社会语言学的理论以及试测的情况进行微调。就是说,高级基本属于标准参照。
定了每个年龄段的高级(母语级)之后,再定初、中级——初、中级水平的确定是一个艰难的过程。最初我们显然不可能确定什么是海外华裔的初、中级水平,而只能确定求取初、中级水平的途径和方法。
第一步:参考母语者标准,并参考现有汉语水平考试的标准,对母语者标准进行大幅度的降低,暂定出初步的初、中级标准。
第二步:根据暂定的初、中级标准,编写初、中级试卷。
第三步:进行大规模试测,尽可能遍及主要海外华人社会。
第四步:根据试测数据调整并确定初、中级标准。
初、中级基本属于常模参照。
需要补充说明的是,初、中级的“常模参照”只是暂时性的,尽管“暂时”仍可能是相当长的一段时间,但随着华测考试实践的积累,随着常模人数和质量的逐渐增加和提高,“常模”将逐渐晋升为“标准”——尽管这个标准可能仍然是变动的。
总体上,华测的等级参照是以“标准”为追求的。至于分数的解释,按照标准参照还是常模参照,可以灵活处理,甚至同时给出两种解释。总之这属于决策的范畴,是另外的话题。
四、华测的等级结构
(一)语言与认知的关系
在语言和认知的关系上,以下两点是华测的基础:
第一,一定程度上,认知依赖于语言,但不依赖于任何一种特定的语言,以不同的母语接受普通教育的普通人,相同年龄段的认知水平大体是相当的。
第二,一定程度上,语言依赖于认知,认知范围之外,语言能力无从体现。
(二)关于“母语水平”
除了“认知”这个关键词,我们还需要关注“母语水平”这个概念。
通常而言,“母语水平”是成年人的语言水平,也即认知范围和能力发展较为成熟时期的语言水平。我们夸外国人的中文水平“跟中国人似的”,显然,这个“中国人”一般指的是成年人。
然而每个认知阶段(年龄段)都有该年龄段的“母语者水平”,3岁、6岁、12岁、18岁都有自己的“母语者水平”,只不过认知范围和语言能力有不同,在一定年龄范围内,语言能力是随着认知、随着年龄的增长而增长的。
(三)华测的层次和等级
华测是为了引导海外华人社会祖语能力的保持和提升,测试对象不仅是成人,成人阶段的考试不是华测的全部,甚至也不是华测的重点。恰恰相反,考虑到少年儿童是认知范围和语言能力迅速发展的阶段,为了有效影响、引导和提升海外华人社会的祖语能力,华测应该关注到认知发展的各个层次,对应不同年龄段,以适龄性的原则定位和开发相对独立的系列测试,这是确定华测结构的基本考虑。
娃娃是华测的起点;少年承上启下;成年(18岁左右即成年人了)当然也是华测家族的一个成员。进一步,每一个相对独立的测试,都在自己的认知范围内对语言能力做出初、中、高的区分。按照以上认识,华测的宏观结构如表2。
需要说明的是,不管是童年、少年、成年,还是初级、中级、高级,都只是逻辑上的简要表达,测试实践上可根据需要增减层次和等级。童年和少年阶段认知能力和语言能力的发展迅速,因此也可以根据社会需要及研发能力的许可,尽可能增加低年龄段的考试。至于语言能力的等级,童年的语言能力还比较基础,而且这个年龄的考试风险不高,宜以鼓励为主,可以把考试等级设置粗一些,而成年阶段,语言能力的全距大,而且这个年龄的考试是高风险测试,可以把考试等级设置细一些。
五、华测的“特别”追求
(一)听说和读写能力严格区分的试题追求
现有语言考试,不管是英语考试还是汉语考试,都没有严格区分听说和读写,听力考试普遍要“阅读”选项,口语考试也有依赖文字的“朗读”题型。这样的考试设计具有明显的理论缺陷:
第一,不管是一语还是二语,听说跟读写显然是相对独立的两种能力,文盲的存在以及所谓“哑巴英语”便是证明。
第二,听说测试却依赖文字,测试结果很难说是客观的,因为根本无从分晓是听不懂还是看不懂,是不会说还是不会认。
但现有汉语考试的做法也无可厚非,因为它们的对象多为正规的在校生,听、说、读、写基本是平行发展的。海外华人社会的情况则大不相同,听、说、读、写能力严重不均衡。例如在印尼的棉兰、坤甸、实拉班让等很多地方的学生都有方言基础以及华语基础,闽南话、客家话等是日常使用语言,而当地一般华人的书面能力严重滞后,甚至根本就是文盲。在由新移民构成的新华人社区,例如欧美澳等地,这种“语”“文”的严重脱节也广泛存在。而且,大家对听说和读写能力的需要也不一致,我们对此已有初步的调查和认识(王汉卫等 2014)。
所以,华测应该理论上明确区分听说和读写,技术上致力于实现听说测试不依赖于文字,以使测试更加精确,解释更加合理。需要补充说明的是,测试实践上并不容易完全做到严格区分听说和读写,但这必须是华测的追求。
(二)强化汉字能力的追求
汉字难几乎是学界的共识,有调查显示,留学生四年的平均识字量仅为1600个左右(王又民 2002;李大遂 2003)。汉字难不仅是对一般外国人而言的,对海外华人亦然,不管是老的还是新的华人社区,读写能力的严重下降都是普遍现象(温晓虹 2011;曹贤文 2014)。王汉卫(2012)认为,“民俗文化可算是相对最持久的祖籍国特征,比文化难于保持的是语言,比语言更难于保持的是文字。反过来,华人身份的流失,首先是从汉字开始的”。陈松岑等(1999)面对新加坡的“讲华语运动”也表达了同样的担忧,“如果只推广华语而不提倡华文,不但用华语来继承传统文化的愿望会落空,华语的使用价值将进一步下降而逐渐被英语所取代,新加坡将变成完全西化的社会,新加坡的华族事实上也将不再是真正的‘华族了”。
可以说,汉字一方面难,一方面对海外华人社会有着至关重要的意义。面对这种情况,开发对促进汉字学习有强力反拨作用的测试,正是华测的特征和使命。
对汉字的重视,体现在测试上,主要有如下一些技术上的手段:
第一,在大纲上,明确各级别层次的汉字要求,包括认读和认写的要求。
第二,在测试上,不论认知层次和语言层次的高低,都设计读写的测试。
第三,在写作试卷上,除了传统的题型,努力尝试从形、音、义三个方面强化对汉字的考查,与此同时也努力把对汉字的考查跟语言能力的考查协调起来。
(三)强化中华文化背景的追求
关于测试中的文化问题,首先需要明确的是以下四点:
第一,文化是认知的一部分。
第二,语言和文化密不可分,语言是文化的最大载体。
第三,语言教学(包括测试)根本就不应该,也不可能回避文化(但应该而且可以回避某些文化,例如负面的文化内容)。
第四,汉语测试,必须在适合的认知范围内,在跟语言测量不相抵触的前提下,力所能及地去承载传播中华文化的使命。
简单说,文化可以分为两大类:普世文化和民族文化。普世文化存在于民族文化中,是各民族文化的共有部分;而民族文化则是普世文化的沃土和延伸。普世文化是一般认知的一部分,以体现普世文化价值的材料作为一般外语考试的材料,非但无妨测试的公平性,也是语料选择应有的“偏好”。
而中华文化有所不同,中华文化是打上了华族印记的认知,是民族文化的一种,体现了华族跟非华族的区别。
面向所有“外国人”的考试,如过多呈现中华文化,等于是抹平了这两类人群的差异,会带来公平性问题。华测单独针对华族,不存在公平性的问题,也可以完全把文化侵略、文化沙文之类的顾虑抛开。因此,在认知的前提下,将中华文化作为语料选择的一个重要的和优先的考量,这也是华测必须有的根本属性之一。
有一系列的技术手段可以在考试上加强中华文化,其中最重要的是语料的选择。例如“信”,作为人类共同的最重要的道德规范、文化内涵之一,如果选用西方的故事(例如《华盛顿与樱桃树》)来表达,就没有了中华文化的影子,而选用《郭伋亭候》则彰显了中华文化。词汇中的实词性成分,特别是名词——哪怕是普通名词,里面也常常有文化的影子,例如牛排、沙拉,西方味道十足,而凤爪、豆腐,中国味扑面而来。
作为测试的背景信息,中华文化的气息可以无处不在,除了语料的选择,排版、装帧、题型等,都可以承载和体现中华文化的元素。这些都非常值得研究,我们将另文展开。
六、华测的意义
当前的汉语测试按“被试”一般分为三大类:以汉语为母语的中国汉族人群,以汉语为第二语言的中国少数民族人群,以汉语为第二语言的外国人群。华测是对被试人群进一步细化的结果,不管从语言、种族、文化哪一个方面,或者说综合考虑这三个方面,华测都应该独立出来,“华测”的位置在下图可以得到更加明确的表达:
考试跟教学息息相关,一如HSK对教师、教材、教法的影响,华测的意义不限于测试,也不限于“三教”问题,而将对汉语教学的整体格局、对海外华人社会的祖语能力的保持和传承、对维系海外华人社会与祖籍国的关系都会产生有益的影响。
近年来,服务于汉语国际教育,国家汉办(2007,2009,2015)推出了一系列的大纲、标准及考试。面对海外华裔及海外华校,国务院侨办出台相应的大纲标准,举办相应的考试也势在必行。本文提出的华测理念仅仅是一些基础思考,华测是一台大戏,这台戏要唱好,从理念到方法,从大纲标准到试题试卷,从组织实施到证书决策,都应该在宏观设计和细节实施上下更多的功夫。
注 释
①“汉语”跟“中文、普通话、华语、华文、华语文”等概念在内涵上有很大程度的重叠,有时异名同指,有时又有不同的侧重,本文视行文的需要灵活使用这些概念。
②“祖语”这个概念系由郭熙先生2015年在《论汉语教学的三大分野》一文中首次使用,对应heritage language。
参考文献
曹贤文 2014 《“继承语”理论视角下的海外华文教学再考察》,《华文教学与研究》第4期。
柴省三 2002 《关于HSK(初、中等)平行信度的实证研究》,《汉语学习》第2期。
柴省三 2003 《汉语水平口试信度的理论与实证研究》,《语言教学与研究》第4期。
柴省三 2012 《关于HSK阅读理解测验构想效度的实证研究》,《世界汉语教学》第2期。
柴省三 2013 《汉语水平考试(HSK)阅读理解测验公平性研究》,《语言文字应用》第4期。
陈 宏 1995 《关于考生团体异质程度对HSK(初中等)信度的影响》,北京语言学院汉语水平考试中心编《汉语水平考试研究论文选》,北京:现代出版社。
陈 宏 1996 《第二语言能力结构研究回顾》,《世界汉语教学》第2期。
陈 宏 1999 《语言能力测验的结构效度检验》,《世界汉语教学》第1期。
陈松岑、徐大明、谭慧敏 1999 《新加坡华人的语言态度和语言使用情况的研究报告》,李如龙主编《东南亚华人语言研究》,北京:北京语言文化大学出版社。
郭树军 1995 《汉语水平考试(HSK)项目内部结构效度检验》,北京语言学院汉语水平考试中心编《汉语水平考试研究论文选》,北京:现代出版社。
郭 熙 2015 《论汉语教学的三大分野》,《中国语文》第5期。
国家汉办/孔子学院总部 2009 《新汉语水平考试大纲》HSK一级、HSK二级、HSK三级、HSK四级、HSK五级、HSK六级,北京:商务印书馆。
国家汉语国际推广领导小组办公室 2007 《国际汉语能力标准》,北京:外语教学与研究出版社。
金 名、红 尘 2002 《汉语水平考试(HSK)等级结构中的几个系统理论问题》,《汉语学习》第2期。
孔子学院总部/国家汉办 2015 《HSK考试大纲》(一—六级),北京:人民教育出版社。
李大遂 2003 《中高级留学生识字量抽样测试报告》,《暨南大学华文学院学报》第2期。
刘镰力 1995 《高等汉语水平考试的性质和等级分数的划分》,北京语言学院汉语水平考试中心编《汉语水平考试研究论文选》,北京:现代出版社。
刘镰力 1997 《HSK(高等)口试探索》,《世界汉语教学》第2期。
刘镰力 1999 《中国汉语水平考试(HSK)的等级体制》,《世界汉语教学》第3期。
刘英林 1996 《中国汉语水平考试十年(一)》,《汉语学习》第4期。
陆庆和 2003 《关于“中国语检定”》,《世界汉语教学》第2期。
鹿士义 2011a 《商务汉语考试(BCT)与欧洲语言共同参考框架(CEFR)的等级标准关系研究》,《华文教学与研究》第2期
鹿士义 2011b 《商务汉语考试(BCT)阅读能力与欧盟框架的匹配研究》,《语言文字应用》第1期。
鹿士义、余嘉元 2003 《当前HSK中若干值得进一步研究的课题探讨》,《汉语学习》第4期。
任春艳 2000 《HSK作文评分客观化探讨》,《汉语学习》第6期。
任 杰、谢小庆 2002 《中国少数民族考生与外国考生HSK成绩的公平性分析》,《心理学探新》第2期。
孙少锋、王 瑜 2015 《新移民家庭之忧:文化夹缝中的华二代》,《人民日报》(海外版)2月2日。
田清源 2007 《HSK主观考试评分的Rasch实验分析》,《心理学探新》第1期。
王汉卫 2012 《华测中的阅读研究》,北京:北京大学出版社。
王汉卫、邵明明、凡细珍、王延苓、吴笑莹 2014 《华文水平测试总体设计再认识——基于印尼、菲律宾、新加坡的调查分析》,《华文教学与研究》第3期。
王佶旻 2002 《三类口语考试题型的评分研究》,《世界汉语教学》第4期。
王佶旻 2007 《初级阶段留学生个体背景因素与口语测验表现的关系》,《汉语学习》第5期。
王佶旻 2011 《初级汉语口语测验题型研究》,《考试研究》第5期。
王佶旻 2013 《汉语能力标准的描述语任务难度研究——以中级口语能力量表为例》,《世界汉语教学》第3期。
王又民 2002 《中外学生词汇和汉字学习对比分析》,《世界汉语教学》第4期。
温晓虹 2011 《美国中文教学面临的挑战与对应策略》,《世界汉语教学》第4期。
谢小庆 1995a 《高等汉语水平考试[HSK(高等)]的分数体系》,北京语言学院汉语水平考试中心编《汉语水平考试研究论文选》,北京:现代出版社。
谢小庆 1995b 《汉语水平考试的分数体系》,北京语言学院汉语水平考试中心编《首届汉语考试国际学术讨论会论文选》,北京:北京语言学院出版社。
张凤麟 2004 《中国少数民族汉语水平等级考试(MHK)简介》,《延边教育学院学报》第5期。
张 凯 1995 《汉语水平考试结构效度初探》,北京语言学院汉语水平考试中心编《首届汉语考试国际学术讨论会论文选》,北京:北京语言学院出版社。
张 凯 2002 《标准参照测验理论研究》,北京:北京语言文化大学出版社。
张 凯 2004 《HSK等级分数的问题》,《世界汉语教学》第1期。
责任编辑:戴军明