基于大数据的汉语国际教育硕士教材研究<br/>——以《汉语国际教育硕士系列教材：核心课教材》在线评论为例*

基于大数据的汉语国际教育硕士教材研究
——以《汉语国际教育硕士系列教材：核心课教材》在线评论为例*

2020-11-25陈晓霞

云南师范大学学报（对外汉语教学与研究版） 2020年6期

陈晓霞

(北京华文学院华侨华人与华文教育研究中心，北京 102206)

一、研究背景

从2007年3月《汉语国际教育硕士专业学位设置方案》的发布迄今，汉语国际教育硕士(以下简称汉硕)培养已经走过了十余年的旅程。虽然全国汉语国际教育硕士专业学位教育指导委员会陆续公布了《汉语国际教育硕士专业学位研究生指导性培养方案》(2007年)和《全日制汉语国际教育硕士专业学位研究生指导性培养方案》(2009年)，详细说明了设置核心课程、拓展课程和训练课程的要求，然而对作为教学环节中必不可少的教材问题，在课程体系中却并未有统一规定或要求。(1)季薇.面向国际汉语师资培训的汉语语言学教材研发问题初探[J].人文丛刊，2012，(0).因此，各培养单位及教师或自编教材，或寻求替代教材，或用以往培养研究型硕士的相关课程教材取而代之，(2)赵金铭.汉语国际教育硕士专业学位课程与教材研究[J].国际汉语教育，2015，(1).各单位之间也出现了课程名称相同，使用的教材却不相同，甚至上下届学生使用的教材都有差异的混乱局面。

直至2014年，外语教学与研究出版社出版了由赵金铭教授担任总主编，北京语言大学、复旦大学、南开大学、北京大学和华东师范大学相关领域的中青年学者参与编写的《汉语国际教育硕士系列教材·核心课教材》(6册)，才终结了之前缺乏核心课程系列教材的困境，“这套教材的设计编写与出版，不仅仅是一项从无到有的开拓性工作，更是一项在汉语国际教育硕士专业学科研究和教材建设中具有创新示范意义的重要成果。”(3)李泉.汉语国际教育硕士专业建设的开拓性成果——读赵金铭总主编MTCSOL系列核心课教材[J].国际汉语教育，2015，(2).作为唯一的国际汉语教育硕士套系教材，它不仅是国际汉语教师证书考试的参考用书，(4)《跨文化交际》被列入《国际汉语教师证书》考试参考书目。也是很多培养单位的入学考试参考书目和课程教材。

至今，这套教材出版已近5年，然而学界对其研究极少，仅散见于数篇汉硕毕业论文。卢楠(5)卢楠.昆明三所高校汉语国际教育硕士专业的课程设置对比研究[D].云南师范大学硕士学位论文，2016.、王佳祥采取问卷，调查了汉硕对于教材的看法，昆明3所高校及天津4所高校汉硕对教材的满意度均不高。(6)王佳祥.天津四所高校汉语国际教育硕士专业课程设置的调查与研究[D].天津师范大学硕士学位论文，2018.然而这两项研究得出的结论基于较少的数据样本，其仅为调查问卷中一道选择题，不足以说明总体情况，对于该教材的评估并不精确、全面。

汉硕不仅是汉语教师的储备力量，也是汉语教学届的重要学习者，然而全球汉语教材库数据显示教师培养教材仅占约3.7%。(7)谭萍.对外汉语教材评估研究现状、问题及对策[J].云南师范大学学报(对外汉语教学与研究版)，2017，(4).蔡武分析了2007～2017年间282篇汉硕研究相关论文，主题分布在学科定位、培养目标、课程设置、教学实习、培养模式、论文写作和就业问题等7大方面。(8)蔡武.汉语国际教育硕士的研究回顾与展望[J].云南师范大学学报(对外汉语教学与研究版),2018,(4).作为教学三要素之一的教材研究则未有所见。总体而言，汉语国际教育教材及其研究局限于以汉语学习者为对象。汉硕作为学习者的教育需求未受到重视。

因此，本文将对网上购书平台关于《汉语国际教育硕士系列教材·核心课教材》(6册)的千余条评论进行采集和分析，利用数据挖掘文本分析的方法，提取评论中有价值的信息，从而对此套教材的使用情况和读者满意度进行评估。文章首次尝试基于大数据样本评估教材，探究教材评估研究新方法，同时也为教材编写者和使用者提供建设性的意见，为汉硕的研究和培养提供参考。

二、研究设计

(一)研究数据的选择

随着大数据时代的到来，研究数据来源和信息技术的壁垒被突破，更先进、更科学地评价教材成为一种可能性。2018年，网上书店销售成为带动我国图书零售市场增长的主要动力，线上销售对我国图书零售市场增长的贡献率高达125.27%。(9)2018年中国图书零售市场现状与发展前景线上销售拉动行业稳定增长[EB/OL]. https://www.qianzhan.com/analyst/detail/220/190213-36304bc7.html.与此相对，各个网络购书平台也产生了大量的在线评论。在线评论是消费者对产品体验的表述、对产品价格、性能等特征的评价。(10)张丽，张蕾，张阳，戢妍.基于中文分词和词频统计的图书在线评论文本分析[J].信息系统工程，2011，(7).多项研究均发现Amazon 在线图书评论能反映图书的受欢迎程度，是图书评价重要的信息来源之一，对于图书评价具有重要的意义。(11)Kousha K,Thelwall M,Rezaie S.Assessing the citation impact of books: The role of Google Books,Google Scholar,and Sco-pus[M].John Wiley & Sons,Inc.,2011.

我国现有的网上书店达到50多个，常见的能获取读者评论的较有影响力的网上平台有且不限于豆瓣、淘宝、当当、京东、亚马逊，等等。当当、京东、亚马逊被业内称为“三大网店”，他们的图书销售占到整个网上图书销售渠道的大部分，是整个网上书店的主流代表。京东和当当对于该套丛书的评价信息丰富且数据样本量充足(亚马逊上无该套书的读者评论)。而豆瓣为国内领先的书籍等文化艺术作品的交流、评论网站，拥有较多的读者评论信息。对上述各个平台做了调研之后，拟定综合采用京东、当当和豆瓣3个网站的读者在线评论作为此次研究的数据对象。

(二)研究过程

首先，利用 Python 数据爬虫模块爬取全部6本书及套装读者评价页面的信息，包括评分和评论文本。由于在线评论的随意性，原始评论中存在着很多不规范的信息，因此接下来对原始评论进行错别字纠正、拼音和英文替换、删除乱码、删除无意义的模板评论、删除不相关的评论等去噪处理，为后续分析提供规范的清洁文本。

利用python自然语言处理相关工具对评论文本进行分词、去除停用词、词频统计、制作词云图，并对关键词进行汇总和分析；此外本文还将计算评论文本的情感倾向。上述步骤能将文本这一非结构化数据转化为结构化数据，以期从中发现有价值的信息。

三、研究结果及分析

(一)数据概况描述

1.数据样例

截至数据采集的时间节点(2019年6月24日)，共爬取京东原始评论613条，当当664条，豆瓣32条。经过去噪处理后，京东剩余568条评论，当当577条，豆瓣31条，共1176条洁净评论，21427字。完整的评论数据样例见表1：

表1 当当、京东、豆瓣评论数据样例

需要说明的是，京东和豆瓣的评分为5分制，而当当为10分制，因此在获取评分时，将京东和豆瓣的评分都乘以2，折算为10分制。

2.数据按时间统计

将3个平台的数据汇合后，以季度为单位，统计出每个季度内的评论个数，如图1所示。本文采集的图书评论中，最早始于2014年8月6日，最近的评论发生于2019年6月19日。见图1:

图1 评论个数按时间汇总

除了2014年的3条评论以外，其他的评论都发生于2015—2019年期间。本套丛书仅《汉语技能教学》一书出版于2014年6月，因此2014年的评论都为针对该书的。具体的评论文本内容为：

“这个商品不错”

“暂时还没有时间拜读，但是老师教授们都在用这本书作为基础教材在讲解”

“有用的书，买了收藏。谢谢京东！”

本书仅出版数月，便被作为高校的“基础教材”供“老师教授们”使用，看出本套丛书从出版伊始便受到了学界的关注和认可，具有较高的认可度和权威性。

3.读者评分情况及差异

在不同平台上，读者的评分数和评论数有较大差异。因此，本文将根据不同的平台汇总读者评分数据。

当当网的评分如表2所示：

表2 当当读者评分数据描述

当当读者评分的众数和中位数均为10分，也就是说大多数读者的评分为10 分，即读者对套系丛书的认可度非常高；与此同时，平均分也超过了9.70的高分。

豆瓣的数据较少，只有3本书的评论内容，详见表3：

表3 豆瓣读者评分数据描述

豆瓣的读者群体是阅读书籍后再来发表评论的。因此，整体数量比当当和京东少，但是另一方面，他们对于书籍的感受更深，他们的评价往往更客观和冷静。这一部分反映在他们的评分偏低上，另一部分反映在他们的评论要更为详细深入、评论文本长度更长上。

京东的评论比较特殊。在京东平台上，一套书可以以单本形式出售，也可以以套装形式出售。但是不管读者买的是单本书或者整套书，该平台针对套系内所有的书的评论都是罗列在一起的。也就是说，京东的评论是不以单本书为单位，而是以套系为单位的，因此我们在处理数据时，将京东所有数据汇总到一起处理，汇总后的描述数据如表4所示：

表4 京东读者评分数据描述

和当当的数据类似，京东读者评分的众数和中位数也均为10分，证明该套丛书在各网购平台都颇受读者好评，大部分得到了满分评价，读者对于该套丛书是极为期待和满意的。

(二)评论文本的语义分析

1.关键词词云

取得洁净的读者评论文本之后，利用目前python使用度较广的中文分词组件——jieba对其进行分词，并标注词性。之后去除停用词，停用词即介词、连词、叹词等虚词及标点符号、特殊字符等。目前常用的停用词表有jieba自带停用词表、哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等。本文对各个停用词表都进行了试用，最终选择了停用词最为全面的百度停用词表。将处理好的文本统计出词频，并做出读者评论关键词词云，见图2：

图2 读者评论关键词词云

有一点要注意的是，读者评论中关于营销因素的讨论在所有有效评论中占了较大的比重。研究显示，45.7%的评论都涉及图书营销因素的探讨。(12)黄建.大数据视角下线上图书营销因素的实证研究—以京东平台的图书评论为例[J].现代出版，2019，(2).鉴于本文关注点并不在购书平台的营销、服务等方面，因此去除跟图书内容评论无关的词后，高频形容词为“不错、满意、实用、必备、值得、有用”。读者对于该套书的评论多体现在正面积极方面，“实用、必备”表明了该套丛书在汉硕课程使用中，具有较大的实际用途，对于读者起到了帮助作用。对本书内容最为关注的点体现在高频名词上——“跨文化、交际、国际、案例、第二语言、教学、习得、教育”，该套丛书读者主要关注文化、交际等方面的内容，即更加重视教学过程中实际应用及与学生互动方面的内容，对于语言本体以及本体教学的关注较少，这或许跟汉硕的生源复杂、背景多样性相关。有相当一部分汉硕之前并未接受过专业的、系统的语言学和教育学知识训练，实际教学经验更是匮乏。他们很多人并未有过和外国人打交道的经历，跨文化交际方面存在短板。(13)李春玲.关于汉语国际教育师资培养的新构想[J].云南师范大学学报(对外汉语教学与研究版)，2015,(1).此外，他们作为应用型储备师资，也更重视实际教学场景的处理与应对，包括其中会出现的跨文化交际、案例教学等等更具实际性、可操作性的话题。这与学界普遍认为的专业硕士侧重解决问题能力的培养和实践技能的养成也相一致。(14)刘颂浩.汉语国际教育专业硕士培养中的若干问题[J].华文教学与研究，2013，(4).而另一个值得关注的点是目前该书在整个行业内具有较大的认可度，“考试、用书、硕士、考研、指定”等行业认可相关词都位于高频词之列。可推测读者购买此书较大缘由是出于考证、考研的刚需。总体而言，此套书的出版符合其设计与内容规划的“核心着眼点”，即满足以“应用导向、职业需求、能力培养的核心课程要求”。(15)李泉.汉语国际教育硕士专业建设的开拓性成果——读赵金铭总主编MTCSOL系列核心课教材[J].国际汉语教育，2015，(2).

2.情感分析

情感分析也是自然语言处理研究领域的热点话题之一。它通过自动提取、计算和分析文本语句特征等技术手段，根据文本主题所持有的观点、立场和态度等对信息进行分类，将文本分为正面、反面和中性等评价模式。(16)任静.基于网络数据的学术图书评价研究[D].南京大学硕士学位论文，2013.在网络购物评论和新闻、舆情分析等具体方面应用较广泛。

目前用于情感分析的工具较多，经过多方比较后，选定一个常用的Python文本分析库——snowNLP库。该库已训练好的情感分析模型是基于网购图书的评论数据，对于本文的分析有较强的针对性，无需再重新训练模型。它将文本分成两类：积极和消极，每条评论语句都返回0—1之间的某个值，即返回情绪的概率，这个值越接近1为积极、正面的评论，接近0为消极、负面的评论。

运行后的情感值示例如表5所示：

表5 评论文本情感值示例

1176条评论处理完后如图3所示：

图3 读者评论情感分析

图3中，当值大于0.5时代表评论文本的情感极性偏向积极；当分值小于0.5时，情感极性偏向消极；该值的分布越偏向两级，表示情绪越偏激。整体上，该套系教材的总体评论偏正面，负面评论出现的情况并不集中。数据显示，0.5分及以下的评论共108条，占全部评论的9.18%。0.5分以上的评论共1068条，占90.82%，占了绝大多数。此次情感分析的结果两极性较强，分类结果比较鲜明。

深入查看评论在0.5分及以下的评论文本，涉及到图书内容方面的负面情感评论文本包括：

“书内容单薄，定价太高。”

“考证用的，然而并没有什么卵用。”

“如果之前买过别的版本的，就没必要再买这个了。个人感觉内容都差不多，别再花钱买重复的东西。不过，这本书对于各国习惯的举例，比较清楚。”

“对考证没什么用。”

“没觉得特别好，还贵的要命。”

“太口水了，这也能当教材。”

“几句话能说清楚的事儿，写了一本书，也是厉害。”

综上所述，读者对于本教材内容方面最大的不满体现在认为教材内容单薄、简单，与以往的类似教材相比，并无特殊之处，专业性有所欠缺。

对于正面评价来说，虽说评价极高的人数最为突出，0.9～1.0分值段评论为639个，占总数的54.33%。然而在0.65～0.75分值段，有一部分评论异军突起。这说明有一部分读者总体满意，但是也会提出问题和不满之处，这对教材编写者来说是非常宝贵的意见。将这部分分值的部分评论文本提取出来：

“理论性太强，感觉不是很实用。”

“如果看过胡文仲版的跨文化交际学概论的话，这本书基本可以考虑先放放了。”

“对于这种应试性很强的书，实在没什么好说的。”

“先入为主的观念！证书必备，又考一次了。希望考前好好休息！别精疲力竭！克服疲软！坚持！”

此分值段的读者主要还是以考证为需求，在此基础上提出该教材与考证的一些关联性。

将情感值和读者评分进行对比，虽然读者评分的众数和中位数均为10分，但情感值的负面评价却占据一定比例。由此可见，读者评分是比较宽松的。相对而言，评论文本则更为消极和冷静，真实和严谨。这也验证了章成志等人的研究，(17)章成志，童甜甜，周清清.整合不同评论平台的图书综合影响力评价研究[J].情报学报，2018，(9).在线评论绝大部分都是自己真情实感的流露，具有很强的真实性，调查问卷和一般访谈难以企及。

四、结语

本文以网络购书平台的图书评论数据为研究对象，研究了《汉语国际教育硕士系列教材：核心课教材》的读者反馈。就读者评分而言，当当和京东读者评分的众数和中位数均为满分10分，平均分也超过了9.70和9.87的高分，读者对套系丛书的认可度非常高，读者对于该套丛书是极为期待和满意的；豆瓣读者在深度使用该教材后的得分较为理性和谨慎，分数稍有所下滑，但是也处于好评分数段内。就读者评论文本而言，该教材的评论核心关键词为“不错、满意、实用、必备、值得、有用”，证实了该教材在读者心中的价值；“考试、用书、硕士、考研、指定”等跟行业认可与要求使用的词都排在高频词行列。总之，该套丛书获得了读者和业界的认可，在行业内具有较高的权威性和实用性。

本文作为初探性文本数据挖掘研究，还存在着诸多不足之处。由于京东平台设置机制的问题，将套装内所含书作为一个整体进行评论，而未按照各本分开评论，使得本文只能将6本书作为一个整体来进行研究，降低了评论文本分析的针对性。期待后续的研究工作从更有针对性的文本方面着手，得出更贴切与精准的研究结果。