网络游戏服装研究热点挖掘
2024-01-10陈睿刘静伟
陈睿,刘静伟
(西安工程大学服装与艺术设计学院,陕西 西安 710000)
0 引言
网络游戏又称为电子游戏,游戏服装直观地展示了游戏角色的性格特征、游戏世界的设定以及游戏文化的传达[1],也是游戏玩家构建自我形象,实现身份认同的重要道具[2],同时给游戏带来了可观的经济价值[3]。
数据挖掘是指从大量的数据中提取有价值的信息和知识,通过数据挖掘技术,可以发现数据之间的关系和规律[4]。通过语料库及自然语言处理工具进行数据挖掘的相关研究,已基于语料库数据,分析了服装色彩情感核心语义特征[5]、“潮”文化的文化特征[6]、丝绸文化情感特征与构成[7]、服装品牌知识集群等[8]。将数据挖掘技术应用于对网络游戏服装的研究现状及研究热点的挖掘,可以进一步分析网络游戏服装研究进展,为网络游戏服装的研究提供参考。
1 网络游戏服装语料库建立
网络游戏服装研究现状及研究热点挖掘的第一步是建立网络游戏服装相关文献的专业语料库。在CNKI 数据库中进行高级检索,检索条件设置为:主题%=“网络游戏服装”or“网络游戏服饰”or“电子游戏服装”or“电子游戏服饰”,共检索出网络游戏服装相关文献282 篇。
我国网络游戏服装的研究起步于2000 年,起步较晚,发展较为缓慢,研究主题统计中,排名最高的是游戏角色设计,其次是与传统文化、文化传播、服装设计等。
为了对网络游戏服装的相关文献进行进一步的详细分析,经过人工筛选,剔除文献核心与网络游戏服装关联不够紧密的文献,最终选择其中的86 篇与网络游戏服装关联度高的文献构建网络游戏服装专业语料库。
2 基于KH coder 网络游戏服装研究的挖掘
KH coder 是一个计量文本数据挖掘软件,用于处理和分析文本数据,该软件有词频分析、共现分析、相关性分析、聚类分析等功能,并将分析结果进行可视化展示,适用于非结构化文本的分析[9]。
2.1 数据预处理
为分析结果更加精确,首先进行新词词表和停用词表的设置。语料库中部分词汇属于行业专有词汇,需进行新词设置,才可被作为一个完整的词语识别,从而进行分析。例如“网络游戏”,如不进行新词设置,软件会把“网络游戏”这个词语分割成为单独的两个词语:“网络”和“游戏”进行分析。通过反复试验,共设置新词306 个,例如:虚拟时尚、武侠小说、忍者服、插肩袖、卷草纹等。
为排除一些出现频率高,但对分析结果无用的干扰词汇,设定停用词表,参考百度的常用中文停用词表,最终设置停用词2 101 个。
在完成新词词表及停用词词表的设置后,对网络游戏服装语料库进行分词和词性标注,将词语分为名词(Noun)、专有名词(ProperNoun)、新词词表词语(TAG)、形容词(Adj、JJ)、副词(Adv)、动词(Verb)。
2.2 层次聚类分析
层次聚类是一种常用的聚类分析方法,用于将一组样本或数据点划分为不同的群组或类别。通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性,距离越小,相似度越高,并将距离最近的两个数据点或类别进行组合,构建聚类层次结构[10]。
图1 是网络游戏服装语料库层次聚类的结果,共七个聚类,左侧的柱状图反映词频的高低。
图1 层次聚类分析图Fig.1 Hierarchical cluster analysis diagram
由聚类A 可见,网络游戏服装与民族、传统文化相关的符号学研究;由聚类B 可见,网络游戏服装的设计与角色的塑造密不可分,且聚类B 的词频明显高于其他聚类,可见网络游戏服装设计和角色塑造相关的研究占比较大;聚类C 可见网络游戏服装的艺术表现形式与角色的人物造型有关;聚类D 可见未来主义风格相关游戏服装的占比较大;聚类E 可见,网络游戏服装的设计元素,例如色彩、纹样等与审美以及历史背景相关;聚类F 可见,网络游戏服装与玩家的虚拟形象相关联;聚类G 可见,游戏服装的发展与玩家心理及虚拟社会中的社交活动相关。
2.3 KWIC 检索
KWIC(keyword in context)检索即上下文关键词检索,通过对检索词左侧右侧的上下文适当距离的词汇进行筛选及统计,探索与检索词一定距离内的高度关联词。
表1 是与网络游戏服装风格密切相关的词汇集群。Jaccard系数越高,则表明该词语在文本中权重越大。根据Jaccard 系数和词频判断,在相关研究中,网络游戏服装风格主要有:未来主义、古典、奇幻、浪漫、传统等。
表1 “风格”KWIC 检索结果统计表(部分)Tab.1 "Style"KWIC search results statistic al table(Part)
2.4 多维尺度分析
多维尺度分析是根据具有多重维度的样本或变量之间的相似性或非相似性来对其进行分类的一种统计学研究方法,其中相似性越高,气泡之间的距离就会越近。选用二维分析,横竖坐标分别对应不同的维度,气泡大小对应该词出现频率的高低,不同颜色的气泡则对应不同的聚类。
图2 是网络游戏服装语料库数据选取形容词进行的多维尺度分析结果,展示了不同维度下形容词之间的相关性。表2 是从形容词中提取和网络游戏服装最为密切相关的美感类形容词,并进行了五个不同的子集划分。
表2 美感形容词分类子集(部分)Tab.2 Classification Subsets(part)ofaesthetic adjectives
图2 形容词多维尺度分析图Fig.2 Adjective multidimensional scale analysis diagram
图3 是动词多维尺度分析结果,将聚类中的动词按照关联角色进行分类,得到表3 所示的五个子集,分别与设计研发人员、运营人员、游戏玩家、研究人员相关联。
表3 动词分类子集(部分)Tab.3 Verb Classification Subsets(parts)
图3 动词多维尺度分析图Fig.3 verbs Multidimensional scale analysis diagram
3 结语
网络游戏服装在我国研究起步较晚,主要有文化、造型艺术、符号学、心理学等相关研究。文章通过对CNKI 数据库内网络游戏服装相关文献进行筛选后建立语料库,并用文本挖掘工具对语料库进行数据分析,挖掘网络游戏服装的研究内容和研究热点。结果表明,运用语料库分析法对网络游戏服装相关文献进行数据挖掘及知识抽取具有可行性,实验结果对网络游戏服装相关领域的研究和应用具有一定的参考价值。