网络时代新型信息分类法探究
2021-11-28苑宁萍孔晓荣
苑宁萍 孔晓荣
摘要:传统信息分类法是自上而下金字塔式的系统的、详细的、全面的分类法,而随着信息高度发展化和透明化的时代的到来,互联网上出现了新型信息分类法--自编分类法和分众分类法,二者采用了独特的信息分类法,方便了用户信息的检索。文章主要概述传统信息分类法和新型信息分类法,并将二者进行比较,分析新型信息分类法的优劣。
关键词:传统信息分类法;自编分类法;分众分类法
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2021)30-0074-02
开放科学(资源服务)标识码(OSID):
网络信息的无序增长,使网络信息非常的多样化,即有可利用信息,又有垃圾信息;另外,网络信息用户在面对网络空间的海量信息,无法高效地获取所需信息。因此,许多的门户网站开始进行探索和开发新的信息分类方法,以解决和缓解网络信息不断增加与有价值的网络信息能够有效利用之间的矛盾,为网络信息用户提供便利的信息获取途径和方法。
1传统信息分类法
传统信息分类即传统文献分类法。传统信息分类法是自上而下金字塔式的系统的、詳细的、全面的分类法,主要是依据文献的内容、特征及其性质,用科学方法和理论把文献分门别类地进行分类,形成体系。它是读者用户利用文献的分类检索语言,也是图书情报部门编制文献分类检索工具、分类排列图书和进行分类统计的基本工具和重要依据。[1]通俗地讲,传统文献分类就是图书馆用来划分图书、组织图书的一种工具,它是由一些根据不同的属性,按照一定的原则,划分出的大小不同的类目组织起来的分类体系。文献分类法主要包括3种类型:等级列举式分类法、分面组配式分类法、半分面分类法等。
2新型信息分类法
网络上的信息分类组织主要采用两种方式:一是采用自编分类法,由后台程序员根据用户的常用搜索词条进行统计得出。二是采用分众分类法,用户根据自己的意愿进行内容分类。由于网络信息类型、表现方式、传播方式、信息基本单元等复杂性,使得网络信息分类组织模式更具多样性。有些网站采用了多维的分类模式,以此满足用户信息检索的需要。
2.1自编分类法——以网易网为例
网站大部分都采用自创的分类体系,运用学科和主题相结合的原则而不是按学科划分类目,主要用于通用性网络信息资源的组织与检索。许多网站的大型综合搜索引擎往往是参考一个或几个分类标准开发自己的分类导航系统。
网易作为“中国四大门户网站”之一,凭借丰富的资源、先进的媒体理念、领先的互联网技术等,在门户网站业务方面,一直保持领先的地位[2]。网易设有新闻、娱乐、财经、汽车、体育、女人、科技、数码、手机、房产、读书、游戏、教育、旅游、酒香、公益、校园、传媒、视频、论坛、博客、应用、健康23个一级类目。
在一级类目中比如“健康”“旅游”“财经”等是以主题为分类原则设立的,而“科技”“教育”“体育”等则是按照学科属性原则来设立的,总体来说网易分类体系的设立是以主题为主,学科属性为辅。在网易网中每个一级类目皆有设立有二级类目。一级类目下的二级类目的分布情况如表1所示。
自编分类法以类目的使用频率、重要性来排列,突出日常生活所相关的、一般用户都感兴趣的类目设置,如健康、教育、娱乐、生活等;对学术性科技类目的设置有些弱化。另外还采取多重列类法来显示类目之间的关系,每个大类又分出若干二级类目,如果需要还可继续细分三级、四级,并且通过超文本与超链接技术灵活、多维和有效地提示了类目之间的关系。但同时也存在分类体系涵盖能力较差、列类较杂、缺乏逻辑性与严密性等缺点。由此可见,目前的网络信息分类法并不能完全满足用户的需要。
2.2 分众分类法
分众分类法是在互联网时代的产生的,表示的是由非专业信息人员来创造的分类法,国内也有称为“自由分类”“通俗分类”“社会分类”等。分众分类法与传统分类法不同,它强调的是一种自下而上的、社会性的、用户共同创造的、自由的分类法。这些网站并不是按照专家建立起来的目录分类学来给网站分类,而是基于一种由大众逐渐发展起来的分类体系———分众分类法,创建者并不是想把他对互联网结构的看法强加给用户,而是将权利交给用户自己,希望大众能够自己发展出一套分类体系。
3传统文献分类法与网络信息分类法的分析比较
3.1分类体系上的区别
传统文献分类法是以文献的内容特征为主要分类标准。如《中图法》就是在此基础上的一种等级列举的分类体系。这种分类体系使用概念层层划分的方法,首先将所有科学划分为22个基本大类,这22个基本大类中仅有5个是按照主题立类的,其余17类均按照学科立类的。后将基本大类划分成若干个二级类目,再将二级类目划分为众多三级类目等。由此形成了由一般到具体、从宽到窄层层划分比较纵深的信息等级结构。
目前,大多数网站及网络搜索引擎放弃了传统文献分类法以学科为原则建立类目体系的方法,而从信息用户的角度出发,多采用以主题为中心或主题与学科相结合的立类方法,多采用自然语言来命名类目。这种学科与主题相结合的方式,可以在一定程度上弥补完全按主题立类时实用性差、无法完全列举所有主题的缺点,也可以在一定程度上克服了按学科立类实用性差、用户不易掌握复杂的分类方法的缺点。但这种方法同样也会带来一定的内容重复的问题。例如在网易网中23个大类:新闻、娱乐、财经、汽车、体育、女人、科技、数码、手机、房产、读书、游戏、教育、旅游、酒香、公益、校园、传媒、视频、论坛、博客、应用、健康。其中“新闻”一级类目下的二级类目“博客”和“视频”就与一级类目“博客”“视频”在内容上发生重复的问题。
3.2分类标准上的区别
传统文献分类法在分类标准使用数量上,一般要求一次划分使用一个分类标准。例如在《中图法》中自然科学大类的分类体系皆按照学科—主题细分,地区复分、时代复分等皆放在分类号的末尾。
网络信息分类法由于类目逻辑关系不够严密,加上又不需要以标记符号标识类目之间的关系,客观上每一等级的划分都使用了多种分类标准,划分后子类之间的内涵相互交叉。例如在网易新闻大类中,将其划分为最新、排行、国内、国际、社会、评论、深度、军事、历史、探索、图片、娱乐、财经、博客、媒体、视频、公益等多个二级类目。其中国际和国内是按照新闻发生地点进行划分的;军事是按照学科进行划分的;娱乐、财经是按照主题来划分的。其中国际与国内包括军事、娱乐、财经的新闻,军事、娱乐、财经也包括国际与国内的新闻。由此可以看出,其各子类所包含的内容相互交叉。
3.3类名设置上的区别
类目名称限定类目所代表的事物概念的内涵和外延。传统文献分类法要求所使用的类目名称要准确、科学、简介,能够恰当地反映类目的实际内容范围,所采用的语词要科学、通行、精炼,要符合大多数用户的使用习惯。传统文献分类法主要用于文献分类、文献排架、文献检索,一般将类名用特定的符号加以标识,《中图法》采用的就是字母加数字的混合标识符号,如A849表示邓小平理论学习和研究[4]。
与传统文献信息分类法不同的是,网络信息的分类方法所采用的类目名比较随意,多采用自然语言,不少类目名称不能够科学、准确地表达类目的内涵和外延。在分类名的选择上更注重向网络信息用户通俗易懂、易于理解的方面选择,但准确性却不如传统文献信息分类法。如网易网中一级类目“女人”“视频”“读书”等。而且网路信息分类法不涉及文献排架的问题,因此不要应用字母与阿拉伯数字混合的名称。
3.4同位类排列方式上的区别
传统文献分类体系对处于同位的类,一般按照类目的关系排列。例如在《中图法》中类目排列的基本方法是:按照事物客观发展的次序、事物内部固有次序、科学的系统次序以及人们认识事物的逻辑次序排列次序。始终贯彻从总到分、从一般到具体的原则。
网络信息分类法中对于处于同位的类,种类众多,在具体的排列形式上往往表现出多样性的特点。例如在網易网中在同位类的排列中,采用了分类字顺的方式。
3.5类目交叉关系处理上的区别
网络信息分类法对类目交叉关系的处理采用的是类目重复反映的方法,也就是涉及多个学科的主题在多个类目下重复设置。例如在网易网中一级类目“博客”“媒体”“视频”同样也存在于“新闻”的二级学科类目中。
网络信息分类方法虽有很多长处,但也存在一些缺陷。如一级类目知识领域不全、分类体系不严密、类目排列缺乏规律等。造成这些缺陷的原因主要是因为目前网络上的搜索引擎大都是研究机构和电脑工作设计者,他们非常重视用户需求,又熟悉网络信息,所以设计出的分类体系有较好的实用性,并且能够体现网络的环境特点。而网络信息公司与图书情报专业人员在知识结构方面存在很大差异,各有所长,所以在建构网络信息分类体系方面有坚实的合作基础,必将网络信息分类体系做得越来越好。
参考文献:
[1] 欧洁,俞学宁,朱礼军,等.基于网易的网络信息分类体系研究[J].图书馆学研究,2012(1):50-53.
[2] 陈树年.网络信息分类法研究[J].现代图书情报技术,2002(3):54-57,80.
[3] 马费成,宋恩梅.信息管理学基础[M].武汉:武汉大学出版社,2011.
[4] 方晓红.网络信息分类法与传统文献分类法比较研究——以网易网和《中图法》为例[J].江西图书馆学刊,2010,40(3):47-50.
[通联编辑:李雅琪]