谈网站科技图书分类体系的构建
2014-11-11金安
金安
科学出版社作为大型综合性科技出版机构,年出书品种和存量品种数量都十分可观,特别是出版物涉及的学科门类十分丰富,遍及自然科学和工程技术的所有领域,还涉及相关的人文科学领域。这一产品特点造就了以专业读者为主的庞大客户群体。而作为企业产品宣传的重要媒介——门户网站,如何构建充分满足专业读者需求的产品分类体系,是衡量出版社网站专业化水平的重要标志,也是网站建设进程中不容回避的重要课题。
到访出版社网站,以浏览方式获取图书信息的客户,会有两方面需求:其一是先概括了解一下自己所关心的图书类别中都包含哪些产品,形成一个总体感受;其二,如果感兴趣,就继续挑选若干最为接近自己需求的产品,并浏览其详细描述信息,然后通过对比做出判断,最终定位到自己选定的具体产品。笔者归纳总结了如下构建网站科技图书分类体系的七项原则与经验。
一、产品分类体系必须反映产品的结构特征
科学出版社是以专业出版和教育出版为主要特征的,专业出版更是其传统特色和优势领域。这就决定了其出版物以专业产品为主、教育产品为辅的结构特征。因此,在分类体系的顶层设计中必须突出最具优势的出版领域,如科学、技术、医学。同时,也不可忽视正在高速发展中的出版领域——教育,以及成长中的出版领域——人文。这样,就形成了上述四大(人文板块暂未列入)板块,其中每一个板块都有自己的学科体系支撑,都可以向下延伸出丰富的二级学科(树状结构)。因此,它们具备处于顶层结构的条件。
二、产品分类体系架构应当具有合理的宽深比
分类体系架构具有宽度、深度和厚度三维指标,其宽度是指系统顶层并列的树状结构的个数(以k表示),深度是指由顶层延伸下来的树状结构的最大层级数(以s表示),厚度则是指在网页上显示分类下的产品列表时,该深度层级上所有子类中的最大分页数(以h表示)。通过这三个指标可以反映分类体系的哪些特性呢?
如果我们用F作为衡量系统复杂性的参数,则可以表述为F=a1。
如果我们用E作为评价系统架构合理性的参数,则可以表述为E=a2。
其中a1和a2是结构系数,它们只与网站的结构(如页面设计、分页设计等)有关。
在不改变网站结构的情况下,我们可以通过观察架构调整以后值的变化,来评价分类系统架构是否更趋合理。
对于大型综合性出版社,由于存量品种规模庞大,是造成读者选择恐惧的重要诱因,这也致使越来越多的用户不再采取浏览方式,而转向选用搜索方式。但对于出版社网站来讲,许多类目的展示页面被跳过,就等于失去了许多产品宣传的机会。所以,为减少这种不利影响,我们推荐采用大宽深比的体系架构。
总之,不断摸索和总结优化体系架构和网站设计两方面的经验,并认真分析自身产品分布的规律与特征,必将推动网站产品分类系统向更科学、更合理的架构迈进。
三、产品分类体系结构必须符合客户的知识系统结构
关于优化体系架构参数的讨论提示我们,架构的宽度和深度是构建者人为可控的。但是,在研究架构内的分类树状结构时,我们遇到如下问题:
产品的分类树状结构是由什么决定的?构建者可以随心所欲吗?
不同类型产品的树状结构有哪些共同点?又各有什么特色?这些特色与客户群体有关吗?客户会要求我们的分类系统体现这些特色吗?
多年的分类实践给了答案:分类树状结构是由客户的知识系统结构决定的,我们在构建分类体系时,必须符合客户的这种知识结构,而不能忽视,更不可随心所欲。科技图书是知识产品,因而其分类体系结构的核心都是知识系统结构;但由于客户类型不同(如行业不同),他们对自身知识系统的表述就各具特色。只有充分体现了这种特色,才能被客户接受和认可。这里包含两层意思。
其一,产品分类基于产品知识,要进行分类,就必须先有产品相关知识。科技图书作为知识产品更是如此,因为其内容承载的全部是知识。所以说,科技图书的分类体系,本质上就是其承载内容的知识体系。因此,分类体系结构必须符合知识系统结构。例如,分类生物科学图书必然采用生物学的学科体系。但这里要强调一点,必须要从客户角度出发。
其二,虽然知识体系结构有客观公认的标准,并不会因人而异。但是由于客户类型不同(如行业不同),对知识产品的需求及使用方式也就不同,因而他们在知识结构的表述上就存在差异。即使是在同一学科领域,也能看出这种差异。虽然这种差异仍属于表现形式上的,但已经足以影响客户对分类体系的认可度。所以,每一分类树状结构都应当定位于一类角色明确的目标客户,从而与这类客户的知识体系表述方式相符。为体现这种差异,一般需要加大体系架构的深度,有时可能还需加大体系的宽度。上述差异最突出地表现在专业出版与教育出版之间。
四、产品分类体系必须能够适应产品的发展进程
出版社的生存与发展,需要不断开发新的出版领域和内容产品。因此产品分类系统将永远处于膨胀的状态中,特别是要面对不断出现新选题类别的压力。如何在现有分类体系架构不受损的前提下,能够在尽可能长的一段时期内持续地将系统结构进行扩展,是在最初的体系构建阶段,就应该很好思考和规划的问题。我们称之为体系结构的柔性设计问题。
柔性设计包括可扩展性和可维护性两个方面。可扩展性设计允许在树状结构的任意分枝下再增加新的分枝,甚至可以从顶层再增加一个新的树状结构。目前我们正在规划的新板块——人文领域,就是这样一例。从理论上讲,架构是可以无限扩展的。可维护性设计允许把某一分枝下的产品移动到任意另一分枝下去,还可以调整彼此间的排序以及编辑分枝的名称等。
随着生产规模的不断扩大,会遇到某一分枝下产品过度密集而需要拆分的情况,柔性设计的功能为我们根据新书生产的节奏,适时调整树状结构创造了条件。而当若干分枝也密集到了一定程度以后,甚至可以搬移其中的一部分,另组一颗新树。这样,分类体系就可以无所顾忌地与产品发展进程保持同步。
五、产品分类体系应支持多种分类特征并存
在宏观上,对产品分类体系已经讨论了许多,在微观上还有没有需要讨论的呢?从单本书的角度看,一个分类定义能够完全满足读者的需求吗?答案是否定的。
前述的分类体系只是从内容的知识属性,这一个特征方面进行了定义。尽管这很重要,但作为一个图书产品,它还有多方面的其他特征也需要定义,因为这是读者需要的。我们认为一个优秀的产品分类系统,是应当支持多种分类特征并存的,只有这样才能够达到为读者提供全方位信息服务的目的。
其他的分类特征还有:
编撰特征:如专著/教材/工具书/论文集/普及读物
外部特征:如画册/图集/漫画/口袋书
层次特征:如研究生/本科生/职业教育/中小学教育/低幼读物
另有许多产品,即使是从内容特征一个方面考察,也不是只有一个定义,例如内容为多学科交叉的产品,系统无法取舍其中的任何一个。如果强制保留其中一个,则势必人为造成属性的不完整,直接损失就是会失去很多被客户发现的机会。为杜绝此类问题,我们的分类系统都支持互见分类设置,实现一书多类,多点相关,以提高客户端呈现率。
六、产品分类体系应当具有现代信息技术特征
信息技术的飞速进步,为分类体系的建设与发展提供了良好机遇。基于数据库技术和网络平台,使许多功能的设计与实现成为可能,并兼具运行高效,性能稳定,存储可靠,柔性充分等特点。还可与其他产品数据关联集成,已然成为网站产品管理系统中不可或缺的组成部分。
七、要使产品分类系统管理者的知识结构与系统本身相匹配
产品分类系统构建完成以后,其管理、运行、维护就成为决定分类质量的关键要素。分类系统的管理模式一般分为集中式与分散式两种。分散式管理是指由各编辑部分工负责自己产品的分类与系统维护,其优点是:由责任编辑分类,准确度高,并行操作,分类速度快;但缺点是:涉及人员多,不易协调,标准不统一,安全性差,流程同步困难。集中式管理是指由网站产品经理统一管理,避免了分散式管理的不足,但最大问题是分类质量受管理者知识水平的影响很大,如果管理者不具备某些学科的知识结构,就无法保证其分类的准确度。两种模式各具优缺点,相对而言,集中式的管理成本较低,但需要解决管理者的知识结构与分类系统相匹配的核心问题。因为很难找到一个具备全产品线知识结构的系统管理者,而只能逐步培养。另外,对于产品规模很大的出版社,分类作业速度也是不容忽视的问题。
在以产品信息为主要内容的出版社网站上,分类展示系统是非常重要的基础性子系统,它和产品搜索系统一起,构成了客户定位所需产品的两条主渠道。对于专业性出版社,分类系统的专业性直接关系到网站的访问量,进而决定了网站的影响力和营销能力。我们还体会到,随着分类系统的不断深化发展,体系架构有趋于复杂化,或称细分化的趋势,这一点通过系统复杂性参数F=a1反映的关系中即可分析看到。我们认为,这种趋势是与数字出版对内容主题进行结构化描述和专业化类聚的大趋势完全吻合的,是将来从事基于主题进行内容加工的重要基础之一。现在,我们已经将此分类系统的数据用于支持网站(主题)搜索引擎的内容相关性评价,并已经成功上线。我们相信,有了理论研究方面的指导,将使产品分类系统建设迈上一个新的台阶。 (作者单位系科学出版社)