APP下载

企业网信息分类模型与物联网实践研究

2017-10-12何子琳赵忠尧

网络安全技术与应用 2017年10期
关键词:准则分类用户

◆何子琳 赵忠尧 姜 波

(1.中国移动通信集团北京有限公司 北京 100007;2.北京饮冰科技有限公司 北京 100087)

企业网信息分类模型与物联网实践研究

◆何子琳1赵忠尧2姜 波2

(1.中国移动通信集团北京有限公司 北京 100007;2.北京饮冰科技有限公司 北京 100087)

本文介绍了一种适用于企业内网系统的信息分类模型,充分考虑到企业内网与目前传统互联网在信息分类方面的差别,从信息管理者、信息发送者、信息接收者三个信息用户角色出发,分析讨论了信息分类准则的选择依据,在此基础上提出了用户感知且易于动态扩展的信息分类模型。通过结合某家企业内网IT架构现状,举例说明了用户感知可扩展的二层信息分类模型的分类方法并在最后给出了一种基于SOA消息总线架构的模型实践可行方案。该分类模型能够满足不同的用户需求,具有很好的动态性能。

企业内网;信息分类模型;用户感知;动态扩展

0 引言

随着企业人员规模、业务需求的不断增长,企业内部需要通过大量各种类型的业务系统对复杂的业务流程进行支撑。以某企业为例,企业内部 IT架构经过多年的建设已经形成了数十个系统的规模,涵盖门户应用、ERP、OA、业务支撑系统、经营分析系统等,各系统之间协同工作,支撑公司内部管理、外部运营等各项业务。

然而,如此众多的业务系统会产生大量的信息,如待办、通知、提醒、告警等信息,企业员工需要花精力对这些信息进行筛选,这不仅浪费了员工的时间,降低工作效率,同时某些员工真正迫切需要的信息往往被淹没,那么如何能够通过一种合理的信息分类机制与方法,从如此众多的信息中提取出企业用户真正感兴趣、关心的信息,从而进一步提高工作效率,将是本文的研究重点。通过上述描述可以看出,信息分类对于企业内网信息化管理尤其重要,与此同时,信息的分类又要满足用户对于信息的快速检索与获取,因此需要找到一种合理的企业IT系统信息分类标准,以满足企业管理要求。

1 相关工作

分类是指人们把事物划分成不同的类别,并且确定这些类别之间的包含与互斥关系。信息分类的方法有很多种,目前,信息分类的研究更多的是集中在互联网网站信息分类中,通过网站信息科学合理的分类,能够很好地方便用户检索到其需要的信息,大大增强了网站的用户体验感。文献[1]给出了网络信息分类的综述,提出了网络信息分类的意义与挑战,文献[2]中系统分析了网络信息分类的体系结构,从信息体系结构,文本分类,信息检索,web工程,网站设计五个方面介绍了网络信息分类体系结构。文献[3-6]分别给出了网络信息分类的方法与模型。文献[7]中,作者给出了企业内部信息分类体系的基本框架及其系统的实现框架,其分类体系结构仅仅简单地定义了相关信息分类,且其静态分类方法并不适用于目前中国企业内部更新速度如此之快的业务模式,因此并不具有很强的参考意义。

从上述文献成果可以看出,传统的网络信息分类方法固然能够满足其要求,但是企业信息内网与传统网络有着本质的不同,其最大的不同就在于企业内网系统数据信息业务类别更新速度快以及受众类型的不一致。例如,企业内网不会像一个新闻网站一样,其受众均是新闻阅读者,或者像一个图书馆信息系统,其受众是图书阅览者,企业内网的信息受众通常来自于各个部门,因此需要找出一种信息的分类方法,满足企业内网信息的需求,这也正是本文的研究重点。

2 问题的提出与定义

2.1 信息定义

定义1 企业内网信息:指面向系统用户的信息,其必须是通过人类可理解的文字,数字与格式所组织成的信息,如字符串、表格、图片、视频、音频等。

从企业内网信息的使用者来看,其拥有以下三类用户角色。

定义2 信息发起者:信息的发起者,此处可以包含系统本身与实际操作业务系统的使用者。

定义3信息接收者:信息的接收者,此处仅指实际接收业务系统信息的使用者。

定义4 信息管理者:对信息进行统一管理的用户。

2.2 信息分类问题定义

信息分类问题的研究目的有如下两个方面:

. 使企业内部的信息更加有序规整地存储,便于统一管理;

. 使信息能够更快,更准确地传达给信息接收者,方便阅读以及第一时间获取到信息中有价值的信息。

那么,对于信息的类别划分存在着不同维度,即存在着不同的分类标准,如图1所示。

图1 同一信息的不同分类标准

如图1所示,从信息内容上分,可以分为业务类信息、营销类信息、技术类信息、管理类信息;从信息优先级上分,可以分为特急信息、紧急信息、一般信息;从信息关注程度上划分,可以分为最受关注信息、一般信息、不受关注信息;从信息发布的时间先后来分,可以分为近1周信息、近2周信息等等。

由此可以看出,从不同的角度可以得到不同的类别,并且不同的人从不同的角度去观察同一个信息都会有自己的一种分类准则。本课题信息分类机制的研究定义如下:

定义5 信息分类问题:给定一组信息集合I = {I1, I2, … In},需要寻找一组可扩展的信息分类准则C={C1,C2,…,Cm},m为分类准则数量,并将其进行组合形成一种分类机制Λ,ΛC使其满足上述两个目的:

. 使企业内网系统信息更加有序规整地存储,便于统一管理;

. 使信息能够更快,更准确的传达给信息接收用户,方便阅读以及第一时间获取到信息中有价值的信息。

这里不妨假设方便信息统一管理的评价指标为α,信息传达的准确性用评价指标β表示,由此可以看出,信息分类问题最终可以归结为一个多目标(此处为2个)优化问题,其数学表达式如公式(1)所示。

max α

max β

从公式(1)可以看出,该多目标问题由于其限制条件的不确定性,因此对于不同企业而言,其内网信息分类的通用数学模型如上,并且本文将提出一种求解上述模型的方法,并不给出某一个具体的优化解。

3 用户感知可扩展的信息分类模型

3.1 分类标准的选择依据讨论

对于寻找一组信息分类评判依据,分类标准的选择受到很多因素的影响,绝大多数是通过人的主观判断去选择的。然而,通过仔细分析我们可以看出,两个目标:信息管理便利性α与信息传达准确性β均与一个定量因素有关,即是分类机制Λ中的评判准测的数量m,即

其中,∝为正比例符号,符号左边正比例与公式右边,公式(2)与(3)分别说明,信息管理的便携性正比例与评判准则的数量,但是信息传达的准确性却反比于评判准则数量。图2显示了α,β与m三者之间数量关系,在三维空间中表示。从图2可以看出,两个目标之间随着 m的变化,其结果呈现出截然相反的变化趋势,特别注意的是,α,β与m之间的比例关系可以是线性的也可以是非线性的(通常为非线性的)。

图2 信息分类标准数量与两个目标的关系

上述关系是不难解释的。首先考察坐标系β-O-m,即分类准则数量与信息管理便利性之间的关系,信息分类评判准则数量m越多,对于一个信息的描述的完整性越好,越充分,越容易定位该信息,因此对于用户而言,用户能够感知到该信息的概率也越大;其次考察坐标系α-O-m,即分类准则数量与信息管理便利性之间的关系,评判准则数量 m越多,对于信息的统一管理便利性则越差,因为不论是采用何种数据结构,如树状、图状,不同的分类维度会提高信息分类的维护成本,尤其是针对企业内网的业务系统所产生的信息,因为企业(尤其是当今中国企业)的业务发展与变化非常之快。

针对上述分析,一种较为原始的想法是寻找到α,β与m三者间的一个最佳契合点,即在三维空间α-β-m中寻找一个最佳点S’= (α’, β’, m’),该 S’中的分类评判准则数量 m’既能够满足管理的便利性α’,同时又能对一个信息进行较为完整的描述β’。当然,针对不同企业内部的不同情况,即公式(1)中的约束条件,总能够找到这个相对于某一个具体企业的最优点S’,只是求解这个最优点的方法有所不同(不同企业的管理者的主观判断不同),但是不管如何,这个点通过某些方法是能够找到的,只是寻找S’的方法不尽相同,我们无法找到一个通用普适的方法,因此寻找最优值的方法不在本文讨论范围之内,这里特此说明。

上述我们已经讨论了公式(1)中两个目标α,β与一元变量-Λ中的评判准测的数量m之间的关系,并且讨论了最佳契合点即是需要我们去寻找的点。但是,上述的最佳契合点并不完全满足定义5,其违背了分类评判标注可扩展的原则,即若能寻找到该契合点,则Λ中的m是不会改变的,这意味着整套信息分类机制中,信息的分类是静态的,而不是动态的,这对于现代化企业而言,是不切合实际的,没有解决信息管理便利性与信息传输准确性之间的矛盾。

解决上述问题的方法是将α,β与m三者间的关系从不同的信息用户视角分解。通过分析可知,信息管理便利性α与信息传达准确性β两者分别是从两个不同的角度去观察同一个问题。信息管理便利性α是从系统的角度去看信息分类问题,而信息传达准确性β则是从用户的角度去看信息分类问题,如图3所示。

图3 基于不同信息用户角色的分类准则

从图3中可以看出,三个不同类型的线段分别表示不同的分类准则集合 Λs,Λm,Λr,对于信息管理者而言,其所关心的仅仅是按照信息的客观属性这一个分类准则 Λm(如信息是是属于多媒体信息或者文本的等),如系统监控类、新闻资讯类、平台支撑类等;而对于信息用户而言(发起或接收者),其所关心的除了按照信息客观属性分类以外,还需要有自己的差异化分类准则,即Λs+Λm,从而更好地对某条信息进行描述与精确定位,如信息发起用户,其关心发起信息的目标受众是谁,因此对于该类用户而言,可以按照目标群体的类别对信息进行划分;而信息接收用户,其并不关心这个信息是发给他自己或是发给其它人的,而关心的是该信息对其本身是否有价值,其分类准则是根据其兴趣进行划分的,即Λr+Λm。

通过上述分析可得,企业内网信息分类需从不同用户的角度对分类准则进行描述,这样对于信息管理者而言,由于按照信息的客观属性准则进行信息分类,分类数量 m相对较为稳定,利于管理,而对于用户而言,分类标准可扩展并且可配置,增加了其灵活可扩展性。

3.2 信息分类机制总体模型

根据3.1节中的分析,企业内网信息分类机制应采用完全分离的两层,分别为信息管理分类层与信息用户分类层。对于信息管理分类层,其信息分类准则不仅对于信息管理者有意义,对于信息用户同样也有意义;对于信息用户分类层,其仅对用户有意义,而对于信息系统的管理者,其无需关心[8,9]。分类机制总体模型如图4所示。

图4 两层信息分类模型

从图4说明如下,信息分类机制模型分为两个层次,第一层为信息客观属性分类标准C,直接根据这个标准,将信息进行类别划分,得到类别1,2,……,其分类不仅被信息的管理者关注,同时被信息用户关注;第二层为可扩展的信息分类标准平台,其上维护着信息收/发用户自己感兴趣的信息分类标准C1,C2,… …,根据不同的分类标准,会得到不同的信息分类,如类1.1,1.2……。信息管理者尽管对第一层的信息分类感兴趣,但是其需要对整个信息分类机制的分类策略进行管理。

由于第一层与第二层间的具有联系,如对于信息收/发用户而言,其既关注第一层也关注第二层,因此需要在第一层与第二层之间建立组合关系将这两层分类进行组合配置。根据图3中的分类准则定义,图4的2层分类模型可以用图5进行简化。

这种分类机制模型是满足定义5中的两个目标的。首先,采用层类别评判标准的管理是从不同用户的角度出发的,能够从不同层面为不同用户提供分类服务,尤其是对于信息本身的管理而言,其仅需要关心根据信息客观属性的分类标准进行分类后的信息类别,不论是在类别查找、删除、修改,还是根据类别对信息进行归档,都十分便捷,尤其是信息归档处理,其分类标准是一维的,因此管理起来尤其方便。

图5 两层信息分类模型树状表示

其次,通过提供第二层的可扩展的信息分类标准平台,其能够根据不同用户的需要,进行分类评判标准的扩展与动态管理,这增强了一个信息的描述完整性。

最后,将两层进行独立开,并通过在两层间的组合关系的配置,增强了各种信息类别标准与信息客观属性间类别的配置灵活性,是一种松耦合的设计,不论是从维护还是从二次扩充开发的角度,都具有一定的优势。

3.3 参考企业内网信息分类示例

基于3.2节中提出的分类机制模型并结合某家企业内网IT系统信息,给出如下参考分类准测并举例。

分类准则m:根据信息客观属性进行分类。

目前该企业IT系统信息可以分为以下九类,如表1所示。

表1 分类准则m的分类结果

m.02 自媒体发布类m.03 系统变更类m.04 业务数据类m.05 待办类m.06 通知类m.07 新闻资讯类m.08 生活资讯类m.09 其它

类别编码中,第一位 m表示其为信息管理类别编码,最后两位表示其顺序编号,编号采用2位十进制数表示,为了便于管理,建议该层分类数最多不超过2位数。

第二层根据信息用户的角度去进行分类准则制定。

分类准则s.01:根据信息接收用户范围分类。

表2 分类准则s.01的分类结果

用户信息分类编码不同于信息管理分类编码,其采用三段式编码,即首位s表示其为信息发送用户的信息分类(接收用户为r),中间一位表示分类准则编号,每个分类准则后面为两位分类编号。

分类准则r.01:根据信息的发布时间分类。

盗用别人思想、算法或结论。学术论文讲究创新和研究结论,如果没有研究成果或创新性的东西,该论文是没有发表意义的。经常有作者在没有研究成果的情况下,为了发表论文,盗用别人的思想或算法或结论,占为己有,在参考文献中刻意地回避引用参考文献,特别是英文参考文献。

表3 分类准则r.01的分类结果

分类准则r.02:根据信息的关注度分类。

表4 分类准则r.02的分类结果

4 原型系统的设计与实现

根据用户感知的两层信息分类机制模型,信息分类机制的技术解决方案应用框架设计如下图6所示。

图6 原型设计

从图6可以看出,信息分类管理中心解决方案应包含三个模块:

. 分类策略配置中心模块:用于存储信息分类策略与配置;

. 分类配置管理子系统:用于信息共享中心,是管理员配置信息分类策略与配置的入口;

. 与业务系统信息集成的消息总线:用户统一传输各个业务系统间的消息。

方案向集成于SOA信息总线上的业务系统提供两个服务接口。这里我们将第一层(信息管理层)按照信息客观属性准则分类的模块称为信息分类器,其目的在于对信息进行分类,便于信息管理者对信息进行存储管理;将第二层(信息用户层)的各个分类准则叫做信息过滤器,其作用是为信息用户的信息打上分类标签。因此两个服务组件接口分别为:分类器服务组件接口;过滤器服务组件接口。通过这两个服务组件,一条消息对应着一个信息管理层的分类,但是可以对应着多个信息用户层的分类。

不论是各个业务系统中的信息发送模块还是信息接收模块均需要调用分类器服务组件接口,而对于过滤器服务组件,根据其业务系统的特点以及接收与发送方的特点,用户可以自行选择与分类器想配套的过滤器进行组合。与此同时,信息过滤器组件还提供用户可配置分类准则与分类接口,供用户自行配置。

5 总结与展望

本文从对信息分类问题进行了系统化的定义,明确系统信息的研究范围,给出信息分类机制的现状调研与用户感知可扩展的信息分类机制研究。在调研相关研究现状的基础上,提出了一种用户感知可扩展的信息分类机制,从不同用户角度考虑,将信息分类机制分为两层分类模型进行分析,分别从信息管理、信息用户两个方面抽象出信息分类器与信息过滤器,通过两者间的灵活配置与组合,能够同时满足信息管理者、信息发送者、信息接收者三个不同角色的需要。

最后,结合信息分类机制理论以及SOA的软件构建思想,给出了一种可行的分类机制解决方案。本文下一步的研究工作将具体深入研究消息过滤器与消息分类器间的过滤算法以及如何提高消息分类准确率,并且建立一套合理的信息分类评价体系。

[1]Mai JE. Classification of the Web: challenges and inqu iries[J].Knowledge Organization,2004.

[2]吴胜.网站信息分类体系优化及应用[D].南京林业大学,2009.

[3]崔艳华.网络信息分类体系的研究[J].图书馆学刊,2006.

[4]陈树年.网络信息的自动分类问题[J].图书馆杂志,2001.

[5]程晓林.网站分类法的比较研究[J].晋图学刊,2006.

[6]陈树年.网络信息分类法研究[J].现代图书情报技术,2002.

[7]黄锦德.企业信息化建设中的信息分类及编码规划[C].全国冶金自动化信息网,2012.

[8]何伟明.计算机网络技术安全与网络防御策略研讨[J].网络安全技术与应用,2017.

[9]张亚辉.计算机网络存在的安全漏洞及应急响应技术研究[J].网络安全技术与应用,2016.

北京市科技计划专项课题计划(Z17010101514)资助。

猜你喜欢

准则分类用户
分类算一算
具非线性中立项的二阶延迟微分方程的Philos型准则
分类讨论求坐标
数据分析中的分类讨论
教你一招:数的分类
关注用户
基于Canny振荡抑制准则的改进匹配滤波器
关注用户
关注用户
学学准则