大数据服务模型研究
2014-11-19裴大容
裴大容
摘要:通过对现有大数据服务研究现状的分析,分析大数据服务研究目前所存在的问题,并针对目前大数据服务对数据特征表达不足,所导致的数据服务发现和组合困难的问题,提出了基于OWL-S的大数据服务模型,通过利用OWL-S中的服务操作、服务类型和数据源等属性,实现大数据服务的可视化、分析和检索等服务的构建和动态组合,使得大数据服务在属性和操作方面的描述更加完备,具有较强的语义理解和自动服务组合能力。
关键词:大数据服务;Web服务;语义Web技术
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)30-7014-03
大数据服务(Big Data-as-a-Service,BDaaS)是可独立部署,具有明确契约和独立功能的功能单元[1]。而大数据服务模型大数据服务的理论基础和实现规范,在传统的数据密集型Web服务中,采用WDSL对Web服务进行描述。但是这种描述方式只是描述了服务接口规范,缺乏对非结构化数据数据质量、模型、隐私等特征的描述,因此传统的数据服务描述方法不适用于大数据服务的描述。
1 大数据服务模型研究现状
目前针对大数据服务模型的研究,还存在如下的问题:
1) 目前的对大数据服务模型的研究,仍然沿用传统的Web服务模型,无法提供对非结构化数据的支持,不适用于大数据服务中对多种服务类型、多种数据源的支持[2]。
2) 对数据服务操作、数据源等特征的表达不足,导致使用传统的数据描述方式阻碍了服务的组合和发现。
2 大数据服务模型设计思路
针对目前对待大数据进行描述的Web服务模型所存在的不支持非结构化数据和特征表达不足的问题,大数据服务模型的设计必须要满足如下三个方面的条件:
1) 同时支持结构化和非结构化的数据模型、服务模型。
2) 能够对数据各个方面的特征属性进行形式化的定义,和完善的描述。
3) 支持可视化型数据服务和分析型数据服务的构建。
针对大数据服务模型设计所需要满足的要求,在进行大数据服务模型设计时,通过如下的方法来满足大数据服务模型的需求。
1) 采用非结构数据模型GDM将非结构化数据结构化,然后对GDM中的属性进行描述,从而将用户对数据服务的检索、可视化请求和分析都转换为对非结构化数据属性的操作。
2) 韩晶(2013)已经对数据服务应该包含的属性进行了全面分析[3],考虑到数据服务应该尽可能的体现数据特征,为此在文献三研究的基础上,增加数据隐私和数据质量部分的属性。并且设计大数据服务模型的相关操作函数,满足用户对输出结果进行筛选的需求。
3) 增加可视化型、分析型逻辑描述,从而支持用户对大数据服务的这两大数据服务需求。
3 大数据服务模型的具体设计
目前对数据服务进行描述的方法主要包括REST API和WSDL方法等,这些数据服务描述方法都由于缺乏相应的语义信息,导致数据服务在自动服务组合方面存在一定的不足。
OWL-S(Ontology Language for Web Service)通过一组语言标记对Web服务进行描述,是基于语义Web技术和Web服务的结合体,从而使得数据服务能够更好的被计算机所理解,有利于数据的分析,从而支持Web服务的发现、调用和组合。除此之外,OWL-S还支持自定义类实现对OWL-S的扩展。为此,使用OWL-S设计大数据服务,可以使得大数据服务模型具备语义和数据特征双重优势。
由于大数据服务的基础数据源复杂,各数据源模式各异。为此,为了实现数据服务的匹配和组合,即必须要采用一种合适的方式来对数据服务进行统一表示,语义Web技术通过RDF将大数据服务的各个数据源的数据模型映射到一个全局共享语义本体上,从而方便用户对数据语义的理解,从而实现基于OWL-S的大数据服务建模。
在建立数据源与共享本体之间的映射之后,就可以在此基础上进行基于OWL-S大数据服务的建设。OWL-S使用OWL语义对Web服务本体进行定义,并且将其中每个具体的Web服务当成是Web服务本体的一个实例来对数据进行描述。
每一个大数据服务模型都需要用一个Service来对模型进行描述[4],在基于OWL-S的大数据模型中,使用由ServiceGrounding、ServiceModel和ServiceProfile三个属性子类构成的Service来对数据模型进行描述。其中,ServiceGrounding主要包含服务端口号、消息格式和服务访问协议等内容,描述用户怎样获取大数据服务;ServiceModel主要对大数据服务内部流程进行描述;ServiceProfile主要包含服务的QoS信息、服务所属分类信息、服务功能和服务提供者信息等内容。
如图1所示,基于OWL-S的大数据服务模型通过对服务组合、服务操作和服务属性三个方面的描述来体现大数据服务的扩展,其中使用OWL-S的ServiceModel实现大数据服务模型的扩展,通过ServiceProfile来实现大数据服务模型中服务操作和服务属性的扩展。
1) 数据源基本属性描述
在ServcieProfile中添加Profile的BasicAttrs子类对数据源的数据隐私、质量等基本属性进行描述,添加DataQuality子类对数据源的清洗程度、精确性等数据质量相关内容进行描述。DataSource属性的描述如下所示:
2) 服务类型属性描述
服务类型属性描述ServiceContent是Profile的子类,服务类型刚属性主要包括serviceType和serviceItems等数据类型属性,ServiceContent属性的描述如下:
3) 服务操作描述
在OWL-S的大数据模型中,将数据源的操作也作为数据源的一个属性进行描述,例如,在Process子类中的inCondition对createTime操作进行描述如下:
4) 服务组合描述
数据源的服务组合也通过属性来进行描述,例如大数据的“顺序组合”服务在基于OWL-S的大数据模型中的描述如下:
4 结束语
本文所研究的基于OWL-S的大数据服务模型增加了服务操作、服务质量、数据源等属性,从而使得数据服务的属性和操作描述更加完备;同时,使得大数据服务继承了语义Web的语义理解能力和自动服务组合能力,从而将服务组合运算融入大数据服务中。
参考文献:
[1] Chen M,Song M,Han J,et al.Survey on data quality[C]//Information and Communication Technologies (WICT), 2012 World Congress on. IEEE, 2012:1009-1013.
[2] 徐宝文,张卫丰.数据挖掘技术在Web预取中的应用研究[J].计算机学报,2001,24(4).
[3] 韩晶,鄂海红,宋美娜,等.基于主体行为的非结构化数据模型[J].计算机工程与设计,2013(3):904-908.
[4] 石嘉,张岳,裴云霞,等.基于Web对象流行度的PPM预测模型[J].小型微型计算机系统,2006,7(27):1378-1383.endprint
摘要:通过对现有大数据服务研究现状的分析,分析大数据服务研究目前所存在的问题,并针对目前大数据服务对数据特征表达不足,所导致的数据服务发现和组合困难的问题,提出了基于OWL-S的大数据服务模型,通过利用OWL-S中的服务操作、服务类型和数据源等属性,实现大数据服务的可视化、分析和检索等服务的构建和动态组合,使得大数据服务在属性和操作方面的描述更加完备,具有较强的语义理解和自动服务组合能力。
关键词:大数据服务;Web服务;语义Web技术
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)30-7014-03
大数据服务(Big Data-as-a-Service,BDaaS)是可独立部署,具有明确契约和独立功能的功能单元[1]。而大数据服务模型大数据服务的理论基础和实现规范,在传统的数据密集型Web服务中,采用WDSL对Web服务进行描述。但是这种描述方式只是描述了服务接口规范,缺乏对非结构化数据数据质量、模型、隐私等特征的描述,因此传统的数据服务描述方法不适用于大数据服务的描述。
1 大数据服务模型研究现状
目前针对大数据服务模型的研究,还存在如下的问题:
1) 目前的对大数据服务模型的研究,仍然沿用传统的Web服务模型,无法提供对非结构化数据的支持,不适用于大数据服务中对多种服务类型、多种数据源的支持[2]。
2) 对数据服务操作、数据源等特征的表达不足,导致使用传统的数据描述方式阻碍了服务的组合和发现。
2 大数据服务模型设计思路
针对目前对待大数据进行描述的Web服务模型所存在的不支持非结构化数据和特征表达不足的问题,大数据服务模型的设计必须要满足如下三个方面的条件:
1) 同时支持结构化和非结构化的数据模型、服务模型。
2) 能够对数据各个方面的特征属性进行形式化的定义,和完善的描述。
3) 支持可视化型数据服务和分析型数据服务的构建。
针对大数据服务模型设计所需要满足的要求,在进行大数据服务模型设计时,通过如下的方法来满足大数据服务模型的需求。
1) 采用非结构数据模型GDM将非结构化数据结构化,然后对GDM中的属性进行描述,从而将用户对数据服务的检索、可视化请求和分析都转换为对非结构化数据属性的操作。
2) 韩晶(2013)已经对数据服务应该包含的属性进行了全面分析[3],考虑到数据服务应该尽可能的体现数据特征,为此在文献三研究的基础上,增加数据隐私和数据质量部分的属性。并且设计大数据服务模型的相关操作函数,满足用户对输出结果进行筛选的需求。
3) 增加可视化型、分析型逻辑描述,从而支持用户对大数据服务的这两大数据服务需求。
3 大数据服务模型的具体设计
目前对数据服务进行描述的方法主要包括REST API和WSDL方法等,这些数据服务描述方法都由于缺乏相应的语义信息,导致数据服务在自动服务组合方面存在一定的不足。
OWL-S(Ontology Language for Web Service)通过一组语言标记对Web服务进行描述,是基于语义Web技术和Web服务的结合体,从而使得数据服务能够更好的被计算机所理解,有利于数据的分析,从而支持Web服务的发现、调用和组合。除此之外,OWL-S还支持自定义类实现对OWL-S的扩展。为此,使用OWL-S设计大数据服务,可以使得大数据服务模型具备语义和数据特征双重优势。
由于大数据服务的基础数据源复杂,各数据源模式各异。为此,为了实现数据服务的匹配和组合,即必须要采用一种合适的方式来对数据服务进行统一表示,语义Web技术通过RDF将大数据服务的各个数据源的数据模型映射到一个全局共享语义本体上,从而方便用户对数据语义的理解,从而实现基于OWL-S的大数据服务建模。
在建立数据源与共享本体之间的映射之后,就可以在此基础上进行基于OWL-S大数据服务的建设。OWL-S使用OWL语义对Web服务本体进行定义,并且将其中每个具体的Web服务当成是Web服务本体的一个实例来对数据进行描述。
每一个大数据服务模型都需要用一个Service来对模型进行描述[4],在基于OWL-S的大数据模型中,使用由ServiceGrounding、ServiceModel和ServiceProfile三个属性子类构成的Service来对数据模型进行描述。其中,ServiceGrounding主要包含服务端口号、消息格式和服务访问协议等内容,描述用户怎样获取大数据服务;ServiceModel主要对大数据服务内部流程进行描述;ServiceProfile主要包含服务的QoS信息、服务所属分类信息、服务功能和服务提供者信息等内容。
如图1所示,基于OWL-S的大数据服务模型通过对服务组合、服务操作和服务属性三个方面的描述来体现大数据服务的扩展,其中使用OWL-S的ServiceModel实现大数据服务模型的扩展,通过ServiceProfile来实现大数据服务模型中服务操作和服务属性的扩展。
1) 数据源基本属性描述
在ServcieProfile中添加Profile的BasicAttrs子类对数据源的数据隐私、质量等基本属性进行描述,添加DataQuality子类对数据源的清洗程度、精确性等数据质量相关内容进行描述。DataSource属性的描述如下所示:
2) 服务类型属性描述
服务类型属性描述ServiceContent是Profile的子类,服务类型刚属性主要包括serviceType和serviceItems等数据类型属性,ServiceContent属性的描述如下:
3) 服务操作描述
在OWL-S的大数据模型中,将数据源的操作也作为数据源的一个属性进行描述,例如,在Process子类中的inCondition对createTime操作进行描述如下:
4) 服务组合描述
数据源的服务组合也通过属性来进行描述,例如大数据的“顺序组合”服务在基于OWL-S的大数据模型中的描述如下:
4 结束语
本文所研究的基于OWL-S的大数据服务模型增加了服务操作、服务质量、数据源等属性,从而使得数据服务的属性和操作描述更加完备;同时,使得大数据服务继承了语义Web的语义理解能力和自动服务组合能力,从而将服务组合运算融入大数据服务中。
参考文献:
[1] Chen M,Song M,Han J,et al.Survey on data quality[C]//Information and Communication Technologies (WICT), 2012 World Congress on. IEEE, 2012:1009-1013.
[2] 徐宝文,张卫丰.数据挖掘技术在Web预取中的应用研究[J].计算机学报,2001,24(4).
[3] 韩晶,鄂海红,宋美娜,等.基于主体行为的非结构化数据模型[J].计算机工程与设计,2013(3):904-908.
[4] 石嘉,张岳,裴云霞,等.基于Web对象流行度的PPM预测模型[J].小型微型计算机系统,2006,7(27):1378-1383.endprint
摘要:通过对现有大数据服务研究现状的分析,分析大数据服务研究目前所存在的问题,并针对目前大数据服务对数据特征表达不足,所导致的数据服务发现和组合困难的问题,提出了基于OWL-S的大数据服务模型,通过利用OWL-S中的服务操作、服务类型和数据源等属性,实现大数据服务的可视化、分析和检索等服务的构建和动态组合,使得大数据服务在属性和操作方面的描述更加完备,具有较强的语义理解和自动服务组合能力。
关键词:大数据服务;Web服务;语义Web技术
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)30-7014-03
大数据服务(Big Data-as-a-Service,BDaaS)是可独立部署,具有明确契约和独立功能的功能单元[1]。而大数据服务模型大数据服务的理论基础和实现规范,在传统的数据密集型Web服务中,采用WDSL对Web服务进行描述。但是这种描述方式只是描述了服务接口规范,缺乏对非结构化数据数据质量、模型、隐私等特征的描述,因此传统的数据服务描述方法不适用于大数据服务的描述。
1 大数据服务模型研究现状
目前针对大数据服务模型的研究,还存在如下的问题:
1) 目前的对大数据服务模型的研究,仍然沿用传统的Web服务模型,无法提供对非结构化数据的支持,不适用于大数据服务中对多种服务类型、多种数据源的支持[2]。
2) 对数据服务操作、数据源等特征的表达不足,导致使用传统的数据描述方式阻碍了服务的组合和发现。
2 大数据服务模型设计思路
针对目前对待大数据进行描述的Web服务模型所存在的不支持非结构化数据和特征表达不足的问题,大数据服务模型的设计必须要满足如下三个方面的条件:
1) 同时支持结构化和非结构化的数据模型、服务模型。
2) 能够对数据各个方面的特征属性进行形式化的定义,和完善的描述。
3) 支持可视化型数据服务和分析型数据服务的构建。
针对大数据服务模型设计所需要满足的要求,在进行大数据服务模型设计时,通过如下的方法来满足大数据服务模型的需求。
1) 采用非结构数据模型GDM将非结构化数据结构化,然后对GDM中的属性进行描述,从而将用户对数据服务的检索、可视化请求和分析都转换为对非结构化数据属性的操作。
2) 韩晶(2013)已经对数据服务应该包含的属性进行了全面分析[3],考虑到数据服务应该尽可能的体现数据特征,为此在文献三研究的基础上,增加数据隐私和数据质量部分的属性。并且设计大数据服务模型的相关操作函数,满足用户对输出结果进行筛选的需求。
3) 增加可视化型、分析型逻辑描述,从而支持用户对大数据服务的这两大数据服务需求。
3 大数据服务模型的具体设计
目前对数据服务进行描述的方法主要包括REST API和WSDL方法等,这些数据服务描述方法都由于缺乏相应的语义信息,导致数据服务在自动服务组合方面存在一定的不足。
OWL-S(Ontology Language for Web Service)通过一组语言标记对Web服务进行描述,是基于语义Web技术和Web服务的结合体,从而使得数据服务能够更好的被计算机所理解,有利于数据的分析,从而支持Web服务的发现、调用和组合。除此之外,OWL-S还支持自定义类实现对OWL-S的扩展。为此,使用OWL-S设计大数据服务,可以使得大数据服务模型具备语义和数据特征双重优势。
由于大数据服务的基础数据源复杂,各数据源模式各异。为此,为了实现数据服务的匹配和组合,即必须要采用一种合适的方式来对数据服务进行统一表示,语义Web技术通过RDF将大数据服务的各个数据源的数据模型映射到一个全局共享语义本体上,从而方便用户对数据语义的理解,从而实现基于OWL-S的大数据服务建模。
在建立数据源与共享本体之间的映射之后,就可以在此基础上进行基于OWL-S大数据服务的建设。OWL-S使用OWL语义对Web服务本体进行定义,并且将其中每个具体的Web服务当成是Web服务本体的一个实例来对数据进行描述。
每一个大数据服务模型都需要用一个Service来对模型进行描述[4],在基于OWL-S的大数据模型中,使用由ServiceGrounding、ServiceModel和ServiceProfile三个属性子类构成的Service来对数据模型进行描述。其中,ServiceGrounding主要包含服务端口号、消息格式和服务访问协议等内容,描述用户怎样获取大数据服务;ServiceModel主要对大数据服务内部流程进行描述;ServiceProfile主要包含服务的QoS信息、服务所属分类信息、服务功能和服务提供者信息等内容。
如图1所示,基于OWL-S的大数据服务模型通过对服务组合、服务操作和服务属性三个方面的描述来体现大数据服务的扩展,其中使用OWL-S的ServiceModel实现大数据服务模型的扩展,通过ServiceProfile来实现大数据服务模型中服务操作和服务属性的扩展。
1) 数据源基本属性描述
在ServcieProfile中添加Profile的BasicAttrs子类对数据源的数据隐私、质量等基本属性进行描述,添加DataQuality子类对数据源的清洗程度、精确性等数据质量相关内容进行描述。DataSource属性的描述如下所示:
2) 服务类型属性描述
服务类型属性描述ServiceContent是Profile的子类,服务类型刚属性主要包括serviceType和serviceItems等数据类型属性,ServiceContent属性的描述如下:
3) 服务操作描述
在OWL-S的大数据模型中,将数据源的操作也作为数据源的一个属性进行描述,例如,在Process子类中的inCondition对createTime操作进行描述如下:
4) 服务组合描述
数据源的服务组合也通过属性来进行描述,例如大数据的“顺序组合”服务在基于OWL-S的大数据模型中的描述如下:
4 结束语
本文所研究的基于OWL-S的大数据服务模型增加了服务操作、服务质量、数据源等属性,从而使得数据服务的属性和操作描述更加完备;同时,使得大数据服务继承了语义Web的语义理解能力和自动服务组合能力,从而将服务组合运算融入大数据服务中。
参考文献:
[1] Chen M,Song M,Han J,et al.Survey on data quality[C]//Information and Communication Technologies (WICT), 2012 World Congress on. IEEE, 2012:1009-1013.
[2] 徐宝文,张卫丰.数据挖掘技术在Web预取中的应用研究[J].计算机学报,2001,24(4).
[3] 韩晶,鄂海红,宋美娜,等.基于主体行为的非结构化数据模型[J].计算机工程与设计,2013(3):904-908.
[4] 石嘉,张岳,裴云霞,等.基于Web对象流行度的PPM预测模型[J].小型微型计算机系统,2006,7(27):1378-1383.endprint