APP下载

基于大数据的家纺行业发展预测

2016-11-19王洛涛

中国新通信 2016年20期

王洛涛

[摘要]近几十年来,信息技术有着跨越式的发展,家纺行业与互联网等信息新技术的融合也不断深入。这也直接导致了有关家纺行业、企业以及产品等不同层次的“信息”呈现爆炸性增长,这些数据信息也具有复杂、多样的特点。在利用这些数据做相关分析时,庄往存在难以处理大量、“关系复杂”数据的难题,使得由互联网等信息新技术得到的数据无法快速、准确的转化为有用信息。为了有效解决上述难题,本文试图构建一种基于大数据分析的家纺行业发展预测定量研究。

[关键词]大数据方法 家纺行业 发展预测

一、引言

随着互联网技术手段的不断发展以及信息技术的广泛普及,基于信息技术而产生的数据量,随时间呈现指数增长的态势,这类“爆炸性”的海量数据被学界称为大数据。大数据的主要5个特点可以用“5V”来表示,即Volume(数据规模大)、Variety(数据的种类多样)、Velocity(高速的数据)、Veracity(数据的真实性)以及Value(数据的价值)。也正式由于大数据具有上述五个特点,其在家纺行业的分析、预测中具有极大应用前景,可以有效解决家纺行业定性分析、预测的不准确性挤以及片面性。

本文首先利用大数据平台处理家纺数据,进而对预测对象的确定和量化,最后详细介绍时间序列分解方法、回归分析法、BP神经网络方法以及灰色系统方法,为大数据方法在家纺行业发展预测中的应用提供了一定参考。

二、利用大数据平台处理家纺数据

利用大数据平台处理家纺数据主要分为以下几个步骤:1、搭建Hadoop平台;2、采用HDFS系统分级分层次存储数据;3、利用Map Reduce架构计算相关的“大数据”;4、将有用数据提取出来。其中,HDFS系统存储数据以及数据的提取是主要难题。

HDFS的是Hadoop Distribute File System的缩写。它一种基于Hadoop的分布式文件系统。HDFS主要是通过网络连接的方式,存储并高速阅读TB级别的文件。HDFS方法对文件的写操作一次性完成,可以多次读出。其缺点也很明显,即相关文件一旦“写”好以后就难以修改。一般来说,家纺行业相关数据存储的“横坐标”通常为时间(即流行趋势),采用Map过程会从HDFS数据中获取研究对象有关数据并进行预处理,然后将其传递给系统预定的reduce函数进行充分的计算以后,输出与研究对象有关的结果。

三、预测对象的确定和量化

影响家纺流行的因素形形色色、多种多样,比如家纺的色彩、各地风俗以及款式设计等相关因素以及天气等无关因素。前人的研究表明,色彩是家纺行业流行中最明显的一个因素,一方面是因为服饰等潮流对家纺行业印象最直接的就是颜色,另一方面是因为消费者往往第一眼看到的就是颜色。为此,本文以色彩作为研究因素的代表。

关于家纺的颜色分类,不同国家、不同研究机构、不同厂家具有不同的分类模式、方法。比如在市场所处的国家方面,美国、欧洲(主要是法国和意大利)、日本以及中国每年的流行颜色具有一定的差异,甚至同一国家不同地区在每年的流行色方面都具有一定的差异。比如基于CNCS色彩体系的流行色趋势数据(中国发布)、基于PANTONE色彩体系的流行色趋势数据(美国发布)等等。

为了更加全面、快速、有效的借助大数据方法定量分析家纺行业色彩趋势,具体颜色分类以及数据的选择应该根据研究的范围来确定。比如,研究国内的家纺行业色彩趋势,就应采用由中国发布的家纺流行颜色相关数据。

四、家纺流行趋势预测模型

家纺流行趋势预测模型的选择和构建,是借助大数据方法定量分析家纺行业色彩趋势方法中的核心问题。预测模型是否准确、合理,直接关系到能否从海量数据中找到与研究问题有关的数据信息。目前可以借鉴的方法主要有以下四种:时间序列分解方法、回归分析法、BP神经网络方法以及灰色系统方法。本节将重点阐述四种方法的基本原理和优缺点。

4.4时间序列分解方法

基于时间序列分解法的预测模型,主要是将可能的影响因素根据作用时间的长短关系分成四大类:短期因素、长期因素,周期因素以及随机因素。由于各因素之间的相互关系、相互作用复杂,于是该方法不考虑各个因素之间影响,重点研究每个因素和时间之间的单一作用关系。

4.2回归分析法

回归分析方法,主要对收集到的数据采用数学统计的方法建立不同变量之间的相互影响关系,进而完成有关预测的。常用的数学回归模型很多,比如直线方程、指数方程等。但是,回归分析方法存在一个严重的弊端,就是需要提供的各因素的数据都是“有效数据”,而实际有关家纺色彩的海量数据绝大部分都是无效数据,即该方法的鲁棒性差。

4.3 BP神经网络方法

BP(Back Propagation)神经网络法中的BP是“BackPropagation”的简称。BP神经网络法,与回归分析方法截然想法,它可以在不确定各因素之间的相互作用关系的前提下,可以模拟人脑的思维,通过“学习”的方式获得输入量与输出量之间的逻辑关系。BP神经网络的判断方式是使网络的误差平方和最小来确定最有可能的相互作用关系。一般来说,一个完整的BP体系应该包括以下三个层次:输入层、隐含层以及输出层。BP方法有较高的容错能力,在部分“神经元”出现错误或者部分信息缺失时,仍然能进行学习,推断未来的趋势并进行判断。但BP法也存在部分不足,主要表现为:1、计算时可能陷入局部最小化而无法寻找到全局最优解;2、BP网络结构的选择不同导致预测结果出现一定的差异;3、BP方法仍然存在一定程度的样本依赖问题。

4.4灰色系统方法

灰色预测法是用灰色系统模型对未知系统进行的定量预测。运用灰色预测法,首先要对比各影响因素之间变化发展的差异性,然后对原始数据进行处理来发现变化规律,重新排列生成有新的数据序列,随后建立相应的微分方程模型,最终达到预测某研究因素随时间的变化规律。与BP神经网络方法不同的是,灰色系统模型对收集到的数据的数量以及数据关系木有特殊要求。

五、结论

伴随着信息技术的大发展,家纺行业与互联网等信息新技术的融合也不断深入。使得学者们有机会利用大数据来定量分析家纺行业发展预测,以避免传统的定性预测方法预测结果不准确、过于片面的难题。但是使用大数据来定量分析时,也有由互联网等信息新技术得到的数据无法快速、准确的转化为有用信息的巨大困难。为了有效解决上述难题,本文试图构建一种基于大数据分析的家纺行业发展预测定量研究方法,首先利用大数据平台处理家纺数据,进而对预测对象的确定和量化,最后利用时间序列分解方法、回归分析法、BP神经网络方法以及灰色系统方法等预测模型完成预测分。本文提供的思路,对大数据方法在家纺行业发展预测中的应用提供了一些有益的思考,具有一定的参考价值。