基于线上数据挖掘的食用菌信息平台构建*
2020-11-11宋佳珍
宋佳珍,罗 帅
(1.湖南外国语职业学院信息技术学院,湖南长沙410116;2.湖南农业大学信息科学技术学院,湖南长沙410128)
随着我国食用菌产业的发展,食用菌电子商务等现代化的信息平台也如雨后春笋不断涌现。如中国食用菌信息网、中国蘑菇信息网、中国食药用菌网、易菇网、天下菇行网等都是比较知名的信息网站平台[1]。各种食用菌信息平台为客户提供了食用菌业内的供求信息、行业资讯、产品报价、人才招聘等服务,人们可以足不出户完成食用菌资讯和商情的查询,随时掌握最新的食用菌信息。信息平台的建设不仅能够加强食用菌相关各企业之间交流,还可以促进彼此之间产业的合作,实现食用菌产业与其它相关产业之间的共同发展[2]。
食用菌信息平台的建设极大在促进了食用菌信息的交流。但随着各种海量食用菌信息的导入,人们已经不满足于平台所提供的数据存储、统计和查询等基本功能。希望从信息平台获得更高层次的知识和信息,也希望信息平台能够从海量的食用菌信息中找到更加有用的信息,为从事食用菌栽培、生产加工、销售的管理人员提供高层的决策支持。从传统的信息平台数据应用提升到数据的挖掘,以获取更多高层次的决策信息,发挥食用菌信息平台的数据优势,扩展食用菌信息的应用。对食用菌信息平台的数据挖掘就是为了给决策者提供一些隐含的、未知的有用信息,为管理层提供辅助决策信息。其主要涉及的技术有数据库、数据仓库、数理统计和人工通知等多学科知识。
1 食用菌信息平台总体设计
1.1 食用菌信息平台的设计目标
食用菌信息平台主要用于针对食用菌销售进行有效管理。通过信息化管理的手段,对食用菌信息进行科学的管理,并对相关的食用菌数据进行数据挖掘。运用数据挖掘技术从海量的食用菌数据中发现有用的信息并充分利用,发现食用菌企业和信息平台运作的基本规律,预测食用菌价格等销售市场走势。从宏观上把握食用菌企业和食用菌产品未来的市场发展方向,提升食用菌企业的经济效益。
食用菌信息平台的设计目标具体有:食用菌的商品信息、食用菌消费客户信息、食用菌产品订单信息、食用菌产品销售信息、食用菌产品退货信息管理、营销情况查询等。
1.2 食用菌信息平台的主要功能模块
食用菌信息平台主要的功能模块结构见图1。
如图1所示,食用菌信息平台的用户类型主要有食用菌的消费客户、平台操作员和决策管理人员,分别负责客户资料的管理、食用菌产品和订单的管理、决策查询等工作。
客户资料管理模块:食用菌消费者通过用户名和密码登录平台,对客户资料库的相关内容进行操作,主要包括食用菌客户的结款情况、食用菌产品资料查询、客户信息修改(更新)、食用菌产品的订货信息、购货信息和退货信息查询等。
操作员管理模块:操作员管理主要涉及食用菌产品的管理(包括食用菌产品的各类信息,如食用菌名称、产品图片、库存数量、上下架情况等);客户管理模块主要负责客户的增加、删除和查询等;食用菌订单管理主要包括新订单的生成、删除订单、修改订单信息等;食用菌销售信息管理包括了食用菌产品销售的信息、库存信息和销售数据的查询统计等;退货管理主要负责对退货详情的查看、删除以及信息入库等。
决策管理模块:该模块主要功能是让食用菌企业的管理者能够通过信息平台的相关信息,对食用菌销售信息、订货信息等进行实时查询,即时掌握最新的食用菌销售数据和订单相关信息。通过食用菌数据挖掘模块建立食用菌数据仓库,对信息平台的相关信息进行数据挖掘,对平台的食用菌数据进行二次开发,从而发现更多有用的信息辅助决策。同时,打印报表模块也可以完成相关统计数据的报表打印和输出工作。
2 食用菌信息平台数据仓库的设计
目前,各种食用菌信息平台已经初具规模,并且随着我国食用菌产业的发展,近年来积累的食用菌信息也随着时间的推移呈几何级数的增长,平台数据量的增加也给信息的管理提出了挑战。大量的食用菌历史数据包含了客户、食用菌企业、食用菌产品和食用菌销售等全方位的业务信息。传统的数据库已经难以满足海量历史数据的统计和分析,因此,需求建立数据仓库来更好地满足数据分析和数据挖掘的需要。
2.1 食用菌数据仓库的数据来源
食用菌信息平台的数据仓库是面向决策分析的数据存储方式[3],其主要面对的数据来源包括客户信息、订单信息、销售信息、财务信息和库存信息。将这些分散的信息数据加以整合,统一放置在数据仓库并进行相应的数据处理。这样不但可以让决策管理人员随时查询食用菌的各类历史数据,而且还可以让食用菌信息平台的各类用户随时进行统计分析。如进行纵向的企业历史数据比较,横向的食用菌企业间业务、订单、销售数据的对比等。从而从多个角度为决策管理层提供最新的数据分析结果,深入挖掘大量食用菌信息背后所隐藏的重要信息。
具体的各类信息来源载体有:1)食用菌信息平台的历史产品、销售、订单等数据;2)食用菌信息平台的Web访问记录和平台留言板、论坛等与客户互动的信息;3)食用菌企业售后服务、供货商、销售商等上下游企业间的通讯记录(如客户回访、供货报价、推广营销、购买咨询、进出口贸易、订货发货信息等);4)食用菌产业相关信息:与食用菌产业相关的政策规章制度、食用菌最新前沿科技、与食用菌产业密切相关的木屑、培养基等原材料的供给情况、食用菌国际贸易市场的变化等。
2.2 食用菌信息平台数据仓库的设计
2.2.1 数据仓库主题设计
对食用菌信息平台来说,数据仓库的主题是指主要的决策分类。食用菌信息平台通过食用菌产品的展示、信息的发布等将食用菌生产、销售等环节连接起来,为客户和食用菌企业之间提供信息的交流和沟通的渠道,并最终促进食用菌的销售。因此按照食用菌信息平台的主要功能,确定食用菌数据仓库的主题为:1)食用菌销售商主题。体现信息平台为食用菌产品销售提供支持的主要目标,包括销售商的基本信息、销售食用菌产品的基本信息等。2)食用菌产品主题。体现食用菌产品的各种信息,如食用菌产品供货信息、订单信息、库存信息、销售信息和退货信息等。3)食用菌客户主题。包括了食用菌销售对象的特征等相关信息,如客户的基本信息、客户订单和退货信息等。
2.2.2 数据仓库模型
食用菌销售商、食用菌产品、食用菌客户这3个主题的相关信息都存储在不同的数据库中,在食用菌信息平台设计之初,这些数据库是相对独立的。但在数据仓库中,通过公共键建立了这些数据库之间的关联,以便进行数据挖掘和数据分析。但这样还不够,在数据挖掘时需要建立一个统一的数据模型,将3个主题的数据库进行整合,集合成一个可用于数据挖掘的数据仓库模型。这个数据模型创建的过程主要包括数据抽取、数据转换和数据传输等3个步骤,建立的数据模型为数据立方体模型。该数据仓库模型主要包括食用菌产品、食用菌客户和时间这3个维度,共同组成一个多维的立方体数据模型[4]。
2.3 数据挖掘过程
食用菌信息平台的数据挖掘过程见图2。
如图2所示,1)利用食用菌信息平台的数据库(历史数据)建立数据仓库;设计食用菌销售商、食用菌产品、食用菌客户等3个数据仓库主题;建立多维的立方体数据模型;设计食用菌产品、食用菌客户和时间3个维度,并对每个维度进行粒度(即数据统计的粗细程度)划分。2)数据预处理,对不规范数据进行清洗、删除不合格数据、补充修正有缺陷的数等。3)选择合适的数据挖掘算法,完成食用菌决策信息的数据挖掘。
3 食用菌信息平台的数据分析及数据挖掘的实现
食用菌信息平台的数据挖掘主要通过Microsoft SQL Server 2005数据库管理系统中的Business Intelligence Development Studio(BIDS)来实现[5]。利用该平台来创建食用菌信息多维数据集,选择合适的数据挖掘算法来完成数据分析和数据挖掘。
新建一个Analysis Services的项目,再按照操作部分新建“数据源”,见图3。
如图3所示,选择食用菌信息平台的数据库,依次创建定义多维数据集及架构、创建食用菌数据立方体模型,然后再进行生成“数据挖掘结构”。根据食用菌销售中3个主题数据挖掘的需要,在Analysis Services中选择关联规则算法来进行食用菌信息的数据挖掘。再通过Analysis Services项目的部署就能够建立实现食用菌信息平台的数据挖掘功能,为食用菌管理层的提供辅助决策信息。
4 结论
食用菌信息平台在长期的运营和发展中,积累了大量的食用菌产品、客户和销售数据。海量历史数据中隐含着许多重要的决策信息,可以为食用菌企业的管理层者提供可靠的辅助决策信息。深入挖掘食用菌信息平台的海量数据,可以帮助食用菌企业在激烈的市场竞争中赢得先机,提高食用菌信息和食用菌企业的管理水平。
通过采用数据仓库和数据挖掘技术,开发设计了食用菌信息平台,将传统的信息管理平台中海量的历史数据进行整合,建立了食用菌数据仓库。并在SQL Server的联机分析处理工具BIDS,利用关联规则算法实现了食用菌信息的数据挖掘。从中发现更多食用菌信息中未知的、隐藏的有用信息。充分利用了食用菌信息平台长期运营中积累的大量数据,为食用菌企业的管理去提供了更多的辅助决策信息。也从更高层次进行了食用菌数据应用,提升了食用菌信息平台的应用价值。