交互式遗传算法在电子购物平台商品搜索中的应用研究
2014-06-20吴晓燕邓小清成淑萍
吴晓燕 邓小清 成淑萍
摘 要:随着电子商务事业的快速发展,越来越多的人们开始进行网上购物等一系列线上活动,但由于搜索系统的滞后,导致了网络交易成功率的下降。交互式遗传算法可根据用户输入的初始关键字进行多层递阶编码,通过不断的解码、变异和交叉算子实现满意解的搜索,具有较为显著的运用效果。本文从交互式遗传算法的操作入手,分析和研究了交互式遗传算法在电子商务平台中的搜索应用。
关键词:遗传算法;交互式遗传算法;电子购物;商品搜索
在数字化时代的发展背景下,电子商务正以蓬勃的速度崛起并發展,但在其发展过程中,也出现了较多问题。现阶段的网络信息资源较大,其以几何级数的速度增长,越来越多的商品信息进入人们的视野。也正因为网络信息的繁杂,导致用户在找寻所需商品时犹如大海捞针。电子商务所面临的首要问题是如何让用户方便快捷的寻找到自己所需的商品。
1 交互式遗传算法
用户在交互式遗传算法中可根据自身需求和偏好,评价进化后的个体表现型,然后计算机便可荣国遗传算子实现个体的变异和交叉操作。计算机会不断重复此项操作,直到寻求到符合用户需求的解。该算法在长时间的发展中已经运用于数据挖掘、语音处理、人脸识别、乐曲创作、知识获取、韵律控制和服装设计等领域。该算法较传统遗传算法而言,具有个性化的特点,其需要用户的参与,而用户的不断参与也决定了该算法的适应值。用户在长时间的人机交互的作用下容易产生疲倦,故该算法的进化代数和种群规模都较小,使算法在复杂的优化问题中难以应用,限制了该算法的发展。以用户评价为基础的个体信息通过适当的机器学习方式,实现用户认知模型的构建。
2 交互式遗传算法因子操作
以交互式遗传算法为基础的个性化商品搜索就是在电子商务系统中引入交互式遗传算法,系统可根据用户的流浪的相关商品信息,缩小用户所需商品的范围,以便更好、更快、更全的寻求用户所需商品。系统在搜索用户所需数商品时,会对适应度函数进行动态调整,在多次进化操作的情况下寻求用户所需信息资源。
2.1 个体编码
交互式遗传算法时以种群搜索为基础而进行的,在解决系统的实际优化问题时,需将问题明确的转换为进化个体。当用户在电子商务系统中输入某些关键字时,系统会以现存数据为基础进行挖掘和寻找,便可快速准确的获取与关键词相关连的信息内容。本文对系统接收的关键字入手,编码其相关的关联词,实现进化个体的构建。
当用户在电子商务系统中输入所需商品的关键字时,系统内统计数据会挖掘之前获取的相关信息,根据关联程度将关联词关联信息导入至数据库内。二进制编码具有便于操作和简单直观等特点,故本文采用二进制编码的方式对信息内容技术进行编码:“1”代表系统选用此关键词;“0”代表系统不选用此关键词。在电子商务系统中,四级关键词入微便可将信息内容细致准确的表述出来。本文模拟的电子商务系统为四级及以下关联词情况。因为各级级关键词都是紧密相连的,所以上层关联词决定了下层关联词的选择。假设一级关联词为N1个,则第n个一级关联词包含 个二级关联词,而该二级关联词下共有 个三级关联词,向下延伸可知三级关联词下共有 个四级关联词。
2.2 解码
各级关联词的排列序号决定了该层二进制码的所处位置,在本文图2中,“1”第一层中关联词的第一位,代表了“该结构中第一层关联词对应的相关信息”,例如上述范文中的“女装外套”。
排列该结构中各层二进制编码所显示的关键词序号,系统便可得到呈现给用户的最终信息。图1中,个体表现型解码后表现为:“1 1 1 1”/“1 2 2 1 ”/“1 2 2 2”,整合解码后的信息内容,便可得到该商品的对应的关键词组合。
将进化种群规模设置为M,用户在系统中输入关键词时,上述编码结构便会对该关键字进行随机初始化得到初始化种群。系统解码该初始化种群,用图片的形式将解码后内容发送给用户,用户再根据自身需求选择所需商品,以用户选择为基础的系统结构可调整合适的个体适应值,便于遗传操作的实施。
2.3 进化个体适应值估计
遗传算法系统中的算子选择是以进化个体适应值为基础进行实施的,故遗传操作正常进行的先决条件是得到进化个体适应值。以往的交互式遗传算法主要通过用户对个体表现的评分状况得到进化个体适应值,而在现如今的电子商务系统中,用户并不会直接对该模板进行评分,而是通过点击其感兴趣的内容实现进化个体适应值的调整。
这里选取用户的关注程度、访问次数和收藏/保存这三种交互进行进行分析,当用户将所需商品加入购物车便提示为购物成功。在第m个进化个体Xm表现型所对应的商品上进行关注程度、访问次数和收藏/保存三种交互行为,分别表示为It(Xm),In(Xm)和Is(Xm)。其中In(Xm)是用户点击该商品的次数,该次数取整数值,即为In(Xm);Is(Xm)为此用户潜在的感兴趣内容,此数据由用户的保存/收藏操作所决定,即为 。现有研究对 It(Xm)考虑为此用户对该商品的关注事件,并未考虑该用户对各商品关注的先后顺序,以下为本文中对It(Xm)的计算方式。
系统以用户初始关键词为基础进行信息相关度的匹配,将匹配后的数据提交给用户。数据信息提交成功后,其内部智能匹配功能可基于该信息实现后续智能搜索功能。假设用户在舒适化呈现信息的t时刻点击进入了第m个进化个体Xm所对应的商品表现型,则点击后关注的时间为 (秒)。用户在浏览相关信息时,会优先关注其感兴趣内容,并点击进入该商品表现型,而由于点击时间的优先则导致该商品表现型的访问时间较长。故第m个进化个体在该情况下的关注度为 。
2.4 进化操作
以已得到的进化个体适应值为基础,遗传操作该进化种群,实现变异、交叉和选择操作。本文通过2规模的联赛选择方式进行综合操作。因递阶结构中的二进制串为进化个体编码,故在进行变异和交叉操作时需进行分层展开,而分层分布的交叉操作可保证其在同层间的有效性,换句话说,递阶结构的编码可使变异和交叉操作有意义。
首先,随机配对进化种群中的个体,假设个体对配对后为 。单点交叉操作该个体集合中 N1层的编码串,获取新的2个编码串后交叉操作该编码串对应的 (激活后),在不断的类推和交叉后达到最后一层。当数据达到最后一层时,按照合适的概率单点变异N1层的基因,进而变异选择后的被激活下层基因。
当用户选择“刷新”、“返回”或“下一页”时,系统会将最新生成的信息内容推送给用户。用户通过不断重复的遗传操作、适应值估计和点击操作便可寻找到自身所需信息。
3 交互式遗传算法在电子商务平台中的搜索应用
3.1 参数设置
设置本系统中第一层关联词为自动化控制类、电子信息类及计算机科学与技术类;第二层的关联词则为具体化的图书名;第三层关联词则为各为各个图书的价格;第四层关联词则为隐含的潜在关键词。本文采用 实现个体适应值的估算,故本文算法种群可包含较大规模,在此设置为200,将交叉概率设置为85%,变异概率设置为2%。
3.2 实验与仿真
本系统中查找的最终书目代表了用户的最终查找意图,在此系统中,用户可根据进化环境选取符合需求的优化目标,进而得到满意的搜索结果。在不断的人机交互过程中,最符合用户需求的个体被称为满意解,系统在不断的深化并增加满意解数量,并将其推送给用户。本系统中设置的关键字为:计算机类,图书名为:《Web应用程序设计基础》,参考价格为:30元。
分别采用传统搜索方式和本文方式进行搜索对比,传统搜索方式仅采用关键字匹配技术,本文搜索方式在关键字匹配的基础上再引入交互式进化优化算法。对两组搜索方式寻找目标的成功率进行比较。经对比分析发现,传统搜索方式的获取满意解的几率仅为55%,显著低于本文方法获取的满意解几率(85%)。故在有限时间内,本文算法可快速有效的获取用户所需的满意解。
4 结语
交互式遺传算法的出现结合了遗传算法的优化能力和用户的认知能力,以实现未能用显式性能指标函数描述完成的优化问题,对遗传算法的运用范围具有较大的扩宽作用。电子商务系统中引入交互式遗传算法,可降低用户的搜索耗时,提高系统内的搜索成功率,在网络交易成功率的提高上具有积极意义。
[参考文献]
[1]齐岩,卢德唐.交互式遗传算法在基于内容的图像检索中的应用[J].中国图象图形学报,2004,9(1):46-55.
[2]邹木春.基于交互式遗传算法和粗糙集的图像检索方法[J].计算机工程与设计,2007,28(9):2086-2088.