把“美丽数据”穿身上
2017-10-23贺文
贺文
比起“衣橱里永远都缺一件衣服”,女人其实更需要一个懂得美、懂得穿搭的“私人小助手”。
全心全意想为年轻女性服务的蘑菇街,正在通过机器学习算法,为平台上的2亿多女性用户,“训练”一个时刻在线的“私人穿搭小助手”。在蘑菇街团队看来,一方面,搭配是女性日常生活中每天都会遭遇的一大痛点;另一方面,看起来非常感性甚至随性的东西,其实也是有迹可循的,不同的元素、单品形成搭配的过程,从数据来说是几何级数增长的,智能“小助手”在其中可能大有用武之地。
需求是推动产品创新的原动力,竞争也是。
如果世上只有一家卖衣服的互联网平台,蘑菇街可能一直做卖衣服的生意就足够了,但是当满世界都在卖衣服时,有没有办法给消费者提供更好的体验,就成为蘑菇街这样的亚平台需要思考的问题。
“不规则”的穿搭难题
蘑菇街所在的美丽联合集团“特别特别重视”AI这件事情是从去年开始的。
美丽联合集团(美丽说和蘑菇街合并为“美丽联合集团”)研发副总裁曾宪杰介绍,去年阿尔法狗战胜李世石后,集团的技术团队非常吃惊于深度学习已经带来这么大的变化,同时期语音输入、语音识别等人机交互技术也突飞猛进,团队开始深度思考人工智能在时尚领域能否有作为,并且开始在战略上布局AI。
相较于围棋这样的规则世界,在倚重感觉、感性的时尚圈,AI能够发挥多大的威力?
曾宪杰将人工智能可以解决的问题分为两类:一类是非常确定性的,比如围棋这样的游戏规则相当明确的问题;另一类是现在看起来并没有那么明确规则的问题,比如搭配,上衣应该是百分之多少的颜色,裤子是百分之多少的颜色,什么做工什么颜色比较好搭配等等,这种问题的解决对于人工智能往往更难。
蘑菇街时尚内容总监王莹曾是时尚杂志资深时装编辑,与袁泉、孙俪、黄轩等明星艺人有过合作。前不久热映的《我的前半生》唐晶的专属服装造型设计师,正是与袁泉合作超过4年的王莹。曾宪杰略带调侃地设问,蘑菇街是否可以做一台像王莹一样厉害的机器,给用户做穿搭呢?他的回答是,目前人工智能发展到的程度是,可以比一般人水平好,但是相比专家还有差距。
有心的用户应该已经留意到,蘑菇街APP新增了一个搭配的入口。曾宪杰介绍,现在的应用状况是,机器帮助内容编辑在海量数据中找到合适的搭配,然后把结果给到编辑,但是现在还达不到80分,所以机器可以帮助人提高效率,却还没有办法完全依靠机器。
曾宪杰认为,通过人工智能方式训练的机器,有两个演进阶段:先是系统帮助人,以人为主,机器帮助人提高效率的同时也在学习。以蘑菇街的“穿搭小助手”来看,从最开始的搭配全靠人,到现在有人与系统相结合,当负责搭配的编辑从上千万的商品通过关键词搜索、浏览图片等方式找到符合要求的搭配候选单品,这个过程就给系统提供了很多数据,系统得以学习到非常多的知识;随着这些训练的提升,一定会有一天变成人来协助机器、主要工作可以交给机器、人做一些抽查工作就可以了,换句话说,到那时机器推荐出来的搭配,人会觉得有80%的可行度。
“小助手”训练过三关
蘑菇街的人工智能到底是如何帮助用户搭配的呢?人工智能落地的关键是数据。
从事计算机视觉和机器学习工作超过10年的蘑菇街图像算法高级技术专家张洪明介绍,在数据方面,蘑菇街有优势。比如在图像上,蘑菇街有海量图像数据,有商品图像,也有用户上传的图像,还有业务积累中的图像;在时尚分析算法方面,蘑菇街有一个团队专门做这方面的算法研究;还有丰富的应用场景,搭配即是很好的落地应用。通过搭配推荐引擎(也是一种算法),在海量数据中寻找和某件衣服搭配的裤子或者裙子。目前,蘑菇街的穿搭“小助手”可以做到上装和下装的搭配,未来也会进一步扩展,比如根据每个用户的爱好不同,也会搭配一些配件、首饰等。
张洪明介绍,要做好穿搭“小助手”,首先要具备理解图片的能力,即图像内容识别。对于蘑菇街来说,让人工智能理解时尚,就要把任意一张图片理解得更加细粒度,从而识别到更加细节的元素。例如将一套完整的全身搭配图片,分解为“烟粉圆领字母印花T恤、蓝色牛仔短裤、亮黑小方包、白色松糕鞋”识别出来。这种图片识别技术,可以极大地提高用户的搜索效率,为搭配推荐提供了解决途径。
人工智能与时尚电商结合,还要理解“搭配因素”。搭配因素包括流行趋势,即不同时节、不同地域的流行单品的变化,除此之外还有流行单品的面料、材质、外观颜色和风格等商品因素等。蘑菇街发布的2017秋冬女装潮流趋势,就能帮助蘑菇街的“私人穿搭小助手”读懂潮流。
再加入用户体验因素和用户画像特征,在用户搜索一件单品衣服的同时,这个“小助手”能为用户找到更多可搭配的款式,形成候选集给到时尚运营,最终帮用户找更“贴心”的搭配。
就人工智能对于海量数据的需求、电商平台有关用户行为的数据更为全面,这样的观点,曾宪杰有不同的看法。他认为,训练机器,首先需要一定量的数据,比起数据的“海量”,数据“种类齐全”更为重要。“如果我们面向女性消费者在服装、配饰领域里有比较全的数据,就够了。因为对于机器学习来说,要训练它,训练好后測试它,然后在线上验证效果,很少有公司训练级别的数据量就那么大,蘑菇街现在利用自有数据,就可以解决我们在这方面的需求。”曾宪杰透露,他们也会引入一些外部数据,比如一些社交网络的数据,比如潮流趋势的数据等来丰富数据来源。
曾宪杰强调,做机器训练,数据的丰富性优于数据量,因为在做模型训练时,挖掘数据“特征”非常重要:这么多数据到底可以找到多少特征?你的数据特征有多细?几百维度甚至上千维度的特征,哪一些对什么有用?等等这些是做机器学习过程中非常难解决问题的点。
除了面向用户端提供“穿搭小助手”这样的AI应用,蘑菇街也在努力尝试做销量预测,以期未来能够助理时尚服装产业实现“柔性生产”,改善行业效率,更好地指导供应链。
曾宪杰介绍,美丽联合集团在AI方面的投入是全方位的,除了自己有专门的团队做相关领域的研究以外,他们也在尝试跟高校合作,结合对方理论的力量,甚至相当长时间的积累,尝试在工业界落地。“我们会很重视这一块,因为我们看到它可以产生很大的业务价值。”他明确表示。