Jellybooks:读者数据分析的新尝试
2015-07-01徐丽芳王钰
徐丽芳+王钰
热词:Jellybooks 读者数据分析
虽然出版业正在经历数字化转型升级的洗礼,但在很大程度上仍然是一个需要依靠直觉的产业。图书出版社通常依靠出版社编辑的个人经验和主观偏好来判断什么内容可能畅销和流行;而且,出版过程中以从内容生产者到消费者的单向信息流为主,加之读者口味太过多变,实际上很难断言哪本书会成为下一本畅销书,就像难以预料一个月后的天气一样。然而随着技术的发展,收集、采样数据的增多,预测天气的精度已经不断提高;出版业也是如此。随着技术的发展和出版业的数字化转型,行业生成和储存的数据越来越多,从而为利用这些数据来做出更好的出版决策打下了基础。在这一领域,2012年创建于英国伦敦的啫喱图书公司(Jellybooks)是无可争议的佼佼者。它致力于收集、分析读者信息,专注于为作者、代理商和出版商提供图书营销、销售和发现工具,目前已积累了一些经验。
一、读者如何发现和分享图书
在读者数据收集方面,一般情况下,出版商所收集到的读者数据通常是聚合的,也就是集合数据;而且,为了保护用户隐私,往往也是匿名的。作家或出版商无法观察到个体用户的行为,也无法看到个体行为之间的联系,比如读者在社交网络发表图书评论与其他读者的购书、读书行为之间的联系。这些看不到的数据往往具有重要的市场价值,长期以来出版商也一直在寻求读者之间或其与图书之间如何相互作用的详细信息。
其中,在这个海量数据时代,可发现性(discoverability)比任何时候都更加重要。数字图书世界(Digital Books World)的调查统计显示,目前全球每年出版的英文图书达100万种左右,读者可以从谷歌、亚马逊、二手书店和图书馆等渠道获得超过3000万种图书的信息。读者已经要被海量的选项淹没了——除非已经知道要找什么书,不然在网上找到喜爱的好书是相当困难的事。许多人认为,亚马逊的推荐模式——“买了这本书的人还买了……”太没有人情味,而且基本上推荐的都是类别里最畅销的书。在这样的情况下,读者如何发现一本好书成了令人感兴趣的课题。
为了收集与读者发现图书相关的数据,Jellybooks建立了一个图书发现网站。网站上的图书按流派和类别排列,采用大图书封面布局和连续滚动页面,在模拟书店体验上非常成功。读者只要点击感兴趣的书,网站就给出摘要、样章和购买链接(见图1)。
图1 Jellybooks网站操作图示
有很多真正的好书都不在排行榜上,为了打破畅销书排行榜的统治,Jellybooks采用与last.fm相似的算法来找到冷门好书。一旦读者开始浏览、下载、分享,Jellybooks会使用在这个过程中收集到的信息向你推荐最符合读者兴趣和需要的图书,并提供50%的购买折扣。当然,不是每个用户会得到这个推荐折扣,它提供推荐折扣与否是根据相关度以及读者的阅读、分享等行为信息来决定的。当用户发现一本感兴趣的书,他们可以下载书籍前10%的样章到个人云账户(My Books)。该样章没有数字权利管理系统(Digital Rights Management,DRM)的限制,可以通过电子邮件、推特(Twitter)、脸书(Facebook)或品趣志(Pinterest)无限制分享。另外,Jellybooks的图书样章也可以下载到智能手机、平板电脑或电子阅读器中阅读,并可以使用“发送到Kindle或iPad”的集成功能发送到读者的Kindle阅读器、Kindle Fire平板或用户的iPad上进行浏览。之后,如果读者决定购买,那么可以通过Jellybooks提供的链接在网上零售商处购买。
Jellybooks本身并不销售图书,因为该平台真正的目标是掌握读者发现图书过程中的信息。因此,它通过向读者提供服务来收集相关数据,从而揭示读者下载什么样章、分享什么内容、对图书作何评价,以及他们是如何被影响的。这些信息无疑是出版商和作者十分感兴趣的,因此Jellybooks专门开发了出版商和作者适用的图书发现工具。2014年伦敦图书展上,Jellybooks推出了Jellyfactory。它能帮助作者和小出版社更好地将社交媒体作为提高读者发现率和促销图书的平台。该工具采用免费云平台的形式,允许作者及出版社分发书籍样章。作者的朋友、粉丝等可以在社交媒体上加关注,或通过电子邮件发送给其他联系人,还可以嵌入在各种相关网页中。其图书微件(book widget)功能允许作者、评论者和博主们免费将图书样章嵌入到他们的主页、博客或网站中,而无需考虑DRM和分享限制。这项革新将网站或博客变成了一个书架,潜在地增加了读者发现、消费和分享内容的机会。
二、读者如何阅读图书
读者发现并购买图书之后,究竟是怎样阅读图书的呢?传统上,作者和出版商对读者如何阅读图书一无所知,而电子书正在改变这一切。阅读应用(Apps)和各种电子书阅读软件可以准确记录读者的所有互动——电子书打开与关闭、翻页、阅读时间,删除图书的时间等。为了收集这些信息,Jellybooks提供了一种名为“电子书分析(Analytics for Ebooks)”的新服务。
是否可以在电子书中放置一个软件,然后作者或出版商就能源源不断地获得用户如何阅读电子书的各种数据?EPUB3恰好可以让这一设想成为可能。国际数字出版论坛(International Digital Publishing Forum,IDPF)执行董事比尔·麦考伊(Bill McCoy)说:“EPUB 3格式是全球电子书格式的下一场革新。基于HTML 5的EPUB3为作者、出版商和零售商提供许多令人振奋的新功能,包括整合先进分析解决方案的能力。” 而在Jellybooks的电子书分析项目中,最重要的组成部分就是EPUB3对Javascript(JS)的支持(见图2)。
图2 EPUB3电子书的构成
Jellybooks的电子书分析项目可以添加自定义的Javascript文件到EPUB3格式的电子书中,并使用这些脚本来收集有关用户阅读习惯的数据。数据储存在电子书内,只有当用户决定点击“提交”按钮时才会上传并仅上传至Jellybooks。该技术目前仅支持苹果公司的iBooks出版物、奥多比公司(Adobe)的数字出版物,考博公司(Kobo)的电子阅读器和电子书应用以及蒙塔诺(Montano)阅读器等。
目前,Jellybooks致力于打造一个平台,激励读者允许被跟踪来获取免费电子书和其他奖励。为解决读者和出版商双方的担忧,软件只放入特殊种类的免费电子书。读者得到免费电子书作为回报,出版商则得到数据。该平台目前还在测试过程中,当其广泛应用时就能跟踪和收集用户的阅读习惯数据,包括读者阅读时间,字号、字体的偏好,使用的设备,点击链接的情况,使用哪款App进行阅读,App打开或关闭的时间等。此外,Jellybooks也能跟踪用户在书中加入的高亮、书签,甚至能根据设备情况获得用户的GPS坐标或其他位置数据。
Jellybooks不是第一个收集这类数据的新创企业,但目前来看他们可能是这个领域最好的。在Jellybooks之前,西普泰普公司(Hiptype)也曾做过类似尝试。2012年,Hiptype还是一个炙手可热的新创企业,他们的想法是:在读者阅读时监视他们,并将信息直接传回出版商。然而由于没有主流电子书平台愿意合作,这个想法很快就土崩瓦解了。Hiptype的运作方式是通过将流数据传回服务器,从而收集读者的阅读信息,但亚马逊、巴诺和Kobo都拒绝合作,之后苹果公司关闭了Hiptype依赖的iBooks软件的安全漏洞,该平台便销声匿迹了。Jellybooks平台的结构与Hiptype不同,这决定了它可能不会像Hiptype那样短命,但它同样会引发关于安全问题的相似担忧。Jellybooks用于跟踪用户阅读的技术也可能被黑客利用,甚至用于攻击用户的移动设备。
“大数据”对于今天的出版业来说仍然还是一个有些华而不实的时髦词汇。但是,数据驱动的出版已经出现,并正处于起步阶段,它很可能会对将来出版工作的流程、业务活动、产品和价值链产生巨大影响。Jellybooks的平台及其电子书分析项目已经获得了英国创新机构“技术创新委员会”(the Technology Strategy Board)的资助,并将与国际数字出版论坛合作,继续开发和完善跟踪读者阅读电子书的工具。毫无疑问,Jellybooks的这项服务是数据驱动出版的一个新趋势。
(作者单位系武汉大学数字出版研究所)