豪伊报告(一)
2014-07-16练小川
练小川
传统出版,自费出版,哪个途径更有利?凭自费出版科幻小说《羊毛》成名的休·豪伊,一直在宣传一个理念:自费出版为作者提供的机会并不逊于传统出版。他认为,自费出版的成功代表,不是休·豪伊和阿曼达·霍金这些收入百万的作者,而是那些从自费出版每月收入几十元、几百元的普通作者。这些人以写作为乐,自费出版给了他们一个赚钱的机会。如果自费出版的收入能买几杯星巴克咖啡,或支付一个月的电费,或偿还一个月的房贷,这就是自费出版的成功。豪伊一直在收集这些普通人自费出版的成功故事,希望积少成多,引起媒体注意。他开辟了一个网络论坛,鼓励自费出版作者自报每月的销售收入,上千人在论坛上分享了各自的销售数据。但是这些零散的事例缺乏振聋发聩的效果。
2月初的一天,豪伊收到一份电子邮件,来自一位自费出版作者。此人精通统计,擅长编码。他写了一个软件程序(网络蜘蛛),可以进入网络书店抓取数据,就像谷歌的软件进入各个网站抓取数据,建立网站索引一样。他给豪伊看了一些蜘蛛从亚马逊电子书店收集的数据。豪伊大喜过望,这些正是他苦苦寻觅、能够为自费出版正名的数据。此人邀请豪伊合伙,豪伊称他为“数据先生”。
数据先生的蜘蛛神通广大,能够扫描网络书店每一本书的网页,从HTML文本中抓取书名、作者、版式、定价、出版社等信息。这些数据并非商业秘密,任何人可以去收集。但是,依靠人工到每一个网页去查看、记录、汇总和整理这些数据,费时费力,迄今无人尝试,而数据先生编写的蜘蛛程序,一天可以完成数百人一周的工作量。
除了书名、作者、价格、书评星级和出版商信息,蜘蛛也抓取一本书在亚马逊电子书店的销售排名,包括总排名和各个图书类别及所有子类别的排名。拿到这些信息后,蜘蛛将每一本书按其销售总排名的顺序,制成一个总表。
销售总排名很重要。有了总排名,就可以根据名次等级来推算销售册数和金额。亚马逊、巴诺、苹果等网络书店从不公布销售数据,但是每个作者能在网络书店上随时看到自己图书的销售情况。许多自费出版作者包括豪伊和数据先生一直都在记录自己的图书在亚马逊书店里每天的排名和相应的销售册数。例如一位名叫特里莎·拉根(Theresa Ragan)的作者,2011年开始自费出版,两年时间里销售超过55万册。她根据自己图书在亚马逊网站上的销售排名和每个档次相应的销售册数,整理出一个表格,放在她的网站上,供其他作者参考。一个作者可能想知道,一本书卖多少册才能在亚马逊电子书店排名第一。根据拉根的经验,每天销售4000册以上,排名可以进入第一至第五。排名350至500,每天的销售是175册至250册。在一个名为“Kindle销售排名计算器”的网站上,用户输入一个名次,便可知道大概的销售册数。例如,排名50000,一天销售一册,排名500,一天销售100册至300册,排名第一,每天销售3500册以上。
数据先生的蜘蛛软件,也用类似的方法来推测一本书的销售册数和金额。蜘蛛的推算标准根据几十个作者(包括豪伊和数据先生)的销售数据综合而成:排名第一,日销售7000册;排名第五,日销售4000册;排名第五万,日销售5册;等等。豪伊解释,根据排名推算出来的销售册数仅用来确定相对的市场份额和理论上的销售潜力,每一个排名级别的实际销售册数并不重要,他们看的是传统出版图书与自费出版图书的百分比。改变一个排名档次的销售册数,比如将排名第一的日销售从7000册(豪伊的标准)改为4000册(特里莎·拉根的标准),并不会改变传统出版图书与自费出版图书市场份额的比例,因为所有图书(自费出版和传统出版)的销售册数都受到同样影响。
1月29日,数据先生交给蜘蛛一项任务,进入亚马逊电子书店里三个畅销书榜,搜爬排名7000以内的图书。这三个畅销书排行榜是惊悚小说、科幻小说和爱情小说。蜘蛛在搜爬亚马逊的总畅销书排行榜时,发现这三个类别的电子书在畅销书前100名中占70%,在畅销书前1000名中占57%,显然,这三类是读者最喜欢的图书。所以,数据先生决定比较这三个畅销书榜里传统出版和自费出版的情况,看看蜘蛛能找到什么答案。
这些书的出版者分为五类:一是作者本人(独立出版),二是中小型出版社(这类图书里面也有许多自费出版的书,但作者使用一个公司的名字,而不用个人名字),三是亚马逊出版社(亚马逊旗下现有15家出版社),四是美国五大出版集团。有些书出版者不清楚,单独列入“未归类的图书”(这类书可能是自费出版,或来自小型出版社)。搜爬这7000种书,蜘蛛忙了整整一天。
豪伊与几家著名媒体联系,希望在他们的网站上发表这些数据,但媒体们以种种理由拒绝了。有的称数据庞杂,不便刊登;有的称数据不实,不宜刊登。豪伊认为,他们的数据和结论对传统出版不利,媒体们不愿得罪五大出版集团。
于是,豪伊和数据先生自己建立了一个网站(http://authorearnings.com/),公布他们的数据和结论。2014年2月12日,豪伊和数据先生发表了第一份分析报告:《亚马逊7000报告》,三天内,49035人蜂拥而来,导致网站暂时瘫痪。
豪伊首先说明《亚马逊7000报告》的局限:①数据仅来自亚马逊电子书店的电子书,但亚马逊是全球最大的网络书店,电子书销售量最大,任何网络销售分析,都不能忽略亚马逊。②数据只包括惊悚小说、科幻小说和爱情小说这三个类别里最畅销的7000种书,不过这些全是付费图书,不含免费书。③报告只含一天的数据。最理想的方法,是让蜘蛛连续收集一周或一月的数据,但是这个工作量巨大,不现实。豪伊和数据先生进一步假设,亚马逊书店里,自费出版图书与传统出版图书的比例每天不会发生巨大的变化,这样,随机地收集一个月里某一天的数据,乘上30或360,可以代表一个月或一年的大致状况。
下面是《亚马逊7000报告》的主要数据和结论。
1.图书的来源
在亚马逊电子书店最畅销的7000种类型小说中,35%由作者自费出版,超过了来自五大出版集团的品种(28%)。自费出版界一直流传一条经验:“找准图书类别,在正确的图书类别里写书。”上面的数据证实了这个建议。
2.销售册数
销售册数透露了几个有趣的现象:第一,亚马逊对本版的图书有令人难以置信的营销能力。从这个表格和前面的表格可以看到,来自亚马逊出版社的品种只占4%,这些书的销售册数却占市场总销售额的15%,几乎是市场平均销售册数的4倍。第二,虽然五大出版集团也有庞大的营销队伍和显赫的品牌,他们每本书的销售册数却很一般,仅为市场平均销售册数的1.2倍。第三,自费出版的销售册数占市场总额的39%,超过五大出版集团销售册数和总合(34%),这个数字令人惊讶。
3.销售总额
虽然五大出版集团的销售册数只占34%,但是这些图书的销售额却占了总销售额一半(52%)。这并不奇怪,因为7000种书里,五大出版集团的电子书平均定价最高(见图1)。
4.作者收入
虽然五大出版集团的电子书总销售额高于自费出版电子书总销售额,自费出版作者的收入份额(47%)却高于五大出版集团作者的收入份额(32%)。图2透露了其中的原因:
我们可以清楚地看到,在五大出版集团的电子书收入分配上,出版商的收入超过作者收入的两倍。相反,虽然自费出版电子书的销售只占总销售收入的24%,但是作为一个群体,自费出版作者的收入比传统出版的同行多出一半以上。
原因是:五大出版集团支付给作者的版税是出版商净收入的25%,而自费出版作者的收入是电子书定价的70% 。
这个图还反映出另一个令人深思的事实,从三大畅销类型小说来看,亚马逊从自费出版作者赚的钱与从五大出版集团赚的钱几乎相当,可见自费出版业务对亚马逊的重要。
这里分析的是1月29日这一天,在全球最大的电子书店亚马逊上,最畅销的三个图书类别里前7000种图书里,最畅销的自费出版图书与最畅销的传统出版图书的比较。这只是豪伊和数据先生利用网络蜘蛛做的第一个分析。接下来,豪伊和数据先生要让蜘蛛去收集亚马逊电子书店所有图书类别的数据,也会去其他网络书店收集数据,做类似的分析。豪伊希望,他们的分析为出版业带来更多的透明度,帮助作者在传统出版与自费出版之间做出明智选择。
豪伊和数据先生将蜘蛛抓取的所有原始数据存放在网站上,供大家无偿使用,任何作者和出版社都可以去分析这些数据,得出自己的结论。豪伊和数据先生尤其鼓励反对者去分析这些数据,挑战《亚马逊7000报告》得出的结论。
(本文作者系纽约佩斯大学出版系兼职教授,本刊特约撰稿人)