张一鸣:定制你的掌上世界
2016-11-19米飙
米飙
2016年3月,打开今日头条客户端的用户会看到这样的页面提示:“4亿用户的选择,你关心的才是头条。”
“每一屏五条新闻中会有两三条我感兴趣的内容,就像定制的报纸一样。别的客户端新闻经常不是自己感兴趣的,得不停地翻屏找自己关心的东西,效率差。”像周帆这样的互联网从业者,浏览行业新闻是每天必做的功课,“今日头条”就是他最常用的新闻客户端,其他新闻客户端都不会把他关心的事放到首页。
凭借为用户“定制”移动报纸,早在2012 年12 月31 日时,“今日头条”的用户总量就已经接近1000万,在新浪微博的日分享信息超过10 万条。按照第三方网站App Annie 统计,在App store2012 年三季度的媒体类客户端中,“今日头条”排名第二,仅次于苹果官方的“iBooks”,超越了“腾讯新闻”“搜狐新闻”等互联网大佬。
其开发商北京字节跳动科技有限公司(以下简称“字节跳动”)创立不到一年就获得了来自海纳亚洲(SIG)以及华尔街著名经济学家、投资银行家的首轮风险投资,融资额达到500 万美元。
今年29 岁的张一鸣,就是字节跳动的创始人。
技术宅男的转型
从牛仔裤上的油渍上你很容易看出他是一个典型的技术宅男。出生于福建龙岩的张一鸣从高中时代起就酷爱计算机,2001 年进入南开大学先后就读于微电子和软件工程专业。他在大四时编写的电路板自动化加工软件PCBS 曾获得过“挑战杯”二等奖。
大学毕业后,张一鸣在一次短暂而失败的创业后进入旅游搜索网站——酷讯。作为酷讯的第一个工程师,他全面负责酷讯的搜索研发,一年后成为高级经理,最终担任技术委员会主席。2008 年张一鸣离开酷讯加入微软,终因受不了低效率的工作方式离职。
2009 年初,国内第一个微博网站饭否吸引了他,他开始担任技术合伙人,负责饭否的搜索、消息分发、热词挖掘、防作弊、用户排名等后台系统方向的工作,为社交分析储备了大量技术。
当饭否被关闭之后,海纳亚洲找上门来,希望出资由张一鸣创立一家房产信息网站,张一鸣由此创立九九房。在九九房,张一鸣开始涉足移动开发,6 个月间推出掌上租房、掌上买房等5 款移动应用,在当时的移动互联网环境下实现150 万用户,是房产类应用的第一名。
“当时觉得自己这么好的技术用在房产行业上太小了,就想做一家移动互联网公司。”张一鸣由此辞去九九房CEO 职位创立了北京字节跳动。
“给你最想看的新闻”
移动互联网的争夺是流量的争夺,而在用户的主要入口中,浏览器、搜索、输入法、社会化媒体、即时通讯工具等领域格局已经基本确定。新闻客户端是仅存的依然能诞生巨头的战场,也就成了移动互联网的下一个必争之地。
按照易观国际《2012 年上半年新闻客户端市场研究报告》,截至2012 年一季度,移动互联网的4.5 亿用户中移动阅读的活跃用户就已经达到3.45 亿。而在移动阅读使用者中,52.5% 的人经常阅读报纸类,39.8% 经常阅读资讯,新闻客户端是他们获取这两类信息的主要入口。
在张一鸣看来,同其他基础入口相比,新闻客户端用户渗透率高,无论国内外,基本是App 第一应用;使用频率高,用户甚至只有半分钟空闲时间都会打开;留存度高,某款游戏会玩腻了,但资讯是长期需要,不会删除的;有很高的可附加性,可以附加商业信息、生活信息、广告,相比之下,闹钟等应用虽然常用、留存度高但是没有可附加性。
“今日头条”新闻的有效性是其特点,哪怕只能用半分钟等候电梯、只能打开客户端首页也能找到自己感兴趣的新闻,而且同一天不同时间打开首页新闻都会各不相同。“我们只给你最想看的新闻,而不是那些你不关心的新闻。”
相比于新闻客户端,张一鸣更愿意把“今日头条”称为是兴趣媒体。当搜狐、网易等新闻客户端将门户新闻直接搬到手机上,推送给用户千篇一律的新闻时,“今日头条”会甄别用户的独特需求,只推送那些单个用户感兴趣的新闻。“网站上都会讲奥巴马如何如何,实际上用户更感兴趣的可能是自己家门口的地铁站发生了哪些事情。”
“定制”你喜欢的
“今日头条”这份移动报纸的“定制”可不是通过人工编辑出来的,而是通过一整套机器算法的资讯流水线来实现的。“本质上我们跟搜狐新闻、网易新闻是两码事,他们更像是门户新闻网站在移动端的延伸,更偏向于用传统的方式做媒体,而我们是以技术实现一切,没有人工编辑。”张一鸣说。
“定制”的基础是基于对用户社交兴趣的数据挖掘。当用户用新浪微博账号初次登录“今日头条”时,他的兴趣和阅读偏好在5 秒之内被分析出来,最感兴趣的新闻随即被推送到眼前。此后,随着他在“今日头条”页面每一次的点击阅读、顶、踩、评论等阅读动作,他的兴趣被更精准地分析出来,变得越来越懂他。“今日头条”不需要用户自己思考“我喜欢什么”,而是主动去理解用户“你的喜欢”。
对于“你的喜欢”的判断来自三个层次:大家都喜欢的新闻(即通常意义的社会热点)、兴趣相近的好友喜欢的新闻和你会喜欢的新闻。而对于每条新闻评论的排序也很酷,优先展示社交好友的评论,其次是社交网络的意见领袖,而不是那些不加筛选的路人甲的评论。
“定制”背后的技术壁垒颇为复杂。来自于酷讯的搜索技术、来自于饭否的社交分析技术、来自于九九房的移动互联网技术被张一鸣结合在了“今日头条”之中。
技术三部曲
用户分析、搜索、推荐是“今日头条”的技术三部曲。用户分析的背后是大规模的数据挖掘和机器学习。“常见的用户类型分析是手机型号,还有就是位置,在哪个城市。但是这个分析维度太低了。”张一鸣基于社交数据和用户行为挖掘将人分为上万个纬度,建立不同的模型。“这样我们可以发现你历史上的所有行为是‘小清新+ 科技还是‘三俗+ 古典。你最近从宅男变潮了,我们也会发现。我们都需要及时地进行大量的运算。”张一鸣笑着说。这些用户分析模型和维度也是由计算机自动搭建和计算的。基于社交数据和用户行为挖掘技术来实现产品的公司,目前在国外做得比较好的有Zite、Prismatic等公司。
“在搜索技术上,国内具有独立研发搜索引擎的公司并不多,不超过5 家。”在搜索引擎浸淫多年的张一鸣说。同时,手机搜索同互联网搜索相比有着不同的特点。通常用户常常对使用电脑搜索精度要求不高,每页20 条,结果不满意就翻页。而在使用手机时,由于时间短暂就要求高效,三条之内必须有一个有用的结果。信息分析精度要求大大提高,需要尽量提取网页内容正文,去除网页冗余信息,甄别同一内容不同主题的文章,去掉重复。
在信息推荐上,使用互联网搜索引擎时,不同用户搜同一关键词的展示结果一样。而“今日头条”则是每个用户的每次请求都会更新。“这导致计算量很大,用户一个小时前浏览了哪些内容,在一小时后的搜索中就要考虑进去,并呈现出不同的结果。”张一鸣说。
在新闻中会插入大量的图片和视频等多媒体信息,相应会需要强大的多媒体搜索、去重技术。这是字节跳动的另一强项。“国内拥有多媒体处理技术的公司少于三家,已发布产品的只有两家。同一个人同一个场景稍微动一下,对机器而言就意味着完全不同的图片,怎么识别、去重很难。”张一鸣很是自豪,字节跳动的图片检索精度能够达到98% 以上。
潜在的巨大市场
从机器识别的角度看,张一鸣把信息归纳为五种,短文本、长文本、图片、视频和结构化信息(例如商品,对它的描述需要同时包括文本、图片等多维度信息)。实际上,张一鸣通过“今日头条”搭建的并非只是一个新闻客户端,而是一个可以全面处理这五种信息的“用户分析+ 搜索+ 推荐”的技术平台。
字节跳动已经基本完成了这五种信息处理的技术储备,并开始用产品的形态呈现出来。除去“今日头条”之外,字节跳动旗下还有“内涵段子”“搞笑囧图”“内涵漫画”“好看图片”“今晚必看视频”等12 款应用。总体表现不俗,其中的“内涵段子”在娱乐类排名一度超过唱吧。
截至2015年5月,与今日头条合作的各类媒体、机构总计约5000家,其中签约合作的传统媒体近千家,包括新华社、人民网、环球网、京华时报、新京报、参考消息、第一财经日报、北京商报网、广州日报、法制晚报、财经网、VOGUE时尚网、南都娱乐周刊等。
“这个平台无所谓搭载什么信息都可以。将来商业信息、生活信息、折扣信息都可以搭载。这会是一个商业价值介于门户和搜索之间的巨大市场。”张一鸣的野心不小,他相信当“定制”折扣、“定制”吃货等一系列定制信息出现时,一个巨大的商业市场由此呈现。