“世界3 ”:重新发现媒体
2015-09-10陈浩
陈浩
在Hiscene的CEO廖春元看来,之所以愿意为《二十一世纪商业评论》(下称《21CBR》)这家商业杂志做“世界3”(一款图像识别并交互的APP),最重要的原因,是想扩大“图像识别和增强现实”的生态圈。
所以,“世界3”不是《21CBR》委托Hiscene做的,不是外包的关系,它是一个“共建型”产品。
“世界3”也是传统媒体第一次用“物联阅读”的思维来重新定义阅读空间和新闻生产流程。它的推出,对于有点衰颓的传媒业来说,是一个真正的亮点。
唐学鹏是“世界3”的缘起者,当他在2013年成为《二十一世纪商业评论》执行主编的时候,整个纸媒市场甚至包含电视广播等媒介市场发生了重大的变化。传统媒体广告市场高速下滑,大家都通过移动端来阅读新闻和看电视,最活跃最有消费价值的家庭不打开电视机。对于杂志而言,无论是一线还是二线杂志,渠道价值都被“拉平”了,广告推销人员如果出去说“发行和销量如何如何厉害”,立即会遭到耻笑。微博以及微信的订阅号和朋友圈分享成为最主要的阅读来源。传统媒体尽管猛推自己的数字报APP,但没什么人下载,数字报APP唯一的意义就是很轻松地分享到微信朋友圈里面,不过随着Html5的成熟,这一点残余的价值也变得可疑起来。
唐学鹏说:“渠道被斩断了,意味着原来的商业模式全都改了。媒体不再是靠硬广模式,靠影响力支持起的‘平台必投’模式,因为根本无法讲清楚哪些读者看你的东西,或者你的东西在纸质上看比在微信上看有更大的优势。”更可怕的是,如果一家纸媒觉得可以不上网或者封闭且付费阅读,那么立即陷入纽约时报的窘境,“没人再关心你的报道、你的趣味、你的死活”。
媒体赖以生存的几种方式——硬广、活动、融资、负面,无一不遭遇挑战。以浙报集团为代表的“不务正业”,比如收购手游,或者直接办培训班,则是目前最热门也最存疑的探索。
唐是这样思考的:移动互联网的碎片式阅读是不可能推翻的。比如现在大部分阅读都来自微信朋友圈,“朋友的推荐、自己的分享”,于是“传统媒体里面的不同文章其实被分解掉了,比如金融版的文章会在银行人士朋友圈流传,仅此而已,没人会关心TMT行业新闻”。
也就是说,现实世界是有行业的,是有圈层的,因此,体现在微信所主导的阅读流里面,就是有圈层的。那么,如何设置这种圈层标识呢?
2011年,唐学鹏受邀参加了艺术家渠岩的“许村计划”,认识了渠蒙,渠蒙向他展示了一个新玩意:现实增强。渠蒙的现实增强是做在自己名片上面的,用APP扫描名片,名片中间会“长”出来一个3D小人,这个3D小人作为虚拟人格,向观者介绍“自己是渠蒙,有怎样的性格”等信息。
这其实是很简单的技术。但这一幕给唐带来了启发,因为它融合了三项内容:一个是图像识别,即APP通过识别名片来“激发”出背后的程序,出现3D小人,3D小人的自我介绍则是现实增强(对名片的内容做了补充),但同时它也提供了虚拟现实(塑造出一个虚拟的人格体)。仅仅在一年前,唐非常沉迷于Second Life(第二人生)——世界上最大的虚拟社区,它的运作方式跟真实世界是一样的。玩家会在里面生成自己的虚拟人像,要买房、要吃饭、要找女朋友、要开车,里面有社交关系(跟其他玩家在虚拟社区里面搭讪)、有货币体系、有爆炒的房地产……里面的货币叫林登币,可以直接兑换美元,这个游戏平台是由林登实验室开发。
唐对记者说:“我突然明白了关键所在。Second Life提供了一个极端参照,人们将生活完全投射化、完全虚拟化,完全是一种镜像,这是有意义的,但这是不对的,就像人们永远在网络空间阅读一样,实际上,最重要的生活应该是现实增强,被现实的某个部分激发,然后网络提供信息流,加强对该现实的理解,从而完成一种必需的、依赖互联网方式的切换。这种切换是在帮助现实生活,而不是沉湎于虚拟世界。”
唐认为,未来的资讯获得模式,不应该仅仅是进入一个线上社区,无论是微博、微信、今日头条或者某媒体的APP,它应该是一个跟现实场景和现实事物“互动”的过程,本质上,它应该是现实增强,而不是虚拟现实,它不是要求将人沉浸到虚拟网络之中,而是看到现实的事物用网络来帮助它去了解。“摄像头是最好的入口,”唐说,“它就像眼睛一样,识别,然后调动知识、记忆或者精神能力,只不过它的调用资源来自互联网,来自机器未来的深度学习。”
于是,在唐的“重构媒体渠道”的计划里面,将资讯“做进”物体里面,用物体来作为天然的分类标签,是最好不过的。比如要看当天精心编辑过的金融新闻,打开研发的“图像识别+现实增强”的APP去扫描一下百元人民币就可以了,出来的结果可以是一屏的新闻列表,可以是当天最热的一款理财产品的购买,也可以是一段最及时的金融分析师视频……
这样,纸媒可以丢掉印刷,同时也可以丢掉数字报,它变成一个更加开放的产品:有资讯、有服务、有电商……而获得的方式是“所遇即所得”。
基本上,它已经描述了“世界3”的全部气味。尽管,“世界3”这时还没有诞生。
廖春元是一个技术大牛。
廖春元领导的Hiscene是中国最著名的图像识别和增强现实公司之一。廖是云南人,高中参加全国物理奥赛并获奖,直接被录取进入清华大学计算机系,读至硕士。随后出国到世界计算机视觉和人机交互发源地之一的美国马里兰大学深造,获博士学位,毕业后任职于富士施乐硅谷研究院,4年内3次获得年度杰出成就奖。Hiscene首席科学家凌海滨,最近在国际上最权威的跟踪算法评测(CVPR 2013 BenchMark)中获得了全球第一的成绩,目标跟踪成功率达到76.8%,显著超越了之前由欧洲研究者实现的73.2%。
2012年廖回国和中学同学唐荣兴一起成立Hiscene,他对记者说:“我一直觉得实现人机交互更自然更简单,是人类最重要的方向。”他向记者举例说,最早的人机交互方式是打孔,那个时候能玩这个的算是超级极客。随后电脑有了键盘,有了命令行,方便了很多,超级极客的人群扩展到一般的技术人员。随着鼠标的发明,通过点击桌面图标的方式来实施人机互动,技术人员扩展到了大众。电脑PC过渡到手机,最早的方式还是鼠标式的,手写笔大行其道,多普达是典型的例子。戳来戳去,在小屏上很不舒服。iPhone的出现让手指取代手写笔,触取代了戳,连小孩子都会的触摸基本动作变成流畅的操作方式。乔布斯带来的“革命”前所未有扩展了人机互动的范围,以及前所未有地降低了人机互动的操作门槛。
那么接下去呢?“比触摸更原始更简单的动作是说(语音识别)、是看(图像识别),这是真正的入口级动作。”廖告诉记者。
实际上,很多大佬都形成共识,比如凯文.凯利就认为“图像识别和现实增强”的结合,是未来一个重要的创新方向。百度创始人李彦宏在一次采访中明确讲到,百度的未来是语音和图像搜索,很快这个比例要达到50%,输入关键字搜索的比重将不断下降。百度为此特别开发了战略级产品BaiduEye,即通过拍照方式进行图片内容搜索(图像识别),比如拍下家具、工艺品、花等,来了解该物件的具体信息(搜索匹配)。
毫无疑问,廖的方向没有问题,但是“图像识别(搜索匹配)”+“现实增强”的最大问题在于,它跑得太快了,方方面面的条件还没有完全成立,从而使得这一动作还不能立即成为“入口”。
一个现实的原因是无线端的网速,按理说,这个问题会在发展中解决,图像识别并与搜索匹配,是需要消耗大量带宽资源的,而现实增强也靠云推送来“推”效果,但现在大多数用户还在为流量费而计较。
另外一个原因是用户习惯的培养。图像识别跟二维码不同之处在于,尽管后者很落后,但它是一个码,意味着它是可“扫”的,而图像识别对应的物体或者图片,处于一种“我不知道是不是可扫描”的状态,从而产生不了普遍的用户行为。
所以,廖的策略是,先尽量推进应用场景的建设,以输出技术和服务为主,从2B市场切入,暂时缓一缓2C市场,先面向有需求的企业客户提供解决方案。Hiscene具备可扩展的云平台技术架构,以Hiscene移动图像搜索云平台为核心,提供APP、插件、微信接口等多种形式的即时搜索服务,支持在千万级以上数据中快速、精准识别,同时支持大容量离线识别。廖的业务跟BaiduEye是有重叠的,但是91助手依然将Hiscene作为合作伙伴,将扫描“某APP的logo图片,即可当场下载”的业务需求交由Hiscene来做,要知道91的股东是百度,由此可见Hiscene的超强实力。
当唐学鹏找上门来,廖完整听了唐的想法之后,认可唐的想法,也觉得这符合自己“构筑场景生态”的策略,从而,“世界3”就被列上了开发日程。
“世界3”的命名是理解它的钥匙。
唐学鹏最喜欢的哲学家是哈耶克、波普尔和伽达默尔。唐说:“哲学家波普尔发表过一篇论文,很多人并不特别在意,名字叫做《没有认识主体的认识论》,文章中提到了‘世界3’的概念。”
波普尔将世界分成3个层次,一个是马克思特别推崇的物质世界,即世界1;一个是黑格尔特别推崇的精神世界,即世界2;还有一个就是思想的客体内容的世界,尤其是科学思想、诗的思想和艺术的世界,就是靠谱的主观世界,即世界3。打个比方,一件雕塑作品,它的质料属于世界1,而形式则属于世界3。按照马克思的观点,世界2是世界1长期发展的产物,主观反映客观,并且具有能动性,实践是检验真理的标准,世界1会不断修正世界2,而世界3则作为世界2中最靠谱的部分,在修正过程中不断被提炼出来,形成各种规律的认知,甚至是先验的存在。打个比方说,像书本啊,胶片啊,图书馆的东西啊,都是世界3。可以假想,有一天人类毁灭,一个不剩,但图书馆还在,外星智慧可以通过破解图书馆里面的内容来客观地了解当时人类的文明程度。世界3存在于主观,但又是客观靠谱的,它不能直接和世界1发生关系,必须通过世界2来作用于世界1。
唐认为,这是对“图像识别+现实增强”最漂亮的哲学概括,“完美得如同一个女人找到了合适她的男人”。
而且“世界3”也刻画了它的属性,它是走“传播”路子,而不是“搜索”。无论是百度的baiduEye还是Hiscene,其主要的方向还是图像搜索,唐用了一个并不令人愉快的比喻,“可以回到我们的中学数学课本,数学里面最常见的两种关系,一种叫‘求解’,一种叫‘映射’:X=Y,这是求解,看到一张图片,比如方便面,一扫描上面的残缺图片,得出是‘统一牌方便面’,这叫‘求解’,是X=Y;还有一种关系叫‘映射’,f(x)→y,一扫描方便面图片,关联的是一个经过我们纸媒人精选的关于方便面行业的视频报道,或者附近的快餐资讯速递,供扫描者选择。它的核心含义是,不是为了知道该方便面是什么牌子,而是通过感知扫描方便面的行为,来做人性化的映射关系。”
世界3牢固地确立了“图像识别”和“现实增强”之间的联络:“映射”。
不过,唐很快遇到和廖相似的问题:如何推广世界3?如何变成实在的应用场景?如何找到靠谱的商业模式?
唐说:“我们展示给好多个杂志的客户看,他们都非常感兴趣,我们也做成了几个案例,比如将很多国家货币作为识别点,来推某家金融客户的理财产品。”坦率地说,唐和他的团队还没有兴起燎原之势,“很多客户会问,一个用户下载这个APP的成本是多大?当我们提出嵌入到客户自己的无线端产品中,他们又叶公好龙式犹豫了。这还是用户习惯没得到培养的问题”。
不过,在普通用户这边,唐找到了更多快乐,“我们一些活跃用户,他们就像玩游戏一样创造这个APP的新玩法”。比如,肉体发行项目、关于金钱的赛博人宣言、146种可能生活以及识别万有引力之虹,等等。
所谓“肉体发行”,就是对一些街头小年轻人的文身做“识别定义”,用世界3扫描它们,将会获得《21CBR》最新一期的封面报道,发行不再是纸质,而变成了一种古惑仔的携带,携带的居然是商务人士感兴趣的内容,这构成了一种奇特的反差关系,近乎当代艺术的工作方法论。
而“关于金钱的赛博人宣言”和“146种可能的生活”及“识别万有引力之虹”等,都是发挥了互联网的大链接精神,比如每个人可以将自己对金钱的看法做成小视频,然后用世界3将它和某个货币进行“关联”;“146种可能的生活”是针对媒体人或者金融人士常用的146个品牌,这146相当于“包围了他们的生活”,“先搜入这些品牌的图片,列入一个图片库,对这些图片识别定义——对这些图片进行关联,比如关联当天的新闻、当天的段子、当天最有趣的视频以及当天最优惠的券券。都是云推送云替换。”唐告诉记者,“做世界3最大的乐趣是,看到自己看重的、很有趣的朋友玩得很嗨。”
当记者逼问:“如果没有强劲的效应,媒体圈好像很多人并不觉得这是个事。不觉得物联式阅读能够帮助媒体转型。”唐笑了笑,打了个哈欠,站起来,打开了音响,传出黄舒骏的歌曲《未来的街头》——
“孩子,我在未来的街头等你”。