勾正数据:藏在智能电视里看你
2021-05-20封聪颖
南方周末记者 封聪颖
你在看智能电视的时候,智能电视也在观察你的一举一动。
视觉中国 ❘图
★2021年5月下旬,勾正更新了用户隐私政策,收集的数据类型从21项减少至16项。“公司的梦想是把智能设备的所有数据都连接起来。”据勾正介绍,CHMP基于勾正1.38亿台智能大屏设备,可连接其他智能设备数量已突破5亿台。
2021年4月23日,一篇题为“我家电视机正在监视所有联网设备”的帖子在技术论坛v2ex曝光。
网友“v64500”发帖称,创维电视的后台运行着一项“勾正数据服务”,其通过“抓包”分析后发现,该服务每隔10分钟扫描一遍家中的联网设备,抓取设备的定位信息、主机名等,并将数据上传到一个叫gz-data.com的域名。
gz-data.com是北京市勾正数据科技有限公司(下称“勾正”)的官网。官网显示,勾正是一家致力于家庭数据智能营销的第三方大数据公司。
帖子引起了公众对于个人信息被违规收集的质疑。4天后,创维发表声明称,已禁用“勾正数据服务”APK(Android应用程序包)。当晚,勾正亦公开回应,强调用户可以自行禁用APK,但承认公司的用户隐私政策提示不够清晰。
创维在声明中称,“勾正数据服务”是子公司酷开科技与勾正的合作内容,事发后双方已解除业务合作关系。公开信息显示,双方的合作始于2014年,酷开科技于2018年11月入股勾正,目前持股2.5%。
勾正此前在对外宣传中表示,除了创维,公司还与TCL、长虹、康佳、风行、微鲸/电视猫、三洋、东芝、飞利浦等厂商建立了长期战略合作关系,通过在智能电视中安装SDK(软件开发工具包),采集一手的用户行为数据。
超范围收集数据?
据勾正披露,截至2020年第一季度,勾正已联合拥有智能电视终端超过1.38亿台,覆盖1.49亿家庭。
“通常来说,第三方数据商安装SDK要在智能电视出厂前完成,这意味着必须获得电视机厂商的授权。”流量资本合伙人吴俊对南方周末记者说。吴俊著有《程序化广告实战》等书籍,拥有二十多年在广告、技术一线的行业经验。
根据创维的声明,酷开科技与勾正的合作内容仅限于以抽样调查国内收视情况为目的的必要的数据采集。“其他任何超出此范围的行为,均未得到本公司的许可及授权。”
家电行业分析师梁振鹏向南方周末记者表示,电视机厂商让第三方数据公司采集数据的用途通常有两种:一种是用于硬件服务,比如通过开机率了解用户更喜欢旗下哪一款的电视机,做销售规划;另一种是广告投放,因为不同节目、时段等收视率的高低会影响广告价位。
此外,电视机厂商也会直接向第三方数据公司购买数据。
一位在TCL旗下雷鸟科技做OTT运营的员工告诉南方周末记者,公司每年会向奥维云网等大数据公司付费购买数据报告,获得包括OTT用户数量、年龄结构、地区结构等行业宏观数据,用于会员业务方向分析。在国内,OTT常被简单地理解为智能电视或互联网电视。
奥维云网(831101)是目前业内规模最大的智能电视第三方大数据平台。根据奥维云网此前发布的公告,2014年、2015年和2016年,创维电视向其分别购买了440万元、370万元和298万元的数据挖掘分析服务等。
梁振鹏认为,勾正数据的问题在于过度收集数据,例如用户家中其他智能终端的数量、设备名称等,此类数据与上述家电厂商授权的用途并无直接关系。
据网友“v64500”曝光,勾正每隔10分钟扫描一遍家中的联网设备,抓取设备的hostname、mac和ip,以及探测周围WiFi SSID(WiFi的名字)和mac。
这些联网设备的数据能反映丰富的信息。一位在互联网公司从事用户端开发的工程师向南方周末记者解释,hostname是主机名,一般情况下会带上用户信息;mac和ip,则是与位置有关的信息。
事实上,勾正官网公布的用户隐私政策显示,公司收集的用户信息多达21项,除了网友“v64500”曝光的,还包括定位信息、设备名称、电视当前信号来源、当前联网WiFi名称等。
2021年5月12日,南方周末记者联系了勾正。对方表示,勾正采集数据的行为是合法合规的,且采集数据的用处对于公众也是比较有利的。
南方周末记者留意到,2021年5月下旬,勾正更新了用户隐私政策,收集的数据类型从21项减少至16项。此外,“用途和目的”一项中增加了“过滤与用户无关的广告信息”的内容。
此前,各类手机App侵犯用户隐私的事例也屡被媒体曝光。
2021年5月1日,国家网信办通报,搜狗输入法、讯飞输入法、高德地图、百度地图等33款App违法违规收集使用个人信息。这些App存在的主要问题均为“违反必要原则,收集与其提供的服务无关的个人信息”。
与电视厂商关系暧昧
互联网电视的兴起,催生了勾正这类以家庭数据为核心的第三方大数据公司。
2005年,盛大公司发布盒子产品“宽带娱乐电脑”,提出“网络内容的电视化”的概念。盛大的盒子业务被广电总局叫停后,传统电视机厂商偷偷登场,在电视机里内置互联网上的内容。
直到2009年国家广电总局采取牌照管理制,互联网电视的发展才走上正轨。2014年,广电总局出台互联网电视181号文,进一步细化牌照制度和内容管控的规定。
与此同时,大数据成为新趋势。2014年,大数据的概念首次被写入政府工作报告。2015年,国务院颁布《促进大数据发展行动纲要》,明确表示要全面推进大数据发展和应用。
勾正是在上述背景中发展起来的。在古代,“勾”是10的32次方,“正”是10的40次方。据勾正介绍,公司名取自“勾正”,意为拥有海量数据。官网显示,勾正成立于2014年5月,整合家庭大数据全域资源,面向客户提供个性化、定制化研究和产品服务。
当时,奥维云网正在酝酿上市。2014年8月,奥维云网在新三板挂牌,次年11月,收购勾正20%的股权,成为其第二大股东。
奥维云网成立于2011年,最初的主营业务是为家电生产商及经销商提供专业咨询服务,由此拥有丰富的家电厂商的资源。2013年,奥维云网的前五大客户为TCL、松下电视、LG、康佳和联想移动通信科技有限公司。
2016年9月,原创维集团总裁杨东文的妻子李婷认购奥维云网600万股,成为公司的第一大股东。次年8月,李婷与奥维云网创始人之一文建平通过签订一致行动协议的方式收购奥维云网,并取得上市公司实际控制权。
奥维云网的控股股东发生变化后,勾正开始脱离上市公司。
2016年12月30日,奥维云网公告称,勾正将改由员工持股平台进行控股(奥维股份占比下降为6.32%)并自主决定公司发展。
勾正在官方公众号上将此称为“单飞”。当时勾正的实力已不弱,截至2016年10月,勾正已拥有智能电视终端超过1100万台,数据覆盖2000+电视频道,地区覆盖全部地级市。2017年12月,奥维云网将所持有的勾正6.32%股权,以605万元全部转让出去。
值得注意的是,奥维云网创始人之一喻亮星也开始从上市公司淡出,逐渐成为勾正的掌门人。
2017年3月,奥维云网董事会换届后,喻亮星卸任董事长和法定代表人,自此不在上市公司担任职务。到2020年年末,喻亮星在奥维云网的股权比例已减少至3.59%。
天眼查显示,目前北京智信云商科技合伙企业(有限合伙)是勾正第一大股东,持股45.85%。智信云商由喻亮星持股44.77%,喻亮星为勾正实际控制人。
此外,两家有电视机厂商背景的公司——酷开科技和欢网科技同为勾正的股东,分别持股2.5%和5%。酷开科技是创维旗下负责智能电视系统运营的技术平台,由创维控股;欢网科技的股东包括TCL、长虹、腾讯等。
连接智能设备所有数据
勾正实际控制人、董事长喻亮星曾在2017年3月接受流媒体网专访时表示,“公司的梦想是把智能设备的所有数据都连接起来。”
从技术上看,由于智能电视大屏拥有联网属性,因此也能够与移动端、其他联网设备之间实现信号打通、数据打通。“一个设备接入Wifi的时候,会跟所有设备说一声hi,我是xxx,我的ip是xxx(未定义),你们要给我分配地址吗?”上述工程师解释。
2019年1月,勾正广告和媒体事业部副总经理陈正轩在2018中国OTT行业发展峰会上表示,勾正已经实现家庭大屏收视测量由“端”向“人”转变,即通过WiFi不断探测电视机周边有哪些手机,通过个人设备的标签反馈给勾正OTT。
出于对精准营销的重视,OTT市场也有对跨屏监测的需求。知名趋势营销专家、知萌咨询机构创始人肖明超告诉南方周末记者,未来OTT作为家庭数据的中台,可以根据用户行为习惯对家庭的消费场景和需求进行洞察。例如,根据用户的购买行为,描绘出完善的家庭消费需求链,把营销变成内容和服务。此外,还可以整合智能家居的行为。
因此,近年来打通大屏和小屏数据已成为业内各家公司发力的方向。
譬如,奥维云网宣称已汇聚移动端小屏数据和线下消费数据,与自有的家庭大屏数据相匹配,从而为智能电视广告精准投放提供全流程大数据支持。
勾正亦有类似的服务。官网显示,勾正CHMP家庭数据营销管理平台是为广告主提供的跨屏解决方案。在家庭场景下,勾正将与电视相通的所有设备建立同源关系,生成家庭及成员唯一的识别ID。
据勾正介绍,CHMP基于勾正1.38亿台智能大屏设备,可连接其他智能设备数量已突破5亿台。
陈正轩在上述峰会上还表示,CHMP通过跨屏同源设备唯一标识体系,能精准锁定正在收看大屏广告消费者的移动端设备ID,并提供给广告主,追踪其后续在移动端的一系列行为路径,如是否产生浏览行为或购买行为,实现广告投放效果验证。
要把用户的消费者特性准确描绘出来,勾正也需要借助外部数据库。《中国家电巨子访谈录》一书作者段传敏向南方周末记者解释,打通跨屏数据,从技术上看不难实现,但还需要有一个相互许可的动作。
据勾正公众号介绍,勾正已与京东黑珑、CTR、尼尔森、Talking Data等数据公司开展合作。其中,黑珑是京东商城开放营销平台,拥有京东商城全量数据。Talking Data则是第三方数据智能服务商,数据来自日活7.5亿台移动设备。
南方周末记者就智能电视用户数据用作其他商业化用途是否合规等问题向勾正发出采访,勾正表示公司目前不便接受采访。