大数据支持“地图炮”
2018-10-19曹林
曹林
东北地区网民偏好文娱,川藏爱体育,西北华中爱时政,江浙爱财经,珠三角爱科技,沿海爱军事。
字节跳动公共政策研究院发布了一份《城市光谱》,用大数据给各大城市的网民画像,分析2018年上半年网民阅读偏好。不管你服不服,反正我服了。
我也曾用自己的感觉给一些城市画过肖像,比如我说某个城市是“一座没有新闻的城市”,说另外一个城市是“官员宜居的城市”,毫无例外,这些城市的主政者都不服,我们怎么“没有新闻”了,我们怎么就“官员宜居”了?
这方面《城市光谱》做得很好,用数据说话,有严谨的统计方法,翔实的数据,分析了2018年上半年全国所有直辖市、地级市和部分省直辖县共366个城市的阅读数据,对信息又进行了分类,用TGI指数的计算方法,对客户端所有用户内容消费偏好用数据进行了一种X光透视,给各大城市画了一幅漫画。一些结论很有意思,比如气质最相近的省竟然是湖南和江西,气质最不相近的是贵州和上海,东北地区网民偏好文娱,川藏爱体育,西北华中爱时政,江浙爱财经,珠三角爱科技,沿海爱军事。
作为个体的网民,可能很少去跳出来看自己的阅读偏好,面对这个光谱,甚至会惊讶,我怎么会是这样呢?可,你就是这样啊,你的指尖比你的直觉更诚实。数据的统计方法,很多时候比那种问卷调查更客观。
最近在看大卫-兰德尔的《全球新闻记者》,里面提到这样一件趣事:1945年后,英国《世界新闻报》曾是世界上销量最大的报纸,每周日,700多万份报纸销售到那些对谋杀和性侵案件感兴趣的人们手中。为了了解读者的品位,编辑们实施了一项调查,他们雇了一些人造访读者的家,问他们喜欢或不喜欢这份报纸的哪些内容。被调查的人绝大部分是妇女,她们没有准备好男性调研员想到的答案:是的,我喜欢阅读与强奸猥亵相关的报道。——相反,取而代之的回答使得调查人员相信,她们认同并阅读这份报纸是因为它的一些值得尊敬的特点。
编辑们看到了调查结果,撤销了报纸上与性有关的内容。仅仅两周之后,报纸的发行量就减少了50万份。第三个星期,报纸换了一个新编辑,恢复了报纸的常态内容,结果,发行量马上回升并最终到达了850万份。
兰德尔感慨地说:读者有种令人困惑的倾向,说一套做一套,他们可能公开鄙视某些报刊却在私下十分渴望购买并阅读它们。——这也正是“城市光谱”让人服的地方,尽可能地去除那些主观化的描述,排除主观冗余的干扰,而让指尖的数据去客观呈现一个城市一群网民的阅读偏好。
“城市光谱”中的分析结论,解释了很多过去我觉得不太能理解的现象。比如前段时间有媒体报道,山东新媒体村农婦批量生产爆款,收入甚至超过上海平均收入。——一群未受过高等教育的农妇能生产出什么样的爆款呢?“城市光谱”的数据解释了这种现象,网民阅读偏好显示,从内容来看,网民最爱看的信息集中在三农和军事,而三农这方面的信息,恰恰正是山东新媒体村农妇们的“在地优势,”她们将这种优势发挥到了极致。
这份报告的“夜读地图”显示,女性更偏好夜读,但男性更偏好“深夜读”。在全国范围内,19点后女性阅读偏好相对男性持续保持优势,但在23点之后的深夜阶段,女性阅读偏好急速下降,但男性阅读偏好同步抬头。我想到王宝强深夜发布离婚声明引发的舆论反应,王宝强是深夜12点半发的声明,那时主导深夜舆论场的是男性,如果换成晚上10点左右发声明,主导舆论场的是女性,舆论反应可能就会不一样。
研究这份“夜读地图”,对于舆情研究和品牌传播会很有帮助。有些刚做自媒体的,经常纠结于什么时候推送文章,把这份“阅读地图”研究透了,也许就掌握了内容精准推送和分发的葵花宝典。
但也要看到报告的数据局限,比如用户范围局限于头条,如果数据扩展到全网,就更有价值了。另外,更要防范陷入“规律强迫症”,如果我们先入为主地认为“不同城市的网民有不同的阅读偏好”,认为“每个城市网民的阅读有一定的规律性”,就很容易陷入自我强化的伪规律误区。可能,阶层、职业、年龄的阅读差异,远远高于地区和城市的差异,一个评论员跟一个新媒体村农妇的阅读差异,远远高于一个江苏人跟一个山东人的差异。