互联网到底有多大?已知网页至少46亿个
2016-04-15
互联网是个繁忙的地方。据统计,互联网上每秒有6000条推特发出,有4万多次谷歌搜索,还有超过200万封电子邮件被发送。但这些数据只是略微提示了这个网络的规模。截至2014年9月,互联网上有约10亿个网站,这一数字始终在变动。在这个大部分人熟悉的互联网之下还有一个“深层网络”,它包括搜索引擎没有编入索引的部分。
将“表面”网络的时刻变化与深层网络的不可定量性结合起来就会很容易地发现,要估算互联网规模是一项困难的任务。据统计,截至2016年3月中旬,在线网页至少有46.6亿个。这只涵盖了可搜索到的网页,并不包括深层网络。那么,互联网包含多少信息呢?加利福尼亚大学戴维斯分校传播学教授马丁·希尔伯特说,“对于这个问题可以从三个角度来看——互联网存储信息、传播信息并计算信息。”
2014年,研究人员在《超级运算技术前沿与创新》杂志上发表了一项研究,估计互联网的存储量为100万艾字节。一个字节是包含8个比特的数据单位,相当于单词中的一个字母。1艾字节相当于100亿亿字节。评估互联网传播能力的一个方式是计量它的流量。根据思科公司的视觉网络指数项目,互联网现在进入“泽字节时代”。1泽字节是1000个艾字节。思科公司估计,到2016年底,全球互联网流量将达到每年1.1泽字节,到2019年将达到每年2泽字节。思科公司称,1泽字节相当于看3.6万年的高清视频,相当于把在线影片租赁提供商奈飞公司的所有列表播放3177次。
研究人员估计,要把整个网络(包括深层网络)的内容都打印出来的话,需要砍伐掉2%的亚马逊雨林来造纸。在研究中,他们对在线文本的规模做了假设,他们估计平均每个网页需要30张A4纸来打印。根据这一假设,互联网上的所有文本将需要1.36×1000亿张纸来打印。希尔伯特说,互联网的规模是个活动目标,它在飞速增长。面对这些海量信息的时候只有一点值得欣慰:我们计算能力的提高比数据存储的速度还要快。
全球数据存储量每三年翻一番,而计算能力每一年半就翻一番。从很多方面来看,人工智能已经超过了人类的认知能力。“计算能力的提高是唯一让在线数据暴增变得有用的事,我们正从信息时代走向知识时代。”希尔伯特说。