APP下载

对社交网络的初步分析与探讨

2012-04-13

黑龙江教育学院学报 2012年8期
关键词:新浪分布式社交

刘 畅

对社交网络的初步分析与探讨

刘 畅

(哈尔滨工业大学,哈尔滨150001)

随着Web2.0时代的到来,互联网公司的竞争也越来越激烈,然而各个社交类网络公司却都能保持着相对的优势,原因是什么?基于此,通过对社交网络的起源发展以及特征分析,旨在让读者更加了解社交网络,并从技术实现角度对中国社交网络的领军公司——新浪微博进行简要分析并指出社交网络的发展前景。

社交网络服务;计算机网络;微博

21世纪,随着信息产业的飞速发展,互联网早已经进入到千家万户。近几年,在互联网领域又诞生了一种新的交互形式——社交网络。社交网络这一词源自英语中的Social Network Service,亦称社会网络服务,它主要基于哈佛大学社会心理学家米格兰姆所提出的“六度理论”,即:最多通过六个人就能够与世界上任何一个陌生人认识。这个理论奠定了社交网络飞速发展的基础。它将人们日常的社交行为以互联网作为媒介进行呈现。与传统社交相比,其主要优势在于:实时性,开放性以及可拓展性。本文旨在通过当下中国最成功的社交网络——新浪微博作为实例进行分析,指出社交网络在互联网领域可鉴的成功之处,以及社交网络的未来发展方向。

一、社交网络的起源与发展

1971年内容为“QWERTYUIOP”的第一封电子邮件的发出,开启了网络对话的新纪元。1978年,通过电话线与用户进行数据交换的BBS(公告板系统)诞生了,开启了互联网迅速发展的三十年。BBS将网络会话的模式进行了升级,从之前e-mail的点对点模式发展到了点对面模式,随后出现的即时通信(Instant Messenger)和博客(Blog)机制更是提高了及时传送、并行处理能力。1998年,腾讯公司将即时通讯引入中国,掀起了我国的网络通讯的热潮。2004年2月4日,Facebook上线,引入了全新的社交理念,每个用户都以自己作为中心,而所有用户又构成了整个关系网。从2006年9月到2007年9月,Facebook在全美网站中的排名由第60名上升至第7名。随着2006年Twitter的上线,社交网络体系已经大体形成。在中国,人人网以及新浪微博则是当代社交网络的代表。人人网源自Facebook模式,而新浪微博则来自Twitter模式。时至今日,新浪微博占据着中国用户总量的57%,以及中国微博活动总量的87%,是中国访问量最大的社交网站之一,已超过3亿注册用户。

二、新浪微博的功能特性分析

新浪微博由新浪公司在2009年7月推出,据中国互联网微博与社区调查研究报告显示,在门户网站的微博产品中,新浪微博在知名度、使用率等十项指标上全面领先。新浪微博模式的成功之处就在于,从每个用户的角度出发,其所看到的网络世界都是以自己为中心,如微博的评论、转发、关注等,而该用户又构成了其他用户微博交际圈的一员,这样,所有的用户构成了以自己为中心的广大社交网。这种模式使得每个用户都有足够的来自于自己社交圈的满足感,同时,由于转发微博这种机制的存在,使得通过新浪微博的信息传播速度远快于传统的信息传播速度,实现了高时效性、高扩展性。另一方面,新浪微博在社会时事方面也起到了很重要的影响作用。基于3亿注册用户,新浪微博每天都会根据用户转发评论数的高低排次选出当日、当周的热门时事话题,所有用户都可以参与到该话题的讨论之中。由于强大的舆论导向与压力,至今新浪微博在很多时事上都起到了至关重要的作用,同时新浪还推出了微群机制,用户以志趣结缘,沟通交流,实现着跨跃时空的体验。

三、新浪微博的逆向工程分析

那么,新浪微博是如何实现上述功能,高效而稳定的运行呢?下面就新浪微博各种特性进行逆向分析:

(一)吞吐率

新浪微博用户的大规模并发请求、超大数据流量及保证客户端性能稳定高效(延迟低,实时性高),对服务器端的处理能力(I/O吞吐量)提出了很苛刻的要求。新浪微博是如何实现这一要求的呢?它采用的是一种活跃度机制,即当一用户发出微博时,并不是将这条微博推给所有的粉丝,而是对于标记为“活跃”的用户推出,对于其他非活跃用户可延迟推送。这样就削弱了海量信息。另外就是分层技术,对于服务的分层,新浪微博将其分为基础服务、平台服务和应用服务三个层次,每个层次相互分开,实现模块隔离,这样既使顶层应用服务访问量过大,平台服务和基础服务也不会受到影响。其具体的实现技术手段有:基于MySQL的分布式数据库设计、异步消息队列处理机制、Cache冷热分层技术、推拉模式和时间分区拉模式。

(二)可靠性

SNS平台需要提供7×24×365的服务,当服务器出现问题时,不会导致整个系统陷入崩溃而停止服务,即“永不宕机的服务器”。新浪微博采用MySQL集群技术,它是一种在无共享架构系统里应用内存数据库集群的技术,是一种分布式设计,要求其内部的各个组成部分拥有自己的内存和外存。其目标在于达到没有任何单点故障点的要求。其主要优点在于:多个节点之间可以分布在不同的地理位置,因此也是一个实现分布式数据库的方案;扩展性很好,增加节点即可实现数据库集群的扩展;冗余性很好,多个节点上都有完整的数据库数据,因此任何一个节点宕机都不会造成服务中断,整个系统不会受到影响。

(三)伸缩性

由于SNS平台的用户数量可能发生较大幅度的波动,为实现这种资源波动付出的成本要低、效率要高。这就要求服务器端的各类资源数量也随之波动,新浪微博采用基于Key-value(键值数据库)的支持分布式数据库系统的Cassandra,它是有很多个数据节点构成的分布式网络服务,对该数据库进行写操作的时候,其操作会复制到所有节点上去,对该数据库的读操作也会由其他节点上面去读取,所以由于其用户数量的变动而引起的服务器数据库端的变动只是影响对于节点的操作而已,对整个数据库整体没有多大影响。基于Key-value的NoSQL分布式数据库是针对互联网web2.0的发展应运而生的,对新浪微博这种海量数据存储读写问题的针对性很强,很好地解决了Scalability的高要求,这些特点都是传统的RDBMS所不具备的,最显著的特点就是,当数据量极大的时候,Mysql这样的数据库性能会变得很低,具有很好的伸缩性。

四、社交网络的发展前景

社交网络拥有着广大的用户基础及良好的用户反响,其发展前景应该是十分乐观的。那么社交网络在保持原有的优势之上,其还可以从哪些方面进行扩展呢?首先,各社交网络公司需要考虑网络条件不是十分理想地区的用户体验,因此需要对原有的系统进行“瘦身”,即精简功能,保证对用户操作的快速响应。在这方面,SNS的领军人物Facebook已经采取了相应的措施,已经在美国和印度推出了简化版的网站Facebook Lite。相对于标准版的网站,简化版网站更干净、更美观,响应速度也更快。其次,鉴于当前便携设备的智能化以及操作系统平台的多元化,社交网络公司需要考虑将其服务推广到多种操作系统与终端,以扩大用户的使用范围。最后,社交网络公司需要紧跟时代潮流,虚心吸取其他领域公司的优点与长处,争取做到在保持原有业务风格的基础上,将公司业务做到多元化发展,这样在竞争越来越激烈的Web2.0时代才能保证长盛不衰。

Primary Analysis and Discussion of Social Network Service

LIU Chang
(Harbin Institute of Technology,Harbin 150001,China)

With the arrival of the Web2.0 era,the competition among the Internet companies is becoming more and more intense.However,among all those competitors,companies which are engaged in social network service(SNS)can always maintain a relatively advantage over others.This paper aims at enlightening the readers with the general idea of SNSby introducing the basic development and characteristics of social network service.Besides,a specific example of Sina Microblog,a leading company of SNSin china,is used to illustrate the technical realization of SNS.At the end of this paper,the development prospect of social network service is given.

social network service;computer network;microblog

G206.2

A

1001-7836(2012)08-0199-02

10.3969/j.issn.1001 -7836.2012.08.077

2012-06-18

刘畅(1991-),男,黑龙江哈尔滨人,学生,从事计算机基础及网络研究。

猜你喜欢

新浪分布式社交
社交之城
社交牛人症该怎么治
猴子虽小
新浪读书排行榜
基于DDS的分布式三维协同仿真研究
西门子 分布式I/O Simatic ET 200AL
新浪与分众合并案告吹
新浪观战记