APP下载

爬虫技术在社交形象定位与塑造中的运用

2019-09-10李雅薇

现代信息科技 2019年8期
关键词:运营管理

摘  要:随着Web2.0时代的到来,如何将爬虫技术下沉运用到社交个人信息的筛选、抽取、组合、分析中,最后得出有助于个人网络社交形象的塑造和社交电商营销的分析报告,成为人们关注的重要问题。通过OAuth2.0技术,可以实现经过用户授权的各类信息的获取。这一技术是实现社群经营指标分析的基础。通过有效的系统设计,我们可以通过系统生成出各种各样的对比分析图,用于帮助人们建立更好的、竞争力更强的社交形象,提升发布内容质量,进一步激发用户的自我提升能力。除此之外,该技术还可以应用于电商品牌的塑造和影响力的生成,也可以用于自媒体运营和发布内容的分析、知识共享平台中对用户提供指导参考等等。

关键词:爬虫技术;运营管理;社交形象定位和塑造

中图分类号:TP311 文献标识码:A 文章编号:2096-4706(2019)08-0023-02

Abstract:With the advent of Web2.0,how to apply crawler technology to the screening,extraction,combination and analysis of social personal information,and finally draw an analysis report that is conducive to the building of personal network social image and social e-commerce marketing,has become an important issue of concern to people. Through OAuth2.0 technology,all kinds of information obtained through user authorization can be realized. This technology is the basis of community management index analysis. Through effective system design,we can generate a variety of comparative analysis charts through the system to help people build a better and more competitive social image,improve the quality of published content,and further stimulate the self-improvement ability of users. In addition,this technology can not only be used to shape and influence e-commerce brands,but also can be used for the analysis of We-Media operation and published content,to provide guidance and reference for users in the knowledge sharing platform,and so on.

Keywords:crawler technology;operation management;social image positioning and shaping

0  引  言

随着互联网的快速发展,爬虫技术,即在冗杂的海量信息中高效快捷地抽取用户需要的信息的一项技术也应运而生。这样的一种辅助性搜索技术被运用到互联网行业中去,大大地方便了人们的工作和生活。网络社交,作为另一种深刻影响人们生产生活的互联网平台,则是更加普遍地与个体紧密联系起来。研究表明,用户愿意为管理自己的在线社交账户而付出更多的成本,这其中包括:过滤负面信息、人设塑造、虚拟化、个性化等等。不同于网红塑造,这样的社交形象管理不存在商业化运作,但又是人们普遍存在的需求,在经营自己的社交形象时,他们很难从专业的角度,全面的审视自己的社交形象,针对这种情况,本文将阐述一种将信息抓取并初步处理后运用到社交形象的管理与塑造的技术。

1  国外案例——Socialbakers

Socialbakers是针对社群经营指标分析,所开发出来的工具。2008年10月13日,一家全球人工智能社交媒体营销公司,提出名为Socialbakers Suite的营销软件即服务平台。它被McDonalds,L’Oreal和Desigual等品牌用于Facebook,Instagram,Twitter,YouTube,LinkedIn,Google +,VK和Pinterest上的社交媒体营销。2010年7月,Socialbakers推出了FanPage Analyzer,為用户提供有关其Facebook页面所遇到的问题以及竞争对手的信息。2012年1月,Socialbakers推出了针对Twitter的Analytics。他们开始提供Twitter统计数据的分析,如每日追随者增长、每日推文与转推比率、总提及数量等。

Socialbakers营销套件包括几个社交媒体管理工具,包括分析、“竞争洞察”和基准测试、企业发布工具、广告,在Facebook和Twitter上优化和管理广告、倾听,帮助品牌跟随品牌周围的对话并提供专业服务。

Socialbakers Analytics通过监控Facebook、Twitter、LinkedIn、VK、Pinterest和YouTube上的社交媒体资料(近期添加了关于Instagram的报告)来生成营销信息。该软件提供性能指标来衡量粉丝增长,跟踪关键影响因素,分析参与率和交互,针对竞争对手和行业标准的基准性能,优化社交媒体存在并生成图形报告。Socialbakers Builder是一个用于安排和发布内容以及在社交媒体上围绕品牌聚合对话的工具。除主要产品套件外,Socialbakers还提供多项服务,包括EdgeRank Checker,这是一种深度学习算法,可以告诉用户哪些内容最适合其品牌的Facebook页面等等。

2  国外爬虫技术介绍

作为Web 2.0时代的典型应用,社交网络服务正在世界各地以极快的速度流行起来。随着社交网络的不断发展以及注册用户的迅猛增加,越来越多的研究人员开始研究如何将现有的python技术运用到社交网站的信息抓取中。国外研究者多针对Facebook、Twitter等进行数据采集,研究者在Twitter平台上建立网络模型,对网络特性进行研究,Twitter底层的很多接口和库是公开的,研究者多利用这一特性对Twitter数据进行统计;Facebook也逐渐开放了API接口,研究者利用陆续开放的接口对Facebook用户数据进行采集与研究应用。国内的研究人员将以Twitter为原型的新浪微博作为研究对象,开发出了OAuth2.0技术。

3  OAuth2.0技术

OAUTH是一种开放的授权标准。它允许用户将自己存放在一个站点上的资源分享给另一个资源,而在这个过程中用户不需要将他在资源站点上的证书提供给另一站点,如用户名、密码。用户可以通过一系列授权指令,将信息共享授权指令发送给微博的API,微博API提供Rest风格的基础数据接口,包括:获取下行数据集接口、微博接口、用户接口、标签接口、话题接口、OAUTH接口等,这些接口为第三方开发者提供了诸如获取用户信息、获取好友关系、发送微博等功能。

返回数据包括:用户id、用户昵称、友好显示名称、用户所在地、用户博客地址、用户个人描述、用户个性化域名、用户头像地址、性别、粉丝数、关注数、收藏数、微博数、用户创建(注册)时间、是否是微博认证用户、认证原因、用户互粉数、用户的在线状态等。

该技术采用广度优先的爬行办法,通过开放API,模拟登录,获得更多权限和相关信息,实现了初步的信息抓取。

4  系统设计——以新浪微博为例

免费功能包括:个人社交页分析报告:包括近三个月内的用户上线时间散点分布图;每日平均登录频次;关注量变化情况折线图;获取最受欢迎帖子的数据,包括浏览量、点赞数、转发量、评论量(Top3进行图片截取展示);话题量统计(表格展示使用量前5名);话题影响度&热度(与使用该话题热度最大的帖子进行数据对比),以上指标可以在用户授权之后,自动生成报告。用户可以通过输入邮箱地址,获取PDF版本的个人社交页分析报告。

用户对比报告:输入自己微博ID并VS竞争对手的ID(单个),可以获取关于近三个月每周发帖量的对比图、发帖总量色条PK图、每周平均发帖量色条PK图;近三个月每周涨粉量对比图、实际粉丝活跃量对比图、1000粉丝量中最大互动量帖子PK色条图、1000粉丝中最小互动帖子的PK色条图、1000粉丝量中平均互动量帖子PK色条图、展示最成功发帖内容Top3(发帖用户头像、发帖时间、发帖内容、总互动量、点赞、评论量、分享量、每一千粉丝互动比例)。用户可以输入邮箱地址获取PDF版本的用户对比报告。

多用户对比分析报告:输入自己微博ID并VS竞争对手ID(多个),可以获取以发帖量和互动量为轴的象限报告;发帖量与互动量的倍数曲线图(分析平均发帖的影响效率)。用户可以直接在网页获取该报告。

付费功能:对不同的平台进行统一监控,把握竞争者的实时数据,提供更加详尽的分析报告。具体功能包括:(1)使用社交媒体分析衡量用户的策略的影响。利用可操作的见解来推动实际业务成果,并轻松地在整个业务中共享数据。获取用户需要的背景信息,并根据用户的行业、国家/地区,进一步了解用户的策略在关键指标中的智能程度,例如总广告支出、广告参与度、广告费用和内容效果。(2)通过受众分析,将用户的内容定制为合适的人物角色。将用户的数字受众群体数据整合到一个位置,借助AI生成用户可以信赖的角色个人资料。创建与用户的细分受众群产生共鸣的个性化内容,并使用社交媒体分析来分析和报告用户的结果。(3)分析用戶的广告系列的情绪。轻松了解受众对用户的广告系列的感受和情感,并分析他们背后的情绪。确定人们喜爱的内容并使用这些数据来构建可带来更多积极影响的策略。(4)构建和共享易于阅读的社交媒体报告轻松跟踪和报告用户的进度。获取可更新的可自定义仪表板,该仪表板配备第三方数据集成,用户可以通过移动设备轻松导出。通过直接发送到收件箱的自动报告,让用户的团队快速掌握数据信息。

5  结  论

综上所述,该技术通过收集用户微博相关数据,并对收集到的微博交互情况进行分析,定义高影响力用户,将用户发微博时间、用户微博的转发、评论、点赞等交互行为因素以及博文的内容相结合,分类提取特征,评估和预测用户以及所发微博的影响力,可以进一步净化网络虚假信息,优化网络生态环境;帮助用户自我经营、自我管理社交平台,自助提升内容质量,扩大影响力,进一步促进社交环境的繁荣发展。

参考文献:

[1] 孙晓,叶嘉麒,唐陈意,等.基于多策略的新浪微博大数据抓取及应用 [J].合肥工业大学学报(自然科学版),2014,37(10):1210-1215.

[2] 丁兆云,贾焰,周斌.微博数据挖掘研究综述 [J].计算机研究与发展,2014,51(4):691-706.

[3] 孙青云,王俊峰,赵宗渠,等.一种基于模拟登录的微博数据采集方案 [J].计算机技术与发展,2014,24(3):6-10.

[4] 王元卓,靳小龙,程学旗.网络大数据:现状与展望 [J].计算机学报,2013,36(6):1125-1138.

[5] 黄延炜,刘嘉勇.新浪微博数据获取技术研究 [J].信息安全与通信保密,2013(6):71-73+76.

[6] 廉捷,周欣,曹伟,刘云.新浪微博数据挖掘方案 [J].清华大学学报(自然科学版),2011,51(10):1300-1305.

[7] 姚科.开放API:新浪微博必经之路? [J].互联网天地,2010(8):71-72.

[8] 姚峰.Java平台中Base64编码/解码算法的改进 [J].计算机应用与软件,2008,25(12):164-165+176.

作者简介:李雅薇(1998.05-),女,汉族,江西人,在校本科生,研究方向:工商管理。

猜你喜欢

运营管理
县域城市公共自行车运营管理体制浅析
对风电场运营管理的探讨
基于电信运营商及物联网运营平台的研究
新能源公交车辆发展的政策支持及使用管理
博物馆免费开放后的运营管理
医药制造型企业总部层面运营管理的思考与实践
医院大型设备的运营管理(pet—ct)
村镇公共设施优化配置与运营管理综述