APP下载

大数据时代社会科学的发展展望

2020-11-09黎嘉雯

文存阅刊 2020年17期
关键词:社会科学大数据时代

摘要:随着云计算技术的发展,数据化浪潮来势汹汹,对原本因为‘实证性与自然科学泾渭分明的社会科学提出严峻挑战。面对此挑战社会科学积极应对,尝试借助数据科学的技术,将数据为己所用,将挑战转为机遇。计算社会科学应运而生,数据科学与社会科学的合作越来越多。展望社会科学的发展,应当借助数据工具,巩固本学科,并积极尝试跨学科研究,把握机遇,建立学科自信。

关键词:大数据时代;社会科学;数据科学;计算社会科学

一、社会科学与数据科学的互助合作

显而易见的,数据科学是迎接大数据发出的挑战的最直接并且有效的方法。数据处理技术、机器学习、算法、模型等一系列有力工具,能够更加迅速、敏捷、从容地处理巨量数据。社会科学并不是脱离数据的,许多社会理论的出现少不了数据结果的支撑。但是不可否认在与数据信息的接触、应用方面需要向数据科学学习的地方还很多。如果说过去社会科学对数据的应用属于‘计量科学‘,那么大数据时代,一个非常明显的趋势是向计算时代‘的转变。这种转变的完成,不过是时间问题。我们总说世界变化得越来越快了。这个逻辑落/追溯在信息领域是可以找到解释的:信息/数据传输速度越来越快-信息越来越多也越来越丰富-人类文明会加速各个领域的产出来应对这些信息,这些加速落在微观/个人层面,人们难免会觉得自己的生活由绿皮火车改成了高铁动车。

在这一背景下,社会科学向数据科学取经,势在必行。在呼啸而来的大数据浪潮中,社会科学做出了哪些回应呢?

1.1 计算社会科学:社会科学对大数据的回应

计算社会科学(Computational social science)指的是在社会科学中采用计算机运算方法的学术分支,运算用以建立模型、模拟、分析社会现象。次分支学科包括计算经济学、计算社会学、自动媒体分析等等,内容则专注在透过模拟、建模、网络分析、媒体分析等观察社会与行为关系及互动。

计算社会科学的产生是大数据时代社会科学发展的必然趋势。在过去(20世纪90年代前后)社会科学关于人类行为的研究常为时代条件所限制。在上個本世纪末到二十一世纪的前十年,互联网、人工智能的发展以及各类电子技术的发展,推动了计算机行动模拟方法以及社会科学研究方法的发展,为计算社会学的产生提供了基础条件。

“计算社会科学”一词是在2009年出现在《科学》(Science)上,由15位优秀学者共同署名发表。文章预言在互联网和新的电脑技术的时代背景下,将会出现能量巨大的新的计算社会科学。如今,物联网、云计算、各类智能电子设备,给社会科学研究者提供了更有力、更广泛的的收集和处理数据的途径。2014年召开了“新计算社会学研讨会”,预示着“综合运用当代计算机和互联网及其他高新技术与大数据分析手段的社会学研究方法体系越来越受到关注”。

计算社会科学既是顺应技术与时代进步,顺应社会生产力和发展方向的必然选择,同时又体现了社会科学家积极应对新事物、新环境,不断探索与追求的科学精神与境界。

1.2 社会科学与数据科学的合作

“数据+技术”之于社会学的重要性在传统数据时代就已体现,并在研究过程的速率、研究的信度和效度、研究结果的展示方面都对社会学有很大的提升。比如利用开放的公共数据资源(如人口普查)在计算机上进行简单的统计分析或绘制某地区的人口密度图示。这种影响不仅是对定量研究,对于以深度访谈为主要研究手段的质性研究,大数据时代网络中每日产出的大量交互性数据可以轻易地采集到比访谈更加丰富多样的数据。纸质资料的数字化趋势,也为史料分析、文献分析补充了更广泛的研究资料。

以数据匹配这一环节为例,从不同的社交网站上获得的数据,为了服务同一变量,少不了经过数据匹配。但不同网站,同类数据并非以同样字段命名,甚至分类标准也存在差异。那么仅仅这一环节所需要用到就有自然语言处理技术、分词技术、正则表达等多项技术。

《新计算社会学:大数据是地的社会学研究》中指出了计算社会学的五方面内涵:数据获取与分析、质性研究与定量研究的融合、社会学互联网实践、ABM模拟、新型社会计算工具的研制与开发。并从上述五个方面列举了多个大数据与社会科学合作的研究成果。(见下表)。

如,在数据获取与分析的应用中有一个关于“名气”的研究:从报纸上获取个体姓名出现次数,次数越多,名气越大。利用莉迪亚文本分析系统(将文本变为时序化的数据进行定量分析)。此次研究筛查了2004-2009年2200中美国各类日报和周刊;初步提取了十万个姓名并进行了合理化剔除,最终对姓名出现频率在1万次以上的几百个姓名进行了分布分析与流动性分析。

再如,将质性研究和定量研究融合的尝试中,一项研究试图分析网民线上线下政治行为的动态关系,也即对人们在社交媒体上关于国会选举的政治讨论进行分析。具体的研究方法是通过大数据+文本资料量化分析,利用数据挖掘获得社交媒体的文本资料;利用“自动文本分析系统”(LIWC,能够识别60多种人类情绪)进行内容分析。此次研究分析了三万名用户的11万条推文。

此外还有很多研究,如通过刊登的文章内容进行学术分析探索学术创新的规律及其影响因素,文化产品市场不公平性的社会实验:文化产品在市场上流行程度的影响因素,关于个体成就的互联网实验,社会地位形成机制的研究等等,都因为多了‘数据工具‘而得到了更进一步的发展。

可见社会科学和数据科学的助力是相互的。社会科学庞大的理论库能够为数据科学提供数据处理的新思路、新视角。既有的、成熟的社会科学理论,可以帮助数据科学家以更具结构化的视角看待多源庞杂的数据,进行数据融合;对数据进行更加准确的价值分类,增加数据资源利益视角,提高数据资源利用率。

总而言之,在面对大数据,数据科学和社会科学有各自不同的独具特色的应对机制,也存在需要向对方及其它学科汲取营养的‘短板‘。二者应当各展其能并且相互学习,相辅相成。共同应对大数据时代的机遇与挑战。

二、展望:社会科学的发展之路

大数据时代社会科学面临着机遇,同时也面临着挑战。大数据使得社会科学有了跟多的可能性,能够减少社会研究的主观性,对于社会研究的纵向研究和动态社会网络研究都将有新的促进;而数据的非结构性、海量性也使得社会科学研究遭遇新的困难。为了更好地迎接挑战,化挑战为机遇,社会科学应当在增强本学科实力的同时,需要开放心态,整合资源,进行跨学科合作研究,牢牢把握机遇,建立学术自信。

(一)巩固和发展本学科理论

大数据带来的挑战还体现为在学科的研究内容、研究对象等方面增加了研究难度。新的时代衍生出了新的问题,部分传统的理论可能在解释力度上出现削弱甚至失效的情况,如美国特朗普竞选结果预测失败。因此,各社会学科首先应当做的还是加强和巩固自身的理论,建立更符合时代发展的,更具解释性的、强有力的理论。

(二)跨学科合作研究

计算社会科学与传统社会科学相比,跨学科特性更为突出,各学科之间的关系也更为紧密。这表现为,完成社会研究需要越来越多地使用计算科学的工具;而新的社会计算工具的开发,需要多个社会科学领域的专家合作完成。在跨学科意识的指引下,进行不同学科间的学习、合作、融合、促进,协同发展。迎接大数据时代,传统的社会科学需要在数据的获取、分析、定性研究于定量研究的融合方面努力突破,克服原有的缺陷和障碍,积极拓展和创新;同时也要学习和使用数据科学及其它学科的研究技术和工具,利用好互联网和计算机模拟系统,进行更具时代感的社会研究。

(三)把握机遇,建立学术自信

科学界,尤其是社会科学界已经形成了以西方科学界为中心的格局。这一定程度上得益于西方科学启蒙和发展较早,使其积累了众多使“思想萌芽”得以快速成长的沃土。大数据时代的到来,拉近了世界的距离,缩小了世界之间信息和只知识的差距,为世界也为中国提供了“弯道超车”的新机遇。尤其是近来中国“5G”技术的突破,更提醒我们需要牢牢把握机会,充分认识并发挥自己的优势,发展符合我国社会的社会科学理论,建立中国社会科学的学术自信。

参考文献:

[1]陈云松.大数据中的百年社会学——基于百万书籍的文化影响力研究[J].社会学研究,2015,30(01):23-48+242-243.

[2]徐岚.大数据背景下的“数据新闻”研究[D].上海社会科学院,2014.

[3]孟小峰,李勇,祝建华.社会计算:大数据时代的机遇与挑战[J].计算机研究与发展,2013,50(12):2483-2491.

[4]沈浩,黄晓兰.大数据助力社会科学研究:挑战与创新[J].现代传播(中国传媒大学学报),2013,35(08):13-18.

[5]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(06):647-657.

作者简介:

黎嘉雯(1995—),女,新疆巴州人,天津師范大学硕士。研究方向:性别社会学。

猜你喜欢

社会科学大数据时代
Education with a Heart that Embraces the World, from the Fertile Cultural Land of the “Eternal City”
大数据时代下计算机信息处理技术的应用
大数据时代背景下高职院校宣传思想工作的思考与实践
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态
社会科学总论
努力规范社科术语  繁荣发展社会科学
繁荣发展哲学社会科学也要实现“两个根本性转变”
紧紧抓住机遇进一步繁荣发展哲学社会科学