APP下载

大数据时代下的社会科学

2020-11-06黎嘉雯

文存阅刊 2020年18期
关键词:社会科学大数据时代大数据

摘要:随着云计算技术的发展和蔓延,数据越来越多、越来越细致,各个领域争相掀起“数据化”的浪潮,‘大数据成为具有时代特征的热议话题。呼啸而来的数据浪潮对素有“亲理论,远实证”特征的社会科学而言既是机遇又是挑战。大数据的海量性、客观性、历时性能够在一定程度上促进社会科学,而非结构化及其来势迅猛又对社会科学如何应对提出较高要求。

关键词:大数据时代;社会科学;大数据

随着科学和技术的进步,第三次信息化浪潮席卷而来。第一次信息化浪潮中,个人计算机的出现使得信息和数据资源得以获取和积累,信息实现了数字化。可谓赋予了人类新的信息处理能力。第二次信息化浪潮中,互联网的出现极大促进了数据流通和集聚,实现了信息的网络化,赋予人类文明信息传输能力。而第三次信息化浪潮中的物联网、云计算、大数据带来的信息爆炸给人类社会带来了什么“礼物”,当前除了合理推测,未来可能通过融合多源数据并分析应用,尤其是应用于人工智能领域,实现信息的智能化,其余的改变目前还不能确切描述和预言。

社会科学和数据并不陌生,对互联网数据的应用也并不是新鲜事物。比如,从数据来源来看、互联网中书籍、媒体、图片、音频、视频等都是可以获取研究资料的途径。根据《大数据机遇与宏观定量社会学》中所说,我国学者当前利用互联网数据、数字化图书和影音视频已经形成了一批实证研究成果;学科领域内高质量期刊也刊登了基于互联网数据的市政应用定量分析文章;许多高水平院校也形成了相关的研究团队。“大数据时代”一词近年来热度不减。从语义分析来看,这是一种将大数据看作这个时代最主要特征的一种时代观。那么作为这个时代基本元素的数据,具有哪些特征和性质呢?当前普遍认同的几个观点是:①海量性 ②无结构性 ③价值密度低 ④传输速度快、处理速度快。⑤来源广泛并特征多样。

一、大数据给社会科学带来了哪些机遇和挑战?

(一)大数据带给社会科学的机遇

1.海量的大数据给社会研究带来更多可能性

首先从资料的内容来看。数据的海量性极大增加了社会科学的可研究内容。随着物联网的发展,“万物互联”状态更将“数据化”这一时代特征践行得淋漓尽致。对于社会科学来说,可利用的资料、数据领域越来越广阔,如文本资料、社会活动、经济信息、地理信息、生活数据、健康数据、媒体数据等。从资料的广度和深度来说,比起传统的研究方式都有了明显提升,资料获得的方式也更加便捷。

2.大数据的客观性可以减少社会研究的主观性

大数据的客观性是指大数据是先于研究设计而存在的这一特征。传统的社会研究步骤遵循:研究设计-资料收集-资料处理和分析的过程,研究所需的数据资料需要围绕研究目标去收集整理。尽管社会科学在资料收集这一过程中有最大化保证所收集资料客观性的方法,但不可避免地仍会受到主观性的干扰。而且据此收集到的资料比较难再应用于其它研究。而在大数据时代,数据是既有的。对于许多社会研究来说,省略了线上线下收集数据的过程,不但极大便利了研究进程,同时还提升了社会科学研究的客观性。

3.大数据的历时性推动了社会科学的纵向研究

社会科学的纵向研究和宏观研究对历史跨度、地理跨度有较高的要求。在社会学领域,近三十年,宏观定量研究已明显滞后于微观定量研究。这一状况的成因之一是社会科学所关注的一些指标在宏观研究层次往往难以测量,也较难发展出成熟有效、认可度高的指标,为专业内所接受认可。

规模大、时空跨度大的大数据出现,有望可以在很大程度上弥补这类宏观研究层次测量不足的缺口,成为研究者重要的分析工具。大数据的丰富性也能够为宏观研究提供更多的变量、方法等研究方面的可能性。

以网络研究為例,传统社会研究中通过社会调查收集来的资料首先调查总体十分有限,往往是几百人,且资料收集困难。而动态性的数据收集更加困难,除了对研究者来说困难重重,对被访者和数据客观性来说也存在阻碍(如消极回应、被访者中途拒访、失联等)。因而多数网络研究成果是基于个人社会网进行的探讨。这种情况下,大数据不仅体量巨大,而且大数据的实时性使它能够提供网络信息传播的速度和方向,这为社会网络的动态研究提供了丰富的研究资料,为社会网络研究,尤其是社会动态网络研究的发展,带来了新的希望和可能。除此之外还可以利用身份证作为理想社会测量的工具,可以获得个体的空间位置、流动方向和流动频率、互动情况等信息;手机上的定位功能、移动支付等功能也留下人们的行为记录;老年人智能穿戴设备可以长时间记录老人的身体健康、情绪波动等各项数据。

《论社会学理论导引下的大数据研究》一文认为动态性的、大规模的、几乎不受时空限制的非结构化的大数据可以弥补过去收集大范围、长时段数据的不足。

(二)大数据带给社会科学的挑战

1.数据本身的非结构化

非结构化数据不适用于直接进行分析处理,每日以TB为量级产生的数据更是增加了原始数据初步处理的难度。比如上市公司的财报数据、风险投资企业的公开资料都是研究者较容易找到的数据资料,包含了比较细致全面的投资相关信息。但这些数据繁杂无序,经过初步数据处理之后也呈现为零散的投资事件。如何将这些投资事件进行匹配,以形成投资网络就需要引入理论的力量。

《社会学理论导引下的大数据研究》还提到,大数据的非结构化正是其不能使用经典的缺失值处理方法(如多重补差法)的根本原因。

2.大数据增加了社会研究的难度

大数据带来了丰富多样的信息,人们的生活也随之变得更加丰富多彩,同时也更难以预测。尽管数据规模增加能够为社会研究提供更可靠的现实支撑。但大数据时代下,人们的行为方式、生活方式、交往方式、思维方式也发生变化,由此带来新的社会现象和新的社会问题不断出现,这对于社会科学,尤其是将人作为重要研究对象的社会科学来说研究难度进一步提升。

3.大数据可能在社会科学领域引起科学革命

范式是指在某一时期规范某一科学活动的一套概念框架。大数据时代,数据的海量性等性质对社会科学的传统研究范式提出了新的要求。并且明显的趋势是需要大量地应用科学的数据处理方法来处理研究信息。根据库恩的理论,当新的研究范式被科学家共同体所广泛接受,科学革命便发生。换言之,科学革命就是一种新的科学范式取代原有科学范式的过程。因此可以合理推论,将数据科学技术引入社会科学研究的“社会科学计算范式”,将在不久的将来为社会科学研究共同体所接受和认同,进一步可能会引发社会科学研究范式的变革。

二、观点:大数据与社会科学

对于大数据时代对社会科学的影响,当前比较热门的讨论是:大数据为社会科学带来了什么机遇?带来了何种挑战?对社会科学的学科发展产生的影响,社会科学的应对之策,以及社会科学和数据科学的合作。

对于大数据带来何种机遇和挑战,《大数据机遇与宏观定量社会学》认为大数据的出现对社会科学最重要的影响之一是能够重启宏观定量社会学,体现在理论发展、领域拓展、方法延展三个方面。作者认为,大数据的出现至少能够在社会科学领域尤其是社会学领域引起更多学者对宏观研究的关注,进而推动社会学的宏观研究。张文宏提出大数据时代的机遇体现在:提供了更多研究的可能性、有可能产生新的分支学科;数据的海量性能够为研究提供更可靠的数据支撑;能够为社会政策和社会治理提供更完善的数据基础。而挑战则是由大数据的海量性及无结构性带来的样本偏差、变量缺失及虚假、虚假相关关系易生、数据整合难度较大等问题。

大数据时代,传统研究所面临的困境也有了新的机遇。夏国美称,社会学一直存在着质性研究与量化研究之间的壁垒。而大数据的出现能够改变二者的对峙状态,走出定性和定量研究方法的结合困境。她在一篇文章中列举了陈云松所做的研究(对谷歌图书最新语料库的大数据检索),认为其研究结果不是传统思维中数据对研究精确性的印证,而是对质性研究结果的补充。而这正是大数据打破定性、定量研究中间壁垒的一个案例

《规律与因果:大数据对社会科学研究冲击之反思》一文认为大数据的出现,不仅可能重构社会科学,特别是社会学的研究目标和宗旨,还会对社会科学的研究逻辑、方法和技术、研究的组织方式及人员素质等方面产生深远影响。如在研究逻辑方面,对大数据的利用,可以从演绎逻辑出发,对大数据进行检验(可称之为“理论驱动”);也可以从归纳逻辑出发,使用大数据进行描述和分析(可以称之为“数据驱动”)。两种研究逻辑并存可能是大数据研究的一个特点。在方法和技术上,对大数据的获取、存储、交换、匹配、分析、建模,以及统计理念、技术和软件等方面都会形成新的冲击。

张旭意识到了大数据的局限性,及其可能带来的影响,提醒需要注意“大数据及其‘社会学后果”。他认为大数据能够在收集数据、整理数据(如机器学习)、分析数据的变革与升级方面产生正面后果。同时也仍有其局限性。比如在定量研究中,大数据尽管规模巨大,但样本代表性存在较大问题,比如想要将两个社交平台的用户数据进行整合时,两个不同平台对用户基本情况的了解和设置都有所区别和差异。因此,大数据还不能取代社会学传统研究。其次,他认为大数据虽然提供了广阔坚实的数据源,但是大数据的收集对于一般研究来说仍是存在一定问题。一是资料收集过程中需要大量资金支持,而是数据提供方通常不愿意分享数据用于研究。而即使一些企业最终同意,数据库可能也并不完全契合研究需要;再次,大数据的出现也引发了新的道德伦理问题。用户的踪迹被追踪、上网数据在不知道的情况下被用于商业销售屡见不鲜。信息安全问题备受关注。最后张旭还从社会学视角探讨了大数据引发的公平性问题。以保险公司通过客户行车记录仪的数据评估顾客,并进行区别收费为例,从社会不平等的角度解释了这一现象背后隐藏的弱势群体利益再次累积的过程,论述了大数据在其它领域的应用。另外他也提到,大數据还可能使研究者面临更多的“研究道德”与“社会道德”的冲突。

在对社会科学和数据科学的合作方面的讨论《论社会学理论导引下的大数据研究》一文,分析了商业投资策略过程,观察其中大数据、社会学理论、预测模型是如何相互促进以致做出最终决策。通过多个计算社会科学案例,文章逐步论证了几个核心观点,即大数据能够进行理论的假设验证、提供新的理论启发;理论可以指导数据挖掘的方向、校正数据挖掘的结果。两者以各自不同的方式都可以为对方提供新的丰富的议题,为彼此指导和启发新的研究方向,拓展了对方发展空间。文章还指出理论和预测模型之间的双向对话:获得证实的理论可以用来建立预测模型,改变模型预测的准确度;而预测模型的出现又可能在理论演绎中发现新的事实。而大数据与理论进行对话的桥梁在于将无结构数据变为结构化数据的一套或多套算法。文章如此详细地分析理论、数据、模型之间的互动对话,实际呈现了计算社会科学的研究方法。

大数据无疑是社会科学面临的一大挑战。社会科学想要紧跟时代、对当下社会问题保持敏感并做出更深入、全面的研究,必须积极思考如何应对挑战,将其转为机遇,促进社会学科的蓬勃发展。

参考文献:

[1]孟天广,郑思尧.信息、传播与影响:网络治理中的政府新媒体——结合大数据与小数据分析的探索[J].公共行政评论,2017,10(01):29-52+205-206.

[2]唐文方.大数据与小数据:社会科学研究方法的探讨[J].中山大学学报(社会科学版),2015,55(06):141-146.

[3]罗玮,罗教讲.新计算社会学:大数据时代的社会学研究[J].社会学研究,2015,30(03):222-241+246.

[4]甄峰,王波.“大数据”热潮下人文地理学研究的再思考[J].地理研究,2015,34(05):803-811.

[5]陈云松,吴青熹,黄超.大数据何以重构社会科学[J].新疆师范大学学报(哲学社会科学版),2015,36(03):54-61.

作者简介:

黎嘉雯(1995—),女,新疆巴州人,天津师范大学,硕士,研究方向:性别社会学。

猜你喜欢

社会科学大数据时代大数据
Education with a Heart that Embraces the World, from the Fertile Cultural Land of the “Eternal City”
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态
基于大数据背景下的智慧城市建设研究
社会科学总论
繁荣发展哲学社会科学也要实现“两个根本性转变”
紧紧抓住机遇进一步繁荣发展哲学社会科学