数字时代文科知识生产的运行机制
——基于全球26个高校计算社会科学实验室的分析
2023-02-01蒋贵友
蒋贵友
(华东师范大学高等教育研究所,上海 200062)
一、问题提出
数字时代开启以来,人工智能、机器学习正以不可逆转之势进入人类互动、舆论传播与学习科学等领域,并凭借以数字算法为代表的信息技术变革文科知识生产的研究范式。[1]智能技术既可以跟踪千万级群体的实时互动,又能精准捕捉个体级别的行动轨迹。2009年,以大卫·拉泽(David Lazer)为首的15位科学家在《科学》杂志上以“计算社会科学”为题高度概括了大数据参与文科知识生产的可能路径。[2]这代表了社交媒体、非结构化文本与视频图像正成为新的数据来源,而信息转变为知识的方式在技术的驱动下不断多样化,文科知识生产在数字时代已被重新定义。相反,传统的知识生产范式已经难以回应知识更新的时代需求,甚至过细的分科研究与科层化的学术管理成为学术研究迭代与创新的制度化障碍。面对智能社会,大学是否有能力应对文科知识生产数字化的挑战,已经成为其推动知识创新与回应社会需求必须要面对的课题。
在智能时代,文科知识生产有两个典型特征:一是就现实而言,它使用大规模的结构性数据与信息处理作为解释人类社会及其内部结构的关键成分,清晰且立体地建构真实的社会系统网络;[3]二是从方法来看,它既非以同一学科知识为蓝本的知识更新,亦非社会科学与数据科学的跨域叠加,而是多学科研究者的协同合作以及企业、政府与公民社会的深度参与。[4]实践证明,不同于知识生产模式Ⅰ与Ⅱ,这是典型的超学科研究与知识生产模式Ⅲ。该范式一定程度回应了现实问题,但从大数据所推动的经验研究飞跃到社会科学的理论阐释时,仍然面临不小的创新困境。同时,跨越边界的数据合作隐含着更大的隐私、伦理与知识产权问题,而回应这些问题既无法依靠传统知识生产进路加以减缓,也不能通过数字技术革命予以祛除,其关键在于建构一个行之有效的运行保障机制。
在运行机制方面,西方大学通过创建更加灵活的数字空间和知识生产体系,与互联网平台、政府数据部门建立了知识创新网络,从而实现数据—知识—决策之间的高效转化。已有研究看到了知识创新的技术优越性与数据便捷性,但却较少探究其背后的运行机制与各要素的互动关系。[5]因此,本研究旨在分析世界一流大学计算社会科学实验室知识生产过程,并深刻剖析文科知识生产数字化背后的运行机制。
二、研究设计
(一)理论抽样与研究方法
在案例选择方面,本研究通过多渠道收集了78个世界一流大学计算社会科学实验室素材,从而形成分析该问题的初步案例资料库。为了更加精准地匹配适切案例进入分析,对备选案例库进行了理论抽样。抽样原则体现在四个方面:一是所选实验室在人文社会科学领域具有代表性,其所属高校为全球排名前列的精英高校;二是所选机构与数据平台、政府、社会建立了长期合作;三是机构类型尽可能地涵盖人文社会科学诸领域;四是所选案例资料至少由网站信息、学术论文、媒体资料三种以上分析文本组成,且字数不低于0.8万字。基于上述原则,最终遴选了26个案例作为研究样本。
研究采用扎根理论方法并基于Nvivo 12.0软件从26个实验室案例样本中随机抽取18个案例,对所涉案例的相关资料采取开放式编码、主轴编码与选择性编码,并分类、提炼与概括数字时代计算社会科学实验室知识生产的关键信息,据此建立与研究问题相契合的分析框架。然后,利用剩余的8个案例资料进行饱和度检验,从而确定得出最后的研究模型。
(二)资料收集
为了系统呈现26个计算社会科学实验室的样本信息,本研究列举了所选案例概况(详见表1)。为了最大限度地还原各实验室的知识生产过程,本研究从实验室官网、学术论文、研究报告与媒体宣传四个方面收集了各案例的文字、视频与图片信息,并将其全部转换为统一的文本信息,按照抽样编码原则进行归类编号,以此作为后续分析的数据资料支撑。
表1 计算社会科学实验室案例概况
表1 计算社会科学实验室案例概况(续)
三、资料编码分析
在组织社会学语境下,机制是指组织内部各要素之间的结构关系及其运作方式,而运行机制是指影响组织活动的因素、结构、功能及其相互关系,以及诸因素所产生影响的作用过程与运作方式。[6]因此,本研究基于扎根理论旨在挖掘计算社会科学实验室知识生产过程的核心要素及其诸要素相互作用机制,以此刻画数字时代文科知识生产的运行过程。
(一)概念与范畴化
开放式编码是基于研究的问题情境对原始素材进行提炼与概括,进而形成初始概念及其范畴化的过程。为此,本研究根据随机原则抽取18个正式样本,除A-05、A-09、A-12、A-14、A-18、A-19、A-21与A-24未入选外,其余案例进入分析阶段。随后,将入选案例材料导入Nvivo12软件中进行编码,经过反复比对、归纳与整合,最终提炼出43个初始概念,并进一步归纳为包含应用服务、项目治理、数字协作与外部问责在内的13个初始范畴。(详见表2)
表2“数字时代文科知识生产运行机制”概念与范畴化过程
表2“数字时代文科知识生产运行机制”概念与范畴化过程(续)
(二)主范畴提炼及其关系内涵
主轴编码立足于开放式编码的基础上,根据案例情境中的初始概念的内涵外延及其相互之间的逻辑联系,确定概念间的类属关系并进行范畴化,从而确立一个以知识生产运行为核心的框架雏形。为确保范畴划分的科学性,本研究将初始概念与范畴置于案例情境中,根据彼此在知识生产案例中所处的位置,进一步明确概念之间的关系并提出更为上位的主范畴。最终,经过范畴合并生成了情境驱动、创新网络、知识集群与评估问责4个主范畴。(详见表3)
表3 “数字时代文科知识生产运行机制”主范畴及其内涵界定
(三)主范畴验证与模型建构
选择性编码旨在寻找所涉初始概念的基本范畴,并通过范畴化将相关概念归类并建立内在联系,以此构建问题研究的分析脉络与框架。具体而言,在研究问题的统摄下,参考编码过程中的备忘录,并将主范畴置于具体的案例情境中以便进一步明确各主范畴之间、主范畴与副范畴之间以及范畴与初始概念间的逻辑关系,并最终以知识生产流程体系将主范畴进行串联。分析表明,以文科知识生产运行机制为研究的核心范畴可衍生出情境驱动、创新网络、知识集群与评估问责四个主范畴。
(四)理论饱和度检验
理论饱和是指新增样本并未能够使研究概念与范畴更新,亦未能产生新的解释,一旦达到此标准将停止研究的理论抽样。为此,本研究将上阶段随机抽样中未入选的8个计算机社会科学实验室案例的相关资料导入质性分析软件中再度进行三轮编码,编码与类属分析中并未涌现新的概念与范畴,概念之间与范畴之间的逻辑关系也并未更改,代表此前建构的分析框架通过了理论饱和度检验,这对分析数字时代文科知识生产运行机制具有较强的解释力。
四、研究发现
本研究从宏观抽象层面呈现了数字时代文科知识生产运行的体系轮廓与内部要素,但并未深入知识生产内部揭示生产要素与环节的关系与作用机制。为此,通过将主范畴与案例情境共置于文科知识生产过程中对运行机制进行解读与验证,从而揭示数字时代文科知识生产运行的过程机制。
(一)情境驱动:聚焦数字时代知识生产的目标导向
数字时代的大学受其生存情境驱动开展文科知识生产创新,其知识生产目标大致可分为应用服务、工具开发与学术创新三个方面。其一,通过知识应用实现咨政决策辅助的智库功能,通过数字模拟与风险预测分析公共政策的实施效力和发展态势,从而优化政策进程与政策设计。换言之,当算法与机器学习愈加智能时,数字技术变革了知识创新方式,并使知识生产能够通过数字模型优化决策与影响政府行动,从而赋予知识新的治理形式与专业权威。[7]其二,旨在推动大学、政府、产业与公民社会之间“产学研用”融合的知识转化与工具开发进程。在新冠病毒疫情期间,马里兰大学计算社会科学跨学科实验室(A-22)使用数字平台模拟疫情舆论传播路径、检测全球媒体的偏见和误导以及优化疫情舆情治理技术,一定程度维护了社会的公共秩序。[8]在此过程中,大学通过数字平台将不同领域的利益主体有效纳入知识转化中,构建知识创新网络生态并实现工具革新。其三,突破学科分化与知识分割的桎梏并实现知识统一化的创新转型。知识创新必然以理论创新为追求,宾夕法尼亚大学沃伦中心(A-17)通过数据集成与信息追踪技术,分析人类互动规律、社会结构演变、公共健康动态追踪与政治舆论传播等复杂问题,以此检测与修正社会动力与舆论传播理论。[9]可见,数字时代的文科知识生产目标受其所处情境的驱动,通过数据技术对人类复杂问题的有效回应,进而寻求理论层面的创新突破。
三重向度的目标关系链可以理解为,以机器学习为核心的数据技术与人文社会科学交叉的创新研究为政策辅助与社会发展提供了事实依据与科学见解,有助于大学、政府、行业与公民社会联结为“四重螺旋”创新结构。这赋予了数字时代知识生产系统所需的创新环境,能够驱动大学、政府、行业以及公民社会在协同创新中形成良好的互动关系,从而生成基于数据智能的知识生产生态系统。譬如,大数据技术在建构机器学习模型时将单点与线性的知识进行智能化链接,形成包含学术层、行业层与社会层在内的网状、多维知识体系。综合而言,数字时代文科知识生产既解决应用性问题,亦回应原理性障碍,其多重目标的出现受到问题情境驱动,实质指向的是以公共利益为取向的人类与社会发展的基本命题。
(二)创新网络:赋予数字时代知识生产的算力支持
知识生产中的创新网络是创新目标转化为知识成果的基础平台与技术联盟,包括项目治理、团队分工、研究支持与制度保障四个维度。第一,实验室通过项目制统筹数字资产,并确定组织架构的基本形态。计算社会科学实验室属于交叉学科集群,是多个研究项目捆绑的去科层化结构。[10]如宾夕法尼亚大学计算社会科学实验室(A-01)由媒体问责、高通量实验与疫情人口流动调查项目组成,在以项目制为基础的知识生产体制下能有效建立公私伙伴关系并有效配置资源。第二,实验室建立的异质成员网络与协同分工体系由研究问题的复杂性所决定,其学科交叉组合根据研究项目的不同而变化。为了保证学科之间的横向协作,实验室秉持小规模作业、跨域协作的开放理念展开项目式合作。在异质网络与专业分工的运作法则下,不同系统、团队与部门相联系,构成基于问题情境的协调创新联盟。第三,数据、资金、技术及其配套的研究支持体系攸关知识生产的有序运行。除了自建集成平台获取数据外,实验室与产业界、政府部门在公共议题领域开展数据共享合作。同时,由于项目、人员与平台的开放性与多元性,技术与资金支持也较为多元。以牛津大学互联网研究所(A-16)为例,它建立了由行业专家、商业精英与政府领袖组成的咨询委员会,更好整合了多元化的资金来源与技术支持,提供了专属开源技术和数据基础设施支持。[11]第四,全方位的组织制度保障有效规避了知识生产中的数字风险。针对数据获取中的伦理隐私问题,苏黎世联邦理工学院社会科学实验室(A15)建立了全域隐私计算与数据安全中心,在保障隐私伦理前提下实现了数据可查找、可访问、可操作与可重用的目标。
显然,创新网络赋予了数字时代知识生产更大的算力支持。譬如,当面对机器学习模型所存在的建模假设偏误与模型偏差的技术限制问题时,“四重螺旋”系统通过数字协调机制克服技术障碍、跨越部门限制与穿越知识谱系,有效回应大数据技术在建构机器学习模型以及评估、比较和使用这些模型时无法回答的方法论和理论问题。[12]正是由于更加扁平化、开放化与异质化的知识创新网络,以及横向协同与纵向联动的立体化知识生产体系,为数字时代的知识生产赋予了更强的组织基础与制度支持。
(三)知识集群:搭建数字时代知识生产的协作系统
复杂混乱的数据信息有效整合为知识成果有赖于知识集群相互协作,这涉及议题设计、数字协作、知识建构与成果输出四个方面。议题设计作为项目的具象化路径,旨在评估与论证研究的创新和可行性。譬如,宾夕法尼亚大学沃顿商学院分析中心(A-12)主导的高通量实验涉及自动化与信息科学的精心设计,可使数千名受试者同时参与社会试验,从而减少研究成本与时间周期。[13]尽管议题极为庞杂,但其本质仍是以数字技术解决社会重大议题为切口,开展面向未来的创新设计。当项目议题确定后,大规模与灵活化的数字协作使实验室、私营部门与政府协同完成数据获取、清洗、分类与储存任务。目前,人文社会科学领域的数据是非结构化的,多呈现为符号、事实与信号的杂乱集合,且不能直接被用于研究分析。为此,康奈尔大学社会科学中心(A-06)构建的云计算虚拟平台与数据库链接,[14]将高度异质性的数据集进行清洗加工后变为可分类、储存与检索的结构化信息,实现了不同知识域的数据融合与去中心化的超学科协作。
在知识建构方面,自动信息提取、社交网络分析、社会地理空间分析、复杂系统建模与社会仿真模型方法使数据信息得以结构化、空间化与系统化,从而完成数字向知识的创新转化。但社会改进方案的成型是多个知识综合的结果,需要经由建模、融合与导航的知识建构才能完成。目前,数据科学领域广泛采用大数据知识工程模型(BigKE)。[15]这一过程将多源异构的碎片化知识整合为局部知识,经过知识融合与知识导航后成为具有全局性与系统性的知识集群,才能为咨政辅助、行业预测与社会创新提供服务。在成果输出方面,由于议题目标差异化,成果类型既涉及出版物、数字课程与技术工具,亦包含数字治理产品、数字经济项目与人机交互机器人。以宾夕法尼亚大学计算社会科学实验室(A-01)开发的行为科学创新工具(Empirica)为例,它是进行人类参与者实验的可定制虚拟平台,既可运行数千个实验条件与系统覆盖给定的参数空间,又能通过数字孪生技术仿真实体组织进行整体分析。[16]可见,以区块链、5G与脑机接口为主的智能技术正在赋予文科知识生产更大的灵活性、便捷性与科学性。
综合而言,数字化知识合作网络可以动员大规模异质化的学科人员、数据专家与行业代表参与知识生产,推动单一的知识成果走向知识集群。在知识生产数字化背景下,议题评估、数字协作、知识建构与成果输出是在以虚拟实验室为集成的多个数字平台上协作完成的,既涉及学科、行业与政府多个层面,又包含资源、人力与数据多个要素,还囊括知识、工具与技术多个形态,呈现了知识集群的动态适应、系统开放与自组织特征。
(四)评估问责:加强数字时代知识生产的质量控制
由于数字时代知识生产具有多主体、多形态与多层次的多维聚合性,知识成果的效用评价既包含内部评价,又囊括了外部问责。在内部评价中,同侪人员基于学术创新视角评估数据建模解释研究假设的科学性,学生从人才培养角度评价数字化知识生产过程中的内容与知识体验,而组织评价的任务在于分析数字模型的有效性。由于建构的机器学习数据模型属于“黑匣子”,无法清晰地掌握内在生产过程,因此内部评价通过数据算法模型对因果关系、机制生成与趋势预测进行检验,从而保证知识生产的整体质量。[17]其实,从确立目标之初,计算社会科学实验室(A-02,A-07和A-20)建立了全时段与全过程的数据评价机制,将历史数据与质量评测纳入知识生产模型中,以便进行动态追踪与监控。
数字时代的文科知识生产是由公共议题、异质知识与数字协作所驱动的,关于知识“成功”的定义愈来愈取决于产业、政府与公民社会对知识成果的反馈,由此也决定了外部评价标准愈来愈成为知识合法性的重要向度。在哥伦比亚大学计算社会科学中心(A-11)建立的外部反馈机制中,侧重关注知识成果对商业模式与资源配置的再生影响,着眼于数字技术评测政策效果与推动政府数字转型进程。此外,他们还从公共利益与道德福祉层面反思知识创新所带来的社会影响。[18]这体现为文科知识生产在通过数字技术更加灵活便捷嵌入“大学—行业—政府—公民社会”的创新生态系统时,亦通过公共尺度强化了知识成果在数字正义与算法规范层面的审查问责,确保了知识创新与公共利益的达成。
为了使内部评价与外部问责有效结合,计算社会科学实验室构建了数字化知识评价体系。以伦敦大学学院知识实验室(A-08)为例,它将数据评测、计算仿真与外部问责相统一,形成了“全过程数字跟踪—机器学习评价模型—知识全景归纳分析—可视化反馈调节”的知识评价路径。不过,数字化评价存在广泛共识,即评价模型、指标与内容需要满足公共利益的统一标准,符合算法正义与数字伦理的共享价值。换言之,当前文科实验室构建了基于技术与数据的知识评价体系,其内核仍是从人的发展向度与社会公益尺度审思数据、计算与技术共同缔造的知识价值。因此,数字时代的知识评价不仅要兼顾一般意义上的多重标准,还须在知识创新的公共价值方面做出更多的制度建设。
(五)数字时代文科知识生产的运行机制
数字时代文科知识生产过程中的关键要素及其相互作用方式,共同构建了从情境驱动迈向知识创新的运行机制(见图1)。本研究秉持整体主义原则将主范畴纳入案例情境中进行逻辑串联发现,各要素之间之所以能形成较为紧密的互动关系,关键在于数字时代“四螺旋”创新结构具有较大的资源整合与动员能力,善于从社会议题中形成具有前瞻性的知识创新目标,构建纵横交错的创新网络与高度协同的知识集群,从而实现知识生产的公共利益。
图1 数字时代文科知识生产创新的运行机制
计算社会科学实验室的高效运作很大程度上归因于多元参与、扁平松散与开放韧性的数字化知识创新生态系统。在智能时代,文科知识生产创新目标并不是私益性的,其必须通过数字技术与多元主体参与实现研究的公益性目标。[19]知识生产在社会情境驱动形成公共目标时,也促进了知识创新实现社会公共利益的进程。融入公共目标的知识生产在评估问责时不仅会遵循学术创新与应用效率的评价逻辑,同时会受到社会公共利益逻辑的问责影响。同样,知识创新目标中公共目标的融入,使大学具备了对政府、行业与公民社会更强的知识动员能力。因此,公共目标是文科知识创新的隐性目标,并渗透到其他目标中随其他目标的达成而实现,而后续的知识生产活动围绕创新目标而展开的过程,更是公共目标融入后组织协同作用的连锁反应。
为了打破数字协作壁垒并提高知识生产创新效率,在使用机器学习与算法治理的大数据计算对社会复杂问题寻求新颖且可复制见解的过程中,学术组织其实构建了包括数据基础设施平台、行业伙伴关系与学术合作网络在内的纵横交错的创新网络。这体现了整合思维、大规模协作与开放科学的组织特征,打破了学科边界与组织层级,使大学在应对数字化挑战与社会危机时能够快速动员知识共同体中的学科专家与公共机构开展数字协作,从而提升知识创新效率。[20]这种适应实践需要而形成的纵横交错的智能平台以云计算为工具,通过数据云、服务云的云层服务实现知识生产协作的无缝衔接,增强了知识治理的灵活性与韧性。创新目标中,公共目标的融入为数字化知识评价模型与体系构建确定了基调,从而有效维护了知识生产过程中的数字伦理、算法正义与计算创新。实质上,这是一种对知识生产创新效果的反馈,并与最初的知识创新目标构成了评估问责的闭环。这一闭路的循环机制与评估问责的激励机制促进了知识生产创新的整体效能,并对文科知识生产目标的实现扮演着过程监督功能。
知识集群作为衔接创新目标、创新网络和评估问责并将诸要素转化为知识创新的中间环节,这一机制关系到数字化知识成果的科学性与有效性。实质上,数字化知识生产运行依托于区块链、人工智能与云计算等技术集合,如通过人机交互机器人、脑机接口与物联网等技术进行数据联通与交互(A-10),通过区块链、智能端口监管与维护数字化知识协作体系运行(A-18),通过云计算、5G技术支撑大规模即时的开放科学实践与数字化合作(A-21)。在文科知识创新过程中,议程设计、数字协作与知识建构共同构成数字化知识生产集群机制,并与纵横交错的创新网络机制、可视化的知识评价机制一道,实现数据生产要素向知识智慧的创新转化。这其实是将社会议题转化为研究任务实现知识输出并完成公共目标的数字化过程,亦有助于各生产要素相互作用所形成的知识联合体实现资源、创新与传播的协同放大效应。概言之,与知识生产模式Ⅲ一致,数字时代文科知识生产运行依赖创新网络与知识集群所促成的创新生态系统开展数字协作与有机联动,加速了知识生产进程并实现知识生产的创新目标。
五、结语
知识生产模式Ⅲ以知识集群、创新网络及其所建构的生态系统作为核心要件,并以“四重螺旋”创新生态系统作为其存在的适应性情境。分析发现,数字时代文科知识生产受问题情境驱动,并在创新网络、知识集群与评估问责运行框架下产生类型多元的知识成果。四者间的互动共同构建了数字化的文科知识生产运行机制,也促成了文科知识生产创新生态系统,使“大学—政府—行业—公民社会”有机联结并具备更大的创新协调能力。为此,全球大学应科学制订文科实验室的规划方案与建设办法,通过公私合作模式建立横纵交错与开放共享的数字协作系统,完善文科知识生产的智能设施与技术结构,从而健全知识生产的智能技术体系。与此同时,由于成果类型较为多元,数字时代的大学应当建立由多领域、多学科与多层次专家与行业领导者组成的学术委员会,对知识成果建立具有发展性、激励性与指导性相兼容的评价体系,并联合政府、行业组织与社会确定更为严格的数据隐私与伦理风险评估体系,预防与治理知识生产中的数据安全问题。但须注意的是,文科知识生产不必对数字算法产生效率崇拜,不必倒置问题与技术的主客关系,而是坚持以人为本的价值立场并与人类命运的公共利益相联系,直面社会问题的复杂与纷乱,才能彰显技术进步的革命性意义。