近20年来中国家庭研究变迁
——基于关键词共现的社会网络分析
2022-01-07熊英宏
李 婷,熊英宏
(1.中国人民大学 人口与发展研究中心,北京 100872;2.中国人民大学 家庭与性别研究中心,北京 100872;3.中国人民大学 社会与人口学院,北京,100872)
在过去的几十年间,中国家庭发生的变化引起了研究者们的关注,相关研究成果逐年增多,议题不断丰富,研究广度和深度持续拓展深入,形成了一个较为庞大的中国家庭研究知识体系。回顾家庭研究知识体系的发展变化,一方面有利于总结该领域的研究议题和发展脉络,加深对中国家庭研究状况及其变迁的理解;另一方面,从知识社会学的角度,探索中国家庭研究的知识体系及其与外部的联系与互动,有利于揭示该研究领域的发展趋势以及相关知识的流动、建构和拓展的规律。
社会网络分析以网络的形式呈现研究领域的合作关系、引用关系和知识结构关系[1-2]。对合作关系的研究主要以作者为“节点”,合作关系为“边”构建出研究领域的核心作者和核心机构,揭示研究的派系和团体分布[3]。对引用关系的研究则以文章为“节点”,引用关系为“边”,展示文章的引用模式和研究领域内知识的传递模式[4]。然而针对合作关系和引用关系的研究只能从较浅层次揭示研究领域的知识构成,隶属于表象法的研究范式。而利用内容分析方法,从文献中直接提出知识点(“节点”),并基于知识点之间的共现关系(“边”)形成的知识网络图谱就是隶属于内涵法的深层研究范式[5]。其中,以文献关键词为知识点创建共现词网络是最为方便和高效的操作方式。
虽然文献计量学已经将社会网络分析应用到多个研究领域,构建起了各自的关键词共现网络[6-8],但由于专业知识有限,这些研究无法深入洞悉各领域内特有的知识内涵,难以挖掘各个领域知识结构体系的独特性。换言之,对该方法的应用需要突破文献计量学的学科视角,使之深入具体的学科领域中才能发挥更大的作用。本研究以近20年来社会学和人口学领域内的中国家庭研究为例,采用关键词共现的社会网络分析方法,展示如何利用该技术来增进对具体领域研究脉络和知识增长过程的理解。家庭研究既涵盖了生育、死亡和迁移等基本人口学内容,又与社会学的多个传统研究领域交叉,能够广泛涉及社会学和人口学研究的相关议题,具有一定的代表性。
一、社会网络分析与关键词共现网络
社会网络分析(Social Network Analysis)出现于20世纪70年代,80年代以后在社会学研究中被广泛运用于探索社会网络关系的构成。有学者认为社会网络分析是一种关于“结构分析”的研究视角[9]。它可以将复杂多样的关系形态转化为一定的网络结构,再基于这些结构及其变动状况,阐释其对个体行动和社会结构的意义[10]。社会网络是由多个节点和节点之间的连线组成的集合,其中“节点”代表各个社会行动者,“边”指的是行动者之间的各种社会关系,连线既可以是有向的,也可以是无向的,有向的连线具有关系上的指向性,而无向连线仅体现二者之间存在联系,比如共存、共现。
文献关键词是表达文章研究主题的词汇,可以概括各篇文献的内容及其所涉及的知识维度。在社会网络中,某一篇文献中的几个关键词不存在指向性,一组关键词两两出现在同一文献中,即为关键词共现的关系,关键词之间被连接的次数多少可以反映其热度,共同出现的次数多少则可以用来表示它们的亲疏关系。关键词共现所产生的连接关系蕴含着作者对研究维度的主动设计,具有主体能动性。而关键词间的互动性则体现在它们通过连接共同架构起特定研究的知识框架。社会网络分析方法对于分析具有能动性和互动性的主体间的关系具备独特的优势,有利于描绘单篇论文在知识维度上的设计和架构最终如何形成研究领域的知识体系图景以及随时间产生的变化。
为了更加清楚地表述这种无向共现的关系,本研究假设存在3篇文献,其关键词如表1所示,其中共有4个关键词节点,“家庭结构”与“迁移流动”和其余关键词都存在连接关系,因此更受关注;而4个关键词共现的次数均为1,因此亲疏关系一致。在社会网络图谱中,通常用不带箭头的简单线段来表示节点间无向共现的关系,而用带有箭头的线段表示有向的关系,图1则展示了这种无向的共现关系。
表1 文献关键词示意
图1 无向共现社会网络示意图
利用共现社会网络来研究某一领域内的关键词有几个优势。首先,共现社会网络能够展示出不同关键词的连接关系和相对位置。利用不同时期的网络连接及其变动情况,可以形象地展示一个领域知识体系的搭建过程。其次,社会网络分析方法有一套系统的分析指标,用以定量刻画关键词共现网络的深层次特征,挖掘不同关键词对整体知识网络的差异性影响。这些分析指标包括点度中心性(Degree Centrality)、中介中心性(Betweenness Centrality)和捷径(Geodesics)等。
点度中心性和中介中心性都属于中心性(Centrality)分析指标,用来代表节点在社会网络中处于怎样的中心地位或拥有怎样的权力。点度中心性测量的是网络中与该节点直接相连的节点的数目。如果一个节点与很多其他节点直接连接,那么该节点就处于中心地位,拥有更多的权力[11]。中介中心性则反映了节点传递信息的能力。节点的中介中心性越高,越多的节点需要通过它才能联系,反映的是节点的“中介”效用[11]。在共现网络中,如果一个关键词具有较高的中介中心性,那么该关键词在网络传播的媒介作用就更明显[12]。
有别于上述几个度量单个节点特征的指标,捷径测量的是网络的全局特征,指代社会网络中任意两节点之间最短路径的平均值,即网络的平均路径长度[8]。如果一个网络的捷径越短,表明网络的通达性越强。著名的六度分割理论认为世界上任意两个人可以通过不超过六个人来获得联系[13],这就代表全世界所有个体所组成的社交网络的捷径值小于6。
二、研究问题和研究思路
对家庭研究的传统分类可以基于四个核心概念:家庭结构、家庭关系、家庭功能和价值观念[14],近些年来有关家庭政策的研究也越来越多。然而文献的关键词所涉及的范围更为广泛,很难把所有关键词都归于以上类别中,需要有更宽泛的划分方式。在本研究中,我们大致将关键词划分为研究议题、研究视角和研究方法。研究议题可以包涵研究的对象、现象和主题等,例如育龄妇女、迁移流动、幸福感等,而人口学中最重要的三大议题包括生育、老龄死亡以及迁移流动。研究视角主要涉及研究采用的理论和分析框架,如性别视角、个体化视角等。需要注意的是,有些关键词既可以作为研究议题,也可以作为研究视角,比如家庭结构。一些文献专门研究家庭结构本身[15-16],而另一些文献则可能讨论家庭结构对特定现象的影响,隐含结构功能主义的视角[17-18]。研究方法则指在研究中采用的数据、测量和分析等方法,如抽样调查、生存分析和成本-效用分析法等。
具体来说,我们可以先观察三类关键词各自网络特征的变化,分析每个类别内部研究体系的变迁。其次,我们关注不同类别的关键词因研究议题的扩大、研究视角的丰富以及研究方法的多样化对整体研究体系扩展过程的影响。最后,我们将依据结果讨论研究体系的变动与现实社会如何关联,这也是知识社会学的核心内容[19]。
本研究的研究思路如下:第一,搜集近20年来关于家庭研究的重要文献;第二,提取文献关键词构建共现网络;第三,总体描述关键词共现网络的重要特征;第四,分时间阶段提取各时期关键词共现网络的信息,通过对中心性等指标的分析,发掘不同阶段关键节点的性质,从而对知识网络扩展的模式进行观察。
三、数据与方法
(一)数据选取
本研究采用社会网络分析。首先,为了揭示历年来家庭研究领域的发展状况,在中国知网“CNKI”数据库进行高级检索,选择篇名中含有关键词“家庭”、期刊类别为CSSCI和北大核心期刊的所有中文文献,按发表年度进行分组,最终得到2000—2019年共20年分年度的相关文献数量,分布情况见图2。
图2 2000——2019年家庭研究领域历年“C刊”及北大核心期刊发文量
整体而言,20年来关于家庭研究的论文数量稳步上升,而文献所覆盖的领域过于宽泛,超越了本文所考虑的社会学及人口学研究范畴。同时,本研究基于相关期刊影响因子的排序以及与本文议题的相关度,选取了以下12本期刊:《中国社会科学》《社会科学》2本综合期刊;《社会学研究》《社会》《青年研究》《社会学评论》《妇女研究论丛》5本社会学类期刊;《人口研究》《中国人口科学》《人口学刊》《人口与经济》《人口与发展》5本人口学类期刊。从这些期刊中选出2000—2019年间刊发的关键词包含“家庭”的文献,共获得565篇文献作为有效样本,其中社会学类共216篇,人口学类共349篇,相关文献每年的发文数量见图3。
图3 2000—2019年12本期刊相关文献刊发数量
(二)分析方法
本文选用UCINET软件作为数据分析的工具,并使用NetDraw作为绘图工具,实现社会网络图谱的可视化。社会网络图谱中的连线长度并不代表实际的距离,任意两个连接的行动者之间的距离都为1个标准单位。采用数据和图形相结合的方式,更有利于系统直观地呈现研究结果。
如上文所述,本研究将首先对近20年来家庭研究领域关键词共现网络的概念图谱、平均路径长度、捷径分布、点度中心性、中介中心性等测量指标进行整体性描述分析;再纵向比较2000—2004年、2005—2009年、2010—2014年以及2015—2019年不同时期共现网络结构的异同,探究家庭研究随时间推移的演进趋势。
四、分析结果
(一)2000—2019年社会学与人口学领域家庭研究关键词共现网络
本文提取所有文献的关键词,处理并去重后,一共得到733个关键词。由于关键词数量较多且连接复杂,因此只将两两关键词之间连接次数大于一次的网络结构绘进共现图谱中。如果两个关键词在超过一篇文献中存在共现关系,也说明它们之间的知识关联具备一定的稳定性。
图4展示了全部文献中的家庭研究关键词共现网络图谱。通过观察可以发现关键词之间连接紧密,关系复杂。网络图谱中的连线表示关键词的共现关系,以节点的点度中心性作为图中节点面积的衡量指标,点度中心性越大,节点越大;关键词共现的次数决定连接两个节点线段的粗细,两个关键词共现次数越多,则连线越粗。
图4 相关研究关键词共现网络图谱注:图中仅展示共现次数大于1的部分网络
图5进一步展示了相关关键词共现网络的捷径长度分布。绝大多数关键词之间的最短距离集中在2~4,比例为95.9%,网络中两个关键词之间最长的距离为7。对捷径的计算结果显示,家庭研究概念网络的平均路径长度为3.157,接近“三度分离”,意味着在网络中任意两个节点之间平均只需要三步(通过两个中间词)就可以互相连接。虽然家庭研究网络中节点数量非常多,但平均路径长度却非常短。这说明,家庭研究是一个知识概念集中度较高的领域,具有“小世界”的特征。
图5 家庭研究概念网络捷径长度分布频数
本文继续通过“点度中心性”和“中介中心性”来考察各关键词在社会网络中的不同地位。“点度中心性”衡量的是与各中心节点相连的关键词数量的多少。结合网络图谱与数据,“家庭结构”“老年人”“教育”“家庭养老”“性别”“迁移流动”等关键词节点的标准化值较大,说明它们不仅是20年来家庭研究领域涉及较多的关键词,还与网络中的其他关键词广泛联系,拓展了研究组合的多样性。如果以上文提到的研究议题、研究视角和研究方法的框架来划分,排名前20的关键词大多数属于研究议题的范畴,只有“家庭结构”“性别”和“社会政策”涉及研究视角,说明有关研究议题的关键词在知识网络中更普遍,拥有更多的权力。由表2可见,点度中心性与中介中心性的排名存在一定的重合,在简单的网络中,这两者相关性很高,但在复杂的网络中,这两方面的特征可能存在一定的错位。一个节点的中介中心性数值高可能存在两种情况:其一,与该节点直接相连的其他节点很多,导致经过该节点的路径很多,出现最短路径的可能性增大;其二,该节点处于两个子网络的结合部位,从而成为连接两个子网络的“必经之路”[8]。“家庭结构”“教育”“农村”“老年人”“家庭养老”“性别”“生育”这些关键词的点度中心性和中介中心性值均很高,属于上述第一种情况。而“家庭暴力”和“消费”虽说在中介中心性方面排名前20,但点度中心性相关数值较小,属于上述第二种情况,它们更可能位于不同的研究模块之间,在不同子团体之间传递信息,起到关键的中介作用。就关键词共现网络而言,这类关键词可能相对冷门,处于不同研究子领域的交叉部位,但可以促进异质性高的议题发生碰撞。因此,关注第二类关键词更有助于理解知识网络是如何扩展的。
表2 两项特征指标分别排名前20的关键词
总体而言,2000—2019年家庭研究领域相关文献中大部分拥有较大权力的关键词都属于研究议题范畴,“家庭暴力”和“消费”更多地连接起了异质性领域,而研究视角中的关键词“女性”起到了中介的作用,增加了网络的连通性。
(二)不同时期家庭研究领域关键词共现网络的比较分析
将相关文献按五年一个时期划分为四个阶段,纵向考察20年来家庭研究领域知识结构的变迁。这四个阶段的关键词数量分别为138、168、309和404个。图6展示了这四个阶段的关键词共现网络图谱。可以看出随着时间的推移,不仅关键词节点的数量在增加,节点之间的连接关系也更为复杂,从最初比较单一、分散的知识模块结构发展成内容丰富、连接紧密的知识网络体系。
图6 家庭研究文献各阶段关键词共现的网络图谱
1.点度中心性的变动
表3展示了整体出现频率排名前20的关键词在四个时期的点度中心性和排名。将表3中的关键词分成三类,第一类是热度持续下降的关键词,包括“家庭养老”“独生子女”“计划生育”“生育”和“婚姻”,这些关键词均在2000年初期有较高的热度并且在网络中起到主导作用,但随后几年不管是点度中心性的绝对取值还是相对排名均大幅度下降。这说明2000年初期生育相关议题是家庭研究领域的热点,此后该议题热度下降。
表3 高频率关键词在四个时期内的点度中心性取值及其排名变化
第二类是热度显著上升的关键词,包括“教育”“迁移流动”“性别”“贫困”“女性”“代际支持”和“家庭照料”。“教育”“迁移流动”和“贫困”是对原有研究议题诸如“家庭结构”“老年人”等的拓展;概念更加具体的“代际支持”和“家庭照料”取代概念宽泛的“家庭养老”;“女性”和“性别”则是新的研究视角。
第三类关键词虽然在四个时期内有所波动但热度总体保持稳定,包括“家庭结构”“农村”“老年人”“代际关系”“家庭经济”“居住安排”和“社会政策”。“家庭结构”是整体网络中出现频率最高的关键词,并在四个时期均保持较高的点度中心性排名。虽然它的标准化连接数量有所下降,但这主要是由关键词网络的扩大和分散所引起的。“家庭结构”除了本身可以作为研究议题外,也可以是一种研究视角。如果仔细观察图6的网络图谱就会发现,在前两个阶段“家庭结构”更多作为研究议题出现,与之连接的“单亲家庭”和“独生子女”等关键词都是家庭结构的具体呈现。然而自2010年起,“家庭结构”开始与其他的议题产生广泛联系,例如“代际关系”“流动人口”等,起到了提供研究视角的作用。除了“家庭结构”,其他关键词大多跟老年人和养老支持有关,说明20年间,家庭研究层面上对养老问题的关注度较高,也体现了我国面临的严峻的人口老龄化问题。
除了出现频率排名前20的关键词之外,某一时期点度中心性突然上升的关键词也值得关注。例如2005—2009年期间的“和谐”,2010—2014年期间的“留守”和“儿童”以及2015—2019年间的“幸福感”“家庭政策”和“不平等”。其中“和谐”和“幸福感”与当时的社会文化相呼应;“留守”和“儿童”体现了2010年以后学界对弱势群体的关注;“家庭政策”中心度的上升与“社会政策”热度的下降表明对家庭问题的政策关怀从“社会政策”转向“家庭政策”;“不平等”作为新的研究视角对研究网络起到有效的拓展作用。
总结来说,从点度中心性所展示的关键词的权力和热度来看,家庭领域中与生育相关的议题热度衰减,迁移流动、教育、贫困等新议题的兴起补充和扩大了相关研究体系。性别和不平等等新视角扩大了家庭研究的理论视域。与养老相关的议题热度变化不大,但是其关键词呈现出更加具体化和深入化的趋势。由此可见,家庭领域研究体系的扩张同时伴随着议题的扩大、新研究视角的出现以及宽泛议题趋于具体化。
2.中介中心性的变动
表4展示了频率排名前20的关键词在四个时期中的中介中心性取值和排名。中介中心性的排名变化与点度中心性大致相似,与生育相关的关键词的中介中心性持续下降,除了“迁移流动”,大部分点度中心性显著上升的关键词的中介中心性排名也提高了。虽然“迁移流动”的点度中心性在后三个时期有明显上涨的趋势,但是其中介中心性却显示出下降的趋势,说明虽然迁移流动的研究热度不断增加,但是它对其他关键词的影响力却在不断下降。这可能是因为迁移流动是一个相对独立的现象,随着知识网络的扩大,更多的关键词可以不经过它而直接产生连接。与此相反,那些涉及研究视角的关键词的中介中心性排名的上涨幅度比较明显,譬如“女性”和“性别”。
表4 高频率关键词在四个时期内中介中心性的取值及其排名变化
上文提到的无论是热度高还是信息控制力强的关键词,大部分都隶属于研究议题范畴,研究视角相关的关键词除了“家庭结构”“女性”和“性别”,其余在两类中心性的排名均在15名开外。如果仔细观察其他与研究视角有关的关键词,例如“现代化”“不平等”“家庭化”“消费”等,它们在两类中心性的排名在四个时期内均有大幅度上升。这说明在家庭研究中,研究视角型的关键词在知识网络中的重要性普遍上升,意味着更多的议题纳入共同的理论视角中,理论对知识网络起到了一定的整合作用。另一方面也反映了我国家庭研究领域缺乏独创且有一定影响力的新兴理论视角。
每个阶段点度中心性和中介中心性排名反差较大的关键词通常处于不同研究子领域的交互地带,对于促进异质性高的议题碰撞、拓展知识网络具有关键的作用。表5展示了四个时期点度中心性与中介中心性排名差异较大的关键词。本研究将中介中心性排名限制在前35名,以排除太过边缘的关键词。
表5 四个阶段点度中心性与中介中心性排名差异较大的关键词
在2000—2004年期间,“社会变迁”“教育”“家庭照料”和“迁移流动”属于较为冷门但能有效连接异质性议题的关键词。这些关键词的热度在随后几年都大幅提升,特别是后三者。2005—2009年和2010—2014年所涉及的关键词的热度大部分也在后续年份有不同程度的上升。由此可见,家庭研究领域的知识体系的扩展方式如下:开始处于边缘地位但具有较强链接能力的关键词主导异质性领域交叉碰撞,从而拓展了原有的知识网络,随着边缘板块热度的上升,网络内部的连接更加紧密,然后边缘板块逐渐成为核心板块,整个研究体系得到了实质性的扩张。值得注意的是,这类处于交叉领域的关键词绝大部分都隶属于研究议题范畴。
另一方面,处于边缘但是具有较高信息控制力的关键词很可能会在随后的时期成为热门词汇。因此,这类关键词所涉及的交叉研究领域值得关注。以2015—2019年为例,“社会工作”所涉及的对家庭的实务干预,“家庭暴力”所涉及的家庭关系问题和法律议题,以及“健康”所涉及的家庭成员的健康福利都可能成为未来家庭研究领域的热门话题。
五、总结与讨论
本研究利用社会网络分析方法展示了近20年来中国家庭研究关键词的共现网络,以揭示我国家庭研究领域知识体系的构建与拓展过程。研究发现,知识网络的拓展主要伴随着三个过程:议题的扩张、研究视角对网络的整合以及宽泛议题的具体化。
研究议题方面,与生育相关的关键词热度持续下降,而与迁移流动、教育和贫困相关的关键词热度持续上升,同时它们在影响其他关键词共现上的能力也同步增强。换言之,这类新兴关键词不仅扩大了网络的节点数,更增加了网络内部其他关键词联系的紧密度和通达性。与养老相关的关键词在整个时期内持续保持较高的热度,但是随着时间的推移愈加细致和具体。研究议题热度的变动体现了家庭研究领域对自身认知的变化,对现实问题的关怀,也受到政策影响。对家庭功能的关注从单一聚焦于人口再生产到养老、教育、经济和消费等方面。由于家庭研究对人口研究领域中对象的包容性,家庭议题的转变也能很好地反映人口学研究议题的变迁。就人口学经典的三大研究领域来说,生育研究热度的下降在家庭研究领域也有所折射。这种下降不仅仅是相关关键词出现频率的下降,控制其他关键词的共现能力也同样下降。迁移流动属于热度显著上升的领域,然而与热度相对平稳的老龄研究相比,它的信息控制能力更弱,可能因为迁移流动是一个相对独立的人口学现象。
研究视角方面,随着时期的推进,一方面“家庭结构”从作为单纯的研究议题转化为研究视角;另一方面以“女性”“性别”等关键词为代表的性别视角在家庭研究领域中快速兴起。相比于议题型的关键词,具有研究视角功能的关键词往往具有更高的信息控制力。这类关键词两类中心性数值的增大也意味着理论对知识网络的整合作用在提高,同时也说明议题的扩大并没有带来显著的范式转移,更多的议题被纳入有限的理论视角中。这也反映了我国家庭研究领域理论发展相对缓慢。
与研究方法相关的关键词在共现网络中不仅数量少,热度也持续走低。这一方面说明中国家庭研究领域并没有形成太多独特的研究方法,另一方面也说明研究方法在推动家庭研究知识体系发展中的作用有限。
总而言之,中国家庭研究知识体系的扩展主要是由议题范围的扩大所主导的,包括新议题的涌现,具有较强信息传递力的边缘议题热度的上升以及传统议题的深入与具体化。研究视角的运用和发展也对知识网络的建构起到一定的整合作用,但是由于理论发展较为缓慢,此类关键词在整个网络扩张过程中的作用相对有限。此外,中国家庭研究并没有发展出新的研究方法或者固定使用某种研究方法,因此知识网络的扩张也并非由研究方法所驱动。
进一步从知识社会学角度对分析结果进行解释,一个领域研究体系的发展通常来自内部和外部力量的共同作用。内部力量推动领域自身的发展和成熟,包括议题的精细化,议题之间的关联性上升,新的研究视角和理论的涌现,独特研究方法的广泛应用等。同时,具有交叉属性的议题和视角能拉动内部异质性板块的互动。这些过程促使研究体系不断发展丰富,内部网络联系更加紧密。其中又以新议题出现以及交叉性板块的纳入为主。家庭研究在社会学和人口学中的发展非常符合知识社会学对科学发展的一般性描述,即科学知识的增长模式并不是革命性地推翻根深蒂固的正统思想,而是发现并探索新的未知领域,扩大其外部边界[20]。
外部力量的作用则指知识是通过磋商在社会互动过程中确立的,是处于特定社会和文化背景中的适当主张[21]。研究者在确立议题、设定研究视角以及运用方法得出结论的时候,均会一方面吸纳社会的政治和文化资源,另一方面又会受到这些资源的限制。就议题的转换而言,政策的变迁和社会现实问题的转移促使部分关键词热度此消彼长,社会文化的转变使得部分关键词在不同时期热度不同,并可以广泛连接其他关键词。而性别研究和性别视角的兴起,也缘于文化层面上女性主义的发展。这种社会外部的文化价值对研究体系的穿透有助于知识体系的整合与扩充。
本文的研究结果一方面能清晰地描述中国家庭研究的发展路径,另一方面有利于明晰相关研究知识体系的构建过程。当然利用网络分析方法研究关键词的共现网络也存在一些问题。首先,本研究并没有合并那些意义较为相近的关键词,而不同的关键词可能存在隶属关系,例如,家庭关系和家庭结构都隶属于家庭这个关键词,这可能使得关键词共现网络不完全等同于真实的概念网络。其次,关键词共现网络的变动非常复杂,本研究仅从频率、点度中心性以及中介中心性这几个维度来进行分析,未能全面呈现出共现网络的整体特征以及单个关键词的连接特征的变动,特别那些暂时位于边缘地带的新兴的关键词未充分涉及。这些问题都有待进一步研究。