多层模型在社会科学中的应用

2015-01-21字星运

商 2014年34期

字星运

摘要：随着近年来信息时代的到临，数据也变得越发的重要起来。逐渐，数据等级结构分析的方法开始出现，多层模型数据分析技术也随之应运而生。顾名思义，多层模型是在单层模型技术分析的基础上发展起来，也具有单层模型不可比拟的优势，分析数据时多层模型比单层模型更加全面，实用性更加广泛，使用起来也更加的灵活多变。本文将简要的阐述多层模型在社会科学中的应用基本原理，以及使用多层模型所具有的优势。

关键词：多层模型；社会科学；应用

由于我国经济的迅速发展，人口的转移与迁移也越来越频繁。一般进行人口普查的时候都会采取大规模的社会调查方法，多层次、分步骤的进行样本的采集[1]。这样，就是得到的人口数据庞大而具有层次性。运用以往的统计方法对这些数据进行分析的话，无法得到精确和准确的答案，因为，往往会将高层的数据与底层的数据混合在一起统计。为了得到更加科学、准确的数据分析，在社会科学领域中运用多层模型进行统计的方式就越来越受到关注了。

一、多层线性模型

在社会科学的研究中，收集而来的数据往往具有多层次的特点，不仅会描述调查个体的变量，还会出现更高一层的变量，这样的变量一般都是以组合的形式出现[3]。具有这样特点的结构数据在测量的时候可以看作为一个具有层次结构的数据，第一水平为测量的不同种类，第二水平为个体或组合，这样重复的测量数据就扩大了多层模型的使用范围。在社会科学领探究之中，像人口调查数据就是典型的分层数据，一般考虑的变测量为社会经济地位，职业、住址等，第一水平的设定是每个公民个人，第二水平则是每个不同的社区。也就是说，对带有层次特征的数据分别在每一个层级进行讨论，并分别设立模型，再通过高层变量对底层方程的截距和变量施加影响来达到相互联系的目的[2]。使用多层模型不仅能考虑到不同水平的变异，还能在模型的假设上与实际情况更加一致，并得出更加合理的答案，也更加正确的揭示了事物之间的变量关系。

二、多层线性模型运用的基本原理

多层模型运用的基本原理是：将变量中的变异分解为两部分，一部分是同一个群体之中的个体差异；另一个部分则是不同群体之间的个体差异，通过分解变异区分多层模型中的群体效果及个体效果，并揭示群体与个体之间的变量关系[1]。

（一）无条件平均模型

比如人口普查，我国的人口普查是社区以家庭为单位的进行统计，最后汇总到统计局的数据往往都是具有家庭和社区两层结构，社区由千万个家庭组合而成，家庭由存在于各个社区之中，两者之间任何一方产生变量另一方也随之发生变化。首先对该数据进行无条件平均模型进行回归分析，假设该模型没有产生任何变量，然后运用公式进行数据的分析，然后要注意三个方面：第一，群体会因变量的变异而产生明显的变异，在人口普查的时候，没有被调查的或者是无法接受调查的社区层次的随机变量的变异成分明显不等于零时，那么因变量就会随着群体的变异而变异，这个时候就需要使用多层线性模型分析了；第二，群体特征对因变量影响的大小；第三，自变量对因变量的解释能力[4]。

（二）随机截距模型

然后，在无条件平均模式中加入变量因素，探讨个体和群体这两个因素对因变量的作用。随机截距模型主要体现的是每个层次的因素之间会缺乏互动性，主要是因为模型假设了因变量的截距会随着群体的变异而变异，且每个群体的回归斜率是固定的前置条件。另一种常用的多层模型则是随机截距和随机斜率相结合的模型。跟随机截距模型的不同是，它不仅假设了截距会会因群体变异而变异，还假设了回归斜率也会因群体变异而变异，这样，就允许了不同层次之间的各个因素可以相互互动和影响。比如，在人口普查中，因变量为家庭背景和社区环境，在经过计算后，这个随机的因变量值就可以成为统计人员估算社区环境对家庭影响大小的依据。另外，也可以根据这个因变量估算出，在同等的社区环境和家庭影响下，不同想的个体之间可能会存在相同的因素。

（三）随机截距与随机斜率模型

反过来，在一些情况下，个体的因素对因变量的影响可能会因群体的不同而不同，也就是允许群体拥有不同的截距和不同的斜率。套用中国的古话则是：近朱者赤近墨者黑。在每次人口普查统计后，统计人员都会发现，每个城市都存在着‘打工村这样的情况。不仅是因为‘打工村社区本身就聚集了许许多多的外来务工人员，更是因为外来的务工人员在城市‘落脚的时候往往会因为自我对号入座的思想及‘打工村的‘名声而选择性的留在‘打工村。另一方面，城市的常住人口也会具有明显的聚集性。这也就是说，个体的因素对因变量的影响很可能会因为社会环境的不同而不同。

三、多层线性模型的优势性

将因变量的变异分解为群内变异和群间变异并将结果尽可能的标准化、精确化是多层模型的主要优点。运用多层模型，不仅可以分析出社区和假体因素对家庭个经济地位的影响，还能探讨出因变量的变异、自变量对因变量的影响和社区之间的关系，从而利于对人口的统计与管理，为城市发展导向提供了良好的依据[1]。

（一）多层模型具有区分不同层次因素对因变量的解释能力

传统的线性模型只能对样本数据的一层进行分析，然而，在社会科学领域当中，研究意义更为重要的、更让人引发兴趣的是家庭层的变量与社区层的变量之间的交互作用。多层模型也许会因为数据的局限性和理论的局限性，在实际计算的时候往往会因为遗漏一些对家庭经济地位至关重要的因素，导致计算出来的答案往往会出现不符合常理、不符合实际的情况。即使社区因素的解释能力强，但是社区层次的随机变量变异非常活跃，要求研究人员仍需要进一步的研究：是否需要在模型中加入其它的重要因素。但是，相对其它模型而言，多层模型能在发现新的重要因素使能随时予以加入，并更加完善的表现出不同层次因素对家庭经济地位的影响结果，并进一步的发展了社会科学领域研究模型，完善了研究理论学识，对社会科学领域的调查数据也更加精准，结论也更加准确、真实。

（二）多层模型运用范围广，使用比较的灵活

多层模型的运用范围很广，比如，在不同层次的数据调查中，同一个个体的特征在不同时间内调查会显示其的共性关联性，这样，就违反了研究中的样本独立原则。那么，后期计算出的数据必然是不真实的，有些数据很有可能重叠计算了。经过研究，运用多层模型进行计算，将每个调查时间作为一个单独的层次来处理就能克服调查数据的重叠问题、假如一个多层模型的纵向设计包括了家庭和社区，那么，在实际计算的时候往往要多加一个类别——时间。并且，多层模型的运用是非常灵活的，横向的因变量不是一成不变的，可以根据社会发展中出现的新产物而进行编入，可以随着时代的发展而不断完善。所以，多层模型又称之为“生长模型”。

四、结语

综上所述，随着社会的不断发展，以及人口迁移的加快，对社会科学领域的研究也越来越深入。但是，社会科学是一门数据非常庞大，统计非常困难，稳定性特别弱的学科。导致社会科学研究人员在面对庞大的数据进行计算的时候，往往会因为公式的运用错误，或者是考虑的不周全而导致结论出错，或者结论不够精准。经过研究人员研究发现，运用多层模型进行数据统计是目前最良好的方式，不仅能得到可靠的假定检验和参数估计，还能使研究人员发现一系列传统数据无法回答，但又具有重要意义的问题。（作者单位：德宏州宏康投资开发有限公司）

参考文献：

[1] 杨菊华.多层模型在社会科学领域的应用[J].中国人口科学，2006，（3）

[2] 雷雳，張雷.多层线性模型的原理及应用[J].首都师范大学学报（社会科学版），2002，（2）

[3] 蔡永红，姜勤德.统计在社会科学领域应用的新进展及反思[J].统计研究，2006，（2）

[4] 谢美华，黄友泉，董圣鸿等.多层多项Logit模型：原理与应用[J].心理学探新，2013，33（5）