APP下载

我国少数民族构成要素的因子分析

2001-04-13

民族研究 2001年1期
关键词:百分比双语母语

黄 行

本文用总人口、自治地方本民族人口、自治地方少数民族人口、人均GDP、农业人口、识字人口、在校生、母语人、单语人、双语人人数等10项指标作为民族的地区、经济、教育和语言构成要素,对这些要素在我国现有少数民族中的构成情况作了描述、相关和因子提取等统计分析,以说明目前我国少数民族构成的基本社会状况,以及这些要素对少数民族整体和个体的构成的作用或代表的信息量有多大。文章还依据已有的经验知识对统计分析结果作了相应的说明和解释。结论是,目前我国少数民族之间的区别特征主要在于经济发展水平、人口的教育水平、居住地区、使用语言等方面的社会差别;但是从发展趋势看,传统意义上的各民族构成要素的作用将逐渐减弱,民族间的差别将逐渐缩小。

关键词:少数民族构成要素因子分析

作者黄行,1952年生,中国社会科学院民族研究所副所长、研究员。地址:北京市白石桥路27号,邮编100081。

民族是一种比较普遍而稳定的人类群体特征,作为一个朴素的概念,它的含义似乎并不难理解。然而作为一个具有行政和法律意义的概念,尤其是对一个多民族的国家,需要根据实际情况依法进行民族识别,制定民族政策,管理各种具体的民族事务,民族的定义就应该具有明确的规范性和可操作性。

词典中对“民族”的定义一般是比较朴素和含糊的,例如《大英百科全书》“民族”(ethnic—group)词条的解释是:“一种生活在较大的社区内,因共同的种族关系、共同的语言、共同的民族性或文化而相互区分或联系的人口社会群体或社会范畴。”罗杰·皮尔逊(Roger Pearson)主编的《人类学词汇》(Anthropological Glossary,Florida,1985)的解释是:“对共同的文化、共同的语言或共同的种族特征有自觉意识因而相互区别的群体。”《中国大百科全书》(1986)对“民族”的表述是:“人们在一定的历史发展阶段形成的有共同语言、共同地域、共同经济生活以及表现于共同的民族文化特点上的共同心理素质的稳定的共同体”,这基本上是中国行政、法律和学术上对民族范畴的普遍理解,迄今仍被认为是科学的。

我国理论上和实际工作中把民族理解为由共同语言、共同地域、共同经济生活和表现于共同文化上的共同心理素质四种主要特征或要素构成的人们共同体,强调的是民族的本体共性特征,而在现实中,这四个民族构成要素对构成民族的作用是有很大差别的。例如对多数人使用本民族语言的民族来说,共同语言这一民族特征对构成民族的作用是重要的;而对基本已不使用本民族语言的民族来说,共同语言已不是构成民族的主要特征。民族的居住状况也很不平衡,有的民族的大多数人口居住在本民族聚居地区,有的民族基本没有民族聚居区,而主要是和其他民族杂居,说明共同地域这个要素对不同民族的构成来说,作用也是很不一样的。

50年来的实践表明,中国民族识别和划分的结果大体是比较合理的,得到了少数民族的认可。因此本文是从我国现行少数民族实际的构成情况出发,以正式文献公布的、部分民族的社会经济文化指标为资料依据,对我国少数民族的诸社会构成要素进行微观和实证的统计分析,试图描述目前我国民族要素构成的基本情况,以及这些要素对民族的构成的作用或代表的信息量有多大。

一、指标、材料和方法

笔者使用的民族社会构成要素有10项指标,可以大致归纳为以下4个要素。

——地区要素,指各少数民族在本民族地区聚居的人口情况。具体包括各民族总人口、各民族自治地方内本民族人口和少数民族人口3项指标数据。民族聚居地区共包括截至1997年已建立的155个少数民族自治地方(5个自治区、30个自治州、120个自治县/旗)。

——经济要素,指各少数民族在本民族地区的经济发展水平和在业人口情况。具体包括各民族自治地方人均国内生产总值(GDP)和各民族在业人口中从事农、林、牧、渔业的人口2项指标数据。

——教育要素,指各少数民族的受教育情况。具体包括各民族人口中的识字人口和在校生人数2项指标数据。

——语言要素,指各少数民族使用本民族语言的情况。具体包括各民族人口中的母语使用人口、单语使用人口和双语使用人口3项指标数据。少数民族语言涉及大陆70种左右目前正在使用的少数民族语言。本民族母语多数情况指和民族名称相一致的本民族语言,对使用两种或几种本民族语言的民族来说,母语人口也包括两种以上本民族语言的使用人口。

当然这里所说的构成民族的地区、经济、教育、语言要素和我国民族定义中所指的有关要素在内涵上不一定完全一致,这主要是由于指标资料来源方面的限制,因此本文的各种描述和分析结果,只能在所依据的指标的意义上理解。

由于分析要素涉及3项与民族区域自治有关的内容,因此本文的分析对象为中国已经建立了民族自治地方的44个少数民族,因为其他11个民族1997年时尚未建立民族自治地方(自治县以上)。这44个少数民族的总人口为90,437,017人(1990年),占全国少数民族总人口90,567,245人的99.86%,所以所用数据和分析结果应该对全国少数民族的情况有很高的代表性。

笔者对中国少数民族构成要素的原始数据作了以下基本的统计分析:

1.分民族的10项指标的描述统计,即统计各少数民族在民族地区的人口、经济、教育、语言使用情况的数据的平均值和标准差,以说明这些指标在民族构成中的集中趋势和离散趋势。

2.10项民族构成要素指标之间的相关分析,以说明各要素之间的相关关系。

3.10项民族构成要素指标之间的因子提取,以说明各要素对民族构成的代表性或所包含的信息量。因为各构成要素之间会或多或少地存在着一定的相关关系,所以通过因子分析可以将复杂的多个要素指标进一步概括为少数几个不相关的综合指标,从而可以对民族构成的情况作出综合的评价。

由于数据绝对值的相关统计显示出多个变量(要素)之间都高度相关,所以用绝对值作原始数据的统计结果不理想。为此笔者把民族总人口外的各项指标的绝对值都转换成相对的百分比,从而避免了指标间信息的重叠。

二、分析结果

(一)描述统计

少数民族地区、经济、教育、语言构成要素的集中与离散趋势统计结果见表1。

结果显示占中国少数民族总人口99%以上的44个少数民族社会构成情况的以下信息:

每个少数民族人口平均约为200万人,但是民族间人口数的标准差很大,说明中国少数民族的人口数量非常悬殊。例如人口最多的壮族有15,555,820人,而人口最少的珞巴族仅有2322人,二者相差6700倍。

每个少数民族平均近60%的人口居住在本民族自治地方中,表明中国实行民族区域自治制度是有本民族人口聚居的基础的。

各少数民族自治地方内的少数民族人口平均占到近60%,说明民族地区的居民确实是以少数民族人口为主。

各少数民族在民族自治地方的人均GDP不到3000元,和5634元的全国平均水平有较大差距,且不同民族之间极不平衡。例如鄂温克族自治地方人均GDP达8659元,而普米族自治地方人均GDP仅192元。

平均每个少数民族84%的在业人口从事农、林、牧、渔业,民族间的差距不算太大,总体上高于全国平均水平(72%)。

每个少数民族平均54%的人口识字,明显低于全国平均水平(70%),各少数民族之间也不平衡。例如最高的朝鲜族的识字人口占82.25%,而东乡族最低,仅占16.17%。

每个少数民族的在校生平均占总人口的16.57%,略高于全国平均水平(16.10%),说明和其他事业相比,少数民族地区的教育事业达到了较高的水平。

平均每个少数民族近70%的人口掌握母语,说明本民族语言目前仍是少数民族的主要社会交际工具;平均每个少数民族近40%的人口只能操母语,而不会其他语言,因此目前少数民族语言的使用和发展仍然应受到重视;平均每个少数民族36%的人口为双语人,可以预计使用双语的人口比例还会逐渐加大。从语言使用人口的各项指标的标准差看,不同民族掌握母语、单语和双语的人口比例是很不平衡的。

(二)相关分析

相关分析可以反映变量(构成要素)之间的相关程度和相关方向。10项民族构成要素之间的相关情况见表2相关矩阵的统计结果。

下面对各项要素之间的相关情况作进一步表述,并依据经验知识对各项要素之间的相关情况作一些说明。

少数民族人口的多少除与双语人比例为负相关外,和其他民族构成要素均没有关系。人口数与双语人数为负相关的原因可能是,人数越少的民族,客观上越需要掌握其他人口较多的民族的语言。

自治地方本民族人口比例与农业人口比例、母语人口比例、单语人比例之间显著地(相关系数带**)相关,与当地少数民族人口比例相关(相关系数带*)。自治地方的少数民族人口比例与农业人口比例显著地相关,与当地自治民族人口比例、单语人比例之间相关。这种相关情况表明少数民族聚居程度越高的地区,从事农、林、牧、渔业的人口越多,同时使用少数民族语言的人口也越多。

少数民族人均GDP的水平与农业人口比例显著负相关,与识字人口比例、在校生比例显著相关。这几项相关关系的原因很容易理解,即从事农、林、牧、渔业的人口越多,民族的教育水平和经济发展水平越低。

农业人口比例与自治地方的自治民族人口比例、少数民族人口比例、单语人比例均为显著的正相关,与人均GDP水平、识字人口比例、在校生比例为显著的负相关。农业人口与多项民族构成的社会指标相关,表明人口的在业状况(即以传统的农、林、牧、渔业生产方式为主)是当前少数民族的一个非常显著的社会特征。

识字人口比例与人均GDP、在校生比例显著正相关,与农业人口比例显著负相关,与母语人比例、单语人比例负相关。在校生比例与人均GDP、识字人口比例显著正相关,与农业人口比例显著负相关,与单语人比例负相关。由此可以看出,使用少数民族母语,特别是使用少数民族语言单语的人数比例越高的民族,受教育水平越低。

母语人比例与自治地方自治民族人口比例、单语人比例显著地相关,与双语人比例相关。

单语人比例和自治地方自治民族人口比例、农业人口比例、母语人比例显著地相关,与自治地方少数民族人口比例、识字人口比例、在校生比例负相关。

双语人比例与民族总人口负相关,与母语人比例正相关。后一项相关的原因可能是,使用母语人数比例高的民族,通常是人数较少的民族,所以他们更需要掌握其他人口较多的民族的语言。

(三)因子分析

因子分析是将多个原始变量转换为少数几个不相关的综合指标,并对这几个综合指标(即因子)加以命名,从而更容易突出分析对象的本质特征。综合指标比原始变量的数量少,但是所包含的信息量却损失很少。

10项民族构成要素的因子分析的初始值如表3。

从初始分析的统计量可以看出,依据特征值大于l的提取原则(如果每个因子的代表信息相等,它们的特征值都应该为1),只有前3个因子的特征值大于1,它们对大多数原始数据具有充分的概括,可以解释总方差的69.23%。

根据表4的因子负荷系数矩阵值可以写出用被提取的3个因子代替诸多原始变量后对各原始变量方差解释%的表达式:

因子1=-0.112*总人口+0.541*本民族百分比+0.537*少数民族百分比-0.571*人均GDP+0.811*农业人口百分比-0.855*识字人口百分比-0.785*在校生百分比+0.615*母语人百分比+0.679*单语人百分比-0.085*双语人百分比

因子2=-0.223*总人口+0.402*本民族百分比+0.038*少数民族百分比+0.255*人均GDP-0.189*农业人口百分比+0.239*识字人口百分比+0.416*在校生%+0.684*母语人百分比+0.307*单语人百分比+0.715*双语人百分比

因子3=0.760*总人口+0.428*本民族百分比+0.148*少数民族百分比+0.450*人均GDP+0.045*农业人口百分比+0.291*识字人口百分比+O.122*在校生百分比+0.029*母语人百分比+0.407*单语人百分比-0.531*双语人百分比

从因子矩阵中3个因子的负荷系数可以看出,因子1对本民族人口百分比、少数民族人口百分比、人均GDP、农业人口百分比、识字人口百分比、在校生百分比和单语人百分比等要素都有概括力(即方差解释力),而因子2和因子3分别只对母语人百分比、双语人百分比及总人口3个要素有概括力,这是由于原始变量之间过高的相关程度所然,因此仍不好对这3个因子加以命名。

为了加大因子之间的正交性(不相关),可以通过对因子模型的旋转变换使因子的负荷系数向更大(向1)或更小(向0)方向变化,从而使对因子的命名和解释变得更加容易。因子模型的旋转变换后的矩阵见表5。

从旋转因子负荷系数矩阵的数值可知,旋转后的因子负荷系数明显地向两极分化,即因子1对人均GDP、农业人口百分比、识字人口百分比、在校生百分比等要素有绝对值较大的负荷系数;因子2对本民族人口百分比、少数民族人口百分比、母语人百分比、单语人百分比等要素有绝对值较大的负荷系数;而因子3则对总人口和双语人百分比这两个要素有绝对值较大的负荷系数。根据诸民族构成要素的原始含义可以对这3个因子进行命名。很明显,第一个因子主要概括了少数民族的经济和教育状况,所以可以命名为经济一教育因子;第二个因子主要概括了少数民族的居住和语言使用状况,所以可以命名为地区一语言因子;第三个因子主要概括了少数民族的总人口和双语使用状况,这两个要素无法提取共性,但却存在着民族人口越多,双语人比例越低的相关关系,所以可以暂命名为人口因子。

三、结论

对超过中国少数民族人口99%的44个民族的10个构成变量的多项统计分析,可以得出以下结论:

1.目前中国少数民族之间的区别特征主要在于经济发展水平、人口的教育水平、居住地区、使用语言等方面的社会差别,人口数量在民族之间也有差别,但影响没有前几项突出。因此共同的语言、地域、经济和教育发展水平是现行少数民族的主要构成要素。

2.同时也应看到,由于民族之间语言、地域、经济和教育等主要要素的差别只可以概括现行少数民族构成信息的70%,说明这些构成要素在现行民族之间的区别性功能并不是很强。随着全国通用语言的推广和扩散,不同地区之间民族人口的迁徙流动,以及整个国家社会、经济、文化生活逐渐趋于一体化,可以预计,传统意义上的各民族构成要素的作用将逐渐减弱,民族间的差别将逐渐缩小。

[责任编辑马俊毅]

本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

猜你喜欢

百分比双语母语
母语教育:从美出发
分析母语在高校英语教学中的地位
第五届中坤国际诗歌奖获奖感言——邵燕祥
趋势攻略之趋势线:百分比线
快乐双语
快乐双语
快乐双语
环保车型最多的美国城市
双语秀
公共艺术与百分比艺术建设