APP下载

清以降云南山地小流域人口Access数据库的设计
——以峨山县槽子河流域聚落人口为例

2018-06-01白玉军

文山学院学报 2018年2期
关键词:山地人口资料

白玉军

(复旦大学 历史地理研究中心,上海200433)

历史时期人口数据库的设计,国外起步早,优势较明显。在众多历史人口数据库中,出现较早且较为有名的是英国历史地理信息系统①[1]和美国国家历史地理信息系统②[2]。日本人口数据库③、加拿大④和荷兰⑤人口普查历史数据库的建立也比较有代表意义。相比较而言,我国历史人口文献资料记载时间长、内容比较翔实,具有建立历史人口数据库的先天优势,但目前仍处于起步阶段。“中国历代人物传记数据库⑥(the China Biographical Database,CBDB)率先起步,包括中研院与国立故宫博物馆的“明清人名权威档案”、麦吉尔大学的“明清妇女著作”数据库及京都大学“唐代人物知识库”[3]。中国人口地理信息系统(Chinese Population Geographic In for mation System,CPGIS)是目前在建的一套长时段中国人口地理信息系统,该系统是世界第一套中国历史时期的人口地理信息系统,也是基于CHGIS(Chinese Historical Geography In formation System)平台⑦最为成熟的专题型历史地理信息系统。中国历史地理数字化应用平台是基于“中国历史地理信息系统‘CHGIS’”的一个应用系统,这个平台的基础数据来自中国历史地理信息系统。[4-5]上海交通大学历史系曹树基主持的中国人口数据库(1393-1953)整合了人口数据的时空属性,为研究者提供详实的人口数据和数字地图。

上述人口数据库是以全国尺度为空间属性的历史人口数据库,通过大规模地整合地方文献和接受各种统计数据而成。为了建立高分辨率的人口数据库,我们有必要缩小时空范围。同时为了避免行政区划历时(境域前后)变化带来的复杂性,可以考虑以自然地域为地理单元。复旦大学历史地理研究中心研制的清嘉庆二十五年(1820)的太湖流域10个府的详图和上海市范围主要聚落逐年变化详图为我们提供了典型案例⑧。在此思路的指导下,充分考量建立数据库的必要条件后,我们选择历史人口资料较为匮乏的西南山区作为研究主题的空间属性,截取一个人口资料保存相对完整的小流域作为空间数据载体。试想,若能攻克此关,其他相对条件较好的自然地域的人口数据库的建立就比较容易。而西南山地人口数据库的设计,由于历史人口文献资料的匮乏,再加之古人资料的因袭重复,这成为历史时期西南山地人口数据库设计及应用的主要瓶颈,因此,通过何种途径获取历史时期山地人口数据,成为建立西南山地人口数据库的首要问题。

一、获取人口数据的路径——以小流域为空间数据载体

云南是我国较典型的高原山地,其面积占全省总面积的94%。众多江河穿越山区,由此奔腾东、南去。西南山地被这些东、南去的江河及其众多支流分割成一个个半封闭的以流域为划分的地理单元。[6]从地形地貌来说,山地是以流域为基本单元。而流域是由地面分水线包围的、具有流出口的、汇集雨水的区域[7],其本身具有一定的规律性和相似性。中小流域生态系统是相对封闭和独立的自然地理单元,其内部的输入——输出关系和能量流动具有半封闭性,其内部具有相似或渐变性的自然地理背景[8]。具体而言,西南山区的中小流域都是由在“纵剖面”上的不同地段(上游、中游和下游)和“横断面”的不同地貌部位(上部坡顶、中部坡面和下部河谷)组成。由此可成为小区域信息化研究的数据载体和合适空间尺度,且满足其稳定性的要求[9]。在此理论指导下,以流域聚落为地理单位展开田野调查,进而复原山区聚落在不同横纵剖面的时空演变,是具有可操作性的。由此可以利用山区聚落的时空变化,来构建一种载体数据。在聚落选择的尺度上,尽量随机选取不同地貌形态下的田野调查点作为样本,对其进行长时期的典型调查,并结合流域内聚落的普遍调查,通过研究不同地貌类型区的聚落样本,可以作为相似生态区域聚落的典型,进而代表整个流域[8]。这种自下而上,采用历史文献与田野调查相结合的研究方法,必须建立在充实的文献资料基础上,进而获得人口数据。只有解决了资料问题,把山地研究建立在夯实的资料基础上,才能实现空间尺度的扩大,由此至大流域、大山地,乃至整个西南山地。当然,这需要更多高质量的样本数据。

由此可见,以山地小流域聚落作为空间属性和载体数据,满足了小区域建立时空人口数据库的基本要求。通过“格网”体系实现空间数据的连续性与标准化,通过“生存期”实现三维时空数据向二维关系表的转换,若是数据满足相关要求,可以将“生存期”转化成“逐年”,最后将多源数据标准化处理后放入数据库中即可。

二、获取人口数据的方法

人口数据的获取对于深入分析人地关系具有重要意义。要想获取历史时期云南山区人口数据,首要面对的便是史料的限制。在“文献无征”的情况下,过去的人口数似乎只存在于渺远的传说世界中。面对如此“场景”,我们必须打破画地为牢的学科分类,采取多学科整合的研究取向。在此基础上,借助田野调查方法,运用多种技术手段,通过时空尺度的转换,进行实证、具体而又全面的高分辨率研究,努力对“场景”进行复原,争取把田野调查和文献分析、历时性研究与结构性分析、国家制度研究与基层社会研究真正有机地结合起来,实现对山区历史人口数量的复原,并探索其时空演变的驱动机制。

(一)历史文献方法

历史文献是山地人口研究的基本史料,对其进行的考辨、解读和对王朝典章制度的真切了解是必不可少的。如果忽视国家的存在而奢谈地域社会研究,难免有“隔靴搔痒”或“削足适履”的偏颇。因此,我们对历史文献采取多种资料源的方法,在已知普遍性史料的基础上,获取区域性史料,做到普遍意义和特殊个案的有机结合。这样的话,要求我们自上而下,亦或自下而上的搜集尽可能多的文献,在不同尺度下相互佐证,并分析其一般史料与特殊史料的匹配是否得当,以及如何实现匹配的问题,从而复原文献层面的山地人口。

鉴于早期山地人口数据缺乏系统、完整的资料,而已有的资料又存在种种潜在障碍。因此,研究的第一步仍是对资料的搜集、鉴别与考订,以探究该时期数据的真实面貌及其时空演变的历史轨迹。而至后期,由于资料本身的存有量和记载较早期明显增多,这就出现文献资料前后不匹配的问题。由此可见,各个时期的文献资料类型和占有量存在显著差异,这会导致研究主题在时间尺度上出现不同的资料分辨率,愈往后研究内容愈发清晰。那么,如何有效处理各时期不同资料的分辨率,及资料之间在时间尺度上的相互衔接,使各种资料的使用价值和分辨率趋于一致,是个不容回避的问题。另外,由于文献记载的历史时期山地人口文字多系描述性语言,很难做到小尺度高分辨率的研究。这就需要我们探索其他方法给予解决,进而获得能够重建高分辨率的资料。

(二)田野调查方法

历史地理研究是以史料考证为主、实地考察为辅的学科,也就是主要依靠史料进行研究,实地考察在很多情况下只是映证史料,或对史料进行补充[10]。但是受到各种原因的制约,在面积广袤的山区,文献资料的匮乏是显而易见的,加之古人资料的因袭重复,这便成为历史时期山地研究的主要瓶颈,尤其是在面对小尺度高分辨率的重建研究时,需要借助一种非常有效的方法来获取可靠的数据资料。而田野调查方法,即通过典型聚落的长期调查和流域聚落的普遍调查相结合,接触到复杂而丰富的实际生活,获取真知灼见,进而获得现当代相关数据,为重建历史时期高空间分辨率的人口研究提供坚实的时空参照。因此,我们的研究特别强调田野调查与文献分析相结合,从而获取多源数据,进行比较研究。

对于山区流域聚落人口的调查,采用时间序列分析法及空间横向剖面分析法相结合,典型个案分析法和普遍聚落调查法相结合,质性研究法与量化分析法相结合。具体技术路线见图1:

图1 技术路线示意图

需要说明的是,我们的调查以历史人口为核心,按照时间顺序排列的人口序列(即编年)转化为叙事,这是我们调查工作的主要任务和写作转化的主导性模式。我们的研究以问题导向的分析性史地研究为主,不再简单地停留在叙事史学层面,这是史学社会科学化推动和倡导的结果。

上述两者方法,即文献阅读和实地调查,我们是同时进行,二者间在时间上互相参差,材料上互为补充,不断调整我们研究的方向和理路,从而少走弯路。与此同时,由于本研究的主题使然,需要对口述史的研究方法单独阐述。

(三)口述研究方法

作为“方法”的口述史,主要关注普通人对历史及其历史事件的经历与记忆,从而揭示历史及其事件背后的社会意义。因此,口述史除了阐明“客观事实”外,更着重个人的“主观性事实”。口述研究方法以访谈形式而深入调查,通过采访倾听“默默无闻的人们”的声音,揭示被传统史学忽略的历史与历史事件的另一个侧面,进而重构历史及其社会意义,这一方法无疑为从根本上转变历史的社会意义提供了手段。通过这个方法,不仅能看到历史,而且能够听到“活生生的历史”,由此理解他们的过去,个人的经历与社会背景如何关联,他们的过去怎样融入到“当下的日常”等问题。[11]

民族地区作调查,除了历史文献、考古遗址外,还必须重视口述史。诸多民族的社会状况记载较少,即使在这些极为有限的记载中也多有失真。但是,少数民族中有靠口耳相传保留下来的口传史,在文化习俗中也保留着许多原始记忆,我们只有通过实地调查、参与观察与访谈,才能为多学科的综合研究提供未见未闻之史料。[12]

关于口述前的准备工作,需要熟知当地方言和地名,阅读地方文献,同时还要进行问题预设和对话想象。另外,需要强调的是,与陌生人交流,需要有向导。可以通过熟人关系,寻找访谈对象。至于访谈对象,以村中年长男性为宜,年龄约在45~75岁间,有一定文化水平(如村支书、组长、会计,教师,文化官员等),对历史文物、古迹遗址、交通路线等熟悉者甚佳。

另外,作为“方法”的口述史,应该注意如下几个问题:

第一,基于在田野调查中采用历史地理学与人类学相结合的长期田野调查和普遍调查方法,我们在进行口述访谈时,对典型聚落的口述调查内容要广,全面深入展开调查,因此需要耗费更长时间。

第二,在实地访谈过程中,为保证口述资料的准确性,先要收集相关文献资料,并将二者结合起来,以保证数据的准确。

第三,从口述到文本,是个复杂的过程。从访谈主题确定、计划安排、访谈对象确定与进行,从录音录像、文本整理,到最后定稿,其内容不能违背口述者的原意。而在访谈过程中,口述历史一般是无逻辑的口头语言,我们需要鉴别、考证,尽可能地还原“历史原貌”,并在此基础上最终形成一个比较客观的文本。

当然,口述反映的历史时代有局限,年代越远可信度越低,但近一百多年的口述历史是有价值的,因此有必要在田野考察中把实地与口述结合起来。

从严格的学术角度而言,上述三种方法都是为了从史料中提取有效数据,这是历史学学科训练的结果。除此而外,空间数据可以提供准确的地理位置及定量化研究,而获取空间数据进行量化研究需要借助技术手段,两者有机结合可以对历史资料的获取做到更为全面和精准。

(四)量化分析的技术手段

构建量化历史数据库,采用量化分析研究方法兼及史料整理与问题研究,可以较好的克服材料与研究者的主观性,这既是史学研究社会科学化的重要途径,也是各相关学科发展的重要推力。量化分析不仅能深入理解各种因素的变迁与彼此的关系,还能兼顾所有个体的影响与权重,避免选材的疏漏与偏废。这无疑为克服史料繁芜的困难提供了重要思路,有利于推进史学的整体研究。同时量化分析可以从复杂历史现象中抽取出相对简单、独立的指标进行直接比较,从而做出新的计算,发现新的史实。[13]由此吴承明强调,在历史研究中“凡能计量者,应尽可能作定量分析”“盖定性分析只给人以概念,要结合定量分析才具体化,并改正概念的偏差”。当然,我们也要避免过度量化倾向,以免出现以下四种情况:裁剪现实生活、忽视社会情境、抹煞主体建构、取消生活意义[14],以此理解人文关怀,彰显价值理性,从而保留人文社会研究,防止全面走向“数据化”,真正做到量化分析与质性研究相结合。

研究高空间分辨率的山地演变,需要借助一些技术手段,这是科学资讯技术发展的必然趋势。如今,随着计算机技术的发展,将量化数据库方法运用于学术研究受到越来越多的关注。如对山地聚落信息数据的管理,因资料较多,考虑到研究需要使用的功能并不复杂,可以选用Microsoft Access软件进行聚落数据库的构建。而对历史文献的定性描述向定量分析,并提供研究结果的定量化程度与精确性,则需要借助“3 S”⑨[15]集成化,用定量方法描述空间格局演变。通过技术手段的提升,结合历史文献,对历史现象做精准还原,可以实现高空间分辨率的山地相关主题研究。当然,对于其技术的运用,必须结合多数据源资料,针对具体问题进行有效处理,进而满足研究问题的需要,争取对历史问题有所突破。在可预见的未来,人文科学的信息化、可视化将得到空前发展。在此基础上,在发现一些传统研究无法得出的新史实的基础上,我们力争对这些新发现有初步的解释或指明可能的解释方向,从而有效推动山地学术研究的进步。

(五)跨学科的理论与方法

1.学科交叉

区域研究强调概念化和跨学科,学科交叉是促进问题研究的重要突破,也是学科相互借鉴、共同发展的有力武器。针对研究问题,需要多学科共同努力,解决问题,这是当今学术研究的整体趋势。另外,任何学科的发展都有其“历史”。只有在长时段的研究中,才能总结出更加可靠的规律,进而满足人们对社会的理想认识。如历史学的时间性、考古学的典型性、人类学的个案性、历史地理学的空间性等,不同学科各有侧重,方法有差异,学科间相互借鉴。放大了说,文理学科交叉对问题意识的培养和解决更有利,数学家可以作诗,哲学家可以研究音乐,这些研究都是有共性的。所以说学科交叉,可以促进我们对问题意识的挖掘,从而更加全面地认识山地社会。当然,学科交叉的核心是问题意识,针对具体问题,采用不同学科的理论与方法,从而解决相关问题,这是山地人口研究的落脚点。

2.理论与方法

理论与方法的学习是比较困难的,山区研究成果较少,理论方法更是匮乏。但我们可以通过构建共同的问题意识,借鉴相关学科的理论与方法,针对我们需要解决的问题,采用不同学科的理论与方法。如山区史地研究自然需要借鉴历史地理学的理论与方法,而山地环境变迁作为区域生态学的重要组成部分,生态学理论与方法自在其中。当下的研究告诉我们,山地人口和民族是山区生态环境变迁的主要驱动力,我们对人口和民族进行深度研究,必须借助人口学和民族学的理论与方法进行分析,尤其是对历史时期相关问题的研究。这样才能更容易地理解“过去是如何转变成现在的”,从而对现当代的山地人口有更加深刻的了解,对未来的发展有更准确的预测。

史无定法,简单地套用某种社会理论和方法是不可取的,对山地人口历史演变的具体而整体的分析是十分必要的。而且,做出某种宏观判断往往是困难的,也是危险的。因此,我们的山地历史具体研究需要建立在实证个案研究的基础上,通过多学科交叉、多源数据和多种技术手段的综合利用,获取较为客观公正的研究数据和资料,进而细致而微地复原山地人口演变的时空过程及其复杂性。由此发现和建立个案之间的关联,使之成为整合研究的一部分。进而按照某种历史逻辑,对特定时空中的个案关联做出判断,实现从具体研究走向整体研究。

三、Access数据库的设计

山地人口数据库的建立,以笔者进行田野调查的流域作为样本进行阐述。截止目前,笔者在云南省峨山县槽子河流域进行了为期九次共计306个工作日的田野调查,以期为建立高分辨率的山地流域聚落人口数据库提供案例。之所以选择在槽子河流域作历史人口研究,主要是由当地保留的碑刻、宗谱、家谱、户口册等基本资料决定的。该史料内容详实,时段较长(始于清初)。更为重要的是,搜集与整理出的人口数据时间序列较为完整。这也从侧面反映了到目前为止该流域提供了最好的研究环境。

图2 云南峨山县槽子河流域聚落分布图

槽子河是岔河乡境内的主要灌溉河流,因其形似猪槽而得名,发源于甸中镇黄草坝山麓的东南面,经甸中镇的西就和岔河乡的文山、安居、河外四个村委会的境内流入化念河至元江。全长19.4公里,径流面积92.8平方公里,落差40米,坡降24.4%[16]。槽子河流域受河流切割作用,形成北南走向的山地与河谷相间的地貌形态;受北南走势的高山阻挡,交通较为困难。河流自北向南奔流,至中下游河谷逐渐开阔,形成峨山县主要农业分布区。该流域是岔河乡的一个重要产粮区,也是岔河乡人口分布最为集中的区域⑩,现有23个自然村(不包括历史时期的消亡聚落),见图2。

在对山地聚落人口信息数据的搜集与管理时,因资料较多,来源不一,考虑到研究需要使用的功能并不复杂,可以选用Access软件进行聚落人口数据库的构建。建立本数据库经历了一个摸索过程,在满志敏师的理论指导下,经与杨煜达师和孙涛师的商讨后,本数据库得以初具雏形,详细阐述如下:

(一)目的

山地人口Access数据库设计的目的,是为西南山地环境变迁课题提供基础史料的收集、管理,以及进一步的分类、分析以及统计之用。整个数据库的设计,服务于这个目的。

(二)数据库的基本功能

为服务于前述目的,数据库需要具备以下的功能:第一、基本数据的输入、储存与管理;第二、基本数据的来源;第三,基本数据的分类;第四、基本数据的检索与查询;第五、基本数据的统计。设计需要满足以上功能需求,并具备一定的设计裕量以备可能扩张的需求。

(三)数据库的基本框架

数据库将由以下几个基本模块构成

1.人口信息表:所有流域内的山地人口及其相关信息构成这个表。其中,每个人都有一个唯一的I D。对于人口相关信息,尽可能考虑全面,并直接放在这个表上。信息来源,则用相应史料类别的I D与信息来源表建立关系。

2.信息来源表:每条信息查阅后,由资料的来源及其相关信息构成这个表。其中,每个信息来源有一个唯一的I D。

3.补充史料表:该表使用与人口信息表中每个人同样的I D,通过I D与人口信息表建立关系。同时,信息来源也使用信息来源表中每个信息来源同样的I D,并用此I D语信息来源表建立关系。另外,该表除了储存文字史料外,还能存储其它形式的资料,比如图片、音频、视频等。

4.查询。设计相关查询,使所有需要的信息和统计都能在查询下完成。并建立网页界面,以方便使用。

上述各表根据需要,建立同名窗体,以方便资料输入。表中各字段的属性可根据需要设定。在此基础上,再根据实际需要设计查询和报表。

(四)数据库中几个表格的基本模式

1.人口信息表

包含以下几个字段:人口信息I D、姓名、性别、民族、受教育程度、出生年月、死亡时间、周岁年龄、初婚年龄、育子数量、育子性别、生育间隔、出生地、婚前居住地、婚后居住地、死亡地、信息来源表、备注等字段。其中有几个字段情况较为特殊,需要说明。

(1)姓名:因该库是以调查聚落人口为主,且不对外公开,故暂不考虑人名的简体、繁体、拼音等。需要注意的是,传统时期女子有姓无名,直至新中国成立后,女性才有姓有名。为了前后统计资料的一致和查询、报表的方便,姓名字段分为“资料名”“曾用名”“今名”等,并以附表形式说明更姓改名的时间及原因。

(2)民族:民族识别是在新中国成立以后,对于之前单个人口族类的统计,以姓氏移民调查来源地和始迁祖族性为准,以方便前后民族的衔接和统计口径的一致。在此基础上上,“民族”字段又可以时间为轴,分为“今民族”“族群”等。因二者均包括“族类”信息,又可建立附表,说明“族类”信息。

(3)生年、卒年:因生卒年月资料源的不同,其生卒年月信息前后不统一。为了统计研究的同一性,前后均采用公历(西元)纪年法,这就涉及到阴阳历的转换问题。方法有两种,一是电脑程序法,采用台湾中央研究院咨讯服务处“两千年中西历转换 ”(http://sinocal.sinica.edu.tw/);一是文献工具法,选用方诗铭、方小芬编著的《中国史历日和中西历日对照表》[17]。在此基础上,生年字段分原始记录、公元年、月、日、精确度等字段,同理,卒年字段亦分原始记录、公元年、月、日、精确度等字段。对于生卒年记录的精确度,在附表中采取定级与文字描述相匹配的形式说明,级别暂定1~5级,见表1:

表1 生卒年月信息定级与文字描述匹配表

A. 对于模糊年号,在没有详细记载的情况下,采取模糊处理方式。若数据时间要求精确定位到“年”,在一级文字描述中的人,其生卒年涉及皇帝年号者,以此皇帝在位的中间年份为准,如乾隆年间,定在乾隆三十年(1765);若是乾隆前、后期,则前期定在乾隆十五年(1750),后期定在乾隆四十五年(1780)。

还有一种方案,若子孙中有生卒年详细者,根据初婚年龄、育子数量、育子性别、(平均)生育间隔等内容推算即可。

B. 对于生活在清末民国时期的村民,即使没有准确的生卒年记载,也可根据访谈对象进行推断;同时还可采访其后代,或其他村民。通过多次访谈后,最终便可确定其人相对准确的生卒年。

(4)受教育程度:村民受教育程度的划分,依据现代人口统计学调查个人文化程度的分类,把村民的受教育程度依次分为文盲、半文盲k,学龄前儿童l,小学,初中,高中(含中专),大专及以上等。对于传统时期参加科举,获取功名,以及接受新式教育的村民,我们都将其匹配至不同时期的教育体系。在其内部进行比较,以科举时期、新式教育、建国后的教育模式以及改革开放后四个时间节点。

(5)对于初婚年龄、育子数量、育子性别、生育间隔等字段的统计,以实地调查和文献结合为准。对于无法确定这些字段内容的村民,以碑刻文献记载为准。由于本文资料多以宗谱、家谱、碑文等为主,类似资料的缺陷是显而易见的,而且是难以弥补,甚至插补都较为困难。因此,在上述字段中,需要对每个字段均给予说明,尤其是生育间隔,需要搞清楚头生子、末生子时间,在此基础上计算头末子间隔时间和平均生育间隔,并说明哪些数据包括夭亡数,哪些不包括夭亡数,并对其分类处理。

(6)对于出生地、婚前居住地、婚后居住地、死亡地等字段的内容,主要是考虑人口的流动性,以此细致研究历史人口空间分布的历史进程。

(7)信息来源,信息来源比较简单,直接使用信息来源表中的I D,并附加卷(册)及页码即可。

2.信息来源表

基本信息包含信息来源I D、类别I D、类别、备注等,其类别分为文献、调查、墓碑等,具体而言,(1)文献资料(包括户口册、家谱、个人传记等):文献名称、成书时间、解题、作者、作者简介;(2)调查资料:调查时间、地点、访谈对象、内容;(3)墓碑资料:中榜内容、立碑时间、立碑人、形制、纹饰、雕饰。

3.补充史料表

补充史料表有几个部分构成:

(1)关联信息:由人口信息I D和信息来源I D构成,其中文献部分,需要有卷(册)及页码的字段。

(2)基本信息包含:文字内容,备注等。

A. 时代信息:包含资料中出现的具体时间:年号,公元纪年。该信息如无具体信息,即以记载的文献修撰的时间为时间。时代:时代需要我们根据需要来做分析,所以可设多个字段以备需要。

B. 地点信息:不用单独填写。地名有变化的,可选择在备注中说明。

C. 作者信息:了解作者的全部相关信息。

这样的基本设计,可以保证能够获取必要的信息,迅速地查询所需内容。同时,这样的数据库是一个开放的系统,今后还可以不断录入新的资料,也可以根据新的需要不断增加查询、报表等项目,进行必要的统计和计算。对数据库中录入资料的错误,也能随时进行修改。由此可见,这个数据库的设计及建立,不仅为本研究提供必要信息,也为山地人口研究提供资料平台。在此基础上,经与杨煜达老师交流后,可设计出一套完整的云南山地人口信息数据库范式,为今后从事该研究的学者提供资料,这是件非常有意义的工作。

四、结语及认识

根据上述,我们以西南山地小流域作为空间数据载体,以山区自然聚落作为载体数据,运用文献分析与田野调查相结合,多学科交叉法和多技术手段,在历史人口数据时空序列保存较完整的槽子河流域,可以建立高分辨率的山地人口数据库。当然,对于其技术的运用,必须结合多数据源资料,针对具体问题进行有效处理,进而满足研究问题的需要,争取对历史问题有所突破。同时,可以得出以下几点认识:

1.历史时期山地人口数据库的建立,首先需要选择人口数据时空序列较为完整的小流域进行田野调查,以流域内聚落为地理单位复原山区聚落在不同横纵剖面的时空演变。在此基础上,可以利用山区聚落时空变化构建一种载体数据。

2.数据库主要由人口信息表、信息来源表和史料补充表组成,表中各字段的设计及属性根据需要设定。需要说明的是,一些特殊字段需要批注。在此基础上,根据实际需要设计查询和报表,为西南山地环境变迁课题提供基础史料的收集、管理及进一步的分类、分析以及统计服务。

3.人口数据库的核心是数据,我们是要把自己的研究对象,放置在历史时空间的框架中,重新去审视它们,研究它们。以期发现并解决那些仅仅通过传统文字描述或简单数理统计,无法发现和解决的问题。所以,建立数据库应该强调实际操作,以期脚踏实地,多做一些开创性的实证研究工作,并对这些新发现的问题有初步的解释或指明可能的解释方向,有效推动山地环境变迁学术研究的进步。

致谢:本研究得到复旦大学历史地理研究中心和云南大学西南环境史研究所的专项资助,谨忱谢意。同时本文写作过程得到杨煜达师和周琼师的悉心指导,在此一并致以谢忱!

注释:

① 该系统包括自19世纪早期以来英国自1840到1973年政区人口普查、劳动力市场数据、死亡率数据和济贫法律数据等,为研究者提供了对于长期的社会、经济和人口变迁的分析方法。

② 美国国家历史地理信息系统是一个为历史人口研究而创建的历史地理信息系统。该系统在GIS的架构下聚合了美国从1790-2000年的大量人口统计数据,包括了调查数据和从各种印刷品与手稿资料中转录的数据,而且建立了能够反映人口地理变化的高精度的历史电子边界,人口数据、资料和边界文件能通过网络数据访问和地图系统的方式进行发布。目前N HGIS(The National Historical Geographic In for mation System)在人口研究领域内已经得到了很好的应用,如居住区种族隔离和城市变化研究、公共健康和流行病的研究等。此外,由明尼苏达大学人口中心(http://www.ipums.org)维护的综合公用微观数据序列数据库包含了1850-2000年的美国人口周期普查数据。

③ 日本以速水融为领导的历史人口项目组在吸取英国的有益经验基础上,发现了德川时代的“宗门改账”资料,建立了日本的历史人口数据库,使得日本的同类研究异军突起,在世界上享有极高的学术声誉。

④ Buck等认为基于1901年人口普查资料之上的加拿大家庭计划(the Canadian Familities Project,CFP)为加拿大家庭地理分析提供了丰富的潜力,建立加拿大历史地理信息系统可以为CFP提供绘图和空间分析的功能。(Buck,JordanD,Mannella S,etc.Reconstructing the Geographi cal Framework of the1901 Census of Canada[J]. Historical Methods,2000,33(4):199-205.)Gaffield详细介绍了试图建立从1911—1951年间的加拿大人口普查资料的历史数据库的世纪研究基础计划(The Canadian Century Research Infrastructure,CCRI)。(Gaffield C.Conceptualizingand Constructing the Canadian Century Research Infrastructure[J].Historical Methods,2007,40(2):54-64.)St-Hilaire等则进一步指出CCRI必须将历史人口普查数据与地理信息结合起来,构建能够进行复杂空间分析的GIS框架。(S t-Hilaire M, Moldofsky B,Richard L,etc.Geocoding and Mapping Historical Census Data:The Geographical Component of the Canadian Century Research Infrastructure [J].Historical Methods ,2007,40(2):76-91)

⑤ 荷兰政府收集的第二次世界大战前的民事记录,登记备案了荷兰居民的人口统计信息,由此建立了荷兰历史GIS,为政府服务管理提供信息。

⑥ Userscanquery CBDB throughan on lineda tabase(follow the linkson the CBDBwebsite,http://isites.harvard.edu/icb/icb.do?keyword=k16229).

⑦ CHGIS项目的详细文档,包括项目概要、版权声明、编辑机构以及数据说明、浏览、查询及下载等,请查看禹贡 网CHGIS栏目,http://yugong.fudan.edu.cn/views/chgis_index.php?list=Y&tpid=700

⑧ Userscanquery CHGIS throughan on linedatabase(follow the linkson the CHGISwebsite,http://yugong.fudan.edu.cn).

⑨ “3S”是指GIS(Geographicalin formation System,地理信息系统)、RS(Remote Sensing,遥感技术)、GPS(Global Positioning System,全球定位系统)的总称。3 S系统是指将上述三种技术及其他相关技术有机地集成在一起的技术,通过RS、GPS和GIS技术的集成,构成从数据获取、数据定位、可视化到空间数据操纵和分析的信息系统。在3 S系统中,遥感技术的主要作用是作为数据源为系统提供遥感图像数据及其他遥感空间数据。全球定位系统可以对被观测目标、遥感图像中的目标进行定位,赋予坐标,使其能与“数字地图”进行配套。地理信息系统可以实现空间数据集成、处理、管理和可视化,提供空间数据及其属性数据分析的能力。

⑩ 该流域养育着以彝族人口占主导的23个自然村4496人,分别占岔河乡总聚落的41%,总人口的45%。(2015年统计数据)

k 文盲、半文盲人口是指15周岁及以上不识字或识字很少的人。

l 学龄前儿童是指1~5岁的未成年人。

[1] University of Portsmouth.GBHGIS[EB/OL].[2017-04-13].http://www.port.ac.uk/research/gbhgis.

[2] Minnesota Population Center.NHGIS[EB/OL].[2017-04-13].http://www.nhgis.org.

[3] Michael A.Fuller,The China Biographical Database User’s Guide (Revised Version2.0), February28,2015.

[4] 周丙锋,周文业.基于中国历史地理信息系统CHGIS的中国历史地理数字化应平台[C].中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集,2007:556-580.

[5] 周丙锋,周文业,赵文吉.中国历史地理数字化应用平台研究[J].测绘科学,2008(4):199-202.

[6] 杨煜达.中小流域的人地关系与环境变迁——清代云南瀰苴河流域水患考述[C]//曹树基.主编.明清以来的自然灾害及其社会应对机制.上海:上海交通大学出版社,2007:28-53.

[7] 辞海编辑委员会.辞海[M].上海:上海辞书出版社,2010:1183.

[8] 霍仁龙.近三百年来掌鸠河流域的土地利用和覆盖变化研究[D].上海:复旦大学,2016.

[9] 满志敏.小区域研究的信息化:数据架构及模型[J].中国历史地理论丛,2008(2):1-10.

[10]张晓虹.2013年帕米尔高原历史地理考察报告[R].历史地理,2014(29):344-353.

[11] [日]中村贵.追寻主观性事实:口述史在现代民俗学应用的方法与思考[J].文化遗产,2016(6):89-95.

[12]刘尧汉.彝族社会历史调查研究文集[M].北京:民族出版社,1980:6.

[13]李中清.构建量化数据库,算出更精确的历史[N].中国社会科学报,2014:6-30.

[14]潘绥铭.生活是如何被篡改为数据的?——大数据套用到研究人类的“原罪”[J].新视野,2016(3):32-35.

[15]张军,等.3 S技术基础[M].北京:清华大学出版社,2013:1-4.

[16]峨山彝族自治县人民政府.峨山彝族自治县志[M].北京:中华书局,2001:77.

[17]方诗铭,方小芬.中国史历日和中西历日对照表[M].上海:上海辞书出版社,1987.

猜你喜欢

山地人口资料
山地草甸
《世界人口日》
人口转型为何在加速 精读
Party Time
PAIRS & TWOS
JUST A THOUGHT
穿越火线之山地作战
山地之旅
人口最少的国家
1723 万人,我国人口数据下滑引关注