大麦地岩画典型图形符号相似性识别及释义
2024-03-19束锡红冯艺飞
束锡红,冯艺飞
(西北大学科学史高等研究院,陕西西安 710100)
早在文字发明之前,岩画是记录人类想象和艺术创造的最早证据,组成人类遗产中最具有普遍意义的部分[1]。大麦地岩画是由这一区域许多北方游牧民族和部落创作的图形符号系统,据专家综合测年并推测,大麦地岩画早期至新石器时期中晚期。大麦地地处宁夏中卫沙漠之中,西面是浩瀚的腾格里沙漠,东面与贺兰山相对成犄角,大麦地岩画与贺兰山岩画既有联系,又自成体系,是个独立的岩画群。大麦地地理单元是一种盆地状的山地,新石器晚期到青铜时代这一河谷区域的密闭小环境,气候湿润,水草丰茂,既有利于狩猎者比较容易的猎获动物,也有利于游牧者畜养牛羊犬马,是许多北方游牧民族和部落的天堂,他们在这里创作了大量的岩画。
一、研究缘起
数字人文是人文与科技理论与方法的交叉融合,若将其运用到岩画传承与保护当中,必然会为其扩展一条全新的路径。在这个领域,南非和瑞典一直是该领域的前沿者。南非拥有世界上最大的岩画文化遗产数据库——南非岩画数字档案库,瑞典岩画研究档案库的建立使斯堪的纳维亚半岛成为了西欧岩画研究的核心地带。岩画研究在数字识别技术的推动下迎来了不同的发展方向和更广泛的可能性,其中之一是专注于数字识别岩画图像的研究方向。在该领域,瑞典学者一直保持领先地位。他们运用数字自动识别技术,成功地记录并辨识了一些肉眼难以识别的岩画图像,取得了显著的成果。在中国直至2016 年,模式识别与图像处理专业的学者提出了一种基于双边滤波的算法,用于增强岩画彩色图像,这标志着对岩画图像数字化识别的初步尝试。
自从发现大量岩画图形符号以来,关于这些符号是否代表了汉字起源的图画阶段一直存在争论。由于技术和人力资源的限制,对岩画图形符号的研究一直局限于个案分析,尚未展开大规模全方位的系统研究。正如知名岩画专家Robert G.Bednarik 所说:“我们只能在我们现在的社会中扮演人类的角色;我们无法理解几千年前人们的概念世界——尽管这些都是考古学。”[2]通过数字识别研究能够找到岩画图形符号与汉文字传承关系的线索,同时揭示汉文字起源与演变的奥秘是本研究的目标所在。另外关于岩画内容的解读和释义研究较多,但岩画中单个符号的解读和释义研究却较少。通过对岩画的解读与释义,可以了解原始人类的生活情形。21世纪信息技术对各个领域都带来了巨大的转变和生机,将计算机领域的图片对比识别技术引入到岩画的相关研究中,对于岩画内容和符号的释读将带来新的发现。
在大麦地游牧民族创作的图形符号中,今天依然能感受到自然、历史、知识与生命的律动,自然界中的阳光和水是生命生存繁衍不可或缺的自然条件,这两者最为先民们所感知,而畜牧与狩猎是最基本的生活方式,先民使用的工具则扮演着重要的角色。对自然界的感知及对食物的渴望,导致能够给人类带来温暖的太阳,哺育人类生命的水资源和生产生活中必需的工具,“”“”“”就在大麦地岩画中屡屡出现,从岩画图形中筛选这三种符号,就图形符号而言,其最具典型性和代表性。
二、大麦地游牧民族岩画图形符号
大麦地岩画分布范围广泛,在十几道如同浪起潮涌的山梁崖壁上,连绵不绝地陈列了大大小小精彩纷呈的岩画作品,一般都延续百米以上到近千米长。在密集地段,几乎每块石头上都有岩画,而许多岩画都有叠压打破关系。其岩画区分布的数量之众多、规模之宏大,内容之丰富、分布之密集,实为罕见。这些岩画图形符号反映了游牧民族的文化记忆,生动地反映了史前人群对现实世界的思考和对未知世界的想象等[3]。
大麦地岩画中存在着大量的象形符号和抽象符号。这些符号我们目前并不了解其形声功能,根据研究发现,这些符号已经具备了象形、指事、会意的功能,这些功能与汉字早期的甲骨文的功能相近,可以说大麦地岩画中的符号已经具有了汉字象形字的部分特征。在研究解读大麦地岩画图形符号的同时,将它和甲骨文作比较,可能会得出较为意外的结果。传统解读岩画的方式总会带有人为主观臆断的局限性,因此就需要客观媒介。甲骨文是现今所知最古老的文字,距今四千年左右,甲骨文的原始图画文字的痕迹比较明显,象形意义也较为显著,它更接近图画,可以用它作为研究岩画图形符号的参照物。经过识别技术和相似度计算后,若岩画图形符号与甲骨文有较高相似度,且被经常、固定地使用在某些场合,代表某些固定的意义,我们就称这些符号为岩画图形文字符号[4]。大麦地岩画中有一些典型的岩画图形符号,这些符号经常与一些岩画图形搭配成一个系统。解读这些符号对破解岩画的奥秘有重大意义。
汉字的古老形式——甲骨文,与世界上已被发现的最古老文字,如古埃及文字和苏美尔的楔形钉头文字一样,在它们的演变过程中尚未找到早于这些文字的起源。中华民族一直使用的汉字,其秉承甲骨文字的特性,在以象形为主的基本汉字的基础上,向合体,向会意、指事、形声方向发展。那么在甲骨文出现之前,作为图画符号的记事阶段,人类文明需要靠什么来记录和表现呢?学术界普遍认为大麦地岩画早期大致对应新石器时代中晚期到青铜时代,这段时间正好处于甲骨文产生之前,弥补了甲骨文之前文字图画形态出现的空档。数字人文概念的提出无疑给岩画图形符号与甲骨文的对比识别研究带来了新的前景,计算机模式识别技术突破了两者对比识别的主观局限性,使得岩画图形符号的释读更加客观。
三、岩画图形符号与甲骨文字形相似性识别路径
目前对岩画的研究中,抽象岩画图形符号表达含义的释读,是一个令人困扰的难题。在不同的岩画中找到相似的岩画图形符号,是耗时耗力的工作。将数据库的构建和计算机对比识别算法引入岩画相关研究中是一种新的尝试。岩画经过长期的自然损坏,通过岩画照片,计算机很难识别岩画的具体信息。而考古线描图可以使用简洁的线条描绘岩画的形状和结构特征,因此本文采用岩画考古线描图作为相似性识别的对象。
图片识别技术和图片相似度对比技术已经趋近成熟,利用这些技术进行抽象的岩画图形符号与甲骨文的识别比较,可以找出与岩画图形符号最为相似的甲骨文字形。甲骨文是中国最为古老的文字,每个甲骨文都有其所对应的现代汉字。而汉字起源于象形或以象形为基础,每个汉字都有独特的解释,用这些解释作为岩画图形符号释读的一种依据,综合具有相似岩画图形符号的不同岩画及所处的时代背景,可以进行大麦地岩画图形符号的判断与解读。大麦地岩画与甲骨文相似度识别路线图如图1所示。
图1 岩画图形符号与甲骨文相似度识别路线图
(一)路线图介绍
1.建立岩画数据库和甲骨文数据库。在建立岩画数据库和甲骨文数据库的基础上,进一步扩充这些数据库的内容和功能,并保留原有的数据资料。贺兰山岩画数据库已经包括了贺兰山岩画及北山的大麦地岩画的清晰图像、线描图,以及采集地点、分期制作方法和采集人等相关数据资料。此外,还为该数据库添加了检索和筛选功能,涵盖了人骑岩画、人面像岩画、动物岩画、生产生活岩画和岩画符号等多个主题。古文字数据库的建立是以已识别的甲骨文为收录对象。这些甲骨文包括每个字形的所有异变字形。为确保字形的准确性,将以原始拓片的形式录入这些字形,以避免字形失真。数据库中将设立子字库,方便用户一次性检索到特定字及其所有的异变字形。这些扩充和改进将使岩画数据库和甲骨文数据库成为研究者进行符号对比识别的重要工具。这些数据库的建立不仅有助于深入研究岩画和甲骨文,也为研究人员提供了更多的参考和资源。
2.从岩画数据库中检索出岩画图形符号,随后将其导入计算机对比识别程序进行分析。不同岩画图片中的相似岩画图形符号通常呈现不整齐的排列、大小不一致和方向不统一的特点。为了应对这些问题,常用的图像特征提取算法包括SIFT 算法、SURF 算法、FAST 算法和ORB 算法。本研究采用基于ORB 的图像特征提取算法,该算法能够提取岩画图像的局部特征,并且对图片的大小、尺度缩放和旋转具有不变性。通过基于ORB 的图像特征提取算法,可以统计出含有相似符号的岩画图片的数量,随后可以对其出现频率进行分析,以供研究人员参考。这种分析可以揭示不同岩画图形符号在岩画艺术中的重要性和普遍性,为进一步研究岩画图形符号的文化含义、制作背景和演化趋势提供支持。
3.在甲骨文数据库中寻找具有相似特征的甲骨文字形图片,将这些图片与已导入的岩画图形符号图片进行相似度计算。相似度计算程序采用了计算机领域中五种传统的图片对比方法,包括aHash、dHash、pHash、Three histogram algorithm 和Histogram algorithm for single channel。这五种算法具有不同的原理及生成的相似度。为得出更准确的结果,通过赋予算法不同的权重,使用这五种算法的加权平均值作为总体相似度指标,并按照从高到低的顺序对结果进行排序。最后,将对比识别结果和相似度计算结果反馈给研究人员,以探究岩画图形符号与汉文字起源之间的关系。
(二)使用算法介绍
1.识别算法
ORB(Oriented FAST and Rotated BRIEF)算法是一种用于图像特征提取和描述的计算机视觉算法。它结合了FAST(Features from Accelerated Segment Test)关键点检测算法和BRIEF(Binary Robust Independent Elementary Features)描述子算法的优点,并在此基础上进行了改进。首先,ORB算法使用FAST 算法来检测图像中的关键点。FAST算法是一种高效的角点检测算法,它通过对像素点的亮度进行快速的特征检测,找到具有显著变化的角点。与其他角点检测算法相比,FAST算法的速度更快,适用于实时应用。ORB 算法通过BRIEF 描述子对检测到的关键点进行描述。BRIEF 算法是一种二进制特征描述子算法,它通过在关键点周围的区域中选择一组二值化的像素对,并将它们编码为二进制串。这种二进制描述子具有快速计算和高效存储的特点。
因为BRIEF 算法对图像的尺度、旋转和光照变化较为敏感。因此为了提高ORB 算法的鲁棒性和可靠性,它引入了旋转和尺度不变性。ORB算法利用关键点的角度信息,对关键点周围的像素进行旋转,以使描述子对旋转变化具有不变性。此外,ORB 算法还采用了金字塔尺度空间来处理图像的尺度变化,从而提高了算法的鲁棒性。
在岩画符号识别任务中,首先构建岩画符号数据库,其中包含不同符号的图像和相应的标签。然后,对于待识别的岩画符号图像,首先使用ORB 算法提取其特征描述符并将其记录,接下来通过与数据库中的符号图像进行特征匹配,找到与待识别符号图像特征最相似的符号。最后,根据匹配结果进行符号的分类和识别。
总之,ORB算法通过使用FAST关键点检测器和BRIEF 描述符来提取岩画图像的特征信息,并引入旋转不变性来增强算法的鲁棒性。通过与数据库中的符号图像进行特征匹配,ORB 算法可以实现对岩画符号的自动化识别,为岩画研究和保护提供了有力的工具。
2.相似度匹配算法
哈希算法:通过哈希算法得到的任意长度的二进制值映射为较短的固定长度的二进制值,即哈希值。哈希算法是一个函数,能够把几乎所有的数字文件都转换成一串由数字和字母构成的看似乱码的字符串给图片生成这样的字符串格式的指纹。两张图片的指纹越相似,说明两张图片就越相似。均值哈希本质上是对颜色的比较;感知哈希由于做了DCT 操作,本质上是对频率的比较;差值哈希本质上是基于渐变的感知哈希算法。
直方图算法:直方图算法将图片中的像素值按照一定的范围分组,并统计每个像素值所占的比例,形成一个直方图。在计算直方图时,可以将像素值分为几个区间,比如将灰度值分为0—255等分成10 个区间,每个区间中包含的像素数量即为该区间的高度。通过比较两张图片的直方图,可以计算它们之间的差异程度。单通道直方图算法是将一张图片的像素值按照灰度值分组,统计每个灰度值所占的比例,形成一个灰度直方图。它对于黑白图像的相似度计算效果很好。三通道直方图算法是将一张彩色图片的三个颜色通道分别按照灰度值分组,统计每个灰度值在每个颜色通道中所占的比例,形成一个三通道直方图。它可以更好地反映彩色图像中的色彩信息。
将哈希算法和直方图算法得到的相似度进行综合评估,并根据实际需求赋予两种算法不同的权重,然后计算加权平均得到最终的相似度得分。综合相似度评估考虑了哈希算法和直方图算法在相似度匹配中的贡献,给予岩画图形符号与甲骨文的对比更全面和准确的相似度度量结果。
史前时期,太阳和现在一样照耀着大地,为万物提供生机。在古人眼中,太阳是光芒四射的发光体,能够照亮万事万物,是被人格化的神。太阳带给了他们光明与能量,是生活不可分割的一部分。通常情况下,太阳是个圆圆的实体,它不像月亮那样时圆时缺。古人在刻画太阳时,都会画一个圆圈,或虚、或实,或画出光芒。正是对太阳的崇拜,使得在大麦地岩画上经常出现“”这种圆圈加点的组合图形,最具典型代表性。
表1 “”识别计算结果①
表1 “”识别计算结果①
?
用岩画中的图形符号“日”和甲骨文中的甲骨文字形“日”进行相似度比较。发现它们具有高度的相似性,岩画图形文字符号“日”在大麦地岩画中反复出现,具有代表性意义。
日(拼音:rì)乃汉语常用字,始见于商代。远古时代,并无“太阳”这个词,“日”就是太阳。日夜更替是由于地球自转产生昼夜交替的一种自然现象,这些科学知识是现代人所熟知的。古人并不了解日夜更替的原因,但太阳的东升西落却被生活在远古时期的人类所悉知。用日作意符的汉字大多与太阳或时间有关,如时、晖、景、晴、明、暗、晦、旦、暮、昏、晓、春、晨,等等。“日”是最早出现的象形文字之一,它所模拟的对象就是太阳。“日”从象形图像到抽象文字符号的演变过程如图2所示。
图2 “日”字的演变过程[5]
无论是岩画图形符号“日”,还是汉字“日”演变过程中的不同字形,它们之间如此神似,均表明远古时期人类思维带有浓厚的原始图形文化信息。
表2 识别计算结果②
表2 识别计算结果②
?
在大麦地生活的原始部族和游牧民族以狩猎和畜牧为主,狩猎和畜牧都离不开动物。大麦地岩画以野生动物和牧养牲畜居多,其中羊是出现次数最多的动物。羊是古人最常见的食物和祭祀用品,游牧民族以羊为主要的生产和生活资料。
表3 “”识别计算结果③
表3 “”识别计算结果③
?
图3 “”及动物岩画
图4两幅岩画都由人、羊、竖勾状岩画图形符号构成。图4 左侧的岩画中,人与旋转后的竖勾工具出现在左侧,人的面前有着两只羊,羊头正对人身,仿佛人在驯服羊群。图4右侧的岩画中,左则的人与右侧的羊中央刻画一竖勾工具,右侧的羊背对人身,描绘的是人要驱赶羊群。人是工具的使用者,人对工具具有能动作用,人、羊、竖勾状岩画图形文字符号的共同出现,使“”岩画图形符号是放牧工具的释义更加合理的。
图4 “”岩画
图5 “游牧风情”岩画
六、结语
大麦地岩画典型岩画图形符号的频繁出现最能反应游牧民族所处的地理环境特征,他们对自然界及人类生殖的崇拜是对生活最基本、最直接的表现。远古社会,风雨雷电的出现就是神明对人的惩罚,而太阳的出现象征着一天的安稳,远古先人对于太阳的尊敬,就表现为“”符号。“”符号体现着古人对水的需求,更是人类不可或缺的自然资源。古人生产生活中也离不开工具,“”符号无论是为屠宰的工具,还是作为游牧民族放牧时使用的工具,都如实地记载在大麦地岩石上。使用计算机模式识别技术进行岩画图形符号与甲骨文的对比识别是可行的,但对比识别的结果不能直接作为判断岩画图形文字符号含义的依据。岩画图形符号与甲骨文有较高的相似度,但因此断定岩画图形符号“”“”“”与现代汉字“日”“水”“亅”对应仍然需要进一步地论证。
无疑将计算机模式识别技术与传统方法的结合运用到典型的岩画图形符号与甲骨文的对比中,增加了岩画释义解读的科学性与准确性,是岩画研究的最新方法与趋势,同样为汉字的起源提供了一种可能。岩画图形符号是汉文字发展最初阶段可能存在的形式之一,如果这种可能性能够通过科学论证加以确认,那么该研究势必为中国乃至世界文明早期起源研究做出重要的贡献。
注释:
①“合”,出自郭沫若主编的《甲骨文合集》,中华书局,1978年—1983年版。
②甲骨文来源这一栏中的数字出自于刘钊、冯克坚主编的《甲骨文常用字字典》,中华书局,2019年版。
③“懷”,出自许进雄的《懷特氏等收藏甲骨文集》,加拿大皇家安大略博物馆。