被忽略的历史之谜
2010-03-01阮元
阮元
被忽略的历史之谜
阮元
3.伏尼契手稿
伏尼契手稿是一份内容不明的神秘书籍,附有插图,成书大约在400年前,书中所用字母及语言至今无人能识别,作者不详。这份手稿被发现以来,专业和业余的译解密码员,如第二次世界大战期间英美顶尖译码专家,都积极研究它,但是连只字片语也未能破译。一连串的失败令伏尼契手稿俨然成为密码术历史中的圣杯。不过有不少人认为,手稿只不过是场恶作剧——因为书中的符号排列全无意义可言。
伏尼契手稿全书大约240页,用上等牛犊皮制成,书页码有跳页。这表明伏尼契获得之前就已经散失了部分书页。书中的文字和素描图都是用鹅毛笔写就,图画上的彩色部分应该是后期才补上的。
手稿内的插图对于揭露书中内容未能有太大帮助,但是借着插图却可以看出全书分为6个“篇章”或“章节”,每篇的风格和主题各有不同。
手稿含有17万个字迹,字迹之间有窄分隔,大部分由一两笔写成。一套有二三十种不同字迹的字母系统几乎说明了整个手稿。关于某些字迹是否为个别字母存在一些争论。部分奇怪的字母仅出现一两次。较阔的分隔可分辨出约3.5万个不同长度的“词汇”,大致符合语音学的规律,例如部分字母在每一个词汇经常出现(正如英语的韵母)等。
统计分析发现,文稿的文字规律与自然语言类似。例如,词汇的出现频率符合齐夫定律,而词汇的熵(每词约10位)亦与英语或拉丁语相类似。
然而,手稿的语言与欧洲语言不太相似。例如,几乎没有词汇是多过10个字母,亦几乎没有1或2个字母的词汇。词汇内的字母分布独特,有些字母仅出现在前缀,有些在字尾,有些在词汇中间,这一特点与阿拉伯字母相似,但不见于拉丁字母、希腊字母或西里尔字母。词汇的重复程度也高于一般欧洲语言,同一词汇可能同时出现三次(相当于在英语中出现and and and)。统计学上,手稿的词汇数目相对较少。