一种藏文文本加密方法的研究与实现
2020-03-16三排才让洪松高定国
三排才让 洪松 高定国
摘要:本文为了解决文本在网络传输过程中的安全性问题,设计并实现了一种根据藏文音节结构的文本加密方法。本文采用移位加密方法,按构件顺序替换相应的构件组成新的藏字,解密时按反向移位方法还原该藏字。该方法不仅能加密常用的藏文字符外,还能加密藏文数字和一些特殊字符,对文本的保密、文件的完整性和稳定性都有很重要的作用。
关键词:藏文;文本;加密
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2020)02-0033-02
1 概述
网络技术的快速发展,方便了我们的日常生活,加快了工作效率,增进了交流。网络的出现给我们带来了很多的便利,但网络安全问题也在时时困扰着我们,病毒、黑客的猖獗,网络安全问题也就成了社会关注的重点问题。文件传输安全就是大众关注的安全问题之一。文本加解密就是对原来可读的明文文本按照某种算法进行处理,使其成为不可读的密文文本,为了文件传输的安全性和保密性要求,经常对文本进行加密。在使用文本时用加密的逆过程还原原来的明文文本。
目前国外最常见的文本加密方法有AES加密方法,RSA加密方法,同态加密方法和属性加密方法(ABE)[1]。国内关于文本加密的算法也较多,有一些基于编码的文本加密方法[2]和基于RSA公钥加密的短文本加密算法[3],还有通过进制转换工具加密文本的算法以及基于自然语言文本水印技术的加密算法[4]。但是目前有关藏文文本的加密方法较少,本文的研究有很重要的价值。
本文根据藏文音节结构和其特性,采用移位加密方法设计并实现了一种藏文文本加密方法,可对藏文文本进行加密和解密。
2 藏文文本加密方法的研究
2.1 藏文音节结构分析
Unicode中藏文字符编码的总共空间是256个,编码段是0F00至0FFF,Unicode6.2收录的藏文字符的编码从0F00到0FDA,共211个,其中包括辅音字符、元音符号、变音符号、数字符号、标点符号和一些特殊符号[5]。
构成现代藏字的辅音字母有30个,分为叠加辅音和非叠加辅音,非叠加辅音在Unicode中的编码段是0F40至0F68,叠加辅音的编码段在0F99至0FBC,元音字母有四个,分别在0F72至0F7C编码段,藏文的數字的编码段在0F20至0F29,除了以上现代藏文的构件外,还有一些用于转写梵音的藏字,分别是11个辅音和5个厚字辅音,4个反体辅音以及其他两个辅音,都在Unicode字符集编码当中[6]。
现代藏文的音节由前加字、上加字、基字、下加字、元音、后加字和再后加字等七个构件组成,并有严格的语法约束。藏语辅音字母中的?????????五个字母可以作为前加字放在基字前面构成字母组合,现代藏字的上加字有3个,分别是??????,现代藏字的下加字有4个,分别是????????辅音字母中的???????????????????可以作为后加字,添加在基字的后面,再后加字有2个,分别是????[7]。
2.2 加密理论
移位加密方法是一种简单的循环移位替换加密,是单表代换密码中的一种[8]。现代藏文中能够独立运用的最小的语言单位是藏文音节[9],藏文音节由1-7个构件构成,每个构件最多有30个字符,运用移位加密方法替换每个构件中的字符,也就是构件表中的字母左右移k个位置(k<30),就完成对藏文音节的加密。它的加密可以用公式1表示。
其中,c表示密文字符,s表示明文字符,k表示移位的数字,n表示代换字符集的字符总个数,在公式1中k取-1,n取30,每个构件在自身的集合中进行移位,加密过程如表1所示。
例如:
公式1中k取不同的值,可以代换出不同的结果,若k取正值,用右边第k个值代换,若k取负值,则用左边第k个值代换。
2.3 解密理论
解密的时候用反向移位方法,构件表中的字母相对于加密反方向移位k个位置(k<30),就能还原明文。解密可以用公式2表示。
3 藏文文本加密方法的实现
3.1 藏文文本加密步骤
读入藏文文本,以藏文音节点以及其他非藏文字符作为分割点对藏文字符进行分割,调用藏文构件拆分的方法,对每个音节点进行构件拆分,把藏文音节的七个构件分别放入列表中,把每个构件按照列表的顺序循环移位,替换成相应的构件,构成新的藏文音节,也就是加密后的藏文音节。直到处理完所有文本为止,具体步骤如图1所示。
3.2 藏文文本解密步骤
藏文文本解密是加密的逆过程,解密时用反向移位方法,按构件的长度循环移位替换,还原相应的构件就得出解密后的文本。具体步骤如图2所示。
4 结果分析
该方法容易实现,操作简单,加密和解密由同一算法实现,明文和密文等长,加密和解密速度快。实现的程序运行结果如图3所示,窗口中输入明文点击加密按钮进行加密,窗口中输入密文点击加解密钮进行解密,最后可以保存加解密结果。经测试藏文文本的加密和解密的准确率为100%,达到了应用水平。
5 结束语
互联网的迅速发展,对人们的生活提供了前所未有的便捷,但同时也对人们的数据传输和信息安全构成了很大的威胁,所以信息的加密有很重要的意义。本文利用移位加密方法,结合藏文等拼音性文字的特点和藏文Unicode编码方案,对藏文音节进行构件识别,并对构件进行移位加密和解密,设计实现了藏文文本加密解密方法,经测试加解密的准确率达到了100%,该方法容易实现,操作简单,加密和解密由同一算法实现,明文和密文等长,加密和解密速度快。为了进一步研究藏文的加密技术,藏文信息的安全奠定了一定的基础。
参考文献:
[1] 张金辉,郭晓彪,符鑫.AES加密算法分析及其在信息安全中的应用[J].信息网络安全,2011(05):31-33.
[2] 王烨,柳增寿,王明春,胡伯良.电子政务内网中的电子文档保密技术研究[J].科技创业月刊,2015,28(18):110-111.
[3] 宋文纳. 基于属性加密的短文本密文检索技术研究[D].武汉理工大学,2016.
[4] 郝宇,姚远.基于文本水印技术的文本加密算法[J].火力与指挥控制,2015,40(05):164-166+170.
[5] 江狄,龙从军.藏文字符研究[M].北京:社会科学文献出版社,2010.
[6] 珠杰,李天瑞,格桑多吉,仁青诺布,乔少杰.藏文音节规则模型及应用[J].北京大学学报:自然科学版,2013,49(01):68-74.
[7] 高定国,珠杰.藏文信息处理的原理与引用[M].西南交通大学出版社.2013.
[8] 程克明,龚宝林,苏煜.非线性随机序列的发生与信息非线性移位加密算法[J].上海铁道医学院学报,1995(02):89-91.
[9] 关白,洛藏,才科扎西.现代藏文自动校对现状分析[J].西藏科技,2011(08):78-80.
【通联编辑:光文玲】