APP下载

维吾尔文本处理中多模式匹配的应用

2019-08-12伊力亚尔·达吾提

电脑知识与技术 2019年16期
关键词:维吾尔语

摘要:维吾尔文模式匹配技术对维吾尔文不良文本检测和过滤有着很大的实用性,因此考虑语言特点在AC-BM多模式算法上改进提出一种AC-BM-Ug算法,算法利用AC多模式匹配算法,借用BM匹配算法跳跃原理提出的一种改进算法。

关键词:改进AC-BM多模式匹配;维吾尔语

中图分类号:TP311      文献标识码:A

文章编号:1009-3044(2019)16-0210-02

开放科学(资源服务)标识码(OSID):

1 概述

维吾尔文模式匹配在维吾尔文搜索引擎、书目检索系统、文本信息过滤、网站监控等各领域中至关重要。考虑AC-BM算法在模式匹配中广泛应用,语言特点对AC-BM算法进行改进实现了维吾尔文多模式匹配。

2 维吾尔文

3 AC算法

4 改进的AC-BM-Ug算法

5 结束语

本文考虑维吾尔语言特征、书写方向等各种因素,在AC-BM算法上进行改进提出适合维吾尔语的多模式匹配算法。此算法可将应用于维吾尔文不良信息关键词的检测和过滤,自动化办公、网络检测等网络信息处理等领域中中,更有效的、快速的处理文本匹配。

参考文献:

[1] 伊力亚尔·达吾提,哈力旦·阿布都热依木.面向维吾尔文的多模式匹配算法研究[J].计算机工程,2015,41(1):143-149.

[2] 早克热·卡德尔,艾山·吾买尔,吐尔根·依布拉音,艾斯卡尔·艾木都拉.维吾尔语名词构形词缀有限状态自动机的构造[J].中文信息学报,2009,23(6):116-121.

[3] 吾守尔·斯拉木.维吾尔语文语转换系统的研究[C].中国青海西宁:第十届全国少数民族语言文字信息处理学术研讨会論文集,2005.

【通联编辑:光文玲】

猜你喜欢

维吾尔语
浅析维吾尔语表可能语气词
统计与规则相结合的维吾尔语人名识别方法
维吾尔语指示词的语用研究
维吾尔语话题的韵律表现
中国维吾尔语、塔吉克语亲属称谓对比研究
指称在维吾尔语语篇中的衔接方式及其功能
维吾尔语主谓句SV句的语义结构分析
维吾尔语词重音的形式判断
汉语动结式在维吾尔语中的表现形式
现代维吾尔语中“-0wat-”的进行体特征