最短路径算法与正则语言的空性判定

2015-07-18姜盼崔艳荣

电脑知识与技术 2015年12期

姜盼　崔艳荣

摘要：正则语言的空性判定方法除了传统的标记法外，还有另一种方法，那就是利用最短路径算法。通过对路径的判断，来证明正则语言的空性是否可判定。如果为空，则路径无限长，不为空，则路径是有限长的。该算法比标记法少了标记这一过程，减少了系统的开销，提高了正则语言的判定效率。

关键词：最短路径算法；正则语言；可判定性

中图分类号：TP301 文献标识码：A 文章编号：1009-3044（2015）12-0079-02

确定型有穷自动机能够识别的语言称之为正则语言。正则语言可以用有穷自动机的形式进行描述。本文研究算法求解问题的能力，因为有一些问题算法上能够求解，而另一些则不能[1]。我们的目的是研究算法可解性的局限。正则语言的空性问题是否是可判定的，这需要我们去证明。

最短路径的问题源出于交通运输等问题，对于n个城镇之间的公路所组成的公路网，从甲地到乙地是否有公路，若有多条公路可以到达时，走哪条路最近？花费最省？这些问题是我们最为关注的。最短路径可以定义为从某顶点出发，沿图的边到达另一顶点所经过的路径中，各边上权值之和最小的一条路径。解决最短路的问题有Dijkstra算法，Bellman-Ford算法，Floyd算法和SPFA算法等。本文结合最短路径Dijkstra算法问题的求解来证明正则语言的空性可判定性。

1 正则语言的空性判定方法 ——标记法

1.1 有穷自动机（DFA）和正则语言

定义1 有穷自动机是一个5元组（Q，Σ，Γ，δ，q0，F）[2]，其中：

Q：一个有穷集合，叫做状态集。

Σ：一个有穷集合，叫做字母表。

δ：Q Σ→Q是转移函数。

q0：起始状态，q0∈Q。

F：接收状态集，F Q。

设M=（Q，Σ，Γ，δ，q0，F）是一台有穷自动机，ω=ω1ω2…ωn是字母表Σ上的一个字符串。如果存在*Q中的状态序列r0，r1，…，rn，满足下述条件：

1） r0= q0

2） δ（ri， ωi+1）=ri+1，i=0，1，…，n-1

3） rn∈F

则M接受ω。

条件（1）说机器从起始状态开始，条件（2）说机器按照转移函数从一个状态到一个状态，条件（3）说如果机器结束在接受状态，则接受它的输入。如果A=﹛ω|M接受ω﹜，则称M识别语言A。

定义2如果一个语言被一台有穷自动机识别，则称它是正则语言[2]。

由于当M1对ω计算时进入的状态序列为

q0，q1，q1，q0，q2，q0，q0，q0，q1，q0

它满足上述3个条件，根据计算形式定义， M1接受ω。M1的语言是

L（M1）=﹛ω|除将计数重新置0之外，ω中所有符号之和模3等于0﹜

因为M1识别这个语言，所以它是正则语言。

1.2 图灵机（TM）的形式定义

定义3 一个图灵机是一个7元组（Q，Σ，Γ，δ，q0，qaccept，qreject），其中：Q，Σ，Γ都是有穷集合[3]，并且：

Q：状态集。

Σ：输入字母表，不包括特殊空白符号凵。

Γ：带字母表，其中：凵∈Γ，Σ Γ。

δ：Q Γ→Q Γ ﹛L，R﹜是转移函数。

q0：起始状态，q0∈Q。

qaccept：接收状态，qaccept∈Q。

qreject：拒绝状态，qreject∈Q且qaccept qreject。

图灵机M=（Q，Σ，Γ，δ，q0，qaccept，qreject）的计算方式如下：开始时，M以最左边的n个带方格接受输入ω=ω1ω2…ωn∈Σ*，带的其余部分是空白（即填以空白符）。读写头从最左边的带方格开始运行。注意，Σ不含空白符，故出现在带上的第一个空白符表示输入的结束。M开始运行后，计算根据转移函数所描述的规则进行。如果M试图将读写头从带的左端移出，即使转移函数指示的是L，读写头也停在原地不动。计算一直持续到它进入接受或拒绝状态，此时停机。如果二者都不发生，则M永远运行下去。

1.3 标记法证明正则语言的空性

下面定理证明了EDFA是可判定的，因而也就证明了问题“一个给定的有穷自动机的语言是否为空”是可判定的。

定理1 EDFA是一个可判定语言。

证明 DFA接受一个串当且仅当：从起始状态出发，沿着此DFA的箭头方向，能够到达一个接受状态。为检查这个条件，设计一个使用标记算法的TM M。

T=“对于输入，其中A是一个DFA：

1）标记起始状态。

2）重复下列步骤，直到所有状态都被标记。

3）对于一个状态，如果有一个到达它的转移是从某个已经标记过的状态出发的，则将其标记。

4）如果没有接受状态被标记，则接受，否则拒绝。”

2 最短路径算法判定正则语言的空性

2.1 最短路径算法及其思想

Dijkstra算法是典型的单源最短路径算法，用于计算一个节点到其他所有节点的最短路径。主要特点：以起始点为中心向外层层扩展，直到扩展到终点为止[4]。