藏文名词短语的语义研究
2016-12-20多杰卓玛
多杰卓玛
(西北民族大学 中国藏文典籍全文数字化研究所,甘肃 兰州730030)
藏文名词短语的语义研究
多杰卓玛
(西北民族大学 中国藏文典籍全文数字化研究所,甘肃 兰州730030)
在藏文网络语料的基础上,文章就“N1+N2”结构的名词短语进行举例分析,其中包括它的结构类型、组成成分、句法及语义功能的分析,给出了名词短语的线性结构组合形式和词性结构扩展模式,细化了它的主要组成成分.从句法和语义的层面出发,挖掘了该结构所蕴涵的句法关系和语义特征.
藏文;名词短语;结构;形式;功能
0 引言
随着网络信息不断发展的今天,藏文自然语言理解而言,藏文的词、词汇、短语的研究就将会对短语词典构建与短语相关的藏文关键词搜索引擎、机器翻译、信息提取等的实现起着重要的作用和对这方面的研究有着深远意义,这一点在文[1]中也类似的提到.为此,我们将收集到 的藏文网络媒体新闻语料100M,其中,查重及噪音处理、整理后约有60M语料,这部分语料进行了机器分词加人工校对的方式完成,并从中抽取了约1000条名词短语.本文以 “名词+名词”或“名词+虚词+名词”型名词短语为主,对其结构类型、组成成分、语法语义功能等方面一一分析.
1 名词短语的结构类型
图1 名词短语的组织形成
表1 表1 名词短语组合形式
图2 (2.1)模式举例示意图
2 名词短语的组成成分分析
我们从N1+N2型名词短语的直接成分和功能两方面综合分析它的组成成分.
图3 名词短语韵律节奏表现
2.2.3 组合方向:
我们采用下面的例子,揭示藏文中存在的音步及它的自然向右组合的规律(见图4).
图4 名词短语的组成成分说明
3 名词短语的句法语义功能分析
5 结语
本文将藏文自然语言处理为目的,进行了基于网络新闻语料的藏文名词短语的结构组成成分分析、结构类型及其短语的语法语义句法功能分析 .为藏文信息科学领域的深入研究提供了参考作用,同时也为今后实现藏文短语词典的构建以及在藏文搜索引擎中的应用提供有力的帮助.
[1]徐艳华.基于语料库的基本名词短语研究[J].语言文字应用,2008,(1):120-125.
[2]马进武.藏语语法四种结构明晰(藏文)[M].北京:民族出版社,2008.9:87.
[3]孙艳.“名词1+名词2”形式研究[J].语文学刊,2009,(9):119-121.
[4]刘志杰等.搜索引擎日志中“N1+N2”型名词短语研究[J].现代图书情报技术,2010,(12):58-63.
[5]冯胜利.论汉语的“自然音步”[J].中国语文,1998,(1):40-47.
[6]易闻晓.中国诗的韵律节奏句式特征[J].中国韵文学刊,2007,21(4):1-7.
Analyses of Noun Phrases in Tibetan Web Corpus
Duo jie Zhuo ma
(Digital Institute of Tibetan Classics Literatures of China,Northwest University for Nationalities,Lanzhou 730030,China )
On the basis of the Tibetan web corpus,this paper discussed the noun phrasal structure of N1+N2including its structure type,which was composed of the composition,syntax and semantic functions.Furthermore,the linear structure of the noun phrases and the noun phrasal extension model of the POS structure were given.Several major components of the noun phrases are refined,the syntactic and semantic relations and implied in the structure were clarified based on the level of the syntactic and semantic.
Tibetan;Noun phrases;Structure form functions
H214
A
1009-2102(2016)03-0035-06
2016-06-02
2014年度国家社科基金项目“基于框架语义的藏文词汇语义资源库构建研究(项目号:14BYY139)资助.
多杰卓玛(1970—),女(藏),青海贵德人 ,副教授,研究方向:藏文信息处理、藏语框架语义学.