GIS 的农业气象情报文本自动化生成技术
2016-02-07胡伟
胡 伟
(库车县气象局,新疆阿克苏 842000)
GIS 的农业气象情报文本自动化生成技术
胡 伟
(库车县气象局,新疆阿克苏 842000)
在气象情报文本自动化生成中,主要以拓扑原理作为基础,通过气象专用语的关联来进行统计数据的自动生成。这种技术可以将GIS平台所观测的农业气象数据进行全面的分析,从而自动生成图表及文字,并对农业气象情报进行描述。
拓扑原理 GIS 自动化 气象情报
1 农业气象情报文本自动化生成技术的使用方法
(1)在此技术使用中,首先需要有气象GIS技术对我国农业气象中的时间、空间等数据信息进行整理、集合,并建立相应的农业气象数据信息库。
(2)此技术主要服务于农业,因此,需要将气候特征、作物生长及不同灾害气象所造成的损伤等级进行确定并建立数据库。
(3)统计在气象情报文本中所有可能出现的专业用语,并将这些词语依据其所具有的属性进行分类。
(4)通过拓扑原理的应用,对气象GIS平台所提供的数据与农业信息数据库进行分析,在语法规则与语句重组模型的基础上进行段落重组,完成气象情报文本的自动生成。
2 农业气象情报文本自动化生成技术的表达方法
(1)时间表达。时间表达的特征及要素较为简单,其主要体现出对比的性质。一般表达形式为,此次观测时间与之前的某段时间之间的对比(主要为时间段内气象出现的各类变化对比)或同期之间的对比(通常为与往年之间的比较)。在拓扑映射关系建立时,对时间的语言规则及模型的建立上,主要是对其对比关系进行说明。
(2)空间表达。农业气象中,空间表达主要包括地区名称、命名规则、农业灾害分布、地理命名规则、作物种植区域命名规则、方位特征命名规则几种,且在空间表达上还需要注意地区各类等级指标。因此,在实际情况中,区域描述是空间表达中的难点。为了保证气象情报文本的准确性,在表达上要注意避免出现生僻、啰嗦等情况。
(3)属性表达。气象要素的属性是指,某一时间段要素值与历史值对比得出结果所对应的农业气象要素评价分类指标。一般包括与前一段或前n段时间尺度的对比,与历史同期相比,与表达指标特征的词汇映射,即属性分类指标与程度用语词汇之间的拓扑关联模型。
3 农业气象情报文本自动化生成技术的语言重组及文本生成
(1)语法规则。在进行拓扑映射模型建立中,要应用语法规则进行各类数据的联系,其也是语言重组所需具备的最基本条件。在农业气象中,包含着气象、时间、空间等内容,要通过制定语义、语序、语式的模本来建立语言规则模型,从而保证文本的可读性及逻辑性。目前,在拓扑原理中,主要应用的是汉语语言规则。在实际使用中,文本准确率较高。
(2)语言重组。语句模型与内容无关,对语言用法的总结表达,自然语言的词汇集有无限个词汇元素,而语句模型是有限的。无限集通过有限的语法结构框架集合生成无限的句子。情报的句型结构比较固定,只在细节上有变化,因此,易于构建科学数据的语句重组模型。
(3)语句生成。在自动生成的气象情报文本中,要包含对气象GIS平台所提供的各类数据的详细分析,并根据这些观测报告,对此区域的农作物种植提供实用的建议。其具体包括文本的整体摘要与各类空间、时间等内容及要素,再依据气象GIS数据库的内容,对区域内农业气象变化的特征进行推演,生成符合拓扑映射关系的语句。
(4)段落生成。农业气象情报文本内容要求结构严谨、逻辑清晰、内容简明。因此,在制订段落生成模型时,要注意减少情报中重复词汇及重复语句,并且段落生成时,要注意统一属性、要素的描述归为一段。例如,对气温的描述,将平均气温、极端气温、温度距平聚合为一段。对不同农作物在特定物候期的气象条件影响下,应采取的措施进行分层检索,拓扑关联其生产建议记录。
4 结语
在人工进行农业气象情报文本编写工作中,主要受工作人员的专业素质水平所影响。而应用拓扑原理及气象GIS的2种技术共同协作完成的文本自动生成技术,可在条件语句下,以科学数据作为基础,对各类语句进行重组,构建完整的段落,能够提高气象情报的工作效率。
[1] 李嘉洁,孙涵,华璀,等.基于气象GIS的农业气象情报文本自动化生成技术研究.气象与环境科学,2016,39(2):137~143