超大规模语料库精深加工及应用研讨会会议报道
2010-02-14金澎
中文信息学报 2010年4期
金 澎
(乐山师范学院 智能信息处理及应用实验室, 四川 乐山 614004)
2010年4月18至19日,在乐山师范学院召开了“超大规模语料库精深加工及应用研讨会”。会议中心议题是交流在超大规模语料获取、整理、加工方面的成果与经验,特别针对基于国家语言资源监测语料库的语言状况调查中遇到的问题进行了深入讨论。
此次会议由北京大学教育部计算语言学重点实验室组织,乐山师范学院计算机科学学院和智能信息处理及应用实验室承办。会议的动机是通过交流,将已有的大规模语料库加工的成果能够有机地应用于基于超大规模语料库的语言状况调查中。会上交流的研究成果包括“现代汉语虚词用法知识库研究及相关工具”、“汉字义类信息库”、“汉语语义构词信息库”、“现代汉语新词语信息电子词典”、“新编同义词词林”、“句子语义成分标注语料库”、“同形标注语料库及标注、校对软件”等。同时,对面向语言监测的分词标注工具的特点、新词语、流行语提取的难点及对策等进行了深入讨论。达成了在超大规模语料库的处理及精加工方面发挥各自所长,相互合作,共享成果的意向。
出席此次会议的专家学者包括:北京大学俞士汶教授、朱学锋副教授、中国传媒大学侯敏教授、鲁东大学亢世勇教授、北京语言大学杨尔弘教授、郑州大学昝红英副教授、中国情报技术研究所刘耀副研究员、北京大学博士后刘鹏远、乐山师范学院金澎博士等。