社会计算与信息检索研究中心,国际评测,佳绩 社会计算与信息检索研究中心在国际评测中获佳绩

13.06.2017  00:39

哈工大报讯(计算/文)在刚刚结束的CoNLL-2017评测中,我校计算机学院社会计算与信息检索研究中心车万翔副教授率队参加比赛,最终摘得了第4名的优异成绩,这也是亚洲参赛队伍取得的最好成绩。

据悉,CoNLL系列评测( http://www.conll.org/ )每年由国际计算语言学协会(ACL)的计算自然语言学习会议(Conference on Computational Natural Language Learning,CoNLL)主办,是自然语言处理领域影响力最大的技术评测。今年的 CoNLL评测任务为“面向生文本的多语言通用依存分析”(Multilingual Parsing from Raw Text to Universal Dependencies)。来自卡内基梅隆大学、华盛顿大学、多伦多大学、牛津大学、爱丁堡大学、东京大学、IBM研究院等113支队伍报名参赛,最终有33支队伍成功提交了评测系统。

我校参赛系统采用了基于转移(Transition-based)的方法实现依存句法分析系统,转移系统一般包括保存待处理词的缓存,保存正在处理词的栈和历史转移动作。参赛系统还使用了两种新的结构:Bi-LSTM Subtraction和Incremental Tree-LSTM,分别对缓存中所有词和栈中的子树进行建模,增强了模型对这两部分信息的表示能力。对于一些资源较少的依存树库和语言,系统使用了迁移学习的方法。该方法由我校社会计算与信息检索研究中心在2015年提出。该系统从资源丰富的语言中学习不同语言的共性知识,然后利用跨语言词向量训练总体模型,最后在资源稀缺的语言上进行有针对性的调整,显著提高了资源稀缺语言的依存分析精度。