绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智东西公开课服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智东西公开课
句子匹配与词对齐的讨论和研究
NLP前沿讲座 2020/11/04 10:00:00
课程讲师
兰武伟 俄亥俄州立大学博士生

师从徐薇教授,本科毕业于中国科学技术大学。主要研究方向为自然语言理解、句子匹配,曾获COLING 2018最佳论文奖。

兰武伟
俄亥俄州立大学博士生

师从徐薇教授,本科毕业于中国科学技术大学。主要研究方向为自然语言理解、句子匹配,曾获COLING 2018最佳论文奖。

课程提纲
  • 句子匹配任务研究背景
  • 针对句子匹配的通用神经网络架构
  • 句子匹配中的关键子任务-词对齐的研究
  • 端到端的词对齐网络模型
课程简介

句子匹配(Sentence Pair Matching)问题是NLP中非经常见的一类问题。对于两个句子,句子匹配意在解决推断这两个句子是否具备某种类型关系的问题。或者说是对于输入两个句子,经过映射函数变换,以输出任务分类标签集合中的某类标签。在自然语言处理领域,该映射函数通过神经网络映射,而标签集合里的分类标签详细代表的含义则与任务相关联。

而在句子匹配中,其关键子任务就是词对齐(Word Alignment)问题。词对齐就是在句对文本中的互译关系的词之间建立对应关系。在NAACL 2018会议中,俄亥俄州立大学在读博士兰武伟在《Character-based Neural Networks for Sentence Pair Modeling》一文中指出,两个句子之间的语义关系很大程度上取决于对齐词或语块之间的关系。对于跨句子的所有词对,论文中提到的PWI模型使用余弦相似度、欧几里德距离和编码层输出上的点积直接计算词对交互作用,通过对交互值进行排序并选择排名靠前的词对,将硬注意力应用于交互张量,以加强词对齐效果,使得上层句子匹配任务取得了较好的效果。因此,词对齐的研究对句子匹配任务的效果有重要的促进作用。

词对齐效果好坏将直接影响最终句子匹配任务的结果。目前在词对齐方法的分类上可以分为:有监督的方法、无监督的方法、启发式的方法、统计式的方法。基于词典的对齐是启发式、有监督的方法,能有效针对数据稀疏问题,适合小规模数据,且准确率有保证。IBM模型是统计式、无监督的方法,使得对齐关系只与原句子长度有关。

11月4日上午10点,智东西公开课邀请到俄亥俄州立大学博士生兰武伟参与「NLP前沿讲座」第7讲,带来主题为《句子匹配与词对齐的讨论和研究》的直播讲解。兰武伟博士将从句子匹配任务出发,概述句子匹配的研究背景和目前在该任务上使用的通用神经网络架构,进而深入讲解句子匹配中的词对齐问题,对端到端的词对齐网络模型进行深入探讨。感兴趣的朋友不要错过!

兰武伟博士来自俄亥俄州立大学,师从徐薇教授,本科毕业于中国科学技术大学,主要研究方向为自然语言理解、句子匹配,曾获COLING 2018最佳论文奖。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...