ACL是自然语言处理领域影响力最大的国际学术组织( 二 )
文章图片
文章图片
3、BASS:基于统一语义图增强的生成式文本摘要
BASS:BoostingAbstractiveSummarizationwithUnifiedSemanticGraph
序列到序列(Seq2Seq)一直以来是生成式摘要中最为流行的架构 , 并在近期的研究中取得了不断的进步 。但是由于Seq2Seq结构中缺乏对文档结构的理解 , 长文本摘要和多文档摘要等较为复杂的摘要任务仍然给予Seq2Seq模型较大的挑战 。针对这一问题 , 本文提出了BASS模型 , 一种基于统一语义图的生成式摘要框架 。短语级别的统一语义图聚合了分散在文本集合不同位置的共指短语 , 且短语之间的结构蕴含了丰富的语义关系 , 从而显式地表示了输入文本集合的语言结构 。BASS模型利用图神经网络显式地建模了统一语义图结构 , 并同时融合了非结构化的文本序列信息 。在统一语义图的指导下 , BASS模型可以更高效地筛选文中的重要信息并组织生成信息丰富、语义连贯的摘要 。BASS同时在编码和解码过程中提出了针对图结构建模的增强机制 , 以更好地挖掘统一语义图中的语义结构信息 。在多文档数据集WikiSum和长文档数据集BIGPATENT上的实验表明 , 本文提出的方法可以有效地提升摘要生成的质量 。
文章图片
文章图片
4、DuReader_robust:评估真实应用场景下机器阅读理解鲁棒性与泛化性的中文数据集
DuReader_robust:AChineseDatasetTowardsEvaluatingRobustnessandGeneralizationofMachineReadingComprehensioninReal-WorldApplications
机器阅读理解(MRC)是自然语言处理领域中的重要研究课题 。本文提出了一个全新的中文机器阅读理解数据集DuReader_robust , 数据集中的全部样例均为真实应用场景下的自然文本 , 旨在从过敏感(Over-sensitivity)、过稳定(Over-stability)与泛化能力(Generalization)三个方面评估现有MRC模型在实际应用场景中的鲁棒性与泛化性(如下图示例) 。此外 , 本文也基于DuReader_robust进行了大量实验 , 希望通过这些实验对未来的MRC研究有所启发 。最后 , 我们已经将DuReader_robust数据集开源以丰富中文MRC的语料资源 。
文章图片
文章图片
5、开放域对话结构发现
DiscoveringDialogStructureGraphforCoherentDialogGeneration
从真实人-人对话中学习离散的对话结构图 , 有助于人们理解对话规律 , 同时也可以为生成通顺对话提供背景知识 。然而 , 当前在开放域对话下 , 这一问题缺乏研究 。在本文中 , 我们从聊天语料库中无监督地学习离散对话结构 , 然后利用该结构来促进连贯的对话生成 。为此 , 我们提出了一个无监督模型(DVAE-GNN) , 来发现多层次的离散对话状态(包括对话和句子层)以及学习不同对话状态之间的转移关系 。其中 , 对话状态以及状态之间的转移关系组成了最终的对话结构图 。进一步的 , 我们在两个基准语料库上进行实验 , 结果表明DVAE-GNN能够发现有意义的对话结构图 , 且使用对话结构作为背景知识可以显著提高开放域对话的多轮连贯性 。
文章图片
文章图片
6、PLATO-2:基于课程学习的开放域对话机器人
PLATO-2:TowardsBuildinganOpen-DomainChatbotviaCurriculumLearning
GitHub链接:
文章图片
- 原神心海是几星(原神心海角色属性介绍)
- 今年的iphonese,还是你熟悉的模样
- 原神雷神是什么定位(原神手游雷神定位分析)
- 原神无尽骤战高分打法是什么(原神无尽骤战玩法技巧分享)
- 崩坏3V5.0版本累计消费活动是什么(崩坏3V5.0版本夏日活动介绍)
- 249克!开箱道通EVO Nano+袖珍无人机:夜景是亮点
- 浓缩洗涤剂,还是老牌国货一轻日化好~
- 饿了么是不是只能用支付宝(饿了么平台运营详细解说)
- 微信朋友验证消息是怎么回事(?微信查看好友添加来源步骤)
- 妄想山海神树蕴养玩法是什么(妄想山海神树蕴养玩法思路介绍)
