《Similarity-based Memory Enhanced Joint Entity and Relation Extraction》论文阅读笔记

2024-02-28 11:03 由大雄的叮当猫发表于 #其他

代码

原文

摘要

文档级联合实体和关系抽取是一项难度很大的信息抽取任务，它要求用一个神经网络同时完成四个子任务，分别是：提及检测、共指消解、实体分类和关系抽取。目前的方法大多采用顺序的多任务学习方式，这种方式将任务任意分解，使得每个任务只依赖于前一个任务的结果，而忽略了任务之间可能存在的更复杂的相互影响。为了解决这些问题，本文提出了一种新的多任务学习框架，设计了一个统一的模型来处理所有的子任务，该模型的工作流程如下：首先，识别出文本中的实体提及，并将它们聚合成共指簇；其次，为每个实体簇分配一个合适的实体类型；最后，在实体簇之间建立关系。图 1 给出了一个来自 DocRED 数据集的文档示例，以及模型期望输出的实体簇图。为了克服基于流水线的方法的局限性，在模型中引入了双向的记忆式依赖机制，使得各个子任务能够相互影响和提升，从而更有效地完成联合任务。

模型架构

该方法受到了 JEREX 的启发，由四个任务特定的组件组成：提及抽取（

）、共指消解（

）、实体抽取（

）和关系抽取（

）。与原来的流水线式架构不同，这里引入了图 2 所示的记忆模块，使得各个组件的输入表示能够通过基于记忆的扩展表示模块进行更新。该模块使用 Memory Read 操作从记忆矩阵

和

中读取信息，这两个矩阵分别由实体和关系分类器写入。这样，各个组件之间就形成了双向的信息交互，从而更有效地完成联合任务。

Memory reading

该方法与 TriMF 类似，都是利用注意力机制，将输入表示与从记忆中读取的信息相结合，得到扩展的表示。如图 2 所示，本文的架构对两种输入表示进行了扩展：一种是词嵌入

，另一种是提及候选的跨度表示

。对于每一种输入表示

（

），以及每一种记忆矩阵

（

），注意力机制将输入表示

作为键和值，其中

是表示向量的个数，

是嵌入的维度。

作为查询，注意力机制使用记忆矩阵

，其中

是记忆槽的个数，

是记忆槽的维度。为了计算注意力权重向量

，对记忆槽的维度求和，公式如下：

其中

是注意力机制的可学习参数矩阵，

是

的第

个记忆槽。然后，

向量用于对

进行加权，得到扩展的输入表示

：

对于每一种输入表示

，记忆读取操作基于两种记忆矩阵生成两种扩展表示

和

。最终的扩展表示是通过对

和

求逐元素平均值得到的。

Memory writing

和

是两个记忆矩阵，它们分别存储了不同的实体和关系类别的表示。这些表示是通过相关分类器的损失函数的梯度来更新的，

对应实体分类器，

对应关系分类器。为了提高表示的精度，损失函数取决于类别嵌入和属于该类别的实例表示之间的相似度，这个相似度是根据实例的标签来确定的。因此，实体和关系分类器都基于输入表示和相应的记忆矩阵之间的相似度函数

来进行分类。给定实体

的表示向量

，它的实体类型的概率分布如下：

给定实体对

的表示向量

，它的关系类型的存在概率如下：

定义

为实例表示

和记忆矩阵

之间的双线性相似度，形式如下：

其中

是一个可学习的参数矩阵。对于实体和关系分类器，分别使用了不同的双线性相似度权重矩阵：

和

，其中

和

是实体和实体对表示的维度。

和

是实体和关系记忆矩阵的记忆槽的维度。在这里，记忆矩阵的记忆槽的数量与分类器的类别的数量相同。

Training

最后，模型被训练优化关节损失

，该关节包含与JEREX中相同的四个子任务相关的损失

，并以固定的任务相关权值

加权:

本文还纳入了TriMF中提出的两阶段训练方法，在超参数搜索过程中调整记忆预热比例。

热门相关：走私大明妖夏神秘老公，晚上见！北宋大表哥重开地狱

相关文章

【内容管理及平台建设】上海道宁为您提供全媒体信息管理平台——WebFuture

动易软件拥有内容管理、流媒体等核心技术，涉及云计算、大数据等前瞻技术，自主研发超过30个软件产品，拥有超过100项知识产权、30项高新技术软件产品，针对医院、高等教育、基础教育、政府、公安、金融、能源等众多行业提供专业的细分产品和解决方案。 ...阅读全文

数字先锋 | 变“制”为“智”！天翼云助力嵊州领航数字化烹饪时代！

由嵊州市经济和信息化局主导，中国电信天翼云参与建设的“厨电行业工业互联网平台”，融合了嵊州智能厨电行业特色和产业特点。通过这个平台，政府可以及时掌握产业态势、产业底数、产业结构情况，促进政策链、产业链与服务链深度融合。企业可以通过较低的成本，利用平台上的软件应用和数据服务优化设计、生产、经营等具体环... ...阅读全文

线性数据结构：数组、受限数组（栈、队列）、线性表

1. 数组数组定义数组（Array）是有序的元素序列。属于线性结构（有且仅有一个前驱、有且仅有一个后继）。数组特点数组的关键在于在内存中的物理地址对应的是一段连续的内存。这意味着如果想要在任意位置删除/新增一个元素，那么该位置往后的所有元素，都需要往前挪/往后挪一个位置。假设数组的长度是 n ...阅读全文

CDN与云计算技术的结合：专业视角下的深度融合

随着信息技术的不断发展，内容分发网络（CDN）与云计算技术作为两种重要的互联网基础设施，其结合已成为行业发展的重要趋势。CDN负责高效地分发和传输互联网内容，而云计算则提供强大的计算、存储和应用服务。当这两者结合时，能够为用户提供更加优质、高效的服务体验。本文将从专业的角度深入解析CDN与云计算技术... ...阅读全文

深入解析RealWorldCTF 2024体验赛PWN方向题目

本报告旨在对RealWorldCTF 2024体验赛中的Pwn方向题目——“Be-an-HTPPd-Hacker”进行深入解析和讲解。该题目涉及一个十一年前的项目，其基于C语言实现了HTTP协议。我们将通过对该协议进行栈溢出攻击，探索真实世界中的攻击手法，并从中学习更多有用的攻击技巧，以提升我们的安... ...阅读全文

亿级月活游戏《迷你世界》全栈容器化实践分享

华为云CCE在网络、容器运行时上进行了增强，再配合社区workload，使能《迷你世界》后端全栈容器化，资源使用量较虚拟化部署环境减少了50+%！ ...阅读全文

Java使用遗传算法，寻找十滴水问题的最优解

近期某手游出了个活动，经确认发现本质为十滴水游戏。简单说一下规则，棋盘大小通常为6x6，在游戏开始时，棋盘随机有若干水珠，其大小范围为1-4。点击棋盘内的一格，会消耗玩家持有的1个小水滴，同时使得该单元格的水珠大小+1。如果水珠大小超过4，则水珠发生爆炸并消失，同时向四个方向各发射1个小水滴。小水 ...阅读全文

探究二维码技术：连接现实与数字世界的桥梁

引言：二维码已经成为现代社会中广泛应用的一种技术工具。它不仅在商业领域中被广泛使用，还在日常生活中发挥着重要的作用。本文将介绍二维码的概念、原理以及在不同领域中的应用，帮助读者更好地理解并利用二维码技术。二维码生成器 | 一个覆盖广泛主题工具的高效在线平台(amd794.com) https:/ ...阅读全文

AtCoder Beginner Contest 341

A - Print 341 (abc341 A) 题目大意给定\(n\)，输出 \(n\)个 \(0\)和 \(n+1\)个 \(1\)交替的字符串。解题思路 \(101010...\)循环输出即可。神奇的代码 n = input() s = "10" * int(n) + "1" print ...阅读全文

HGAME 2024 WEEK2 Crypto Misc

CRYPTO midRSA 题目描述：兔兔梦到自己变成了帕鲁被crumbling抓去打黑工，醒来后连夜偷走了部分flag from Crypto.Util.number import * from secret import flag def padding(flag): return flag+b ...阅读全文