+高级检索
基于域分离网络的实体解析迁移方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

基金项目:


Domain Separation Network Based Entity Resolution Transferring Method
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    实体解析致力于识别多条记录是否描述真实世界相同实体,这是数据清洗和数据集成中的关键问题.近年来,基于深度学习的实体解析广受欢迎,它们需要大量标注数据才能达到较优的效果.然而,在现实场景中,大量高质量标注数据不容易获得.本文提出了一个基于深度迁移学习的实体解析模型,通过域分离网络提取源域和目标域的公共特征,并利用公共特征得到实体解析结果,从而实现从源域到目标域的迁移.实验结果表明,在多个数据集上,本文提出的方法比之前最好的方法在F1度量上最大提高了40%左右.实验证明本文的方法具有更好的表现,并且训练时间更短.

    Abstract:

    Entity resolution (ER) is a task to identify whether several records correspond to the same entity in the real world, which is a key problem in data cleaning and data integration. Recently, deep learning-based entity resolution is popular, which requires a large number of labeled data to achieve better results. However, a large number of high-quality labeled data are not always easily available in the real scenario. This paper proposes a deep transfer learning-based entity resolution model. The common features of the source domain and the target domain are extracted through a domain separation network. ER results are obtained by utilizing these common features. Therefore, the common features are transferred from the source domain to the target domain. The experimental results show that, on several datasets, the proposed method has a maximum improvement of about 40% in the F1 metric compared with the previous best method. Experiments show that the proposed method has superior performance and shorter training time.

    参考文献
    相似文献
    引证文献
文章指标
  • PDF下载次数:
  • HTML阅读次数:
  • 摘要点击次数:
  • 引用次数:
引用本文

孙琛琛 ?,许雷 ,申德荣 ,聂铁铮 .基于域分离网络的实体解析迁移方法[J].湖南大学学报:自然科学版,2023,(2):86~94

复制
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2023-03-06
  • 出版日期:
作者稿件一经被我刊录用,如无特别声明,即视作同意授予我刊论文整体的全部复制传播的权利,包括但不限于复制权、发行权、信息网络传播权、广播权、表演权、翻译权、汇编权、改编权等著作使用权转让给我刊,我刊有权根据工作需要,允许合作的数据库、新媒体平台及其他数字平台进行数字传播和国际传播等。特此声明。
关闭