×
水产学报

水产和渔业论文_水产动物疾病诊断的知识图谱构

文章目录

摘要

Abstract

第一章 绪论

1.1 研究背景和意义

    1.1.1 研究背景

    1.1.2 研究意义

1.2 国内外研究现状

    1.2.1 知识图谱

    1.2.2 语料库

    1.2.3 命名实体识别

    1.2.4 关系抽取

    1.2.5 联合抽取

1.3 研究内容

1.4 文章结构

第二章 相关理论

2.1 知识图谱基础

2.2 相关技术

    2.2.1 BERT预训练模型

    2.2.2 LSTM神经网络

2.3 联合抽取技术

2.4 Neo4j数据库

    2.4.1 数据特点

    2.4.2 应用领域

2.5 本章小结

第三章 水产动物疾病领域文本的语料库构建

3.1 语料来源及预处理

3.2 H-BIO的序列标注策略

3.3 标注方案设计

3.4 标注结果

3.5 本章小结

第四章 融合标签嵌入的实体关系联合抽取模型

4.1 模型总体架构设计

    4.1.1 水产动物疾病的BERT输入模型

    4.1.2 标签嵌入

    4.1.3 水产动物疾病的BiLSTM模型

    4.1.4 注意力机制模型

    4.1.5 CRF模型

    4.1.6 水产动物疾病实体关系联合抽取

4.2 水产动物疾病的联合抽取实验

    4.2.1 实验环境及配置

    4.2.2 实验数据

    4.2.3 评价指标

    4.2.4 实验步骤

    4.2.5 实验结果与分析

4.3 本章小结

第五章 水产动物疾病诊断的知识图谱构建

5.1 图谱框架

5.2 图谱可视化

5.3 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间发表的学术论文及成果

致谢

文章摘要:我国是渔业大国,而水产动物疾病对水产养殖业产生了严重的不良影响。本文针对水产动物疾病诊断知识图谱的实体关系联合抽取进行了研究,为水产动物疾病诊断提供了支持。实体识别和关系抽取是构建水产动物疾病诊断的知识图谱的部分主要关键技术。然而,水产动物疾病的数据分布广泛且十分零散无序。目前亟待解决的问题就是将这些数据资源进行合理的整理与共享。由于收集到的水产动物疾病文本语料是篇章级的数据,在实体及关系抽取的任务上存在困难在于两个实体间的跨越较大且存在大量重叠关系等,这些问题会影响信息抽取的准确率,进而影响构建水产动物疾病诊断的知识图谱的质量。针对上述问题,本文主要的研究工作如下:(1)构建了水产动物疾病领域语料库。针对水产动物疾病数据的特点并结合水产领域专家的意见,本文提出了H-BIO的标注方法并选取标注工具UltraEdit对预处理结束的中文水产动物疾病语料进行标注,采用领域词典预标注与多人多轮标注相结合的方式,标注了34万余字的水产动物疾病语料,进而构建水产动物疾病领域语料库。(2)提出了一种以深度学习为基础的篇章级水产动物疾病实体关系联合抽取方法。针对以往使用的通过流水线的方式进行的实体关系抽取方法中会存在错误传播等问题,本文提出了对水产动物疾病数据的实体关系联合抽取方法。该方法首先将BERT与标签嵌入模型结合作为输入模型,使用BERT+BiLSTM+Attention+CRF模型对文本进行标注,最后通过对自定义的抽取规则进行三元组抽取。(3)构建了水产动物疾病诊断的知识图谱。本文利用融合标签嵌入方法的BERT+BiLSTM+Attention+CRF模型完成对水产动物疾病领域的实体关系联合抽取,选用Neo4j图数据库完成对抽取到的实体三元组的知识存储,最终实现水产动物疾病诊断知识图谱的构建。

文章关键词:

论文作者:姜鑫 姜鑫 

作者单位:姜鑫 

论文DOI:10.27821/d.cnki.gdlhy.2022.000154

论文分类号:S941;TP391.1

上一篇:水产和渔业论文_面向水产动物疾病诊断及防治的
下一篇:没有了

Top