说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210181120.0 (22)申请日 2022.02.25 (71)申请人 大连海洋大学 地址 116036 辽宁省大连市沙河口区黑石 礁街52号 (72)发明人 张思佳 于英囡 张鑫 王梓铭 安宗诗 孙华 王贵艳 (74)专利代理 机构 西安铭泽知识产权代理事务 所(普通合伙) 61223 专利代理师 崔瑞迎 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01) G06F 16/951(2019.01)G06F 16/215(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 融合ResNe Xt的EBAC鱼类文本联合抽取方法 (57)摘要 本发明属于文本实体 关系联合抽取领域, 涉 及一种融合ResNeXt的EB AC鱼类文本 联合抽取方 法, 将鱼类科普文本输入深度学习模 型进行实体 关系联合抽取; 深度学习模型包 括: ERNIE 预训练 模型, 对鱼类科普文本进行编码, 获得相应字向 量; BiLSTM模型, 捕捉字向量中依 赖关系, 获得相 应隐藏状态向量; Attention注意力模型, 对隐藏 状态向量进行权重分配, 生成相应语义向量, Attention注意力模型融合ResNeXt思想, 不增加 模型复杂 度的前提下提高抽取效果; CRF解码器, 对语义向量进行解码, 获得规范标签, 完成实体 关系联合抽取。 本发明解决了实体间语义不强、 长序列语义稀释和长距离依赖问题, 抽取效果 好。 权利要求书2页 说明书7页 附图1页 CN 114528408 A 2022.05.24 CN 114528408 A 1.融合ResNe Xt的EBAC鱼类文本联合抽取 方法, 其特 征在于, 包括: 将鱼类科普文本 输入深度学习模型进行实体关系联合抽取; 所述深度学习模型包括: ERNIE预训练模型, 用于对所述鱼类科普文本进行编码, 获得相应的字向量; BiLSTM模型, 用于捕捉所述字向量中的依赖关系, 获得相应的隐藏状态向量; Attention注意力模型, 用于对所述隐藏状态向量进行权重分配, 生成相应的语义向 量, 其中所述Attention注意力模型融合了ResNeXt思想, 在不增加 模型复杂度的前提下提 高抽取效果; CRF解码器, 用于对所述语义向量进行解码, 获得相应的规范标签, 根据规范标签确定 实体关系。 2.根据权利要求1所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 在 抽取所述实体关系前, 需要对所述Bi LSTM模型进行训练, 训练方法为: 获取鱼类科普文本, 建立鱼类科普文本库; 将所述鱼类科普文本库中的部分 鱼类科普文本作为训练集; 对所述训练集中的鱼类科普文本进行 标注; 将所述训练集中的鱼类科普文本 输入所述ERN IE预训练模型, 获得相应的字向量; 将所述字向量输入所述Bi LSTM模型, 获得相应的隐藏状态向量; 将所述隐藏状态向量输入融合了ResNeXt思想的Attention注意力模型, 获得相应的语 义向量; 将所述语义向量利用CRF解码器进行解码, 获得相应的规范 标签及实体关系; 根据所述CRF解码器解码得到的实体关系与所述训练集中的鱼类科普文本标注的实体 关系的误差对所述深度学习模型进行调整, 完成对所述深度学习模型的训练。 3.根据权利要求2所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 在 将所述鱼类科普文本库中的部分 鱼类科普文本作为训练集之后, 还 包括: 将所述鱼类科普文本库中的部分 鱼类科普文本作为测试集; 根据所述CRF解码器解码得到的实体关系与所述训练集中的鱼类科普文本标注的实体 关系的误差对所述深度学习模型进行调整之后, 还 包括: 采用所述测试集对调整之后的所述深度学习模型进行测试。 4.根据权利要求2所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 在 获取所述鱼类科普文本之后, 还 包括: 对所述鱼类科普文本进行清洗 。 5.根据权利要求4所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 所 述鱼类科普文本的获得及清洗方法具体如下: 通过Python爬虫的方式获取多个百科类网站的鱼类科普信息, 并进行整合及清洗, 去 除噪声, 获得鱼类科普文本 。 6.根据权利要求5所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 所 述鱼类科普信息包括鱼类级别分类、 别称、 主要分布位置、 经常栖息的环境、 喜好捕食对象、 初代鱼种产地。 7.根据权利要求3所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 训权 利 要 求 书 1/2 页 2 CN 114528408 A 2练集和测试的鱼类科普文本数量比例为7: 3 。 8.根据权利要求2所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 对 鱼类科普文本进行 标注如下: 根据鱼类科普文本特 征, 采用标注工具, 使用 “BIOS”的方法进行 标注。 9.根据权利要求1所述的融合ResNeXt的EBAC鱼类文本联合抽取方法, 其特征在于, 隐 藏状态向量的获得 方法如下: BiLSTM模型用于将正向隐藏层向量、 反向隐藏层向量处理后的结果合并, 并作为当前 字符的隐藏状态向量。权 利 要 求 书 2/2 页 3 CN 114528408 A 3
专利 融合ResNeXt的EBAC鱼类文本联合抽取方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:25
上传分享
举报
下载
原文档
(601.9 KB)
分享
友情链接
DB4403-T 51-2020 珠宝行业经营服务规范 深圳市.pdf
GB-T 40013-2021 服务机器人 电气安全要求及测试方法.pdf
GB-T 42615-2023 在用电梯安全评估规范.pdf
GB-T 24560-2009 电解、电镀设备节能监测.pdf
GB-T 20274.3-2008 信息安全技术 信息系统安全保障评估框架 第3部分:管理保障.pdf
法律法规 青岛市民用建筑节能条例2022-01-21.pdf
GB-T 36007-2018 锄草机器人通用技术条件.pdf
SN-T 4261-2015 出口中药材中苯并(a)芘残留量的测定.pdf
GB-T 26698-2022 考试用铅笔和涂卡专用笔.pdf
T-CCTAS 24—2021 互联网货运平台安全运营规范.pdf
GB-T 4830-2015 工业自动化仪表 气源压力范围和质量.pdf
T-CCTAS 35—2022 公路水路建设工程锚杆锚固质量检测规范.pdf
DB42-T 2226.3-2024 自然资源政务一张图应用规范 第3部分:数据共享交换 湖北省.pdf
GB-T 41819-2022 信息安全技术 人脸识别数据安全要求.pdf
GB-T 42260-2022 磷酸铁锂电化学性能测试 循环寿命测试方法.pdf
CSA 企业网络安全合规框架体系.pdf
GB-T 30428.1-2013 数字化城市管理信息系统 第1部分:单元网格.pdf
T-ZACA 019—2019 绿色设计产品评价技术规范 预拌混凝土.pdf
DB50-T 1275.6-2022 生猪智慧养殖数字化应用与管理 第6部分:养殖 重庆市.pdf
GB-T 33130-2016 高标准农田建设评价规范.pdf
1
/
11
评价文档
赞助2.5元 点击下载(601.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。