说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221016184 4.9 (22)申请日 2022.02.22 (71)申请人 科大国创云网科技有限公司 地址 230000 安徽省合肥市高新区文曲路 355号办公楼4层 (72)发明人 王颜颜 李飞 范文斌 周源 张雨晴 冯影 方烨锟 (74)专利代理 机构 合肥昊晟德专利代理事务所 (普通合伙) 3415 3 专利代理师 何梓秋 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于多层注意力的通信领域过程类事 件语义消岐方法 (57)摘要 本发明公开了一种基于多层注意力的通信 领域过程类事件语义消岐方法, 属于自然语言处 理技术领域, 包括: S1: 事件属性 分解; S2: 特征表 示; S3: 事件表示聚合; S4: 事件消岐。 本发明将通 信领域过程类事件按照不同属性 分为文本、 事件 元素、 触发词, 对每一种属性进行基于词汇注意 力的语义聚合, 然后再通过属性级注 意力将不同 属性特征的语义实现汇聚, 完成对事件的语义表 征, 最后通过两个事件的语义表征计算事件相似 度, 从而判断事件之间的关系标签, 实现事件消 岐; 可以在小数据量下实现对文本语义的快速捕 捉与微调, 在通信领域过程类数据共指消岐实验 中准确率较高。 权利要求书3页 说明书8页 附图1页 CN 114692643 A 2022.07.01 CN 114692643 A 1.一种基于多层注意力的通信领域过程类事 件语义消岐方法, 其特 征在于, 包括: S1: 事件属性分解 将每一个事 件分为三类属性, 包括事 件文本、 事 件触发词、 事 件元素; S2: 特征表示 对事件文本和事件元素基于词汇注意力 机制进行表示, 事件触发词直接使用词嵌入表 示; S3: 事件表示聚合 将事件的三个特 征通过异质特 征注意力机制进一 步整合, 获得事 件表示向量; S4: 事件消岐 不同事件的表示向量点乘计算事件相似度, 根据获取的相似性预测概率得到不同事件 的关系标签, 从而实现事 件语义消歧。 2.根据权利要求1所述的一种基于多层注意力的通信领域过程类事件语义消岐方法, 其特征在于: 在所述步骤S1中, 事件文本是一段短文本序列, 记为TexA; 事件触发词包括触 发类型、 触发位置以及触发词汇, 记为TriA; 事件元素包括元素类型、 元素位置以及元素名 称, 记为A rgA, 其中下标A表示事件EventA。 3.根据权利要求2所述的一种基于多层注意力的通信领域过程类事件语义消岐方法, 其特征在于: 在所述步骤S2中, 事件文本通过第一多层注意力模型进 行表示, 第一多层注 意 力模型包括三层, 分别为 故障文本初始嵌入层、 第一上下文语义表示层、 第一基于词汇注 意 力机制的文本信息聚合网络 。 4.根据权利要求3所述的一种基于多层注意力的通信领域过程类事件语义消岐方法, 其特征在于: 在故障文本初始嵌入层中, 对故障文本进行分词, 得到序列长度为Lt的文本 通过初始化嵌入矩阵Me, 其中, L表示词汇表中的词 汇数目, D1表示每一个词汇的初始向量维度, 获得文本序列TexA中词汇的语义表征 在第一上下文语义表示层中, 对文本序列 TexA的嵌入表示通 过卷积神经网络操作之后第i个词汇的上 下文语义表征 为: 其中, 表示第i个词汇上下k个词汇的拼接嵌入向量, 维度为(2k+1) ×D1, (2k+ 1)表示卷积神经网络上下文窗口长度, 和 是卷积神经网络滤波 器的参数矩阵, 是权重参数矩阵, 是偏置项, ft表示滤波器数目; 在所述第一基于注意力机制的文本信息聚合网络中, 定义文本序列TexA中第i个词汇的 重要性权 重 为: 其中, 和 是注意力机制训练过程中不断训练优化的参权 利 要 求 书 1/3 页 2 CN 114692643 A 2数矩阵, 下角标a表示以上参数为注意力相关的权重, 是权重参数矩阵, 是偏置项, 和 分别是文本序列第i和第j个词汇的重要性, 通过Softmax归一化得到最终的词汇注意 力权重, Lt是文本序列长度; 最终通过将事件文本中每一个词汇的上下文嵌入表示和注意 力权重相乘叠加实现信息的聚合, 得到事 件文本的表示rT: 5.根据权利要求4所述的一种基于多层注意力的通信领域过程类事件语义消岐方法, 其特征在于: 在所述步骤S2中, 事件 元素通过第二多层注意力模型进 行表示, 第二多层注 意 力模型包括三层, 分别为事件元素文本初始嵌入层、 第二上下文语义表示层、 第二基于词汇 注意力机制的事 件元素信息聚合网络 。 6.根据权利要求5所述的一种基于多层注意力的通信领域过程类事件语义消岐方法, 其特征在于: 在事件元素文本初始嵌入层中, 通过序列长度为La的事件元素 并通过初始化嵌入矩阵Me, 其中, D1表示每一个词汇的初 始向量维度, 获得文本序列ArgA中词汇的语义表征 在 第二上下文语义表示层中, 对事件元素文本ArgA的嵌入表示通过卷积神经网络操作之后第 i个词汇的上 下文语义表征为: 其中, 表示事件元素文本第i个词汇上下k个词汇的拼接嵌入向量, 维度为(2k +1)×D1, (2k+1)表示卷积神经网络 上下文窗口长度, 和 是卷积 神经网络滤波器的参数矩阵, 是权重参数矩阵, 是偏置项, fa表示滤波器数目; 在所述第二基于注意力机制的文本信息聚合网络中, 定义事件元素文本ArgA中第i个词 汇的重要性权 重 为: 其中, 和 是注意力机制训练过程中不断训练优 化的参数 矩阵, 下角标a表示 以上参数为注意力相关的权重, 上角标a表示这些是事件元素的文本, 是权重参数矩阵, 是偏置项, 最终通过将事件元素中每一个词汇的上下文嵌入表示 和注意力权 重相乘叠加实现信息的聚合, 得到事 件元素的表示ra: 7.根据权利要求6所述的一种基于多层注意力的通信领域过程类事件语义消岐方法, 其特征在于: 在所述步骤S2中, 直接使用词嵌入矩阵Me查询获得触发词嵌入表 示eTr, 再通过 dense层进行向量维度归一, 获得触发词的表示rTr。 8.根据权利要求1所述的一种基于多层注意力的通信领域过程类事件语义消岐方法, 其特征在于: 在所述步骤S 2中, 事件元素的表示为rA, 事件文本的表示为rT, 触发词的表示为权 利 要 求 书 2/3 页 3 CN 114692643 A 3
专利 一种基于多层注意力的通信领域过程类事件语义消岐方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:30
上传分享
举报
下载
原文档
(1005.2 KB)
分享
友情链接
GB-T 33540.3-2017 风力发电机组专用润滑剂 第3部分:变速箱齿轮油.pdf
T-CSTM 00839—2022 材料基因工程 术语.pdf
GB-T 42584-2023 信息化项目综合绩效评估规范.pdf
GB-T 42005.2-2022 轨道交通 储能式电车 第2部分:地面充电系统.pdf
6-28-01-14 变配电运行值班员.pdf
GB-T 32124-2015 磷石膏的处理处置规范.pdf
GB-T 21898-2008 纺织品颜色表示方法.pdf
GB-T 33850-2017信息技术服务质量评价指标体系.pdf
专利 一种具有温控功能的配电箱.PDF
DB45-T 2760-2023 电子政务外网网络技术规范 广西壮族自治区.pdf
GB-T 37267-2018 建筑抗震支吊架通用技术条件.pdf
T-WD 107—2020 公共海外仓设施技术要求与运营管理规范.pdf
NB-T 10691-2021 数据中心机房用不间断电源系统.pdf
GB-T 21709.20-2009 针灸技术操作规范 第20部分:毫针基本刺法.pdf
GB-T 18771.1-2015 烟草术语 第1部分: 烟草类型与烟叶生产.pdf
DB3302-T 1122-2021 数字化车间 智能工厂评估规范 宁波市.pdf
GB 15084-2013 机动车辆 间接视野装置 性能和安装要求.pdf
DB11-T 1640-2019 冷库系统节能监测 北京市.pdf
TB-T 3504-2018 列车接近预警地面设备.pdf
GB-T 34658-2017 电动汽车非车载传导式充电机与电池管理系统之间的通信协议一致性测试.pdf
1
/
13
评价文档
赞助2.5元 点击下载(1005.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。