说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210181458.6 (22)申请日 2022.02.25 (71)申请人 复旦大学 地址 200433 上海市杨 浦区邯郸路2 20号 (72)发明人 赵津 程俏 岳之昂 肖仰华 (74)专利代理 机构 上海德昭知识产权代理有限 公司 31204 专利代理师 程宗德 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 5/02(2006.01) (54)发明名称 一种面向运维领域的配置命令知识抽取的 框架 (57)摘要 本发明公开了一种面向运维领域的配置命 令知识抽取的框架, 包括: 知识模板构建模块, 根 据运维领域配置命令的业务需求, 定义配置命令 关系集合, 并在用户手册中构造包含 预定义关系 的文本, 将其泛化为知识描述模板; 实体抽取模 块, 结合字符串的编辑距离, 对配置命令实体进 行模糊匹配, 以抽取文本中的命令实体; 关系分 类模块, 利用深度学习模型对文本的语义进行建 模, 通过习得文本中的配置命令关系来泛化规 则; 基于bootstrap的数据增强模块, 利用槽位替 换文本中提及的配置命令实体, 将泛化后的文本 视为高质量知识描述模板, 并将高质量知识描述 模板添加到模板库, 当新产生的高质量知识描述 模板少于阈值时, Bootstrap数据扩充和增强迭 代收敛。 权利要求书2页 说明书7页 附图2页 CN 114547250 A 2022.05.27 CN 114547250 A 1.一种面向运维领域的配置命令知识抽取的框架, 其特 征在于, 包括: 知识模板构建模块, 根据运维领域配置命令的业务需求, 定义配置命令关系集合, 并在 用户手册中构造包 含预定义关系的文本, 将其泛化 为知识描述模板; 实体抽取模块, 结合字符串的编辑距离, 对配置命令实体进行模糊匹配, 以抽取所述文 本中的命令实体; 关系分类模块, 利用深度学习模型对所述文本的语义进行建模, 通过习得所述文本中 的配置命令关系来泛化 规则, 从而挖掘更多表达类似关系的文本; 基于bootstrap的数据增强模块, 利用槽位替换所述文本中提及的所述配置命令实体, 将泛化后的文本视为高质量知识描述模板, 并将所述高质量知识描述模板添加到模板库, 当新产生的所述高质量知识描述模板少于阈值时, Bo otstrap数据扩充和 增强迭代收敛, 其中, 所述关系分类模块包括基于预训练语言模型的编码器部、 句法注意力部以及基 于PU Learning的分类部 。 2.根据权利要求1所述的面向运维领域的配置命令知识抽取的框架, 其特 征在于: 其中, 所述配置命令关系集 合至少包括前序关系 、 互斥关系, 所述构造的方式为 通过关键词检索或句式匹配构造 。 3.根据权利要求1所述的面向运维领域的配置命令知识抽取的框架, 其特 征在于: 其中, 所述基于预训练语言模型的编码器部用于将所述文本与 所述配置命令实体结合 来建模文本的语义特 征, 即: hcontext=BERT([CLS, c1, ..., cn, SEP, cmd1, cmd2]) 式中, ci(i≤n)表示第i个token, n表示文本的长度, cmd1, cmd2分别表示两个命令实体, CLS与SEP分别表示BERT特殊标记符。 4.根据权利要求1所述的面向运维领域的配置命令知识抽取的框架, 其特 征在于: 其中, 所述句法注意力部用于使关系分类模型捕获句法层面的特征, 首先对所述知识 描述模板进行依存句法分析以构造句法注意力权重矩阵, 并结合多头注意力机制获取句法 增强后的文本向量, 具体包括以下步骤: 步骤1, 初始化全零的注意力权重矩阵, 利用依存句法分析计算每个token ci的所有祖 先节点集合pi, 并更新权 重矩阵, 计算方式如下: 式中token cj是token ci的祖先节点; 步骤2, 利用多头注意力机制增强编码器的上 下文语义向量: hsg=Wo·Concat([A1·V1; ...; Ai·Vi; ...; AH·VH]) 式中, i(1≤i≤H)表示第i个头注意力模块, 分别由多头注意力矩阵计算, 表示Q, V分别 表示查询Query和键Key, 用于计算注意力权重A, Ai.j表示token ci和token ci之间的 attention score, 指导模型关注分数高to ken之间的信息, 将句法树中存在直接依存关联token之间的原始 权重保留, 文本的语义表示hc+sg以加权权 利 要 求 书 1/2 页 2 CN 114547250 A 2融合策略结合编码的上 下文表示与句法增强的上 下文表示: hc+sg=α·hcontext+(1‑a)·hsg。 5.根据权利要求1所述的面向运维领域的配置命令知识抽取的框架, 其特 征在于: 其中, 所述基于PU Learning的分类部采用PU learning中 的nnPU损失函数优化模型参 数: Jmnpu= π·Ep(x|y=1)[l(g(x))]+max{0, Ep(x)[l(‑g(x))]‑π·Ep(x|y=1)[l(‑g(x))]} 式中, π是类别先验概率, g是决策函数, 用于输出最终预测为正样本(y=1)的概率, l为 损失函数。权 利 要 求 书 2/2 页 3 CN 114547250 A 3
专利 一种面向运维领域的配置命令知识抽取的框架
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:26
上传分享
举报
下载
原文档
(598.2 KB)
分享
友情链接
思度安全-DSMM-011 数据分析安全管理规范V1.0.pdf
NB-T 10802—2021 水电工程预应力锚固设计规范.pdf
华泰 信创 研究框架.pdf
国家网信办 儿童个人信息网络保护规定 2019.pdf
DB31-T 1400-2023 药品生产全过程数字化追溯体系建设和运行规范 上海市.pdf
GB-T 42680-2023 基于相位多普勒技术的液体燃料雾化特性测试方法.pdf
T-GVS 009—2022 注塑模具表面纳米硬质PVD涂层评价规范.pdf
GB-T 34004-2017 家用和小型餐饮厨房用燃气报警器及传感器.pdf
华为 消除数据孤岛 迈向智能数据湖 释放数据价值.pdf
GB-T 26933-2011 钢制通用集装箱封闭槽型顶板.pdf
T-CAAMTB 64—2022 汽车解耦式电子助力制动系统总成性能要求及台架试验方法.pdf
GB-T 22264.4-2022 安装式数字显示电测量仪表 第4部分:频率表的特殊要求.pdf
GB-T 30029-2023 自动导引车 设计通则.pdf
DB5301-T 79-2022 计量器具监督抽查工作规范 流通领域 昆明市.pdf
GB-T 20204-2006 水利水文自动化系统设备检验测试通用技术规范.pdf
GB-T 43206-2023 信息安全技术 信息系统密码应用测评要求.pdf
GM-T 0072-2019 远程移动支付密码应用技术要求.pdf
GB-T 41165-2021 海洋预报结果准确性检验评估方法.pdf
DB34-T 4757-2024 固定污染源废气挥发性有机物监测技术规范 安徽省.pdf
GB-T 42078-2022 化工园区开发建设导则.pdf
1
/
12
评价文档
赞助2.5元 点击下载(598.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。