(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210159907.7
(22)申请日 2022.02.22
(71)申请人 子长科技 (北京) 有限公司
地址 100101 北京市朝阳区金泉时代广场3
单元718
(72)发明人 陈贺方 李伟 顾夏辉 安涛
刘威
(74)专利代理 机构 北京聿宏知识产权代理有限
公司 11372
代理人 陈超德 吴昊
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/289(2020.01)
(54)发明名称
文本信息处 理方法、 装置、 电子设备及 介质
(57)摘要
本公开涉及信息处理技术领域, 提供了文本
信息处理方法、 装置、 电子设备及介质。 该方法包
括: 将获取的目标文本信息导入 预设的实体提取
模型, 提取出至少一个实体信息, 其中, 每个实体
信息包括关键词信息以及与关键词信息对应的
标签信息; 基于目标文本信息以及标签信息, 生
成插入文本信息; 将插入文本信息导入预设的关
系提取模型, 生成关系信息, 其中, 关系信息包括
关键词信息以及关键词信息 之间的关联关系。 本
公开实施例可以通过上述步骤提取出文本信息
中任意数量的关键词以及关键词之间的关系, 大
大提高了提取精准度和准确率, 从而大大提高了
从文本信息中提取关键信息的效果。
权利要求书1页 说明书7页 附图4页
CN 114218963 A
2022.03.22
CN 114218963 A
1.一种文本信息处 理方法, 其特 征在于, 包括:
将获取的目标文本信 息导入预设的实体提取模型, 提取出至少一个实体信息, 其中, 每
个所述实体信息包括关键词信息以及与所述关键词信息对应的标签信息;
基于所述目标文本信息以及所述标签信息, 生成插 入文本信息;
将所述插入文本信 息导入预设的关系提取模型, 生成关系信 息, 其中, 所述关系信 息包
括所述关键词信息以及所述关键词信息之间的关联关系。
2.根据权利要求1所述的方法, 其特征在于, 所述基于所述目标文本信 息以及所述标签
信息, 生成插 入文本信息, 包括:
获取与每 个所述标签信息对应的标识符, 得到 至少一个标识符;
将每个所述标识符插入所述目标文本信 息中, 生成所述插入文本信 息, 其中, 每个所述
标识符插 入与所述标识符对应的关键词信息的位置 。
3.根据权利要求1所述的方法, 其特征在于, 所述关联关系包括: 逻辑合取、 逻辑析取以
及优先组合。
4.根据权利要求1至3任一项所述的方法, 其特征在于, 获取所述目标文本信息的步骤
包括:
获取原始文本信息;
将所述原 始文本信息导入预设的文本提取模型, 提取 出所述目标文本信息 。
5.一种文本信息处 理装置, 其特 征在于, 包括:
提取模块, 被配置为将获取的目标文本信息导入预设的实体提取模型, 提取出至少一
个实体信息, 其中, 每个所述实体信息包括关键词信息以及与所述关键词信息对应的标签
信息;
生成模块, 被 配置为基于所述目标文本信息以及所述标签信息, 生成插 入文本信息;
第二生成模块, 被配置为将所述插入文本信息导入预设的关系提取模型, 生成关系信
息, 其中, 所述关系信息包括所述关键词信息以及所述关键词信息之间的关联关系。
6.根据权利要求5所述的装置, 其特 征在于, 所述 生成模块被进一 步配置为:
获取与每 个所述标签信息对应的标识符, 得到 至少一个标识符;
将每个所述标识符插入与 所述标签信 息对应的关键词信 息的位置, 生成所述插入文本
信息。
7.根据权利要求5所述的装置, 其特征在于, 所述关联关系包括: 逻辑合取、 逻辑析取以
及优先组合。
8.根据权利要求5至7任一项所述的装置, 其特征在于, 获取所述目标文本信息的步骤
包括:
获取原始文本信息;
将所述原 始文本信息导入预设的文本提取模型, 提取 出所述目标文本信息 。
9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器中并且可以在所述处理
器上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1
至4任一项所述方法的步骤。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被处 理器执行时实现如权利要求1至4任一项所述方法的步骤。权 利 要 求 书 1/1 页
2
CN 114218963 A
2文本信息处理 方法、 装置、 电子设备及介质
技术领域
[0001]本公开涉及信息处理技术领域, 尤其涉及文本信息处理方法、 装置、 电子设备及介
质。
背景技术
[0002]目前信息 的种类越来愈多, 想要获取较全面的关联信息 的难度也越来越大。 现有
技术中通常采用智能分析方法来从大量的信息中提取关键词, 但只能提取关键词信息, 或
者只能提取两个关键词以及两个关键词之间的关系, 不能提取三个及以上的关键词的关
系, 导致对关联信息的提取精准度低, 提取效果差 。
发明内容
[0003]有鉴于此, 本公开实施例提供了文本信息处理方法、 装置、 电子设备及介质, 以解
决现有技 术中提取精准度低, 提取效果差的问题。
[0004]本公开实施例的第一方面, 提供了一种文本信息处理方法, 包括: 将获取的目标文
本信息导入预设的实体提取模型, 提取出至少一个实体信息, 其中, 每个实体信息包括关键
词信息以及与关键词信息对应的标签信息; 基于目标文本信息以及标签信息, 生成插入文
本信息; 将插入文本信息导入预设的关系提取模型, 生成关系信息, 其中, 关系信息包括关
键词信息以及关键词信息之间的关联关系。
[0005]本公开实施例的第二方面, 提供了一种文本信息处理装置, 包括: 提取模块, 被配
置为将获取的目标文本信息导入预设的实体提取模 型, 提取出至少一个实体信息, 其中, 每
个实体信息包括关键词信息以及与关键词信息对应的标签信息; 生成模块, 被配置为基于
目标文本信息以及标签信息, 生成插入文本信息; 第二生 成模块, 被配置为将插入文本信息
导入预设的关系提取模型, 生成关系信息, 其中, 关系信息包括关键词信息以及关键词信息
之间的关联关系。
[0006]本公开实施例的第三方面, 提供了一种电子设备, 包括存储器、 处理器以及存储在
存储器中并且可以在处理器上运行的计算机程序, 该 处理器执行计算机程序时实现上述方
法的步骤。
[0007]本公开实施例的第四方面, 提供了一种计算机可读存储介质, 该计算机可读存储
介质存储有计算机程序, 该计算机程序被处 理器执行时实现上述方法的步骤。
[0008]有益效果
本公开实施例 与现有技术相比存在的有益效果至少包括: 通过从目标文本信息中
提取关键词信息以及标签信息, 生成插入文本信息, 并生 成关系信息; 由于标签信息目标文
本信息以及关键词信息均相关, 因此可以提取出文本信息中任意数量的关键词以及关键词
之间的关系, 大大提高了提取精准度和 准确率, 从而大大提高了从文本信息中提取关键信
息的效果。说 明 书 1/7 页
3
CN 114218963 A
3
专利 文本信息处理方法、装置、电子设备及介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:29上传分享