(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211369675.4
(22)申请日 2022.11.03
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 赵闻飙 林金镇 应缜哲 薛兰青
王维强 徐恪 李琦
(74)专利代理 机构 北京国昊天诚知识产权代理
有限公司 1 1315
专利代理师 朱文杰
(51)Int.Cl.
G06Q 20/40(2012.01)
G06Q 30/00(2012.01)
G06Q 40/02(2012.01)
G06F 40/284(2020.01)G06F 40/289(2020.01)
G06F 40/30(2020.01)
(54)发明名称
数据处理方法、 装置及设备
(57)摘要
本说明书实施例提供了一种数据处理方法、
装置及设备, 所述方法包括: 获取待检测的目标
数据, 并获取所述目标数据与每个候选用户意图
对应的目标概率, 所述目标数据包括人机交互过
程中用户的输入数据; 对所述目标数据进行划
分, 得到多个子数据, 并基于 预设梯度积分算法,
获取每个所述子数据对所述目标数据属于每个
所述候选用户意图的贡献度; 基于所述目标数据
与每个候选用户意图对应的目标概率, 以及所述
每个所述子数据对所述目标数据属于每个所述
候选用户意图的贡献度, 确定所述目标数据对应
的目标用户意图。
权利要求书3页 说明书14页 附图5页
CN 115423485 A
2022.12.02
CN 115423485 A
1.一种数据处 理方法, 其特 征在于, 包括:
获取待检测的目标数据, 并获取所述目标数据与每个候选用户意图对应的目标概率,
所述目标 数据包括人机交 互过程中用户的输入数据;
对所述目标数据进行划分, 得到多个子数据, 并基于预设梯度积分算法, 获取每个所述
子数据对所述目标 数据属于每 个所述候选用户意图的贡献度;
基于所述目标数据与每个候选用户意图对应的目标概率, 以及所述每个所述子数据对
所述目标数据属于每个所述候选用户意图的贡献度, 确定所述目标数据对应的目标用户意
图。
2.根据权利要求1所述的方法, 其特征在于, 在所述获取所述目标数据与每个候选用户
意图对应的目标概 率之前, 还 包括:
确定与对所述目标数据对应的第 一向量, 并基于预先训练 的意图识别模型和所述第 一
向量, 确定所述目标数据与每个第一用户意图对应的第一概率, 所述意图识别模型为基于
预设深度学习算法构建的用于对用户意图进行识别的模型;
将所述第一概率中大于第一概率阈值且不大于第二概率阈值的第一概率对应的第一
用户意图确定为所述 候选用户意图;
所述基于所述目标数据与每个候选用户意图对应的目标概率, 以及所述每个所述子数
据对所述目标数据属于每个所述候选用户意图的贡献度, 确定所述目标数据对应的目标用
户意图, 包括:
将所述第一概率中大于第三概率阈值的第一概率对应的第一用户意图确定为第二用
户意图;
基于所述第二用户意图、 所述目标数据与每个候选用户意图对应的目标概率, 以及所
述每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度, 确定所述目标数
据对应的目标用户意图。
3.根据权利要求2所述的方法, 其特征在于, 所述获取所述目标数据与每个候选用户意
图对应的目标概 率, 包括:
将所述目标数据对应的词向量替换为零向量, 并基于替换后的词向量, 确定与对所述
目标数据对应的第二向量;
基于所述预先训练的意图识别模型和所述第 二向量, 确定所述目标数据与每个候选用
户意图对应的第二 概率;
基于所述第 一概率和所述第 二概率, 确定所述目标数据与每个候选用户意图对应的目
标概率。
4.根据权利要求3所述的方法, 其特征在于, 所述基于替换后的词向量, 确定与对所述
目标数据对应的第二向量, 包括:
获取所述目标数据中每个词在所述目标数据中的位置向量, 以及所述每个词在所述目
标数据中分段向量;
基于所述替换后的词向量、 所述位置向量和所述分段向量, 确定与对所述目标数据对
应的第二向量。
5.根据权利要求4所述的方法, 其特征在于, 所述基于所述第二用户意图、 所述目标数
据与每个候选用户意图对应的目标概率, 以及所述每个所述子数据对所述目标数据属于每权 利 要 求 书 1/3 页
2
CN 115423485 A
2个所述候选用户意图的贡献度, 确定所述目标 数据对应的目标用户意图, 包括:
若所述贡献度中存在小于预设贡献度阈值的贡献度, 则将所述小于预设贡献度阈值的
贡献度对应的候选用户意图确定为潜在用户意图;
基于所述第二用户意图和所述潜在用户意图, 确定所述目标数据对应的目标用户意
图。
6.根据权利要求5所述的方法, 其特征在于, 所述目标数据为执行目标业务所需的数
据, 所述方法还 包括:
获取与所述第二用户意图对应的第 一风控策略, 以及与 所述潜在用户意图对应的第 二
风控策略, 并基于所述第一风控 策略和所述第二风控策略, 对 所述目标业务进 行风险检测,
以确定执 行所述目标业 务是否存在风险。
7.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括:
基于所述目标数据及对应的目标用户意图, 对所述意图识别模型进行训练, 得到训练
后的意图识别模型。
8.一种数据处 理装置, 其特 征在于, 包括:
数据获取模块, 用于获取待检测的目标数据, 并获取所述目标数据与每个候选用户意
图对应的目标概 率, 所述目标 数据包括人机交 互过程中用户的输入数据;
贡献确定模块, 用于对所述目标数据进行划分, 得到多个子数据, 并基于预设梯度积分
算法, 获取每 个所述子数据对所述目标 数据属于每 个所述候选用户意图的贡献度;
意图确定模块, 用于基于所述目标数据与每个候选用户意图对应的目标概率, 以及所
述每个所述子数据对所述目标数据属于每个所述候选用户意图的贡献度, 确定所述目标数
据对应的目标用户意图。
9.一种数据处 理设备, 其特 征在于, 所述数据处 理设备包括:
处理器; 以及
被安排成存储计算机可执行指令的存储器, 所述可执行指令在被执行时使所述处理
器:
获取待检测的目标数据, 并获取所述目标数据与每个候选用户意图对应的目标概率,
所述目标 数据包括人机交 互过程中用户的输入数据;
对所述目标数据进行划分, 得到多个子数据, 并基于预设梯度积分算法, 获取每个所述
子数据对所述目标 数据属于每 个所述候选用户意图的贡献度;
基于所述目标数据与每个候选用户意图对应的目标概率, 以及所述每个所述子数据对
所述目标数据属于每个所述候选用户意图的贡献度, 确定所述目标数据对应的目标用户意
图。
10.一种存储介质, 其特征在于, 所述存储介质用于存储计算机可执行指令, 所述可执
行指令在被处 理器执行时实现以下流 程:
获取待检测的目标数据, 并获取所述目标数据与每个候选用户意图对应的目标概率,
所述目标 数据包括人机交 互过程中用户的输入数据;
对所述目标数据进行划分, 得到多个子数据, 并基于预设梯度积分算法, 获取每个所述
子数据对所述目标 数据属于每 个所述候选用户意图的贡献度;
基于所述目标数据与每个候选用户意图对应的目标概率, 以及所述每个所述子数据对权 利 要 求 书 2/3 页
3
CN 115423485 A
3
专利 数据处理方法、装置及设备
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:24上传分享