说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210331824.1 (22)申请日 2022.03.30 (71)申请人 北京沃东天骏信息技 术有限公司 地址 100176 北京市大兴区经济技 术开发 区科创十一 街18号院2号楼4层A402室 申请人 北京京东世纪贸易有限公司 (72)发明人 张夏杰  (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 专利代理师 贾伟 张颖玲 (51)Int.Cl. G06V 10/25(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06K 9/62(2022.01) (54)发明名称 一种图像识别方法及 装置、 计算机可读存储 介质 (57)摘要 本发明实施例公开了一种图像识别方法及 装置、 计算机可读存储介质, 方法包括对待识别 图像进行多分辨率下采样, 从而得到至少两种分 辨率各自对应的第一特征图; 对至少两种分辨率 各自对应的第一特征图进行特征融合, 从而 得到 第二特征图; 对第二特征图进行多尺度目标检 测, 从而得到预设数量个候选框; 对预设数量个 候选框进行筛选, 得到目标候选框; 目标候选框 表征第二特征图中包含目标对象的区域; 对目标 候选框对应的目标对象进行识别, 从而得到识别 结果。 实现识别待识别图像中不同尺 寸的目标对 象, 提高识别结果的丰富程度, 满足现实应用场 景的需求。 权利要求书2页 说明书13页 附图3页 CN 114693918 A 2022.07.01 CN 114693918 A 1.一种图像识别方法, 其特 征在于, 包括: 对待识别图像进行多分辨率下采样, 从而得到至少两种分辨率各自对应的第一特征 图; 对所述至少两种分辨率各自对应的所述第 一特征图进行特征融合, 从而得到第 二特征 图; 对所述第二特 征图进行多尺度目标检测, 从而得到预设数量个候选 框; 对所述预设数量个候选框进行筛选, 得到目标候选框; 所述目标候选框表征所述第二 特征图中包 含目标对象的区域; 对所述目标候选 框对应的目标对象进行识别, 从而得到识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述识别结果包括类别信 息、 位置信 息、 面 积占比以及数量信息 。 3.根据权利要求1所述的方法, 其特征在于, 所述对待识别图像进行多分辨率下采样, 从而得到 至少两种分辨 率各自对应的第一特 征图, 包括: 基于所述待识别图像的边长, 确定下采样比例系数; 所述下采样比例系数为所述待识 别图像边长的公约数; 根据所述下采样比例系数对待识别图像进行至少两种分辨率的下采样, 得到所述至少 两种分辨 率各自对应的所述第一特 征图。 4.根据权利要求1中所述的方法, 其特征在于, 所述对所述第 二特征图进行多尺度目标 检测, 从而得到预设数量个候选 框, 包括: 通过滑窗, 对所述第二特征图中每层分解层的子特征进行检测, 直至预设数量个滑窗 均检测到目标子特 征, 实现多尺度目标检测; 根据所述目标子特征映射于所述待识别图像的区域, 生成对应的候选框, 从而得到所 述预设数量个候选 框。 5.根据权利要求2所述的方法, 其特征在于, 所述对所述目标候选框对应的区域进行识 别, 从而得到识别结果, 包括: 对所述目标候选 框对应的目标对象进行识别, 得到所述目标候选 框的位置信息; 根据所述位置信息, 以及所述待识别图像的尺寸信息, 得到所述识别结果中的所述面 积占比信息以及所述 位置信息 。 6.根据权利要求2所述的方法, 其特征在于, 所述对所述目标候选框对应的区域进行识 别, 从而得到识别结果, 包括: 对所述目标候选 框对应的目标对象进行识别, 得到所述目标对象的预测分类标签; 对所述预测分类标签与预设分类标签进行匹配, 从而得到所述识别结果中的所述数量 信息和所述类别 信息。 7.根据权利要求2、 5或6所述的方法, 其特 征在于, 所述方法还 包括: 当所述数量信息为 一个目标对象时, 显示所述 一个目标对象对应的物品活动信息 。 8.根据权利要求2、 5或6所述的方法, 其特 征在于, 所述方法还 包括: 当所述数量信息为至少两个目标对象时, 接收活动信息获取请求, 所述活动信息获取 请求携带有所述至少两个目标对象中的任意 一个目标对象; 响应于所述活动信息获取请求, 根据所述任意一个目标对象显示对应的物品活动信权 利 要 求 书 1/2 页 2 CN 114693918 A 2息。 9.根据权利要求2、 5或6所述的方法, 其特 征在于, 所述方法还 包括: 接收商品追踪请求, 所述商品追踪请求携带有所述识别结果; 响应于所述商品追踪请求, 基于所述识别结果, 得到对应的追踪信 息, 并根据所述追踪 信息和所述识别结果中的所述 面积占比信息, 显示 提示信息。 10.一种图像识别装置, 其特征在于, 包括下采样单元、 融合单元、 检测单元、 筛选单元 和识别单 元; 其中, 所述下采样单元, 用于对待识别图像进行多分辨率下采样, 从而得到至少两种分辨率 各自对应的第一特 征图; 所述融合单元, 用于对至少两种分辨率各自对应的所述第一特征图进行特征融合, 从 而得到第二特 征图; 所述检测单元, 用于对所述第二特征图进行多尺度目标检测, 从而得到预设数量个候 选框; 所述筛选单元, 用于对所述预设数量个候选框进行筛选, 得到目标候选框; 所述目标候 选框表征所述第二特 征图中包 含目标对象的区域; 所述识别单 元, 用于对所述目标候选 框对应的目标对象进行识别, 从而得到识别结果。 11.一种图像识别装置, 其特 征在于, 包括: 存储器, 用于存 储可执行指令; 处理器, 用于执行所述存储器中存储的可执行指令时, 实现权利要求1至9任一项所述 的方法。 12.一种计算机可读存储介质, 其特征在于, 存储有可执行指令, 用于引起处理器执行 时, 实现权利要求1至9任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114693918 A 3

.PDF文档 专利 一种图像识别方法及装置、计算机可读存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图像识别方法及装置、计算机可读存储介质 第 1 页 专利 一种图像识别方法及装置、计算机可读存储介质 第 2 页 专利 一种图像识别方法及装置、计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:32:05上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。