说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210331824.1 (22)申请日 2022.03.30 (71)申请人 北京沃东天骏信息技 术有限公司 地址 100176 北京市大兴区经济技 术开发 区科创十一 街18号院2号楼4层A402室 申请人 北京京东世纪贸易有限公司 (72)发明人 张夏杰 (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 专利代理师 贾伟 张颖玲 (51)Int.Cl. G06V 10/25(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06K 9/62(2022.01) (54)发明名称 一种图像识别方法及 装置、 计算机可读存储 介质 (57)摘要 本发明实施例公开了一种图像识别方法及 装置、 计算机可读存储介质, 方法包括对待识别 图像进行多分辨率下采样, 从而得到至少两种分 辨率各自对应的第一特征图; 对至少两种分辨率 各自对应的第一特征图进行特征融合, 从而 得到 第二特征图; 对第二特征图进行多尺度目标检 测, 从而得到预设数量个候选框; 对预设数量个 候选框进行筛选, 得到目标候选框; 目标候选框 表征第二特征图中包含目标对象的区域; 对目标 候选框对应的目标对象进行识别, 从而得到识别 结果。 实现识别待识别图像中不同尺 寸的目标对 象, 提高识别结果的丰富程度, 满足现实应用场 景的需求。 权利要求书2页 说明书13页 附图3页 CN 114693918 A 2022.07.01 CN 114693918 A 1.一种图像识别方法, 其特 征在于, 包括: 对待识别图像进行多分辨率下采样, 从而得到至少两种分辨率各自对应的第一特征 图; 对所述至少两种分辨率各自对应的所述第 一特征图进行特征融合, 从而得到第 二特征 图; 对所述第二特 征图进行多尺度目标检测, 从而得到预设数量个候选 框; 对所述预设数量个候选框进行筛选, 得到目标候选框; 所述目标候选框表征所述第二 特征图中包 含目标对象的区域; 对所述目标候选 框对应的目标对象进行识别, 从而得到识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述识别结果包括类别信 息、 位置信 息、 面 积占比以及数量信息 。 3.根据权利要求1所述的方法, 其特征在于, 所述对待识别图像进行多分辨率下采样, 从而得到 至少两种分辨 率各自对应的第一特 征图, 包括: 基于所述待识别图像的边长, 确定下采样比例系数; 所述下采样比例系数为所述待识 别图像边长的公约数; 根据所述下采样比例系数对待识别图像进行至少两种分辨率的下采样, 得到所述至少 两种分辨 率各自对应的所述第一特 征图。 4.根据权利要求1中所述的方法, 其特征在于, 所述对所述第 二特征图进行多尺度目标 检测, 从而得到预设数量个候选 框, 包括: 通过滑窗, 对所述第二特征图中每层分解层的子特征进行检测, 直至预设数量个滑窗 均检测到目标子特 征, 实现多尺度目标检测; 根据所述目标子特征映射于所述待识别图像的区域, 生成对应的候选框, 从而得到所 述预设数量个候选 框。 5.根据权利要求2所述的方法, 其特征在于, 所述对所述目标候选框对应的区域进行识 别, 从而得到识别结果, 包括: 对所述目标候选 框对应的目标对象进行识别, 得到所述目标候选 框的位置信息; 根据所述位置信息, 以及所述待识别图像的尺寸信息, 得到所述识别结果中的所述面 积占比信息以及所述 位置信息 。 6.根据权利要求2所述的方法, 其特征在于, 所述对所述目标候选框对应的区域进行识 别, 从而得到识别结果, 包括: 对所述目标候选 框对应的目标对象进行识别, 得到所述目标对象的预测分类标签; 对所述预测分类标签与预设分类标签进行匹配, 从而得到所述识别结果中的所述数量 信息和所述类别 信息。 7.根据权利要求2、 5或6所述的方法, 其特 征在于, 所述方法还 包括: 当所述数量信息为 一个目标对象时, 显示所述 一个目标对象对应的物品活动信息 。 8.根据权利要求2、 5或6所述的方法, 其特 征在于, 所述方法还 包括: 当所述数量信息为至少两个目标对象时, 接收活动信息获取请求, 所述活动信息获取 请求携带有所述至少两个目标对象中的任意 一个目标对象; 响应于所述活动信息获取请求, 根据所述任意一个目标对象显示对应的物品活动信权 利 要 求 书 1/2 页 2 CN 114693918 A 2息。 9.根据权利要求2、 5或6所述的方法, 其特 征在于, 所述方法还 包括: 接收商品追踪请求, 所述商品追踪请求携带有所述识别结果; 响应于所述商品追踪请求, 基于所述识别结果, 得到对应的追踪信 息, 并根据所述追踪 信息和所述识别结果中的所述 面积占比信息, 显示 提示信息。 10.一种图像识别装置, 其特征在于, 包括下采样单元、 融合单元、 检测单元、 筛选单元 和识别单 元; 其中, 所述下采样单元, 用于对待识别图像进行多分辨率下采样, 从而得到至少两种分辨率 各自对应的第一特 征图; 所述融合单元, 用于对至少两种分辨率各自对应的所述第一特征图进行特征融合, 从 而得到第二特 征图; 所述检测单元, 用于对所述第二特征图进行多尺度目标检测, 从而得到预设数量个候 选框; 所述筛选单元, 用于对所述预设数量个候选框进行筛选, 得到目标候选框; 所述目标候 选框表征所述第二特 征图中包 含目标对象的区域; 所述识别单 元, 用于对所述目标候选 框对应的目标对象进行识别, 从而得到识别结果。 11.一种图像识别装置, 其特 征在于, 包括: 存储器, 用于存 储可执行指令; 处理器, 用于执行所述存储器中存储的可执行指令时, 实现权利要求1至9任一项所述 的方法。 12.一种计算机可读存储介质, 其特征在于, 存储有可执行指令, 用于引起处理器执行 时, 实现权利要求1至9任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114693918 A 3
专利 一种图像识别方法及装置、计算机可读存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 07:32:05
上传分享
举报
下载
原文档
(652.0 KB)
分享
友情链接
GB-T 42768-2023 公共安全 城市安全风险评估.pdf
GB-T 12688.5-2019 工业用苯乙烯试验方法 第5部分:总醛含量的测定 滴定法.pdf
法律法规 中华人民共和国反恐怖主义法.pdf
基于内生安全的信创安全体系.pdf
GB-T 39044-2020 政务服务平台接入规范.pdf
DB3205-T 1083-2023 医疗机构数据安全管理规范 苏州市.pdf
GB-T 43806-2024 资产管理系统通用技术要求.pdf
GB 26783-2011 消防救生照明线.pdf
GB-T 22336-2008 企业节能标准体系编制通则.pdf
GB-T 42595-2023 承压设备修理基本要求.pdf
T-GIEHA 050—2022 国际健康驿站 规划建设.pdf
GB-T 20984-2022 信息安全技术 信息安全风险评估方法.pdf
GB-T 17710-2008 信息技术 安全技术 校验字符系统.pdf
思度安全-DSMM-011 数据分析安全管理规范V1.0.pdf
GB-T 26527-2011 有机硅消泡剂.pdf
T-CRHA 016—2023 成人失禁患者皮肤护理规范.pdf
风险评估管理制度.pdf
DB31-T 1219-2020 节能技术评审方法和程序 上海市.pdf
T-CIATCM 016—2019 针灸科电子病历基本数据集.pdf
T-GSEE 0003—2022 高海拔地区电网多旋翼无人机智能巡检工作规范.pdf
1
/
3
19
评价文档
赞助2.5元 点击下载(652.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。