专利 一种基于deepstream的图书识别方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210388526.6 (22)申请日 2022.04.14 (71)申请人重庆亲禾智千科技有限公司地址 401120 重庆市渝北区仙桃街道数据谷东路19号 (72)发明人袁杨宇　刘宽　樊宸铭　王鹏　 (74)专利代理机构北京中政联科专利代理事务所(普通合伙) 11489 专利代理师覃毅 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) H04N 7/18(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于deepstream的图书识别方法 (57)摘要本发明公开了一种基于deepstream的图书识别方法，属于图书分拣技术领域，所述识别方法通过以流媒体相机为输入源，获取外部图像，将视频信号以rtsp流的形式传输，在视频实时传输到微型计算机后，使用基于gstream的 deepstream技术对rtsp流进行实时处理，通过建立管道对视频信号完成解析，再通过在管道上建立的插件，完成对图书的识别。采用本发明方法对图书进行识别，可以弥补现有技术中对于图书识别的场景以及投入段的重叠，并且减少对硬件的要求。权利要求书1页说明书2页附图1页 CN 114898247 A 2022.08.12 CN 114898247 A 1.一种基于deepstream的图书识别方法，其特征在于：所述识别方法通过以流媒体相机为输入源，获取图书的外部图像，将视频信号以rtsp流的形式传输，在视频实时传输到微型计算机后，采用Yolo v4算法，使用基于gstream的deepstream技术对rtsp流进行实时处理，通过建立管道对视频信号完成解析，再通过在管道上建立的插件，完成对图书的识别，所述deepstream的视频处理技术通过接入多路视频实时处理，完成多摄像头对一机器的处理。， Yolo v4在基准网络和输出层之间添加了SPP 模块与FPN +PAN两种方式， SPP 模块通过融合不同大小的最大池化层来获得鲁棒的特征表示，最大池化层采用padding操作，移动步长为1。 2.根据权利要求1所述的基于deepstream的图书识别方法，其特征在于： Yolo v4的 neck结构采用FPN+PAN模式， FPN是自顶向下的，将高层特征通过上采样和低层特征做融合得到进行预测的特征图，两部分通过 FPN+PAN结构进行融合。权　利　要　求　书 1/1 页 2 CN 114898247 A 2一种基于de epstream的图书识别方法技术领域 [0001]本发明属于图书分拣技术领域，具体涉及一种基于de epstream的图书识别方法。背景技术 [0002]目前在图书馆分拣过程中主要分为投入段、输送段、识别段、分拣段等几大部分，但是由于使用对象特殊性，图书分拣系统与其他分拣系统有着明显的差异。比如： [0003]1、从投入段来看，图书分拣系统要求进入分拣系统的图书不可以重叠，若是图书重叠之，识别系统所看到的图书外观就发生了很大的变化，在后续的识别过程中、分拣过程中就会大幅地提升错误率。 [0004]2、输送段需要根据图书馆场地不同，通过为多样的组合形式，最终将图书运送至分拣机进行分拣，并且每本图书所放的间距都有要求，故而增加了人力物力。 [0005]3、在硬件方面，增加多条主线汇聚后再进入最终的分拣部分，使得最终图书量非常大，对硬件的要求非常高，对识别的精度要求也随之提高。发明内容 [0006]有鉴于此，本发明的目的在于提供一种基于deepstream的图书识别方法，可以弥补现有技术中对于图书识别的场景以及投入段的重叠，并且减少对硬件的要求。 [0007]为达到上述目的，本发明提供如下技术方案： [0008]本发明一种基于deepstr eam的图书识别方法，所述识别方法通过以流媒体相机为输入源，获取外部图像，将视频信号以rtsp流的形式传输，在视频实时传输到微型计算机后，使用基于gstream的deepstream技术对rtsp流进行实时处理，通过建立管道对视频信号完成解析，再通过在管道上建立的插件，完成对图书的识别。 [0009]进一步，所述deepstream的视频处理技术通过接入多路视频实时处理，完成多摄像头对一机器的处理。 [0010]进一步， Yolo v4在基准网络和输出层之间添加了SPP模块与FPN+PAN两种方式， SPP模块通过融合不同大小的最大池化层来获得鲁棒的特征表示，最大池化层采用padding 操作，移动步长为1。 [0011]进一步， Yolo v4的neck结构采用FPN+PAN模式， FPN是自顶向下的，将高层特征通过上采样和低层特征做融合得到进行预测的特征图，两部分通过 FPN+PAN结构进行融合。 [0012]本发明的有益效果在于： [0013]本发明一种基于deepstream的图书识别方法，通过采用机器视觉技术，可以模拟人的视觉功能，从客观的事物中提取特征信息，可有效的判断各个阶段中的图书是否出现重叠，以及传输篮中的图书是否清空，可以弥补现有技术中对于图书识别的场景以及投入段的重叠，并且减少对硬件的要求。 [0014]本发明的其他优点、目标和特征将在随后的说明书中进行阐述，并且在某种程度上对本领域技术人员而言是显而易见的，或者本领域技术人员可以从本发明的实践中得到说　明　书 1/2 页 3 CN 114898247 A 3

专利 一种基于deepstream的图书识别方法

专利一种基于deepstream的图书识别方法