说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210989621.1 (22)申请日 2022.08.18 (65)同一申请的已公布的文献号 申请公布号 CN 115062876 A (43)申请公布日 2022.09.16 (73)专利权人 京华信息科技股份有限公司 地址 510520 广东省广州市天河区高普路 138号京华信息大楼中座 (72)发明人 李思伟 李锦洲 池沐霖 张旭君  申鑫  (74)专利代理 机构 广州专理知识产权代理事务 所(普通合伙) 44493 专利代理师 张凤 (51)Int.Cl. G06F 9/451(2018.01) G06Q 10/04(2012.01) G06Q 10/06(2012.01)G06Q 10/10(2012.01) G06N 3/00(2006.01) G06V 30/412(2022.01) G06V 30/414(2022.01) G06V 30/162(2022.01) G06V 30/164(2022.01) (56)对比文件 CN 112598366 A,2021.04.02 CN 110264288 A,2019.09.20 US 20191 14574 A1,2019.04.18 CN 111612166 A,2020.09.01 未红霞等.工作流 技术在工程项目合同审批 中的应用研究. 《计算机 应用与软件》 .2013,(第 08期), 武星等.成本最优化工作流 技术驱动的研发 协同软件即服 务应用. 《计算机集成制造系统》 .2013,(第08 期), 审查员 钟容 (54)发明名称 基于OCR的流程快速建模 方法、 系统、 设备及 存储介质 (57)摘要 本发明涉及一种计算机应用技术, 揭露了一 种基于OCR的流程快速建模方法、 系统、 设备及存 储介质。 本发 明对目标审批流程进行多维度的特 征采集, 并组建申请表集合, 其中包括多类申请 表; 依次确定各类申请表的审批用户, 并构建申 请表‑审批用户列表; 获得申请表审批任务, 并确 定所述申请表审批任务中目标申请表的类型, 结 合所述申请表 ‑审批用户列表匹配目标审批用户 集合; 构建任务分配模型并分析确定处理所述申 请表审批任务的目标审批用户; 基于OCR构建表 单识别模型, 并获得所述目标申请表的识别信 息; 生成标准目标申请表并发送至所述目标审批 用户进行审批。 本发明可优化审批流程, 同时提 高审批效率, 进 而提高决策频度和工作质量。 权利要求书4页 说明书13页 附图5页 CN 115062876 B 2022.11.08 CN 115062876 B 1.一种基于OCR的流 程快速建模方法, 其特 征在于, 包括: 组建步骤: 对目标审批流程进行多维度的特征采集, 并根据特征采集结果组建申请表 集合, 其中, 所述申请表集 合包括多类申请表; 构建步骤: 依次确定所述多类申请表中各类申请表的审批用户, 分别组成审批用户集 合, 并根据所述审批用户集 合与所述多类申请表的对应关系构建申请表 ‑审批用户列表; 匹配步骤: 获得申请表审批任务, 并分析确定所述申请表审批任务中目标申请表的类 型, 根据所述目标申请表的类型, 结合所述申请表 ‑审批用户列表匹配目标审批用户集 合; 确定步骤: 基于粒子群优化算法构建任务分配模型, 并通过所述任务分配模型对所述 目标审批用户集 合进行分析, 确定处 理所述申请表审批任务的目标审批用户, 包括: 提取所述目标审批用户集 合中任意 一个用户, 并采集所述用户的实时任务列表; 根据所述实时任务列表, 计算所述用户的实时负载, 其中, 所述实时负载的计算公式如 下: ; 其中, 所述 是指所述用户, 所述 是指所述用户 处理完所述实时任务列表 的总时间, 即所述实时负载, 所述 是指所述实时任 务列表中任 意一类任 务, 记作第 类任 务 , 所述 是指所述实时任务列表 中共有 类任务, 所述 是指所述用户 处 理完所述实时任务列表中第 类任务 的总时间, 所述 是指所述实时任务列表中第 类 任务的 总个数, 所述 是指所述实时任务列表中第 类任务 中每个任务的处 理时间; 将所述申请表审批任务分配至所述用户, 结合所述实时负载计算所述用户的预测负 载, 其中, 所述预测负载的计算公式如下: ; 其中, 所述 是指所述用户 处理所述实时任务列表和所述申请表审批任务的 总时间, 即所述预测负载, 所述 是指所述用户 处理所述申请表审批任务的时间, 所 述 是指所述申请表审批任务; 基于所述预测负载, 在所述目标审批用户集 合筛选得到预选目标审批用户集 合; 基于所述预选目标审批用户集合, 获得所述申请表审批任务的审批工作流, 并对所述 审批工作流进行 形式化描述 转换, 得到所述审批 工作流的有向无环图; 提取所述有向无环图的任意 一个流程, 并采集所述 流程的任务, 组成流 程任务集合; 基于所述流程任务集合计算所述流程的总时间成本, 并根据所述流程的总时间成本确 定所述流程的适配度指数; 将所述适配度指数最大作为寻优目标, 将所述预选目标审批用户集合作为寻优区域, 确定所述目标审批用户; 获得步骤: 基于OCR构建表单识别 模型, 并通过所述表单识别模型获得所述目标申请表权 利 要 求 书 1/4 页 2 CN 115062876 B 2的识别信息; 执行步骤: 根据 所述目标 申请表的识别信 息, 生成标准目标申请表, 并将所述标准目标 申请表发送至所述目标审批用户进行审批 。 2.根据权利要求1所述的流 程快速建模方法, 其特 征在于, 所述获得步骤 包括: 构建所述表单识别 模型, 其中, 所述表单识别 模型包括预处理层、 裁剪层、 分割层、 识别 层; 获得所述目标申请表的图像, 并利用所述预处理层对所述图像进行处理, 得到预处理 图像; 利用所述裁 剪层对所述预处 理图像进行裁 剪, 得到内容预处 理图像; 利用所述分割层将所述内容预处理图像中的各连续字符依次进行分割, 得到多个待识 别块; 利用所述识别层依次识别所述多个待识别块的信息, 组成目标申请表的识别 信息。 3.根据权利要求2所述的流 程快速建模方法, 其特 征在于, 所述得到预处 理图像, 包括: 将灰度化单 元、 二值化单元、 降噪单 元依次内嵌至所述预处 理层; 所述灰度化单元基于最大值法对所述图像进行变换, 得到所述图像中各像素点的灰度 值, 并根据所述各像素点的灰度值得到灰度图; 基于所述各像素点的灰度值, 得到所述图像的灰度直方图, 并根据所述灰度直方图确 定图像最佳阈值; 所述二值化单元基于所述图像最佳阈值对所述灰度图进行二 值化处理, 得到二 值图; 所述降噪单 元基于高斯滤波算法原理, 对所述 二值图进行降噪, 得到所述预处 理图像。 4.根据权利要求2所述的流程快速建模方法, 其特征在于, 在所述组成 目标申请表的识 别信息之后, 还 包括以下步骤: 采集审批流 程中的签名数据、 印章数据, 并组建审批通过 数据库; 判断所述目标申请表是否为初始申请表, 若所述目标申请表不是初始申请表, 提取所 述目标申请表的审批意见信息; 对所述审批意见信息进行分析, 并将分析结果在所述审批通过数据库中进行遍历, 根 据遍历结果 生成智能审批结果。 5.根据权利要求1所述的流 程快速建模方法, 其特 征在于, 所述执 行步骤包括: 获得所述目标申请表的标准化表单, 并提取所述标准化表单的指标类目, 组建标准指 标类目集; 基于所述识别 信息, 依次提取 所述标准指标类目集中各 标准指标类目的识别数据; 将所述识别数据分别填充至所述标准化表单, 并人工校验确 认后得到所述标准目标 申 请表。 6.一种基于OCR的流程快速建模系统, 所述基于OCR的流程快速建模系统包括存储器和 处理器, 其特征在于, 所述存储器上存储有基于 OCR的流程快速建模程序, 所述基于 OCR的流 程快速建模程序被所述处 理器执行时实现如下步骤: 组建步骤: 对目标审批流程进行多维度的特征采集, 并根据特征采集结果组建申请表 集合, 其中, 所述申请表集 合包括多类申请表; 构建步骤: 依次确定所述多类申请表中各类申请表的审批用户, 分别组成审批用户集权 利 要 求 书 2/4 页 3 CN 115062876 B 3

PDF文档 专利 基于OCR的流程快速建模方法、系统、设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于OCR的流程快速建模方法、系统、设备及存储介质 第 1 页 专利 基于OCR的流程快速建模方法、系统、设备及存储介质 第 2 页 专利 基于OCR的流程快速建模方法、系统、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:29:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。