说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211170822.5 (22)申请日 2022.09.23 (71)申请人 深圳今日人才信息科技有限公司 地址 518000 广东省深圳市福田区沙 头街 道新华社区新洲十一街139号中央西 谷大厦15 08A (72)发明人 卢婷 李敬泉 肖小范 景昊  谢志辉 吴显仁 徐伟招  (74)专利代理 机构 深圳市中科创为专利代理有 限公司 4 4384 专利代理师 谭雪婷 (51)Int.Cl. G06F 16/33(2019.01) G06Q 10/10(2012.01) (54)发明名称 一种简历信息模块 化的评估方法 (57)摘要 本发明公开了一种简历信息模块化的评估 方法, 包括如下步骤: S1: 对信息模块化的简历 进 行版块标签的召回率测试, 输 出召回率; S2: 对信 息模块化的简历进行版块信息内容相似度测试, 输出相似度及准确率; S3: 将输出的召回率、 相似 度、 准确率作为简历信息模块化的评估结果。 本 发明通过量化指标, 解决了目前在对比简历信息 结构化应用性能时, 存在着通用性差、 无法评估 大规模简历信息、 无法真实反映用户体验, 或效 率低下、 耗费人力过多的缺陷的问题, 取得了通 用性强、 能够真实反映用户体验, 且更加高效的 有益效果; 通过本申请的方法评估的结构化简历 能够更加便于招聘人员审阅修改以及简历信息 管理平台的管理工作。 权利要求书1页 说明书8页 附图3页 CN 115495554 A 2022.12.20 CN 115495554 A 1.一种简 历信息模块 化的评估方法, 其特 征在于, 包括如下步骤: S1: 对信息模块化的简历进行版块标签的召回率测试, 输出召回率, 其中, 召回率为简 历在信息模块 化时抽取的版块标签数量与预存 储的版块标签数量的比值; S2: 对信息模块化的简历进行版块信息内容相似度测试, 输出相似度和准确率, 其中, 相似度为简历在信息模块化时抽取的版块信息与预存储的版块信息的匹配度, 并为相似度 设定合理阈值, 计算相似度达到阈值的版块信息数量与预存储的版块信息数量比值作为版 块信息内容的准确率; S3: 将输出的召回率、 相似度、 准确率作为简 历信息模块 化的评估结果。 2.根据权利要求1所述的简历信息模块化的评估方法, 其特征在于: 在步骤S3之前, 还 执行步骤S30: 对信息模块化的简历进行版块标签的联合召回率测试, 输出联合召回率, 其 中, 联合召回率为简历在信息模块化时抽取的联合版块标签的数量与预存储的对应联合版 块标签的数量的比值, 并且, 联合版块标签为简历的版块标签的任意数量的组合, 并且, 步 骤S2中, 还对信息模块化的简历进 行版块信息的联合准确率测试, 输出联合准确率; 步骤S 3 中: 将输出的召回率、 联合召回率、 相似度、 准确率和联合准确率作为简历信息模块化的评 估结果。 3.根据权利要求2所述的简历信息模块化的评估方法, 其特征在于: 步骤S1之前, 还执 行步骤S0: 根据简历的版面和内容进 行版块划分, 按照划分的版块设定版块标签, 保存设定 好的版块标签, 并保存简 历的内容作为版块信息 。 4.根据权利要求3所述的简历信息模块化的评估方法, 其特征在于: 任意调换步骤S1、 S2、 S30的顺序。 5.根据权利要求4所述的简历信息模块化的评估方法, 其特征在于: 步骤S3中, 是采用 简历在信息模块化时抽取的版块信息的字符串与预存储的对应版块信息的字符串的比值 进行相似度计算, 相似度计算规则为, 去除掉特殊字符后, 在抽取的板块信息字符串中获取 最长连续匹配子序列长度与预存储的版块信息字符串长度的比值, 其中, 超过预设阈值则 为相似, 低于预设阈值则为 不相似。 6.根据权利要求5所述的简历信 息模块化的评估方法, 其特征在于: 所述预设阈值的取 值范围为0.6~1。 7.根据权利要求5所述的简历信 息模块化的评估方法, 其特征在于: 在进行相似度计算 前, 还对简历在信息模块 化时抽取的版块信息进行 数据清洗, 去除冗余的符号。 8.根据权利要求3 ‑7任一所述的简历信 息模块化的评估方法, 其特征在于: 在步骤S3之 前, 对每一份简历分别执行步骤S0、 S1、 S2、 S30, 并且, 步骤S3中, 将输出的召回率的平均值、 联合召回率的平均值、 相似度的平均值、 准确 率的平均值及联合准确 率的平均值作为简历 信息模块 化的评估结果。 9.根据权利要求1 ‑7任一所述的简历信 息模块化的评估方法, 其特征在于: 还包括步骤 S4: 将所述评估结果可视化对照标注在简 历上。 10.根据权利要求9所述的简历信息模块化的评估方法, 其特征在于: 步骤S4具体为: 采 用简历在信息模块化时抽取 的版块标签将简历分隔为不同的版块, 并且, 并在相应版面的 右上角标注版块标签和版块信息的相似度。权 利 要 求 书 1/1 页 2 CN 115495554 A 2一种简历信息模块化的评估方 法 技术领域 [0001]本发明涉及计算机软件领域, 尤其涉及的是一种简 历信息模块 化的评估方法。 背景技术 [0002]当前对简历信息进行结构化的应用包含深度学习、 命名实体识别及内容分块几大 类, 但缺乏对结构化信息进行定量比较的统一标准, 难以在同一标准下去衡量不同应用对 简历信息结构化的准确性和有效性。 [0003]当前简历结构化信息评估有两种方式, 一种依赖于应用本身提供的评估方式, 例 如CN202010258249中提供一种将所述预设结构化字段与对应的简历实体关联并与简历实 体一同向用户显示以使用户对抽取 结果进行评价。 [0004]可视化工具虽然能够便于简历人员进行审阅, 但对于批量数据的管理不够快捷有 效。 并且由于不同简历结构化应用采用的评估方法不同, 难以量化横向比较不同简历结构 化应用的性能差异。 [0005]第二种方式则完全依赖于人工对结果与简历进行对比, 费时费力, 且不便于对批 量数据进 行审阅和管理。 这一方法通常只能通过人工目测的方式来判断应用处理得的结构 化信息的准确性。 这一方法显然有着效率低下, 通用性差, 准确性低, 无法对大规模简历结 构化信息进行分析以及难以横向比较不同应用之间性能等 缺陷。 [0006]因此, 现有技 术存在缺陷, 需要改进。 发明内容 [0007]本发明所要解决的技术问题是: 提供一种旨在解决当前对简历信息进行结构化 时, 评估标准不一致以及结构化信息与真实值的格式差异, 难以横向比较各个算法之间的 性能差异的问题的简 历信息模块 化的评估方法。 [0008]本发明的技 术方案如下: [0009]一种简历信息模块化的评估方法, 包括如下步骤: S1: 对信息模块化的简历进行版 块标签的召回率测试, 输出召回率, 其中, 召回率为简历在信息模块化时抽取的版块标签数 量与预存储的版块标签数量的比值; S2: 对信息模块化的简历进行版块信息内容相似度测 试, 输出相似度, 其中, 相似度为简历在信息模块化时抽取的版块信息与预存储的版块信息 的匹配度, 并为相似度设定合理阈值, 计算相似度达到阈值的版块信息数量与预存储的版 块信息数量比值作为版块信息内容的准确率; S3: 将输出的召回率、 相似度、 准确率作为简 历信息模块 化的评估结果。 [0010]应用于上述技术方案, 所述的简历信息模块化的评估方法中, 在步骤S3之前, 还执 行步骤S30: 对信息模块化的简历进行版块标签的联合召回率测试, 输出联合召回率, 其中, 联合召回率为简历在信息模块化时抽取的联合版块标签的数量与预存储的对应联合版块 标签的数量的比值, 并且, 联合版块标签为简历的版块标签的任意数量的组合, 并且, 步骤 S2中, 还对信息模块化的简历进行版块信息的联合准确率测试, 输出联合准确率; 步骤S3说 明 书 1/8 页 3 CN 115495554 A 3

PDF文档 专利 一种简历信息模块化的评估方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种简历信息模块化的评估方法 第 1 页 专利 一种简历信息模块化的评估方法 第 2 页 专利 一种简历信息模块化的评估方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:29:15上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。