(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210173979.7
(22)申请日 2022.02.24
(71)申请人 特赞 (上海) 信息科技有限公司
地址 200000 上海市浦东 新区中国 (上海)
自由贸易试验区张衡路20 0号2幢3层
(72)发明人 王喆 范凌
(74)专利代理 机构 北京知果之信知识产权代理
有限公司 1 1541
专利代理师 高科
(51)Int.Cl.
G06F 16/75(2019.01)
G06F 16/783(2019.01)
G06V 20/40(2022.01)
G06V 30/14(2022.01)
G06V 10/82(2022.01)G06V 30/19(2022.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/08(2006.01)
G10L 15/12(2006.01)
G10L 15/14(2006.01)
G10L 15/16(2006.01)
G10L 15/26(2006.01)
(54)发明名称
文本标签治理的系统、 方法、 电子设备及存
储介质
(57)摘要
本发明提供一种文本标签治理的系统、 方
法、 电子设备及存储介质, 文本标签治理的方法
包括获取待打标的视频内容, 将所述视频内容转
换为文本信息; 基于所述文本信息生成关键字标
签; 将所述 关键字标签中相近的关键字标签通过
无监督学习进行聚类; 基于聚类后的所述关键字
标签构建标签树; 通过所述标签树中关键字标签
与所述视频内容的映射关系, 为每一个视频内容
生成内容标签。 该文本标签治理的方法改善了 现
有技术中的工具对标签治理工作不适配且工作
效率低下的问题。
权利要求书1页 说明书6页 附图3页
CN 114547371 A
2022.05.27
CN 114547371 A
1.一种文本标签治理的方法, 其特 征在于, 所述方法具体包括:
获取待打标的视频内容, 将所述视频内容 转换为文本信息;
基于所述文本信息生成关键 字标签;
将所述关键 字标签中相近的关键 字标签通过 无监督学习进行聚类;
基于聚类后的所述关键 字标签构建标签树;
通过所述标签树中关键字标签与 所述视频内容的映射关系, 为每一个视频内容生成内
容标签。
2.根据权利要求1所述的文本标签治理 的方法, 其特征在于, 所述获取待打标的视频内
容, 将所述视频内容 转换为文本信息, 包括:
基于语音识别算法和文字识别算法将视频内容中的声音信息和图像信息转换为语音
字幕的文本信息 。
3.根据权利要求1所述的文本标签治理 的方法, 其特征在于, 所述基于聚类后的所述关
键字标签构建标签树, 包括:
将所述关键 字标签进行 标签治理和标签结构搭建, 生成一颗标签树。
4.根据权利要求3所述的文本标签治理 的方法, 其特征在于, 所述基于聚类后的所述关
键字标签构建标签树, 还 包括:
建立标签树的管理库, 将所述标签树存 储至所述管理库。
5.根据权利要求1所述的文本标签治理 的方法, 其特征在于, 所述通过所述标签树中关
键字标签与所述视频内容的映射关系, 为每一个视频内容 生成内容标签, 包括:
实时反馈各个用户对所述文本标签的治理结构, 实现多用户协作治理。
6.根据权利要求1所述的文本标签治理 的方法, 其特征在于, 所述文本标签治理 的方法
还包括:
将治理后的内容标签映射到所述文本信息中。
7.一种文本标签治理的系统, 其特 征在于, 包括:
获取模块, 用于获取待打标的视频内容, 将所述视频内容 转换为文本信息;
生成模块, 用于基于所述文本信息生成关键 字标签;
聚类模块, 用于将所述关键 字标签中相近的关键 字标签通过 无监督学习进行聚类;
构建模块, 用于基于聚类后的所述关键 字标签构建标签树;
所述生成模块还用于通过所述标签树中关键字标签与 所述视频内容的映射关系, 为每
一个视频内容 生成内容标签。
8.根据权利要求7所述的文本标签治理 的系统, 其特征在于, 所述文本标签治理 的系统
还包括转换模块, 所述转换模块用于基于语音识别算法和文字识别算法将视频内容中的声
音信息和图像信息转换为语音字幕的文本信息 。
9.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算
机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至6中的任一项
所述的方法的步骤。
10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算
机程序被处 理器执行时实现如权利要求1至 6中的任一项所述的方法的步骤。权 利 要 求 书 1/1 页
2
CN 114547371 A
2文本标签 治理的系统、 方法、 电子设备及存储介质
技术领域
[0001]本发明涉及互联 网技术领域, 尤其涉及一种文本标签治理的系统、 方法、 电子设备
及存储介质。
背景技术
[0002]随着企业营销中获取流量越来越困难, 成本日益增高, 各个品牌方迫切需要从自
身营销内容出发, 通过内容的优化来帮助提升效果转化质量。 如何把内容转变为数据, 如何
把感性的营销内容创造转变为可以被定量分析的文本标签和数值数据, 是内容分析和优化
的关键。 数以千万计的营销内容如何被打上标签, 打上哪些标签, 应该来自哪些维度, 这些
标签如何建立和系统化管理, 标签又如何与效果数据产生关联, 日益成为企业营销领域的
重要问题。
发明内容
[0003]本发明的目的在于提供一种文本标签治理的系统、 方法、 电子设备及存储介质, 该
文本标签治理的方法能够解决现有技术中的工具对标签治理工作不适配且工作效率低下
的问题。
[0004]为了实现上述目的, 本发明提供如下技 术方案:
[0005]本发明实施例提供一种文本标签治理的方法, 所述方法具体包括:
[0006]获取待打标的视频内容, 将所述视频内容 转换为文本信息;
[0007]基于所述文本信息生成关键 字标签;
[0008]将所述关键 字标签中相近的关键 字标签通过 无监督学习进行聚类;
[0009]基于聚类后的所述关键 字标签构建标签树;
[0010]通过所述标签树中关键字标签与所述视频内容的映射关系, 为每一个视频内容生
成内容标签。
[0011]在上述技术方案的基础上, 本发明还可以做如下改进:
[0012]进一步地, 所述获取待打标的视频内容, 将所述视频内容 转换为文本信息, 包括:
[0013]基于语音识别算法和文字识别算法将视频内容中的声音信息和图像信息转换为
语音字幕的文本信息 。
[0014]进一步地, 所述基于聚类后的所述关键 字标签构建标签树, 包括:
[0015]将所述关键 字标签进行 标签治理和标签结构搭建, 生成一颗标签树。
[0016]进一步地, 所述基于聚类后的所述关键 字标签构建标签树, 还 包括:
[0017]建立标签树的管理库, 将所述标签树存 储至所述管理库。
[0018]进一步地, 所述通过所述标签树中关键字标签与所述视频内容的映射关系, 为每
一个视频内容 生成内容标签, 包括:
[0019]实时反馈各个用户对所述文本标签的治理结构, 实现多用户协作治理。
[0020]进一步地, 所述文本标签治理的方法还 包括:说 明 书 1/6 页
3
CN 114547371 A
3
专利 文本标签治理的系统、方法、电子设备及存储介质
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:27上传分享