说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210641547.4 (22)申请日 2022.06.08 (71)申请人 深圳微言科技有限责任公司 地址 518049 广东省深圳市福田区梅林街 道孖岭社区凯丰 路10号翠林大厦13层 1305、 1306、 1307、 1308室 (72)发明人 吴叶国 韩彧  (74)专利代理 机构 上海创开专利代理事务所 (普通合伙) 31374 专利代理师 张佑富 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/2455(2019.01) G06F 16/2453(2019.01) G06F 16/906(2019.01)G06F 16/9537(2019.01) (54)发明名称 一种时序特 征数据表的存 储方法及装置 (57)摘要 本发明公开了一种时序特征数据表的存储 方法及装置, 涉及时序数据技术领域。 本发明的 处理单元: 用于对数据进行预处理与挖掘, 包括 预处理模块与数据挖掘模块; 操作单元: 用于对 处理后的数据进行修改, 包括数据可视化模块与 修改模块; 提取单元: 用于对时序数据中的特征 进行提取、 识别与生成, 包括特征提取模块、 特征 类型识别模块与特征类型生成模块; 创建单元: 用于时序特征数据表的生 成以及存储。 本发明采 用采用时序数据与其特征信息结构化的存储, 完 整的保存结构化建表后的时序数据与其特征信 息, 通过对特征信息的查询, 可得出多个含有该 特征信息的时序数据, 能够 使用特征信息查询时 序数据, 使得对时序数据的查询和分析更为直观 和易于理解。 权利要求书2页 说明书5页 附图3页 CN 114969158 A 2022.08.30 CN 114969158 A 1.一种时序 特征数据表的存储装置, 控制器以端口的形式连接数据库, 其特征在于, 所 述控制器的内部包 含有处理单元、 操作单 元、 提取单元与创建单 元; 处理单元: 用于对数据进行预处理与挖掘, 包括预处理模块与数据挖掘模块; 所述预处 理模块用于对时序数据中的空缺值与噪声 数据进行处理; 所述数据挖掘模块对时序数据进 行切分、 分类、 聚类与索引; 操作单元: 用于对处理后的数据进行修改, 包括数据可视化模块与修改模块; 所述数据 可视化模块主要 是将时序数据以直观图像的方式展示时序数据; 所述修改模块根据实际情 况对数据进行修改; 提取单元: 用于对时序数据中的特征进行提取、 识别与生成, 包括特征提取模块、 特征 类型识别模块与特征类型生成模块; 所述特征提取模块是使用特征提取算法对原始的时序 数据进行分段, 并且提取每一段 的特征值; 所述特征类型识别模块是对使用特征类型 的约 束条件对每个特征信息进 行筛选, 符合特征类型的约束条件的特征信息就是特征类型的特 征实例; 所述特征类型生成模块是参考特征类型数据信息, 把原始 时序数据和特征值结合 起来, 生成由特 征类型描述的、 结构化的数据; 创建单元: 用于时序 特征数据表的生成以及存储; 包括表格生成模块与存储模块; 所述 表格生成模块用于对时序特征数据表的创建, 并将原始时序数据与特征值填入到创建的时 序特征数据表中; 所述存储模块用于对时序特征数据 表与时序特征数据 表中的原始时序数 据以及特 征值进行保存。 2.根据权利要求1所述的一种时序特征数据表的存储装置, 其特征在于, 所述 时序数据 中的空缺值处理方法包含有忽略元组、 人工填写空缺值、 使用一个全局常量填充空缺值、 采 用属性的平均值 填充空缺 值与使用最可能的值 填充空缺 值。 3.根据权利要求1所述的一种时序特征数据表的存储装置, 其特征在于, 所述噪声数据 处理的方法为分箱、 聚类与回归中的任意 一种。 4.根据权利要求1所述的一种时序特征数据表的存储装置, 其特征在于, 所述特征提取 模块采用分段提取时序数据中的特 征信息。 5.根据权利要求1所述的一种时序特征数据表的存储装置, 其特征在于, 所述控制器的 内部包含有查询模块与描述模块。 6.根据权利要求2所述的一种时序特征数据表的存储装置, 其特征在于, 所述使用最可 能的值填充空缺值的方法为采用回归、 贝叶斯形式方法或判定树归纳方法, 根据现存数据 的多数信息推导 最优可能的空缺属性的属性 值。 7.一种时序特征数据表的存储方法, 其特征在于, 采用如权1 ‑6任一项所述的一种时序 特征数据表的存 储装置实现, 包括如下步骤: S1、 通过预处理模块对数据进行预处理, 包括对数据中的空缺值与噪声数据进行处理, 在处理空缺值时, 应采用回归、 贝叶斯形式方法或判定树归纳方法, 根据现存数据的多数信 息推导最优可能的空缺属 性的属性值, 而在对 噪声数据进行处理时通过分箱、 聚类以及回 归中任意一种的方法对其进 行处理, 在将处理好的数据经过切分、 分类、 聚类与索引进行挖 掘; S2、 将挖掘好后的数据通过数据可视化模块以直观图像的方式展示时序数据, 根据不 同情况通过修改模块对时序数据进行读、 写、 增、 删、 改等 一些列操作;权 利 要 求 书 1/2 页 2 CN 114969158 A 2S3、 通过特征提取模块使用特征提取算法对修改好后的时序数据进行分段, 并且提取 每一段的特征值, 通过特征类型识别模块使用特征类型约束条件对每个特征值进行筛选, 符合特征类型的约束 条件的数值就是时序数据的特征值, 通过特征类型生成模块将时序数 据和特征值结合 起来, 生成由特 征类型描述的、 结构化的数据; S4、 通过表格生成模块创建表格, 并将时序数据特征值输入到表格的第 一行, 将修改后 的时序数据填入到表格的第一列, 并通过存 储模块对其进行储 存。权 利 要 求 书 2/2 页 3 CN 114969158 A 3

.PDF文档 专利 一种时序特征数据表的存储方法及装置

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种时序特征数据表的存储方法及装置 第 1 页 专利 一种时序特征数据表的存储方法及装置 第 2 页 专利 一种时序特征数据表的存储方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:11:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。