说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221047672 9.0 (22)申请日 2022.04.30 (71)申请人 杭州石原子科技有限公司 地址 310000 浙江省杭州市余杭区五常街 道西坝路51号B座20 3、 204室 (72)发明人 王万平  (74)专利代理 机构 北京盛凡佳华专利代理事务 所(普通合伙) 11947 专利代理师 王艳 (51)Int.Cl. G06F 16/28(2019.01) G06F 16/22(2019.01) G06F 16/215(2019.01) G06F 16/21(2019.01) G06F 16/2455(2019.01) (54)发明名称 一种通用的实时查询引擎 (57)摘要 本发明属于数仓技术领域, 具体为一种通用 的实时查询引擎, 包括注册模块、 数据接入模块、 查询模块、 数据清理模块以及FoundationDB; 所 述注册模 块, 用于在FoundationDB上建立表 格以 及注册索引, 表格用于辅助数据的导入以及查 询, 索引用于调用FoundationDB的查询能力; 所 述数据接入模块, 用于录入数据以及提供插件扩 展机制, 插件扩展机制可以通过插件提取不同格 式的数据, 最后将录入的数据及提取的数据写入 FoundationDB的表 格中; 注册模块支持数据的表 格建模, 数据接入模块具有灵活的数据接入能 力, 提供插件扩展机制支持各种数据格式的录 入, 查询模块支持新数据的事实查询, 从而实现 新写入的数据实时可查, 数据清理模块可以对 过 期数据进行清理, 进 而避免过期占用内存。 权利要求书1页 说明书3页 附图1页 CN 114756632 A 2022.07.15 CN 114756632 A 1.一种通用的实时查询引擎, 其特征在于: 包括注册模块、 数据接入模块、 查询模块、 数 据清理模块以及Foundati onDB; 所述注册模块, 用于在FoundationDB上建立表格以及注册索引, 表格用于辅助数据的 导入以及查询, 索引用于调用Foundati onDB的查询能力; 所述数据接入模块, 用于录入数据以及提供插件扩展机制, 插件扩展机制可以通过插 件提取不同格式的数据, 最后将录入的数据及提取的数据写入Foundati onDB的表格中; 所述查询模块, 用于通过索引调用FoundationDB的查询能力, 然后对FoundationDB的 表格中的数据进行 快速查询; 所述数据清理模块, 用于分析FoundationDB的表格中的数据是否过期, 并对表格中过 期数据进行清理。 2.根据权利要求1所述的一种通用的实时查询引擎, 其特征在于: 所述注册模块还包括 时间添加模块, 所述时间添加模块用于为导入FoundationDB的表格中的数据添加操作时 间, 操作时间也会录入在Foundati onDB的表格中。 3.根据权利要求2所述的一种通用的实时查询引擎, 其特征在于: 所述数据清 理模块还 包括时间设定模块, 所述时间设定模块用于设定过期数据的具体时间, 当数据的操作时间 超过过期数据的具体时间时, 该 数据即为过期数据。 4.根据权利要求2所述的一种通用的实时查询引擎, 其特征在于: 所述查询模块在查询 时, 也可以FoundationDB的表格中的数据的操作时间对FoundationDB的表格中数据进行查 询。 5.根据权利要求1所述的一种通用的实时查询引擎, 其特征在于: 所述数据接入模块在 接受新数据的录入时支持流式写入。 6.根据权利要求1所述的一种通用的实时查询引擎, 其特征在于: 所述数据清 理模块还 包括数据导出模块, 所述数据导出模块用于导出 Foundati onDB的表格中的过期数据。 7.根据权利要求1所述的一种通用的实时查询引擎, 其特征在于: 所述数据清 理模块采 用lock‑free的引擎模型。权 利 要 求 书 1/1 页 2 CN 114756632 A 2一种通用的实时查询引擎 技术领域 [0001]本发明涉及数仓技 术领域, 具体为 一种通用的实时查询引擎。 背景技术 [0002]数仓是数据仓库的简称。 它是一个面向主题的、 集成的、 相对稳定的、 反映历史变 化的数据集合, 用于支持管理决策。 不同于传统数据库对应于某一个或多个项目, 数据仓库 根据使用者实际需求, 将不同数据源的数据在一个较高的抽象层次上做整合, 所有数据都 围绕某一主题来组织。 数据仓库中存储的数据是来源于多个数据源的集成, 原始数据来自 不同的数据源, 存储方式各不相同。 数据仓库中保存的数据是一系列历史快照, 不 允许被修 改, 用户只能通过分析工具进 行查询和分析。 数据仓库会定期 接收新的集成数据, 反应出最 新的数据变化。 [0003]在数仓领域中, 写入数据后需要经过一系列复杂的数据处理后, 才可以对数据进 行查询, 该过程需要较长的时间, 即新写入的数据不能实时可查, 数据的延时不利于对数据 进行实时追踪, 也不能及时的了解到数据的变化, 因此需要一种实时查询引擎, 用于让新写 入的数据实时可查。 发明内容 [0004]本发明的目的在于提供一种通用的实时查询引擎, 以解决上述背景技术中提出的 目前数仓领域无法做到新写入的数据实时可查的问题。 [0005]为实现上述目的, 本 发明提供如下技术方案: 一种通用的实时查询引擎, 包括注册 模块、 数据接入 模块、 查询模块、 数据清理模块以及Foundati onDB; [0006]所述注册模块, 用于在FoundationDB上建立表格以及注册索引, 表格用于辅助数 据的导入以及查询, 索引用于调用Foundati onDB的查询能力; [0007]所述数据接入模块, 用于录入数据以及提供插件扩展机制, 插件扩展机制 可以通 过插件提取不同格式的数据, 最后将录入的数据及提取的数据写入FoundationDB的表格 中; [0008]所述查询模块, 用于通过索引调用FoundationDB的查询能力, 然后对 Foundati onDB的表格中的数据进行 快速查询; [0009]所述数据清理模块, 用于分析FoundationDB的表格中的数据是否过期, 并对表格 中过期数据进行清理。 [0010]优选的, 所述注册模块还包括时间添加模块, 所述时间添加模块用于为导入 FoundationDB的表格中的数据添加操作 时间, 操作时间也会录入在FoundationDB的表格 中。 [0011]优选的, 所述数据清理模块还包括时间设定模块, 所述时间设定模块用于设定过 期数据的具体时间, 当数据的操作时间超过 过期数据的具体时间时, 该 数据即为过期数据。 [0012]优选的, 所述查询模块在查询时, 也可以FoundationDB的表格中的数据的操作时说 明 书 1/3 页 3 CN 114756632 A 3

.PDF文档 专利 一种通用的实时查询引擎

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种通用的实时查询引擎 第 1 页 专利 一种通用的实时查询引擎 第 2 页 专利 一种通用的实时查询引擎 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:12:30上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。