说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210439220.9 (22)申请日 2022.04.22 (71)申请人 远光软件股份有限公司 地址 519085 广东省珠海市科技创新海岸 远光软件园 (72)发明人 宣日科 金涛 吴诚 肖波  陈冠辉 季飞飞  (74)专利代理 机构 广东朗乾 律师事务所 4 4291 专利代理师 杨焕军 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/248(2019.01) G06F 16/27(2019.01) (54)发明名称 信息搜索方法、 装置、 存 储介质及服 务器 (57)摘要 本申请实施例公开了一种信息搜索方法、 装 置、 存储介质及服务器, 涉及信息搜索领域。 本申 请利用分布式批量消息处理系统在从不同供应 商的多个数据源中采集对象数据, 以及将采集的 对象数据写入到分布式搜索引擎的各个节点中, 实现分布式搜索引擎和供应商之间亿级海量数 据的及时同步, 保证数据的准确性。 然后, 利用多 个评估因子的参数值权重计算各个候选对象的 得分, 基于得分对候选对象进行降序排列, 以便 将用户真正所需的对象进行推荐, 提高用户搜索 的便捷性和合 规性。 权利要求书2页 说明书8页 附图4页 CN 114969113 A 2022.08.30 CN 114969113 A 1.一种信息 搜索方法, 其特 征在于, 包括: 分布式搜索引擎在 分布式批量消息处理系统中获取对象数据到各个节点进行存储; 其 中, 所述对象数据是所述分布式批量消息处理系统通过下载服务在多个数据源中采集得到 的; 所述分布式搜索引擎接收来自计算机设备的搜索请求; 其中, 所述搜索请求携带搜索 条件信息; 所述分布式搜索引擎响应于所述搜索请求, 基于所述搜索条件信 息在各个节点存储的 对象数据中进行搜索得到多个候选对象; 所述分布式搜索引擎确定各个候选对象的评估因子的参数值和权 重; 所述分布式搜索引擎 根据评估因子的参数值和权 重计算各个候选对象的得分; 所述分布式搜索引擎基于得分对各个候选对象降序排列得到 搜索结果; 所述分布式搜索引擎向所述计算机设备返回搜索结果。 2.根据权利 要求1所述的方法, 其特征在于, 所述分布式批量消息处理系统为Kafka, 所 述分布式搜索系统为Elasticsearc h。 3.根据权利要求1或2所述的方法, 其特征在于, 对象数据为酒店数据, 候选对象为候选 酒店, 所述分布式搜索引擎中配置有酒店的父文档和关联的至少一个子文档父文档用于存 储酒店属性信息, 子文档用于存储酒店价格房态信息; 所述酒店属 性信息包括: 酒店编号、 酒店名称、 酒店地址、 所属城市、 行政区、 商圈、 酒店电话、 酒店经纬度、 酒店星级、 酒店渠道; 所述价格房态信息包括: 酒店编号、 日期、 房型编号、 房型名称、 价格计划编号、 价格计划名 称、 早餐、 带宽、 成本价格、 销售价格、 房量、 支付方式、 是否协议。 4.根据权利要求3所述的方法, 各个候选酒店的评估因子包括: 关键词相关性、 酒店类 型、 酒店距离、 酒店差标差和酒店评分。 5.根据权利要求4所述的方法, 其特征在于, 所述确定各个候选酒店的评估因子的参数 值, 包括: 计算候选酒店的酒店名称 或酒店地址与用户输入的关键词之间的匹配程度, 基于所述 匹配程度确定该候选酒店的关键词相关性的参数值; 其中, 匹配程度和关键词相关性的参 数值呈正相关性; 或 获取候选酒店和用户之间的服务方式, 根据 所述服务方式确定该候选酒店的酒店类型 的参数值; 或 计算候选酒店的位置和用户输入的位置之间的距离, 根据 所述距离确定该候选酒店的 酒店距离的参数值, 距离和酒店距离的参数值呈负相关性; 或 计算用户的差标和候选酒店的酒店价格之间的差值, 根据 所述差值确定该候选酒店的 酒店差标差的参数值; 其中, 差值和酒店差标差的参数值呈负相关性; 或 在候选酒店的商 品描述界面中获取好评数和差评数, 基于所述好评数和所述总评价数 之间的比例计算该候选酒店的酒店评分的参数值。 6.根据权利要求5所述的方法, 其特 征在于, 评估因子的参数值是归一 化处理得到的。 7.根据权利要求1或2或4或5或6所述的方法, 其特征在于, 所述分布式搜索引擎在分布 式批量消息处 理系统中获取对象数据到各个节点进行存 储之前, 还 包括: 基于用户的配置指令, 配置对象的多个评价因子, 以及配置各个评价因子的权 重。权 利 要 求 书 1/2 页 2 CN 114969113 A 28.一种信息 搜索装置, 其特 征在于, 包括: 下载单元, 用于在分布式批量消息处理系统中获取对象数据到各个节点进行存储; 其 中, 所述对象数据是所述分布式批量消息处理系统通过下载服务在多个数据源中采集得到 的; 收发单元, 用于接收来自计算机设备的搜索请求; 其中, 所述搜索请求携带搜索条件信 息; 搜索单元, 用于响应于所述搜索请求, 基于所述搜索条件信息在各个节点存储的对象 数据中进行搜索得到多个候选对象; 确定单元, 用于确定各个候选对象的评估因子的参数值和权 重; 计算单元, 用于根据评估因子的参数值和权 重计算各个候选对象的得分; 排序单元, 用于基于得分对各个候选对象降序排列得到 搜索结果; 所述收发单 元, 还用于向所述计算机设备返回搜索结果。 9.一种计算机存储介质, 其特征在于, 所述计算机存储介质存储有多条指令, 所述指令 适于由处 理器加载并执 行如权利要求1~7任意 一项的方法步骤。 10.一种服务器, 其特征在于, 包括: 处理器和存储器; 其中, 所述存储器存储有计算机 程序, 所述计算机程序适于由所述处理器加载并执行如权利要求1~7任意一项的方法步 骤。权 利 要 求 书 2/2 页 3 CN 114969113 A 3

.PDF文档 专利 信息搜索方法、装置、存储介质及服务器

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息搜索方法、装置、存储介质及服务器 第 1 页 专利 信息搜索方法、装置、存储介质及服务器 第 2 页 专利 信息搜索方法、装置、存储介质及服务器 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:12:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。