全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211081165.7 (22)申请日 2022.09.06 (71)申请人 北京麦聪软件 有限公司 地址 100080 北京市海淀区北四环西路68 号左岸工社132 2室 (72)发明人 程志国  (74)专利代理 机构 合肥上博知识产权代理事务 所(特殊普通 合伙) 3418 8 专利代理师 花锦涛 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/27(2019.01) G06F 16/242(2019.01) G06F 16/2453(2019.01) G06F 16/22(2019.01)G06F 16/907(2019.01) (54)发明名称 多数据源元数据快速比对方法、 系统、 设备 和存储介质 (57)摘要 本发明涉及数据处理技术领域, 具体涉及多 数据源元数据快速比对方法、 系统、 设备和存储 介质。 该方法根据数据源名称获取当前数据库连 接, 构建初始化SQL语句, 查询数据库中对应的元 数据信息; 根据查询到的数据库中的元数据信 息, 基于Hash规则计算每条元数据信息内容的 Hash值; 针对待比较的元数据信息, 比对元数据 信息的Hash值, 并以列存储 方式进行分块并行计 算; 分块并行计算Hash值对比的待比较的元数据 信息的内容是否相同, 筛选 出本地待删减、 新增、 修改的表和字段的元数据记录。 本发 明通过将多 种数据源的元数据进行快速比对, 提高了数据交 互的效率, 通过Hash值比对的方式, 避免逐条逐 个记录的比对, 提高了 计算效率。 权利要求书2页 说明书11页 附图4页 CN 115145943 A 2022.10.04 CN 115145943 A 1.一种多数据源元 数据快速比对方法, 其特 征在于, 该 方法包括以下步骤: 根据数据源名称获取当前数据库连接, 构建初始化SQL语句, 查询数据库中对应的元数 据信息; 根据查询到的数据库中的元数据信息, 基于Hash规则计算每条元数据信息内容的Hash 值; 针对待比较的元数据信息, 比对元数据信息的Hash值, 并以列存储方式进行分块并行 计算; 分块并行计算Hash值对比的待比较的元数据信息的内容是否相同, 筛选出本地待删 减、 新增、 修改的表和字段的元 数据记录 。 2.如权利要求1所述的多数据源元数据 快速比对方法, 其特征在于, 所述多数据源元数 据快速比对方法中, 采取Hash校验的方式比对元数据信息之间的Hash值, 基于一条Hash结 果用以确定元 数据是否发生变化需要更新。 3.如权利要求2所述的多数据源元数据 快速比对方法, 其特征在于, 根据 数据源名称 获 取当前数据库连接, 还 包括: 查询数据库中的同步标识状态, 检查当前同步任务是否为第一次全量同步; 若为第一次全量同步, 则将同步状态更新为 “开始同步 ”, 并查询数据库中是否存在当 前数据源的元 数据配置, 存在则清空。 4.如权利要求3所述的多数据源元数据快速比对方法, 其特征在于, 构建初始化SQL语 句, 查询数据库中对应的元 数据信息之前, 还 包括: 读取目标 数据库信息,  根据type类型判断需连接的数据库, 获取 数据库数据连接 。 5.如权利要求1所述的多数据源元数据快速比对方法, 其特征在于, 查询数据库时, 还 包括: 判断数据源内数据库的数目, 根据数据库的数目初始化每个数据库单独的元数据读 取语句, 并根据多条查询SQ L的情况设置后续数据写入的合并逻辑的标识符。 6.如权利要求5所述的多数据源元数据 快速比对方法, 其特征在于, 所述多数据源元数 据快速比对方法, 还 包括: 根据多个数据库分别的查询解析查询到的目标数据库元数据信息, 将目标库的表信 息、 属性信息保存至 本地数据库中; 每个数据库的分别读取SQL, 并判断所需保存的数据是否超过预设保存阈值, 若超过预 设保存阈值则分批次保存, 否则一次性保存。 7.如权利要求6所述的多数据源元数据 快速比对方法, 其特征在于, 每个数据库的分别 读取SQL, 所需保存的数据在分批次保存时, 采用列存储方式进行分块并行计算, 将Hash整 体比对划分为分块多 线程Hash比对。 8.一种多数据源元 数据快速比对系统, 其特 征在于, 该系统包括: 初始化模块, 用于根据数据源名称获取当前数据库连接, 构建初始化SQL语句, 查询数 据库中对应的元 数据信息; 元数据计算模块, 用于根据查询到的数据库中的元数据信息, 基于Hash规则计算每条 元数据信息内容的Hash值; Hash值比对模块, 用于针对待比较的元数据信息, 比对元数据信息的Hash值, 并以列存 储方式进行分块并行计算;权 利 要 求 书 1/2 页 2 CN 115145943 A 2元数据记录更新模块, 用于分块并行计算H ash值对比的待比较的元数据信息的内容是 否相同, 筛 选出本地待删减、 新增、 修改的表和字段的元 数据记录 。 9.一种计算机设备, 其特征在于, 所述计算机设备包括处理器、 存储器、 以及存储在所 述存储器上并可被所述处理器执行的多数据源元数据快速比对程序, 其中所述多 数据源元 数据快速比对程序被所述处理器执行时, 实现如权利要求 1至7中任一项 所述的多 数据源元 数据快速比对方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有多数据 源元数据快速比对程序, 其中所述多数据源元数据快速比对程序被处理器执行时, 实现如 权利要求1至7中任一项所述的多数据源元 数据快速比对方法的步骤。权 利 要 求 书 2/2 页 3 CN 115145943 A 3

PDF文档 专利 多数据源元数据快速比对方法、系统、设备和存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 多数据源元数据快速比对方法、系统、设备和存储介质 第 1 页 专利 多数据源元数据快速比对方法、系统、设备和存储介质 第 2 页 专利 多数据源元数据快速比对方法、系统、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:57上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。