公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210673705.4 (22)申请日 2022.06.13 (71)申请人 深圳致星科技有限公司 地址 518000 广东省深圳市南 山区粤海街 道大冲社区深南大道9676号大冲商务 中心 (一期) 2栋 3号楼18C -1 (72)发明人 高晓龙  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 黄禹强 (51)Int.Cl. G06F 21/62(2013.01) G06N 20/20(2019.01) (54)发明名称 隐私计算、 隐私数据及联邦学习的数据管 理 系统及方法 (57)摘要 本申请涉及隐私计算、 隐私数据及联邦学习 技术领域, 具体涉及一种隐私计算、 隐私数据及 联邦学习的数据管理系统及方法。 数据管理系统 包括: 元信息 数据库, 用于存储数据元信息; 数据 存储库, 用于存储数据; 数据导入模块, 配置为选 择性地将输入数据通过数据映射方式映射到所 述元信息数据库或者通过数据写入方式导入到 所述数据存储库; 和数据导出模块, 配置为从所 述数据存储库导出ID数据、 特征数据或者数据查 询反馈到与所述数据管理系统相连接的隐私计 算框架, 或者, 通过所述元信息数据库从外部数 据源获得所述ID数据、 所述特征数据或者所述数 据查询反馈。 如此提供统一的数据管理使用方式 以及提高数据使用的灵活性和便捷性。 权利要求书2页 说明书11页 附图3页 CN 114996760 A 2022.09.02 CN 114996760 A 1.一种数据管理系统, 用于隐私计算、 隐私数据及联邦学习, 其特征在于, 所述数据管 理系统包括: 元信息数据库, 用于存 储数据元信息; 数据存储库, 用于存 储数据; 数据导入模块, 配置为选择性地将输入数据通过数据映射方式映射到所述元信 息数据 库或者通过数据写入方式导入到所述数据存 储库; 和 数据导出模块, 配置为从所述数据存储库导出ID数据、 特征数据或者数据查询反馈到 与所述数据管理系统相连接的隐私计算框架, 或者, 通过所述元信息数据库从外部数据源 获得所述ID数据、 所述特 征数据或者所述数据查询反馈 。 2.根据权利要求1所述的数据 管理系统, 其特征在于, 所述数据 管理系统配置为通过所 述数据导出模块 导出ID数据到所述隐私计算框架从而 进行求交操作以获得 数据ID交集。 3.根据权利要求2所述的数据 管理系统, 其特征在于, 所述数据 管理系统还配置为通过 所述数据导出模块以基于所述数据ID交集导出与所述数据ID交集对应的特征数据到所述 隐私计算框架从而 进行建模操作以建立联邦学习模型或者进行离线预测操作。 4.根据权利要求3所述的数据 管理系统, 其特征在于, 所述数据 管理系统还配置为接收 数据查询要求并且通过所述数据导出模块以基于所述数据查询要求导出与所述数据查询 要求对应的数据查询反馈到所述隐私计算框架从而进 行在线预测操作, 其中与所述数据查 询要求对应的数据查询反馈包括所述数据存储库中符合所述数据查询要求的至少一个数 据的特征。 5.根据权利要求4所述的数据 管理系统, 其特征在于, 所述建模操作适用于离线建模场 景, 所述离线预测操作适用于 离线预测场景, 所述在线预测操作适用于在线预测场景。 6.根据权利要求1所述的数据 管理系统, 其特征在于, 所述数据导入模块将所述输入数 据通过所述数据映射方式导入所述元信息数据库, 包括: 所述数据导入模块从所述外部数 据源获取所述输入数据的虚拟映射信息后将所述输入数据的虚拟映射信息导入所述元信 息数据库。 7.根据权利要求6所述的数据 管理系统, 其特征在于, 所述数据导出模块通过所述元信 息数据库获取所述输入数据的虚拟映射信息后基于所述输入数据的虚拟映射信息从所述 外部数据源获得与所述输入数据对应的所述ID数据、 所述特征数据或者所述数据查询反 馈。 8.根据权利要求1所述的数据 管理系统, 其特征在于, 所述数据导入模块将所述输入数 据通过所述数据写入方式导入所述数据存储库, 包括: 所述数据导入模块从所述外部数据 源获取所述输入数据后将所述输入数据写入所述数据存 储库。 9.根据权利要求8所述的数据 管理系统, 其特征在于, 所述数据导出模块从所述数据存 储库获取并导出与所述输入数据对应的ID数据、 特 征数据或者数据查询反馈 。 10.根据权利要求8所述的数据管理系统, 其特征在于, 所述输入数据是关系型数据并 且所述数据存 储库以关系型 数据表形式存 储所述输入数据。 11.根据权利要求1所述的数据管理系统, 其特征在于, 所述元信息数据库所存储的数 据元信息包括以下至少一项: 名称、 版本号、 特 征名称、 标签名称、 数据量、 数据存 储地址。 12.根据权利要求1所述的数据管理系统, 其特征在于, 所述数据管理系统还包括异步权 利 要 求 书 1/2 页 2 CN 114996760 A 2调度模块, 所述异 步调度模块用于协调所述数据导入模块和所述数据导出模块从而以异 步 执行方式完成数据导入导出任务。 13.一种数据 管理方法, 用于隐私计算、 隐私数据及联邦学习, 其特征在于, 所述数据 管 理方法应用于数据管理系统, 所述数据管理系统包括元信息数据库、 数据存储库、 数据导入 模块和数据导出模块, 所述数据管理方法包括: 通过所述元信息数据库存 储数据元信息; 通过所述数据存 储库存储数据; 通过所述数据导入模块, 选择性地将输入数据通过数据映射方式映射到所述元信 息数 据库或者 通过数据写入方式导入到所述数据存 储库; 和 通过所述数据导出模块, 从所述数据存储库导出ID数据、 特征数据或者数据查询反馈 到与所述数据管理系统相连接的隐私计算框架, 或者, 通过所述元信息数据库从外部数据 源获得所述ID数据、 所述特 征数据或者所述数据查询反馈 。 14.根据权利要求13所述的数据管理方法, 其特征在于, 所述数据管理方法还包括: 通 过所述数据导出模块导出ID数据到所述隐私计算框架从而进行求交操作以获得数据ID交 集, 以及通过所述数据导出模块以基于所述数据ID交集导出与所述数据ID交集对应的特征 数据到所述隐私计算框架从而 进行建模操作以建立联邦学习模型或者进行离线预测操作。 15.根据权利要求14所述的数据管理方法, 其特征在于, 所述数据管理方法还包括: 接 收数据查询要求并且通过所述数据导出模块以基于所述数据查询要求导出与所述数据查 询要求对应的数据查询反馈到所述隐私 计算框架从而进行在线预测操作, 其中与所述数据 查询要求对应的数据查询反馈包括所述数据存储库中符合所述数据查询要求的至少一个 数据的特 征。 16.根据权利要求15所述的数据 管理方法, 其特征在于, 所述建模操作适用于离线建模 场景, 所述离线预测操作适用于 离线预测场景, 所述在线预测操作适用于在线预测场景。 17.一种非瞬时性计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有 计算机指 令, 该计算机指 令被处理器执行时实现根据权利要求 13至16中任一项 所述的数据 管理方法。 18.一种电子设备, 其特 征在于, 所述电子设备包括: 处理器; 用于存储处理器可执行指令的存 储器; 其中, 所述处理器通过运行所述可执行指令以实现根据权利要求13至16中任一项所述 的数据管理方法。权 利 要 求 书 2/2 页 3 CN 114996760 A 3

PDF文档 专利 隐私计算、隐私数据及联邦学习的数据管理系统及方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 隐私计算、隐私数据及联邦学习的数据管理系统及方法 第 1 页 专利 隐私计算、隐私数据及联邦学习的数据管理系统及方法 第 2 页 专利 隐私计算、隐私数据及联邦学习的数据管理系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:38:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。