公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210089691.1 (22)申请日 2022.01.25 (71)申请人 鹏城实验室 地址 518000 广东省深圳市南 山区兴科一 街2号 (72)发明人 程正涛 张伟哲 束建钢 杨帆 邹庆胜 (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 赵燕燕 (51)Int.Cl. G06F 21/62(2013.01) G06F 21/60(2013.01) G06F 16/36(2019.01) G06F 16/31(2019.01)G06F 40/30(2020.01) G06F 16/901(2019.01) (54)发明名称 跨模态隐私语义表征方法、 装置、 设备及存 储介质 (57)摘要 本发明公开了一种跨模态隐私语义表征方 法、 装置、 设备及存储介质, 涉及数据处理技术领 域, 方法包括: 获取多模态数据; 根据多模态数 据, 获得对应的文本数据; 对文本数据进行关键 词提取和加密, 得到密态关键词; 根据密态关键 词, 对预设知识图谱进行分割, 得到密态子图; 对 密态子图进行图嵌入, 得到与密 态关键词对应的 密态表征向量, 以得到多模态数据的语义表征结 果。 本发明解决了现有技术中存在密态关键词之 间的语义关联性较差的问题, 实现了不仅可以保 证密态关键词之间的语义关联, 还 可以为后续进 行隐私语义的检索提供准确的语义表征的效果。 权利要求书2页 说明书14页 附图3页 CN 114528588 A 2022.05.24 CN 114528588 A 1.一种跨模态隐私语义表征 方法, 其特 征在于, 所述方法包括: 获取多模态数据; 根据所述多模态数据, 获得对应的文本数据; 对所述文本数据进行关键词提取和 加密, 得到密态关键词; 根据所述密态关键词, 对所述预设知识图谱进行分割, 得到密态子图; 对所述密态子 图进行图嵌入, 得到与所述密态关键词对应的密态表征向量, 以得到所 述多模态数据的语义表征 结果。 2.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述多模态数据包括至 少两种不同模态的数据信息; 所述根据所述多模态数据, 获得对应的文本数据的步骤 包括: 当所述多模态数据包括语音模态的第一模态数据时, 利用语音识别技术, 将所述第一 模态数据转换为第一文本数据; 当所述多模态数据包括视频模态的第二模态数据时, 利用训练好的文本生成模型, 将 所述第二模态数据转换为第二文本数据; 当所述多模态数据包括文本模态的第 三模态数据时, 直接将所述第 三模态数据确定为 第三文本数据。 3.如权利要求2所述的跨模态隐私语义表征方法, 其特征在于, 所述对所述文本数据进 行关键词提取和 加密, 得到密态关键词的步骤 包括: 对所述第 一文本数据、 第 二文本数据和/或第 三文本数据进行关键词提取和加密, 得到 密态关键词。 4.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述对所述文本数据进 行关键词提取和 加密, 得到密态关键词的步骤 包括: 通过无监督学习算法对所述文本数据进行关键词提取, 得到关键词; 通过对称加密算法对所述关键词进行加密处 理, 得到密态关键词。 5.如权利要求4所述的跨模态隐私语义表征方法, 其特征在于, 所述通过无监督学习算 法对所述文本数据进行关键词提取, 得到关键词的步骤 包括: 对所述文本数据进行分词处 理, 得到多个词汇; 根据所述多个词汇, 绘制词汇网络图; 其中, 所述词 汇网络图的网络节点对应于所述词 汇, 连接两个网络节点的边具有属性 值, 所述属性 值根据所述多个词汇的共现关系确定; 根据所述词汇网络 图, 对所述多个词汇进行排序和筛选, 得到表征所述文本数据的关 键词。 6.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述根据 所述密态关键 词, 对所述预设知识图谱进行分割, 得到密态子图的步骤之前, 所述方法还 包括: 通过开源知识图谱确定一基础 知识图谱; 对所述基础知识图谱进行加密处理, 得到预设知识图谱; 其中, 所述加密处理采用的加 密算法与所述对所述文本数据进行加密时采用的加密算法一 致。 7.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述根据 所述密态关键 词, 对所述预设知识图谱进行分割, 得到密态子图的步骤 包括: 根据所述密态关键词, 在所述预设知识图谱中匹配与所述密态关键词对应的实体, 获权 利 要 求 书 1/2 页 2 CN 114528588 A 2得知识节点; 在所述预设知识图谱中, 以所述知识节点为中心, 根据预设裁剪距离进行分割, 得到密 态子图; 其中, 所述预设裁剪距离的长度单位为两个实体之间的边, 所述密态子图为以所述 知识节点为中心的预设裁 剪距离范围内的实体与边的集 合。 8.一种跨模态隐私语义表征装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取多模态数据; 文本描述模块, 用于根据所述多模态数据, 获得对应的文本数据; 关键词提取模块, 用于对所述文本数据进行关键词提取和 加密, 得到密态关键词; 图谱分割模块, 用于根据 所述密态关键词, 对所述预设知识图谱进行分割, 得到密态子 图; 图嵌入模块, 用于对所述密态子 图进行图嵌入, 得到与所述密态关键词对应的密态表 征向量, 以得到所述多模态数据的语义表征 结果。 9.一种跨模态隐私语义表征设备, 其特征在于, 所述跨模态隐私语义表征设备包括存 储器和处理器, 所述存储器上存储有跨模态隐私语义表征程序, 该跨模态隐私语义表征程 序被所述处 理器执行时, 实现如权利要求1至7中任一项所述的跨模态隐私语义表征 方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 可被一个或多个处理器执行, 以实现如权利要求 1至7中任一项 所述的跨模态隐私 语义表征 方法。权 利 要 求 书 2/2 页 3 CN 114528588 A 3
专利 跨模态隐私语义表征方法、装置、设备及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:33:45
上传分享
举报
下载
原文档
(692.5 KB)
分享
友情链接
GB-T 1871.5-2022 磷矿石和磷精矿中氧化镁含量的测定 火焰原子吸收光谱法、容量法和电感耦合等离子体发射光谱法.pdf
GB-T 43439-2023 信息技术服务 数字化转型 成熟度模型与评估.pdf
NY-T 1236-2006 绵、山羊生产性能测定技术规范.pdf
雾帜智能 TOP 10 SOAR 安全剧本最佳实践520.pdf
GB-T 26695-2011 家具用钢化玻璃板.pdf
2022-2023 年中国信创生态及信创PC市场发展研究报告.pdf
GB-T 23889-2009 家用空气源热泵辅助型太阳能热水系统技术条件.pdf
DB33-T 2495-2022 中华蜜蜂饲养技术规范 浙江省.pdf
奇安信 API安全能力建设桔皮书.pdf
美创 数据安全解决方案简介.pdf
企业软件安全开发实践 培训材料.pdf
T-CTSS 1—2018 白茶仓储规范.pdf
T-SSCE 0001—2021 关于团体标准 轴力自动补偿钢支撑技术规程 报批稿 的批复.pdf
T-CASME 665—2023 乡村居住建筑节能设计规范.pdf
T-ZSA 152—2023 自动驾驶出租汽车测试运营规范与安全管理要求.pdf
信通院 联邦学习应用安全研究报告 2023年.pdf
GB-T 37433-2019 低功率燃油燃烧器通用技术要求.pdf
360 新一代XDR-面向未来的数字安全防御架构.pdf
GB-T 7344-2015 交流伺服电动机通用技术条件.pdf
T-CSEIA 1003—2023 能源工业互联网平台 发电侧电力数据的分类分级规范.pdf
交流群
-->
1
/
20
评价文档
赞助2元 点击下载(692.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。