公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210082425.6 (22)申请日 2022.01.24 (71)申请人 平安科技 (深圳) 有限公司 地址 518057 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 张跃威 文浩宇  (74)专利代理 机构 深圳市力道知识产权代理事 务所(普通 合伙) 44507 代理人 张传义 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 灾害事件的描述文本处理方法、 装置、 设备 及存储介质 (57)摘要 本申请提供一种灾害事件的描述文本处理 方法、 装置、 设备及计算机 可读存储介质, 该方法 包括: 从源终端获取目标灾害事件的描述文本; 基于分词模型, 对描述文本进行分词, 得到多个 关键词; 基于语义泛化模型, 对关键词进行语义 泛化处理, 得到与关键词对应的属性概念词, 属 性概念词用于描述关键词的属性或类别; 基于实 体词数据库, 对属性概念词进行实体匹配, 得到 与属性概念词对应的实体词, 实体词为与属性概 念词的属性或类别关联的词; 根据实体词确定泛 化事件描述文本, 并发送至目标终端。 通过对描 述文本的泛化过程进行约束得到泛化事件描述 文本的同时, 提高泛化事件描述文本的置信度。 本申请还涉及区块链技术, 泛化事件描述文本可 以存储于区块链中。 权利要求书2页 说明书14页 附图3页 CN 114417865 A 2022.04.29 CN 114417865 A 1.一种灾害事 件的描述文本处 理方法, 其特 征在于, 包括: 从源终端获取目标灾害事 件的描述文本; 基于分词模型, 对所述描述文本进行分词, 得到多个关键词; 基于语义泛化模型, 对所述关键词进行语义泛化处理, 得到与所述关键词对应的属性 概念词, 其中, 所述属性 概念词用于描述所述关键词的属性或类别; 基于实体词数据库, 对所述属性概念词进行实体匹配, 得到与所述属性概念词对应的 实体词, 其中, 所述实体词为与所述属性 概念词的属性或类别关联的词; 根据所述实体词确定泛化事件描述文本, 并将所述泛化事件描述文本发送至目标终 端。 2.如权利要求1所述的灾害事件的描述文本处理方法, 其特征在于, 在所述基于语义泛 化模型, 对所述关键词进行语义泛化处 理之前, 还 包括: 基于词根确定模型, 确定各 所述关键词的词根; 基于预设语法模板, 根据各所述关键词之间的位置关系以及各所述关键词的词根确定 每一个所述关键词的词性; 所述基于语义泛化模型, 对所述关键词进行语义泛化处理, 得到与所述关键词对应的 属性概念词, 包括: 基于语义泛化模型, 根据所述关键词的词性对所述关键词进行语义泛化处理, 得到与 所述关键词对应的属性 概念词。 3.如权利要求2所述的灾害事件的描述文本处理方法, 其特征在于, 所述根据 所述关键 词的词性, 对所述关键词进行语义泛化处 理, 得到与所述关键词对应的属性 概念词, 包括: 确定与词性为动词的关键词相邻的多个待选关键词, 并在多个所述待选关键词中, 将 词性为名词的关键词作为目标关键词; 将所述目标关键词映射至语义映射网络中, 确定所述目标关键词对应的属性 概念词。 4.如权利要求1所述的灾害事件的描述文本处理方法, 其特征在于, 所述对所述关键词 进行语义泛化处 理, 得到与所述关键词对应的属性 概念词, 包括: 基于所述语义泛化模型的语义映射网络, 确定所述关键词对应的待选属性概念词, 以 及确定所述待选属性 概念词的数目; 若所述关键词对应的待选属性概念词的数目大于或等于预设数目阈值, 则对多个所述 待选属性 概念词进行词义消歧处 理, 得到所述关键词对应的属性 概念词。 5.如权利要求4所述的灾害事件的描述文本处理方法, 其特征在于, 所述对多个所述待 选属性概念词进行词义消歧处 理, 得到所述关键词对应的属性 概念词, 包括: 基于预设与余弦相似度计算公式, 将所述关键词与各所述待选属性概念词 进行相似度 计算, 得到所述关键词和各 所述待选属性 概念词的相似值; 确定所述相似值最高的待选属性概念词, 并将相似值最高的待选属性概念词作为所述 关键词对应的属性 概念词。 6.如权利要求1 ‑3任一项所述的灾害事件的描述文本处理方法, 其特征在于, 所述实体 词数据库包括至少两个层 级, 且每一层级包括多个实体词, 所述基于实体词数据库, 对所述 属性概念词进行实体匹配, 得到与所述属性 概念词对应的实体词, 包括: 在所述实体词数据库中确定所述属性概念词所处的第 一层级, 所述属性概念词对应的权 利 要 求 书 1/2 页 2 CN 114417865 A 2多个待选实体词, 以及各 所述待选实体词所处的第二层级; 基于预设词义相似度计算公式, 根据所述第一层级和所述第二层级, 得到所述属性概 念词与各 所述待选实体词的词义相似度; 确定词义相似度最高的待选实体词, 并将词义相似度最高的待选实体词作为所述属性 概念词对应的实体词。 7.如权利要求1 ‑3任一项所述的灾害事件的描述文本处理方法, 其特征在于, 在所述根 据所述实体词确定泛化事 件描述文本之后, 还 包括: 基于事件关联度计算模型, 对所述描述文本和所述泛化事件描述文本进行事件关联度 计算, 得到所述 灾害事件和所述 灾害事件的泛化事 件之间的关联强度数值; 根据所述关联强度数值, 确定所述泛化事 件描述文本是否符合需求; 若确定所述泛化事件描述文本符合需求, 则向所述源终端发送用于指示所述泛化事件 描述文本符合需求的文本泛化成功信息 。 8.一种灾害事件的描述文本处理装置, 其特征在于, 所述灾害事件的描述文本处理装 置包括: 文本获取模块, 用于从源终端获取目标灾害事 件的描述文本; 文本分词模块, 用于基于分词模型, 对所述描述文本进行分词, 得到多个关键词; 属性概念词确定模块, 用于基于语义泛化模型, 对所述关键词进行语义泛化处理, 得到 与所述关键词对应的属 性概念词, 其中, 所述属 性概念词用于描述所述关键词的属 性或类 别; 实体词确定模块, 用于基于实体词数据库, 对所述属性概念词进行实体匹配, 得到与所 述属性概念词对应的实体词, 其中, 所述实体词为与所述属 性概念词的属 性或类别 关联的 词; 文本生成模块, 用于根据所述实体词确定泛化事件描述文本, 并将所述泛化事件描述 文本发送至目标终端。 9.一种计算机设备, 其特征在于, 所述计算机设备包括处理器、 存储器、 以及存储在所 述存储器上并可被所述处理器执行的计算机程序, 其中所述计算机程序被所述处理器执行 时, 实现如权利要求1至7中任一项所述的灾害事 件的描述文本处 理方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机 程序, 其中所述计算机程序被处理器执行时, 实现如权利要求1至7中任一项所述的灾害事 件的描述文本处 理方法的步骤。权 利 要 求 书 2/2 页 3 CN 114417865 A 3

PDF文档 专利 灾害事件的描述文本处理方法、装置、设备及存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 灾害事件的描述文本处理方法、装置、设备及存储介质 第 1 页 专利 灾害事件的描述文本处理方法、装置、设备及存储介质 第 2 页 专利 灾害事件的描述文本处理方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。