公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210094425.8 (22)申请日 2022.01.26 (71)申请人 深圳壹账通科技 服务有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 邹倩霞 (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 专利代理师 姚泽鑫 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/34(2019.01) G06F 40/194(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01) (54)发明名称 文本匹配方法、 装置、 终端及存 储介质 (57)摘要 本申请实施例提供一种文本匹配方法、 装 置、 终端及存储介质, 所述方法包括: 获取待匹配 短文本; 对所述待匹配短文本进行过滤处理, 以 得到过滤后的待匹配短文本; 根据特征提取模型 对所述过滤后的待匹配短文本进行特征提取, 以 得到向量特征; 将所述向量特征输入至文本匹配 模型中进行匹配, 以得到与所述待匹配 短文本对 应的目标文本; 展示所述目标文本, 能够提升短 文本匹配时的准确性。 权利要求书2页 说明书10页 附图3页 CN 114490999 A 2022.05.13 CN 114490999 A 1.一种文本匹配方法, 其特 征在于, 所述方法包括: 获取待匹配短文本; 对所述待匹配短文本进行 过滤处理, 以得到过 滤后的待匹配短文本; 根据特征提取模型对所述过 滤后的待匹配短文本进行 特征提取, 以得到向量特 征; 将所述向量特征输入至文本匹配模型中进行匹配, 以得到与 所述待匹配短文本对应的 目标文本; 展示所述目标文本 。 2.根据权利要求1所述的方法, 其特征在于, 所述根据特征提取模型对所述过滤后的待 匹配短文本进行 特征提取, 以得到向量特 征, 包括: 将所述过滤后的待匹配短文本输入至所述特征提取模型的嵌入层进行运算, 得到第 一 运算结果; 将所述第一运算结果输入至所述特征提取模型的卷积池化层进行运算, 以得到第 二运 算结果; 将所述第二运算结果输入至所述特征提取模型的全连接层进行运算, 以得到第 三运算 结果, 以及将所述第三 运算结果确定为所述向量特 征。 3.根据权利要求1或2所述的方法, 其特征在于, 在展示所述目标文本之前, 所述方法还 包括: 获取所述待匹配短文本与所述目标文本之间的目标相似度; 若所述目标相似度低于第 一预设相似度阈值, 则对所述待 匹配短文本和所述目标文本 进行分词处 理, 以得到所述待匹配短文本的第一词集 合和所述目标文本的第二词集 合; 获取所述第 一词集合与所述第 二词集合中对应的词语之间的相似度, 以得到相似度集 合; 获取所述相似度集合中高于第二预设相似度阈值的相似度对应于所述第一词集合中 的词语, 得到参 考词语, 所述第二预设相似度阈值高于所述第一预设相似度阈值; 获取包括所述 参考词语的短文本, 以得到 至少一个参 考短文本; 根据所述至少一个参考短文本和所述第 二词集合中, 确定出与 所述待匹配短文本对应 的短文本; 将与所述待匹配短文本对应的短文本确定为目标文本 。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述至少一个参考短文本, 确定 出与所述待匹配短文本对应的短文本, 包括: 获取所述至少一个参考短文本的语义信 息, 以得到与 所述至少一个参考短文本对应的 参考语义信息; 获取所述待匹配短文本的目标语义信息; 根据所述目标语义信 息和所述至少一个参考短文本对应的参考语义信 息, 从所述至少 一个参考短文本中确定出与所述待匹配短文本对应的短文本 。 5.根据权利要求3所述的方法, 其特征在于, 所述根据所述至少一个参考短文本, 确定 出与所述待匹配短文本对应的短文本, 包括: 获取所述至少一个参考短文本的语义信 息, 以得到与 所述至少一个参考短文本对应的 参考语义信息;权 利 要 求 书 1/2 页 2 CN 114490999 A 2对所述至少一个参考短文本对应的参考语义信息进行融合处理, 以得到目标语义信 息; 根据所述目标语义信息对所述目标文本进行调整, 以得到调整后的目标文本; 将所述调整后的目标文本, 确定为与所述待匹配短文本对应的短文本 。 6.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括: 对所述待匹配短文本进行去感叹词处 理, 以得到第一处 理文本; 对所述第一处 理文本进行语义结构分析, 以得到所述第一处 理文本的语义结构; 根据所述语义结构对所述目标文本进行 校验, 以得到校验结果; 展示所述校验结果。 7.一种文本匹配装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取待匹配短文本; 过滤单元, 用于对所述待匹配短文本进行 过滤处理, 以得到过 滤后的待匹配短文本; 提取单元, 用于根据特征提取模型对所述过滤后的待匹配短文本进行特征提取, 以得 到向量特 征; 匹配单元, 用于将所述向量特征输入至文本匹配模型中进行匹配, 以得到与所述待匹 配短文本对应的目标文本; 展示单元, 用于展示所述目标文本 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述 提取单元用于: 将所述过滤后的待匹配短文本输入至所述特征提取模型的嵌入层进行运算, 得到第 一 运算结果; 将所述第一运算结果输入至所述特征提取模型的卷积池化层进行运算, 以得到第 二运 算结果; 将所述第二运算结果输入至所述特征提取模型的全连接层进行运算, 以得到第 三运算 结果, 以及将所述第三 运算结果确定为所述向量特 征。 9.一种终端, 其特征在于, 包括处理器、 输入设备、 输出设备和存储器, 所述处理器、 输 入设备、 输出设备和存储器相互连接, 其中, 所述存储器用于存储计算机程序, 所述计算机 程序包括程序指 令, 所述处理器被配置用于调用所述程序指 令, 执行如权利要求 1‑6任一项 所述的方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序包括程序指令, 所述程序指令当被处理器执行时使所述处理器执行如 权利要求1 ‑6任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114490999 A 3
专利 文本匹配方法、装置、终端及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:33:42
上传分享
举报
下载
原文档
(668.5 KB)
分享
友情链接
GB-T 38645-2020 信息安全技术 网络安全事件应急演练指南.pdf
DB3308-T 026-2015 衢州市河道生态治理导则 衢州市.pdf
GB-T 29314-2023 电动机系统节能改造规范.pdf
T-CFA 02010120.1—2017 耐低温耐大气腐蚀铸钢件.pdf
GB-T 33592-2017 分布式电源并网运行控制规范.pdf
T-CHES 54—2021 取水权交易可行性报告编制导则.pdf
中汽研汽车检验中心 汽车个人信息保护白皮书 2022.pdf
DB32-T 4659.2-2024 医院公共卫生工作规范 第2部分:疾控机构医防融合工作指南 江苏省.pdf
CH-T 4024-2019 《城市政务电子地图更新技术规范》.pdf
DB63-T 2010.1-2022 涉路行为标准化规范 第1部分:技术导则 青海省.pdf
GB-T 26834-2011 无损检测仪器 小焦点及微焦点X射线管有效焦点尺寸测量方法.pdf
GB-T 28055-2023 钢质管道带压封堵技术规范.pdf
T-SZUAVIA 001—2021 低慢小无人机探测反制系统通用要求.pdf
GB-T 12962-2015 硅单晶.pdf
T-CEC 729—2022 户用光伏发电系统运行规程.pdf
T-CFA 031103.4—2018 铸造工艺数字化设计通用要求.pdf
TB-T 30001-2020 铁路接发列车作业.pdf
T-CADERM 3008—2019 严重过敏反应诊断和早期治疗规范.pdf
GB-T 25647-2010 电子政务术语.pdf
T-CSTM 00411—2021 化学试剂 苯甲醇.pdf
交流群
-->
1
/
16
评价文档
赞助2元 点击下载(668.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。