公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210073114.3 (22)申请日 2022.01.21 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 胡意仪 阮晓雯 陈远旭  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 代理人 廖慧贤 (51)Int.Cl. G06K 9/62(2022.01) G06F 40/30(2020.01) G06F 40/295(2020.01) G16H 50/70(2018.01) (54)发明名称 模型的训练方法、 数据处理方法和装置、 设 备、 介质 (57)摘要 本实施例提供一种模 型的训练方法、 数据处 理方法和装置、 设备、 介质, 属于人工智能技术领 域, 包括: 获取中医疾病与证型训练集、 中医诊断 规则数据、 第一症状实体数据和症状实体归一化 数据; 对中医疾病与证型训练集、 中医诊断规则 数据和症状实体归一化数据进行数据匹配处理, 得到种子症状实体数据; 根据种子症状实体数 据, 对第一症状实体数据进行数据提取处理, 得 到非种子症状实体数据; 根据种子症状实体数 据、 非种子症状实体数据、 中医疾病与证型训练 集、 中医诊断规则数据、 第一症状实体数据和预 设训练规则对 预设的预测模型进行训练处理, 得 到目标矩阵预测模型。 本实施例能够提高症状实 体数据的准确性, 保证中 医疾病智能决策效果。 权利要求书3页 说明书14页 附图8页 CN 114399001 A 2022.04.26 CN 114399001 A 1.一种模型的训练方法, 其特征在于, 用于训练目标矩阵预测模型, 所述训练方法包 括: 获取中医疾病与证型训练集、 中医诊断规则数据、 第一症状实体数据和症状实体归一 化数据; 对所述中医疾病与证型训练集、 所述中医诊断规则数据和所述症状实体归一化数据进 行数据匹配处 理, 得到种子症状实体数据; 根据所述种子症状实体数据, 对所述第一症状实体数据进行数据提取处理, 得到非种 子症状实体数据; 根据所述种子症状实体数据、 所述非种子症状实体数据、 所述中医疾病与证型训练集、 所述中医诊断规则数据、 所述第一症状实体数据和预设训练规则对预设的预测模型进 行训 练处理, 得到所述目标矩阵预测模型, 其中, 所述目标矩阵预测模型用于生成目标参数矩 阵。 2.根据权利要求1所述的模型的训练方法, 其特征在于, 所述对所述中医疾病与证型训 练集、 所述中医诊断规则数据和所述症状实体归一化数据进行数据匹配处理, 得到种子症 状实体数据, 包括: 对所述症状实体归一化数据和所述中医疾病与证型训练集进行数据匹配处理, 得到第 一匹配数据; 从所述第一匹配数据中, 提取 得到包含在所述中 医诊断规则数据中的第二匹配数据; 将所述第二匹配数据作为所述种子症状实体数据。 3.根据权利要求1所述的模型的训练方法, 其特征在于, 所述根据 所述种子症状实体数 据, 对所述第一症状实体数据进行 数据提取处 理, 得到非种子症状实体数据, 包括: 根据所述种子症状实体数据, 从所述第一症状实体数据中确定候选匹配数据; 对所述候选匹配数据进行 数据提取处 理, 得到非种子症状实体数据。 4.根据权利要求3所述的模型的训练方法, 其特征在于, 所述对所述候选匹配数据进行 数据提取处 理, 得到非种子症状实体数据, 包括以下至少之一: 根据预设的分词算法和分词字典对所述候选匹配数据进行分词提取处理, 得到所述非 种子症状实体数据; 或者, 根据所述症状实体归一化数据对所述候选匹配数据进行数据匹配处理, 得到所述非种 子症状实体数据; 或者, 根据预设的实体识别模型对所述候选匹配数据进行分类提取处理, 得到所述非种子症 状实体数据。 5.根据权利要求1至4任一项所述的模型的训练方法, 其特征在于, 所述预设训练规则, 包括以下至少之一: 通过所述预测模型对所述种子症状实体数据和所述非种子症状实体数据进行训练处 理, 得到所述种子症状实体数据和所述非种子症状实体数据对应的中 医疾病与证型 标签; 或者, 通过所述预测模型根据所述中医诊断规则数据对所述种子症状实体数据进行训练处权 利 要 求 书 1/3 页 2 CN 114399001 A 2理, 得到所述种子症状实体数据对应的中医诊断规则标签, 其中, 所述中医诊断规则数据包 括所述中医诊断规则标签, 所述中医诊断规则标签包括八纲标签、 病性标签或者病位标签 中的至少一种; 或者, 通过所述预测模型根据第二症状实体数据对所述种子症状实体数据和类别症状实体 数据进行训练处理, 得到所述第二症状实体数据对应所述种子症状实体数据和所述类别症 状实体数据的关联数据, 其中, 所述第二症状实体数据表征属于所述非种子症状实体数据 的所述第一症状实体数据, 所述类别症状实体数据表征与所述种子症状实体数据具有相同 的中医诊断规则标签的中 医诊断规则数据。 6.一种数据处理方法, 其特征在于, 应用于由权利要求1至5任一项所述的模型的训练 方法训练得到的目标矩阵预测模型, 所述 目标矩阵预测模型用于生成目标参数矩阵, 所述 数据处理方法包括: 获取待处 理的第三症状实体数据和符合预设中 医规则的第四症状实体数据; 根据预设的查找函数, 从所述目标参数矩阵中筛选得到与所述第 三症状实体数据对应 的第一向量 参数数据; 根据所述查找函数, 从所述目标参数矩阵中筛选得到与 所述第四症状实体数据对应的 第二向量 参数数据; 根据语义相似度计算方法对所述第一向量参数数据和所述第二向量参数数据进行相 似度处理, 得到所述第一向量 参数数据对应所述第二向量 参数数据的语义相似度数据; 根据所述语义相似度数据, 对所述第一向量参数数据进行筛选处理, 得到与所述第一 向量参数数据对应的第 五症状实体数据, 其中, 所述第三症状实体数据包括所述第 五症状 实体数据, 且所述第五症状实体数据表征不符合所述预设中 医规则; 将所述第五症状实体数据映射到所述第四症状实体数据中。 7.一种模型的训练装置, 其特征在于, 用于训练目标矩阵预测模型, 所述训练装置包 括: 第一获取模块, 用于获取中医疾病与证型训练集、 中医诊断规则数据、 第 一症状实体数 据和症状实体归一 化数据; 数据匹配模块, 用于对所述中医疾病与证型训练集、 所述中医诊断规则数据和所述症 状实体归一 化数据进行 数据匹配处 理, 得到种子症状实体数据; 数据提取模块, 用于根据所述种子症状实体数据, 对所述第一症状实体数据进行数据 提取处理, 得到非种子症状实体数据; 模型训练模块, 用于根据 所述种子症状实体数据、 所述非种子症状实体数据、 所述中医 疾病与证型训练集、 所述中医诊断规则数据、 所述第一症状实体数据和预设训练规则对预 设的预测模型进行训练处理, 得到所述目标矩阵预测模型, 其中, 所述目标矩阵预测模型用 于生成目标参数矩阵。 8.一种数据处理装置, 其特征在于, 应用于由权利要求1至5任一项所述的模型的训练 方法训练得到的目标矩阵预测模型, 所述 目标矩阵预测模型用于生成目标参数矩阵, 所述 数据处理装置包括: 第二获取模块, 用于获取待处理的第 三症状实体数据和符合预设中医规则的第四症状权 利 要 求 书 2/3 页 3 CN 114399001 A 3

PDF文档 专利 模型的训练方法、数据处理方法和装置、设备、介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型的训练方法、数据处理方法和装置、设备、介质 第 1 页 专利 模型的训练方法、数据处理方法和装置、设备、介质 第 2 页 专利 模型的训练方法、数据处理方法和装置、设备、介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。