(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210065479.1
(22)申请日 2022.01.20
(71)申请人 北京北大英华科技有限公司
地址 100080 北京市海淀区中关村大街27
号中关村大厦9层901-902室
(72)发明人 梁鸿翔
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
代理人 李慧引
(51)Int.Cl.
G06F 16/335(2019.01)
G06F 40/194(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06F 16/35(2019.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 50/18(2012.01)
(54)发明名称
一种基于复合投票机制的类案推送方法及
装置
(57)摘要
本申请公开了一种基于复合投票机制的类
案推送方法及装置, 将信息网络输入至预设的非
监督学习模 型中, 得到与案情描述之间的相似度
大于预设阈值的多个裁判文书。 将 案情描述的文
本嵌入矩阵, 输入至监督学习模型中, 得到案情
描述的罪名。 将与案情描述之间的相似度大于预
设阈值的多个裁判文书、 以及案情描述的罪名,
作为投票机制的参考依据, 并利用投票机制从各
个裁判文书中选取出目标裁判文书, 作为对外推
送的裁判文书。 将非监督学习模型的输出结果
(即与案情描述之间的相似度大于预设阈值的多
个裁判文书)、 以及监督学习模型的输出结果, 作
为投票机制的参考依据, 并利用投票机制从各个
裁判文书中选取出目标裁判文书, 能显著提高类
案推送的准确性。
权利要求书2页 说明书12页 附图5页
CN 114416965 A
2022.04.29
CN 114416965 A
1.一种基于复合投票机制的类案推送方法, 其特 征在于, 包括:
将信息网络输入至预设的非监督学习 模型中, 得到与案情描述之间的相似度 大于预设
阈值的多个裁判文书; 所述信息网络基于所述案情描述、 所述裁判文书、 以及案件实体之间
的关联关系 预先构建; 所述关联关系基于预设的文本嵌入模型对所述案前描述、 以及所述
裁判文书进行案件实体识别得到;
将所述案情描述的文本嵌入矩阵, 输入至监督学习模型中, 得到所述案情描述的罪名;
所述监督学习模型基于样本裁判文书的文本嵌入矩阵预先训练得到; 所述案情描述的文本
嵌入矩阵, 基于所述文本嵌入 模型对所述案情描述进行文本嵌入矩阵化得到;
将所述与案情描述之间的相似度大于预设阈值的多个裁判 文书、 以及所述案情描述的
罪名, 作为投票机制的参考依据, 并利用所述投票机制从各个所述裁判文书中选取出目标
裁判文书, 作为对外推送的裁判文 书。
2.根据权利要求1所述的方法, 其特征在于, 所述利用所述投票机制从各个所述裁判 文
书中选取 出目标裁判文 书, 作为对外推送的裁判文 书, 包括:
所述投票机制, 用于:
预先统计各个所述裁判文书的罪名, 得到罪名序列; 其中, 所述罪名序列中的各项罪
名, 依据所包 含的裁判文 书的数量从多到少的顺序进行排序;
在所述案情描述的罪名位于所述罪名 序列的前m位, 且位于所述罪名 序列中第一序位
的罪名所包含的裁判文书的数量大于预设数值的情况下, 按照所述裁判文书与所述案情描
述之间的相似度从高到低的顺序, 对所述第一序位的罪名所包含的多个裁判文书进行排
序, 得到第一文书序列, 并将所述第一文书序列中前k位的裁判文书, 作为目标裁判文书; 其
中, m和k均为 正整数。
3.根据权利要求2所述的方法, 其特 征在于, 还 包括:
所述投票机制, 还用于:
在所述案情描述的罪名位于所述罪名 序列的前m位, 且位于所述罪名 序列中第一序位
的罪名所包含的裁判文书的数量不大于所述预设数值的情况下, 按照所述裁判文书与所述
案情描述之 间的相似度从 高到低的顺序, 对所述案情描述的罪名所包含的多个裁判文书进
行排序, 得到第二文书序列, 并第二文书序列中前k位的裁判文书, 作为目标裁判文书; 其
中, m和k均为 正整数。
4.根据权利要求2所述的方法, 其特 征在于, 还 包括:
所述投票机制, 还用于:
在所述案情描述的罪名没有位于所述罪名 序列的前m位的情况下, 按照所述裁判文书
与所述案情描述之 间的相似度从 高到低的顺序, 对所述与案情描述之 间的相似度大于预设
阈值的多个裁判文书进 行排序, 得到第三文书序列, 并将所述第三文书序列中前k位的裁判
文书, 作为目标裁判文 书; 其中, m和k均为 正整数。
5.根据权利要求1所述的方法, 其特征在于, 所述将信 息网络输入至预设的非监督学习
模型中, 得到与案情描述之间的相似度大于预设阈值的多个裁判文 书, 包括:
将信息网络输入至预设的非监督学习模型中, 得到案情描述的网络表示、 以及各个裁
判文书的网络表示;
针对每个裁判文书, 基于所述案情描述的网络表示、 以及所述裁判 文书的网络表示, 计权 利 要 求 书 1/2 页
2
CN 114416965 A
2算所述裁判文 书与所述案情描述之间的相似度;
按照所述裁判 文书与所述案情描述之间的相似度从高到低的顺序, 对各个所述裁判 文
书进行排序, 得到文 书序列;
确定所述文 书序列中前n 位的裁判文 书均大于预设阈值; 其中, n 为正整数。
6.根据权利要求1所述的方法, 其特 征在于, 还 包括:
从所述信息网络中获取与新建裁判文 书关联的各个案件实体的向量表示;
计算各个所述案件实体的向量表示的算 术平均, 得到所述 新建裁判文 书的网络表示;
基于所述案情描述的网络表示、 以及所述新建裁判文书的网络表示, 计算所述新建裁
判文书与所述案情描述之间的相似度;
在所述新建裁判 文书与所述案情描述之间的相似度 大于所述预设阈值的情况下, 将所
述新建裁判文 书纳入所述 参考依据。
7.一种基于复合投票机制的类案推送装置, 其特 征在于, 包括:
网络筛选单元, 用于将信息网络输入至预设的非监督学习模型中, 得到与案情描述之
间的相似度大于预设阈值的多个裁判文书; 所述信息网络基于所述案情描述、 所述裁判文
书、 以及案件实体之间的关联关系 预先构建; 所述关联关系基于预设的文本嵌入模型对所
述案前描述、 以及所述裁判文 书进行案件实体识别得到;
罪名预测单元, 用于将所述案情描述的文本嵌入矩阵, 输入至监督学习模型中, 得到所
述案情描述的罪名; 所述监督学习模型基于样本裁判文书的文本嵌入矩阵预先训练得到;
所述案情描述的文本嵌入矩阵, 基于所述文本嵌入模型对所述案情描述进 行文本嵌入矩阵
化得到;
投票筛选单元, 用于将所述与案情描述之间的相似度大于预设阈值的多个裁判文书、
以及所述案情描述的罪名, 作为投票机制的参考依据, 并利用所述投票机制从各个所述裁
判文书中选取 出目标裁判文 书, 作为对外推送的裁判文 书。
8.根据权利要求7 所述的装置, 其特 征在于, 还 包括:
文书筛选单元, 用于从所述信 息网络中获取与新建裁判 文书关联的各个案件实体的向
量表示; 计算各个所述案件实体的向量表示的算术平均, 得到所述新建裁判文书的网络表
示; 基于所述案情描述的网络表示、 以及所述新建裁判文书的网络表示, 计算所述新建裁判
文书与所述案情描述之 间的相似度; 在所述新建裁判文书与所述案情描述之间的相似度大
于所述预设阈值的情况 下, 将所述 新建裁判文 书纳入所述 参考依据。
9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的程序,
其中, 所述 程序执行权利要求1 ‑6任一所述的基于复合投票机制的类案推送方法。
10.一种基于复合投票机制的类案推送设备, 其特征在于, 包括: 处理器、 存储器和总
线; 所述处 理器与所述存 储器通过 所述总线连接;
所述存储器用于存储程序, 所述处理器用于运行程序, 其中, 所述程序运行时执行权利
要求1‑6任一所述的基于复合投票机制的类案推送方法。权 利 要 求 书 2/2 页
3
CN 114416965 A
3
专利 一种基于复合投票机制的类案推送方法及装置
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:50上传分享