公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111670144.4 (22)申请日 2021.12.3 0 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融大街31号 (72)发明人 仲籽彦 龚滨 魏丫丫 张明哲  洪迪  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 代理人 苏培华 (51)Int.Cl. G06F 40/205(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种会话信息切割方法和装置 (57)摘要 本发明实施例提供了一种会话信息切割方 法和装置, 所述方法包括: 计算采集的历史行为 数据中包含的至少一种类型的元事件的停留时 长; 所述元事件为用户行的最小单元; 针对每一 类型的元事件, 抽取预设数量的元事件作为样本 集合; 提取所述样本集合中所述元事件的特征数 据; 采用所述样本集合以及所述特征数据对预设 的深度学习模型进行训练, 得到目标模型; 在获 取到待切割行为数据时, 采用所述目标模型对所 述待切割行为数据进行处理, 得到会话信息。 本 发明实施例能够实现采用历史行为数据训练得 到目标模型, 采用目标模型输出与待切割行为数 据匹配的会话信息, 以实现智能化切割行为数据 得到会话信息 。 权利要求书2页 说明书10页 附图3页 CN 114417817 A 2022.04.29 CN 114417817 A 1.一种会话信息切割方法, 其特 征在于, 包括: 计算采集的历史行为数据中包含的至少一种类型的元事件的停留时长; 所述元事件为 用户行的最小单 元; 针对每一类型的元事 件, 抽取预设数量的元事 件作为样本集 合; 提取所述样本集 合中所述元事 件的特征数据; 采用所述样本集合以及所述特征数据对预设的深度学习模型进行训练, 得到目标模 型; 在获取到待切割行为数据时, 采用所述目标模型对所述待切割行为数据进行处理, 得 到会话信息 。 2.根据权利要求1所述的方法, 其特征在于, 在所述抽取预设数量的元事件作为样本集 合的步骤之后, 所述方法还 包括: 按照三西格玛准则对所述样本集 合进行数据清洗 。 3.根据权利要求2所述的方法, 其特征在于, 在所述采用所述样本集合以及所述特征数 据对预设的深度学习模型进行训练, 得到目标模型之前, 所述方法还 包括: 对清洗后的样本集 合进行线性变换, 以对所述清洗后的样本集 合进行标准化处理。 4.根据权利要求3所述的方法, 其特征在于, 所述采用所述样本集合以及所述特征数据 对预设的深度学习模型进行训练, 得到目标模型的步骤, 包括: 按照预设比例将经 过所述标准 化后处理的样本集 合划分训练集和 测试集; 构建与所述深度学习模型匹配的整体损失函数; 采用所述训练集对所述深度学习模型进行训练, 得到已训练的深度学习模型, 以及训 练信息; 采用所述已训练的深度学习模型对所述训练集进行 预测, 得到预测结果; 依据所述测试集、 所述训练信息、 所述预测结果和所述整体损失函数, 计算整体损失 值; 当所述整体损失值小于预设目标值时, 确定所述已训练的深度学习模型为目标模型。 5.根据权利要求 4所述的方法, 其特 征在于, 所述训练信息包 含迭代次数; 所述整体损失函数为: N为迭代次数, L1为置信度损失函数, x 为预测结果以及测试集 之间的距 离, c为置信 度, l 为预测结果, g为测试集, L2为欧式距离损失函数。 6.根据权利要求3所述的方法, 其特征在于, 所述深度学习模型包括: 输入层、 4个数据 处理层以及输出层; 所述数据处 理层包括3 *3卷积层、 池化层以及sigmo id层。 7.根据权利要求1所述的方法, 其特征在于, 所述深度学习模型还包括第一选择单元、 第二选择单元、 第一数据融合单元、 第二数据融合单元、 第三数据融合单元; 所述第一数据 融合单元、 第二数据融合单 元、 第三数据融合单 元依次设置 于所述4个数据处 理层之间; 所述第一选择单元用于将所述第二数据融合单元输出的特征数据传递至所述第一数 据融合单 元或者第三数据融合单 元;权 利 要 求 书 1/2 页 2 CN 114417817 A 2所述第二选择单元用于将所述输入层输出的特征数据传递至所述第一数据融合单元 或者第二数据融合单 元。 8.一种会话信息切割装置, 其特 征在于, 包括: 元事件停留时长计算模块, 用于计算采集的历史行为数据中包含的至少一种类型的元 事件的停留时长; 所述元事 件为用户行的最小单 元; 数据采样模块, 用于针对每一类型的元事 件, 抽取预设数量的元事 件作为样本集 合; 特征提取模块, 用于提取 所述样本集 合中所述元事 件的特征数据; 模型训练模块, 用于采用所述样本集合以及所述特征数据对预设的深度 学习模型进行 训练, 得到目标模型; 模型预测模块, 用于在获取到待切割行为数据时, 采用所述目标模型对所述待切割行 为数据进行处 理, 得到会话信息 。 9.一种电子设备, 其特征在于, 包括: 处理器、 存储器及存储在所述存储器上并能够在 所述处理器上运行的计算机程序, 所述计算机程序被所述处理器执行时实现如权利要求 1‑ 7中任一项所述的会话信息切割方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储计算机程 序, 所述计算机程序被处理器执行时实现如权利要求 1至7中任一项 所述的会话信息切割方 法的步骤。权 利 要 求 书 2/2 页 3 CN 114417817 A 3

.PDF文档 专利 一种会话信息切割方法和装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种会话信息切割方法和装置 第 1 页 专利 一种会话信息切割方法和装置 第 2 页 专利 一种会话信息切割方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:54:26上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。