(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210085516.5
(22)申请日 2022.01.25
(71)申请人 浙江大学
地址 310058 浙江省杭州市西湖区余杭塘
路866号
(72)发明人 赵亚萍 龙诗颖 周灵智 王勇超
(74)专利代理 机构 杭州天勤知识产权代理有限
公司 33224
专利代理师 胡红娟
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/253(2020.01)
G06F 40/211(2020.01)
G06F 40/44(2020.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于条件变分自编码器的诗歌生成方
法及系统
(57)摘要
本发明公开了一种基于条件变分自编码器
的诗歌生成方法, 包括: S1获取关键词, 并生成对
应的关键词语义向量, 所述关键词包括待生成诗
歌的主题信息; S2将S1中获取的关键词语义向量
与诗歌库中存储的语义向量进行采样, 生成包括
多首诗歌的候选集; S3根据所述候选集中诗歌语
义向量与所述关键词语义向量, 计算获得隐层变
量; S4根据关键词语义向量, 上下文语义向量以
及S3中获得的隐层变量, 生成诗歌。 本发明还公
开了一种基于上述方法的诗歌生成系统。 通过本
发明的方法可以避免过度翻译的问题, 通过扩充
关键词的语义信息, 获得语句通顺且 具有一定风
格的高质量诗歌 。
权利要求书1页 说明书5页 附图2页
CN 114510947 A
2022.05.17
CN 114510947 A
1.一种基于条件变分自编码器的诗歌生成方法, 其特 征在于, 包括:
S1获取关键词, 并生成对应的关键词语义向量, 所述关键词包括待生成诗歌的主题信
息;
S2将S1中获取的关键词语义向量与诗歌库中诗歌的语义向量进行采样, 得到包括多首
诗歌的候选集;
S3根据所述 候选集中诗歌语义向量与所述关键词语义向量, 计算获得隐层变量;
S4根据关键词语义向量, 上 下文语义向量以及S3中获得的隐层变量, 生成诗歌 。
2.根据权利要求1所述的诗歌生成方法, 其特征在于, 所述诗歌库: 通过提前收集的一
定量诗歌与对应的关键词, 采用双向GRU循环神经网络进行编码, 获得诗歌对应的语义向
量, 存储在所述诗歌库中。
3.根据权利要求1所述的诗歌生成方法, 其特 征在于, 所述S2具体为:
S2.1将输入的关键词语义向量, 与诗歌库中诗歌的语义向量计算相似度;
S2.2基于相似度, 采样一定量诗歌作为 候选集。
4.根据权利要求1所述的诗歌生成方法, 其特 征在于, 所述S3具体过程 为:
S3.1通过全概 率公式计算所述 候选集中诗歌的后验概 率分布;
S3.2计算 候选集中诗歌后验概 率分布的期望与方差;
S3.3基于候选集中诗歌后验概 率分布的期望与方差, 计算诗歌的先验概 率分布;
S3.4根据S3.3计算获得 先验概率分布, 利用重参数技巧计算获得隐层变量。
5.根据权利要求1所述的诗歌生成方法, 其特 征在于, 所述S4中生成诗歌的具体过程:
S4.1初始设置上 下文语义向量 为0;
S4.2通过上下文语义向量, 关键词向量与隐层变量映射到高维抽象语义空间, 生成当
前诗行;
S4.3通过一维卷积核co nv1*d和当前生成诗 行作卷积, 获得新的上 下文语义向量;
S4.4基于S4.3获得的上 下文语义向量, 重复S4.2获得最终诗歌 。
6.一种实施权利要求1 ‑5任一所述的诗歌生成方法的系统, 包括:
输入模块, 用于将获取的关键词向量 化;
诗歌库模块, 根据关键词语义向量从诗歌库中采样一定量的相关诗歌;
先验概率计算模块, 根据诗歌库中的相关诗歌计算诗歌的先验概率分布, 为关键词补
充语义信息;
后验概率计算模块, 用于修 正先验概 率计算模块中相关诗歌的先验概 率分布;
诗歌生成模块, 根据先验概 率计算模块补充的语义信息, 生成诗歌 。
7.根据权利要求6所述的系统, 其特征在于, 所述系统是基于条件变分自编码器搭建,
通过双向GRU循环神经网络进行训练获得。
8.根据权利要求6所述的系统, 其特征在于, 所述修正是通过KL散度函数评估先验概率
分布与后验概率分布的相似度, 利用反向传播算法更新先验概率计算模块与后验概率计算
模块的概 率分布情况。权 利 要 求 书 1/1 页
2
CN 114510947 A
2一种基于条件变分自编码器的诗歌生成方 法及系统
技术领域
[0001]本发明涉及深度学习与自然语言处理技术领域, 具体涉及一种基于条件变分自编
码器的诗歌生成方法及系统。
背景技术
[0002]古典诗歌是中国文化遗产的重要组成部分。 它们被运用在日常生活的方方面面,
比如可以将其作为表达个人情感, 政治观点或在节日和葬礼上传达信息的手段。 中国古典
诗歌的创作必须满足一系列的结构, 音调, 音韵和语义要求, 种种严 苛的限制让中 国古典诗
歌创作成为了一项艰巨的任务。 以绝句为例, 绝句有四行, 每行五到七个字符, 字符在每一
行内和行与行之 间遵循特定的音调和音韵模式。 例如, 第二, 第四和 第一行(可选)中的最后
一个字符必须押韵, 而第三行却没有押韵约束。 此外, 诗歌必须遵循规定的音调模式。 在中
文中, 每个字符都有一个音调, 即Ping(水平音调)或Ze(向下音调)。 以五言绝句为例, 常见
的音调模式如“*ZPPZ, PPZZP, *PPZZ,*ZZPP ”, 其中*表示可以为任意音调。 除了遵守上述格
式标准外, 诗歌还必须表现出简洁, 准确的语言使用方式, 并表达自己的情感。
[0003]然而, 大多数人由于缺少专业训练, 缺乏在长度有限且格式受限的文本中表达丰
富情感的能力。 因此, 研究如何利用计算机自动生成诗歌吸引了越来越多研究人员的注意。
当前的诗歌生成方法根据用户提供的关键词生成诗歌。 关键词由有限数量的字符或词组
成, 一般为2 ‑6个字符。 然而, 由于生 成诗歌的字符数是关键词字符数的两倍以上, 字 符数量
的巨大差距导致模型输入和模型输出的语义信息差距过大, 进而给诗歌生成模型带来了过
翻译问题: 某些字或词会无意义的连续出现, 一般为两次。 诗歌创作手法之一叠词的表现形
式和过翻译问题的表现形式一致, 无法简单 的根据语法规则进行分辨。 而叠词可以增加诗
歌的韵律性和节奏感, 单纯在模型生成过程中加以限制 字符或词的重复次数, 虽然能够缓
解过翻译问题, 但也会导 致叠词的消失, 降低诗歌的美感。
[0004]专利文献CN108563622B公开了一种具有风格多样 性的绝句生成方法及装置, 所述
方法包括获取生成绝句的首句, 将首句的文字序列转化成首句向量, 将首句向量和表示绝
句风格类型的单热向量拼接之后得到的第一向量输入到预先建立好的绝句生成模型中, 得
到多首具有不同风格的绝句 。 该发明需要提供具体的诗句内容, 在一定程度上增大了操作
员的工作量, 降低了诗歌生成的效率。
[0005]专利文献CN109582952A公开了一种诗歌生成方法、 装置、 计算机设备和介质, 包括
基于条件变分自编 码器(CVAE)构建的诗歌生 成模型, 通过诗歌生成模型对诗歌描述文本进
行解析获得文本特征向量, 并至少根据诗歌描述文本的文本特征向量获得第一诗句; 根据
诗歌描述文本的文本特征向量以及第一诗句的诗句特征向量确定上下文向量; 根据上下文
向量获得先验分布并获得诗句隐变量向量; 根据诗句隐变量向量和上下文向量生成第二诗
句, 从而获得诗歌。 该方法采用是传统的条件变分自编 码器算法, 只适用于多字符的文本来
进行诗歌, 生成的诗歌依旧存在重复词的问题。说 明 书 1/5 页
3
CN 114510947 A
3
专利 一种基于条件变分自编码器的诗歌生成方法及系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:44上传分享