公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210084386.3 (22)申请日 2022.01.24 (71)申请人 同方知网 (北京) 技 术有限公司 地址 100084 北京市海淀区清华园清华大 学36区华业大厦B1410、 1412、 1414室 申请人 同方知网数字出版技 术股份有限公 司 (72)发明人 胡飞雪 张振海 刘丹丹 颜靖义 (74)专利代理 机构 北京天奇智新知识产权代理 有限公司 1 1340 代理人 陈新胜 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/30(2020.01) G06N 5/02(2006.01) (54)发明名称 一种以人为中心的基 本知识体系构建方法 (57)摘要 本发明公开了一种以人为中心的基本知识 体系构建方法, 包括构建语义知识框架; 从已有 词表或词典 中选取相应词条; 确定并标注词条的 语义体系标签; 生成以词条、 词条信息和语义体 系标签为内容的语义知 识体系; 将所构建的语义 知识体系运用于文本语义标注, 服务于文本自然 语言理解和自然语言处 理。 权利要求书1页 说明书14页 附图3页 CN 114417014 A 2022.04.29 CN 114417014 A 1.一种以人为中心的基本知识体系构建方法, 其特 征在于, 包括以下步骤: 步骤A构建语义知识框架; 步骤B从已有词表或词典中选取相应词条; 步骤C确定并标注词条的语义体系标签; 步骤D生成以词条、 词条信息和语义体系标签为内容的语义知识体系; 步骤E将所构建的语义知识体系运用于文本语义标注。 2.如权利要求1所述的以人为中心 的基本知识体系构建方法, 其特征在于, 所述步骤A 是以人为中心并基于人的基本认知体系构建语义知识框架, 具体包括: 结合人对世界、 人生的基本认识和价值判断, 从人的世界观、 人生观、 价值观出发, 构建 符合人类基本认知体系的语义知识框架, 包括人本身、 人所 处的自然环境、 人所 处的人文 社 会环境、 物质材料或基础材料、 部件构件、 人的主观精神 世界、 时空概念、 属性关系状态、 行 为活动和过程。 3.如权利要求1所述的以人为中心 的基本知识体系构建方法, 其特征在于, 所述步骤B 具体包括: 从已有的词表或词典中按照来源、 构词、 词频、 词条语义信息选取相应词条和词 条信息语料, 所选词条要求涉及认知体系的各个 语义类别或常用有价 值。 4.如权利要求1所述的以人为中心 的基本知识体系构建方法, 其特征在于, 所述步骤C 具体包括: 依据词条信息条件, 结合已经建立的语义知识框架, 批处理添加标注词条的语义 体系标签; 并人工核查再审, 剔除或修改不当标签; 针对部分高频词或小类语义标签对应的 词条, 人工审核并标注相应 语义体系标签。 5.如权利要求1所述的以人为中心 的基本知识体系构建方法, 其特征在于, 所述步骤D 具体包括: 汇总词条及相应语义体系 标签信息, 加入已有词表, 整合生成以词条、 词条信息 和语义体系标签为内容的语义知识体系, 使得语义词典成为符合人类基本认知体系的知识 体系, 该知识体系是 人工智能理解文本语义信息的背景和基础。 6.如权利要求1所述的基于人的基本认知体系建立语义框架知识体系的方法, 其特征 在于, 所述所述 步骤E具体包括: (1)随机抽取或选取一定的文本语料; (2)对文本进行基本分词处 理和命名实体识别; (3)将已经建立的语义知识体系词条与文本进行匹配, 输出相应词条的语义体系标签; (4)对形成带语义体系标签的文本语料 标注结果; (5)结合文本语料 标注结果对文本进行语义理解和文本处 理。权 利 要 求 书 1/1 页 2 CN 114417014 A 2一种以人为中心的基本 知识体系构建 方法 技术领域 [0001]本发明涉及本体构建和自然语言处理技术领域, 尤其涉及一种以人为中心的基本 知识体系构建方法。 背景技术 [0002]随着自然语言处理和人工智能技术的发展, 人们也越来越认识到语义词典、 知识 图谱、 知识库和知识本体构建在自然语言处理和自然语言理解中的重要性。 知识库和本体 本身, 不仅是机器理解分析自然语言文本的背景语境基础, 也是将语义信息引入机器理解 和分析处 理自然语言的关键 。 [0003]知识库发展, 从20世纪提出以来, 早期WordNet(英文)、 HowNet(中文)和其他一些 知识库或知识本体多以人工构建为主, 以同义词、 词义信息分析等标注集合, 数据准确, 质 量较高, 但规模较小。 [0004]也有不少方案结合了语言学理论、 语法信息等来进行数据标注和知识库构建, 偏 向语言学角度的知识库如CLKB的词典(词语、 术语、 同义词等)、 语法信息和语料库综合型语 言知识库等, 但这类知识库仅标注词性、 语法等, 词汇的语义信息较少。 [0005]近些年来的通用一般领域或全领域知识库、 知识图谱、 知识本体等, 大多基于网络 百科、 海量网页等数据, 多与互联网机构如搜索引擎、 问答等相联系, 依靠数据抓取、 社区编 辑和多种机器提取方法构建, 往往规模巨大。 依赖百度百科、 维基百科、 互动百科等网络百 科和其他网页数据的知识库中, 大规模实体都是实例 类专名, 关系为各类百科标签属 性属 性值(信息框、 标签、 属性信息、 上下位实例、 同义)等。 实体名和关系数目动辄千万级到亿 级。 [0006]早期人工构建的语义词典、 知识库大多规模受限, 基于语言学语法信息的知识库 语法结构和类别较少应用于语义理解, 近年来依靠百科网页等大规模自动 构建的知识库语 义类别多为 实体名。 总的来说要么词条规模和覆盖面受限, 要么语义结构类别较为单一, 我 们认为, 人工智能的实现应以模拟人类认识世界的方式, 建立人类基本语义认知体系和世 界观人生观价 值观。 发明内容 [0007]为解决上述技术问题, 本发明的目的是提供一种以人为中心的基本知识体系构建 方法。 [0008]本发明的目的通过以下的技 术方案来实现: [0009]一种以人为中心的基本知识体系构建方法, 包括: [0010]步骤A构建语义知识框架; [0011]步骤B从已有词表或词典中选取相应词条; [0012]步骤C确定并标注词条的语义体系标签; [0013]步骤D生成以词条、 词条信息和语义体系标签为内容的语义知识体系;说 明 书 1/14 页 3 CN 114417014 A 3
专利 一种以人为中心的基本知识体系构建方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:33:47
上传分享
举报
下载
原文档
(1.5 MB)
分享
友情链接
GB-T 28447-2012 信息安全技术 电子认证服务机构运营管理规范.pdf
GB-T 43698-2024 网络安全技术 软件供应链安全要求.pdf
GB-T 22080-2016 信息安全技术 信息安全管理体系要求.pdf
GB-T 22739-2008 地理标志产品 建莲.pdf
T-CRHA 018—2023 人肝胆肿瘤细胞类器官构建、质量控制与保藏操作指南.pdf
T-CAAMM 28—2018 农业机械用轻型联组V带.pdf
GB-T 38775.2-2020 电动汽车无线充电系统 第2部分:车载充电机和无线充电设备之间的通信协议.pdf
MT-T 244.1-2020 煤矿窄轨车辆连接件 连接链.pdf
DB36-T 1584-2022 电子政务外网企事业单位接入技术规范 江西省.pdf
GB-T 6052-2011 工业液体二氧化碳.pdf
DB33-T 2351-2021 数字化改革 公共数据分类分级指南 浙江省.pdf
人工智能大模型体验报告2.0.pdf
思度安全-DSMM-024 监控与审计管理规范V1.0.pdf
GB-T 14619-2013 厚膜集成电路用氧化铝陶瓷基片.pdf
GB/T 40566-2021 流化床法颗粒硅 氢含量的测定 脉冲加热惰性气体熔融红外吸收法.pdf
GB-T 43628-2023 空气中病原微生物宏基因组测序鉴定方法.pdf
信通院 量子信息技术发展与应用研究报告 2022年.pdf
GM-T 0124-2022 安全隔离与信息交换产品密码检测规范.pdf
GB-T 903-2019 无色光学玻璃.pdf
TY-T3901-2019 滑雪模拟机通用安全要求和试验方法.pdf
交流群
-->
1
/
19
评价文档
赞助2元 点击下载(1.5 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。