公共安全标准网
ICS35.240 CCSL70 中华人民共和国国家标准 GB/T45288.2—2025 人工智能 大模型 第2部分:评测指标与方法 Artificialintelligence—Large-scalemodel— Part2:Testingandevaluationformetricsandmethods 2025-02-28发布 2025-02-28实施 国家市场监督管理总局 国家标准化管理委员会发布目 次 前言 Ⅲ ………………………………………………………………………………………………………… 引言 Ⅴ ………………………………………………………………………………………………………… 1 范围 1 ……………………………………………………………………………………………………… 2 规范性引用文件 1 ………………………………………………………………………………………… 3 术语和定义 1 ……………………………………………………………………………………………… 4 缩略语 1 …………………………………………………………………………………………………… 5 评测指标 1 ………………………………………………………………………………………………… 5.1 理解能力评测指标 1 ………………………………………………………………………………… 5.2 生成能力评测指标 8 ………………………………………………………………………………… 6 评测方法 11 ………………………………………………………………………………………………… 6.1 概述 11 ………………………………………………………………………………………………… 6.2 评测数据集 14 ………………………………………………………………………………………… 6.3 评测环境 14 …………………………………………………………………………………………… 6.4 评测工具 14 …………………………………………………………………………………………… 6.5 评测实施 14 …………………………………………………………………………………………… 附录A(资料性) 评测指标计算方法 17 …………………………………………………………………… A.1 客观评测方法 17 …………………………………………………………………………………… A.2 主观评测方法 18 …………………………………………………………………………………… 参考文献 21 …………………………………………………………………………………………………… ⅠGB/T45288.2—2025

.pdf文档 GB-T 45288.2 2025 人工智能 大模型 第2部分评测指标与方法

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 45288.2 2025 人工智能 大模型 第2部分评测指标与方法 第 1 页 GB-T 45288.2 2025 人工智能 大模型 第2部分评测指标与方法 第 2 页 GB-T 45288.2 2025 人工智能 大模型 第2部分评测指标与方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-04-21 21:08:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。