12月22日,国内首个官方“大模型标准符合性评测”结果出炉。百度文心一言、腾讯混元大模型、阿里云通义千问、360智脑四款国产大模型首批通过评测。
阿里云12月22日宣布,国内首个官方“大模型标准符合性评测”结果公布,阿里云通义千问成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。同时,MaaS模型服务相关标准正式启动编制,作为首个在业界提出MaaS理念的企业,阿里云将以技术牵头方的身份持续贡献我们的想法和实践经验。
腾讯方面发布消息,腾讯混元大模型凭借在通用性、智能性、安全性等多个指标上的领先成绩,首批通过国家大模型标准测试。会上,腾讯云以提案牵头方的身份,正式启动了《人工智能模型即服务(MaaS)功能要求》的讨论与编制工作。这一提案详细规定了MaaS系统的设计、实现、部署和使用,涵盖了用户层、访问层、服务层、跨层功能、运营支撑和安全系统等多维度,旨在规范MaaS领域的标准化工作,为行业的高质量发展注入活力。
据了解,首批大模型标准符合性测试通过名单于全国信息技术标准化技术委员会人工智能分委会全体会议上宣布。全国信标委人工智能分委会成立于2020年,主要负责人工智能基础、技术、风险管理、可信赖、治理、产品及应用等人工智能领域国家标准制修订工作。
为促进国内大模型和人工智能产业健康发展,2023年,中国电子技术标准化研究院发起“大模型标准符合性评测” ,围绕多领域多维度模型评测框架与指标体系,涵盖语言、语音、视觉等多模态领域,建立大模型标准符合性名录,引领人工智能产业健康有序发展。
最终,吸收产业和行业多个单位意见,并通过32个细分维度进行测评,第一批有百度文心一言、腾讯混元大模型、阿里云通义千问、360智脑四款大模型通过测试。