讯飞星火认知大模型荣登国产主流大模型测评榜榜首

新知榜官方账号

2023-09-04 22:39:05

讯飞星火认知大模型荣登国产主流大模型测评榜榜首

近日，新华社研究院中国企业发展研究中心、《麻省理工科技评论》中国分别发布大模型评测报告，讯飞星火认知大模型均以总分第一的成绩荣登国产主流大模型测评榜榜首。

根据新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》（简称《报告》），讯飞星火以总分1013分位列本次国产主流大模型测评榜首位，在四大评测维度中的智商能力和工具提效两个维度获得第一。四大评测维度分别为基础能力、智商能力、情商能力、工具提效。在智商能力方面，课题组分别从常识知识（20%）、逻辑能力（50%）和专业知识（30%）方面对大模型进行考量，讯飞星火排名第一。在工作提效方面，课题组重点在工具提效（50%）和生成创新（50%）方面进行考量，讯飞星火以350分排名第一并遥遥领先，《报告》认为，讯飞星火认知大模型拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。

无独有偶，《麻省理工科技评论》中国发布的大模型评测报告显示，在8个一级大类的600道题目的测试和盲评中，讯飞星火认知大模型V2.0在6个大类中得分率排名第一，以81.5分（百分制计）的成绩在本次评测中登顶，荣获“最聪明”的国产大模型称号。大模型评测综合得分率本次评测使用的测试集包含600道题目，覆盖了语言专项、数学专项、理科综合、文科综合、逻辑思维、编程能力、综合知识、安全性共8个一级大类。讯飞星火在编程能力、理科综合、逻辑思维、数学专项、语言专项和综合知识这6个一级大类中得分率排名第一，在此次评测中表现十分全面，尤其是在代码生成、数学能力、理科与逻辑等方面优势明显，是本次“最聪明的理科生”。

据了解，科大讯飞为应对国产大模型的涌现，在讯飞星火认知大模型的立项、发布和迭代升级的各个阶段，都进行了紧锣密鼓的推进工作。5月6日，发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地；6月9日，突破开放式问答，并在数学能力和多轮对话能力上迭代升级；8月15日，科大讯飞发布“讯飞星火认知大模型V2.0版本”，此次最大的升级在于代码能力和多模态能力的大幅提升；10月24日，将全面对标ChatGPT，中文超越、英文相当，明年上半年对标GPT-4。

科大讯飞上海总部是科大讯飞的区域总部之一，于2021年正式入驻位于长宁临空园区的中山国际广场。上海总部围绕1+X战略布局，深化“1”个科大讯飞上海人工智能研究院和“X”个创新业务场景，助力上海城市数字化转型。其中，讯飞上海人工智能研究院重点聚焦多语种核心技术研发。目前上海研究院多语种技术已覆盖全球60种语言语音合成、69种语言语音识别和168种语言机器翻译，覆盖全球50亿人口，成功解决华为手机等产品在海外市场因语音交互卡脖子的问题。

本页网址：https://www.xinzhibang.net/article_detail-10866.html

寻求报道，请

关键词

分享至微信：

相关工具

Claude

ChatGPT的最为有力的竞争对手之一

ColossalChat

Colossal-AI推出的免费开源版ChatGPT聊天机器人替代品

TigerBot

虎博科技推出的AI对话聊天机器人，基于TigerBot开源大模型

Forefront

免费版基于GPT-4的AI聊天机器人

DeepMind联创新公司推出的AI聊天机器人

Google Bard

Google推出的AI聊天对话机器人Bard

科大讯飞发布科大讯飞星火认知大模型V3.0和12个行业大模型，华为联合发布国产计算平台“飞星一号”

科大讯飞发布科大讯飞星火认知大模型V3.0和12个行业大模型，华为联合发布国产计算平台“飞星一号”在最近举办的第六届世界声博会科大讯飞全球1024开发者节上面，科大讯飞公司正式发布了科大讯飞星火认知大模型V3.0，文本生成、语言理解、知识问答、逻辑推理、编码能力、数学能力、多模态能力等七个方面较上一

分类标签科大讯飞星火认知大模型V3.0行业大模型华为飞星一号算力平台

11-28 02:15

大模型时代“无处不AI”：讯飞AI产品亮相第25届中国国际高新技术成果交易会

大模型时代“无处不AI”：讯飞AI产品亮相第25届中国国际高新技术成果交易会11月15日开始，为期五天的第二十五届中国国际高新技术成果交易会（以下简称“高交会”）在深圳正式开启，超过100个国家和地区的团组参加，展览规模预计将达到50万平方米，为历史上规模最大的一届高交会。本文介绍了讯飞在第25届中

分类标签大模型讯飞晓医讯飞星火AI助手智能办公本AI学习机

11-28 02:14

科大讯飞发布讯飞星火认知大模型V30及其他人工智能产品

科大讯飞发布讯飞星火认知大模型V30及其他人工智能产品2023年10月24日，科大讯飞在第六届世界声博会暨2023科大讯飞全球1024开发者节上发布了令人瞩目的讯飞星火认知大模型V30。这一重要突破使得科大讯飞在人工智能领域取得了巨大进展，并且整体性能超越了ChatGPT，在医疗、法律和教育行业也表

分类标签科大讯飞讯飞星火认知大模型V30人工智能产品

11-28 02:13

科大讯飞发布讯飞星火认知大模型V3.0，七项能力持续提升

科大讯飞发布讯飞星火认知大模型V3.0，七项能力持续提升在近日举办的第六届世界声博会暨2023科大讯飞全球1024开发者节上，科大讯飞董事长刘庆峰和研究院院长刘聪共同发布了讯飞星火认知大模型V3.0。这款全新的大模型在七大能力方面都得到了持续的提升，全面对标了目前业界领先的GPT3.5。在主论坛上，

分类标签科大讯飞讯飞星火认知大模型V3.0人工智能

11-28 02:12

科大讯飞发布星火认知大模型V3.0，多项能力超越ChatGPT（GPT3.5）

科大讯飞发布星火认知大模型V3.0，多项能力超越ChatGPT（GPT3.5）10月24日，一场名为“2023科大讯飞全球1024开发者节”的盛大活动在合肥拉开了帷幕。这场活动由科大讯飞公司主办，旨在为全球的开发者提供一个交流和学习的平台。在开幕式主论坛上，科大讯飞董事长刘庆峰如约而至，并发表了重要

分类标签科大讯飞星火认知大模型V3.0人工智能

11-28 02:11

再次炸天的OpenAI，大模型生态初现光锥智能关注2023-11-081评论750浏览0收藏18分钟

再次炸天的OpenAI，大模型生态初现光锥智能关注2023-11-08OpenAI又一次炸天，大模型生态初现，光锥智能关注2023-11-08。作为人工智能领域的巨头，OpenAI一直致力于研究和推广人工智能技术的发展。在最近的一次发布会上，OpenAI展示了他们的最新成果——一款名为GPT-5的大

分类标签 OpenAI大模型生态光锥智能

11-09 08:00

虚拟伴侣会取代现实伴侣吗？AI恋爱案例分析

随着科技的不断发展，虚拟伴侣逐渐成为人们生活中的一部分。如今，AI助手已经可以提供情感支持和陪伴，甚至有些人认为虚拟伴侣比现实伴侣更加完美、更能适应个人需求。然而，虚拟伴侣是否真的能够取代现实伴侣呢？从情感和利益两个方面来看，与虚拟伴侣的互动可能会对现实伴侣关系产生影响。在情感方面，虚拟伴侣可以提供

分类标签虚拟伴侣AI助手恋爱案例

11-01 10:31

科大讯飞前三季度营收下降，星火大模型V3.0将发布

科大讯飞昨日发布财报，前三季度营收为126.14亿元，较上年同期下降0.37%；净利为9936万元，较上年同期下降76.36%；扣非后净亏损为3.24亿元，上年同期的扣非后净利为正。科大讯飞2023年第三季度营收为47.72亿元，较上年同期增长2.89%；净利为2579万元，较上年同期下降81.86

分类标签科大讯飞财报营收星火大模型人工智能教育

10-20 16:46

AI创作不限次数

AI创作不限次数今年是当之无愧的AI元年，国内外大语言模型纷纷落地，如文兴预言昆仑天宫阿里通一千问，ChatGPTcloud等百模大战开打，每家模型各有所长，要说哪个模型更实用，那必须得试试科大讯飞星火认知大模型。内置的星火助手数量已高达4000家，涵盖了工作、生活的方方面面，是小白易上手，落地情景

分类标签 AI创作语言模型讯飞星火

10-20 16:44

国产AI模型带来新机遇，讯飞星火免费开放使用

国产AI模型带来新机遇，讯飞星火免费开放使用今年可以被称为AI技术的爆发年，各种AI模型如雨后春笋般涌现，其中不乏从国外引入的高级模型。然而，由于各种原因，这些国外产品的使用门槛被大大提高，这也使得很多国内用户无法接触到最先进的AI技术。不过，这一局面终于在最近得到了改变。百度、阿里等相继都推出了自

分类标签 AI技术国产AI模型讯飞星火

10-20 16:42

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway