百度文心一言在工业领域知识问答能力评测中超过GPT3.5

新知榜官方账号

2023-07-01 21:20:22

工联院评测结果显示百度文心一言领先于GPT3.5

中国工业互联网研究院(工联院)近期对人工智能大模型在中文工业领域的知识问答能力进行了系统性评测,评测结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。本次工业知识问答测试选取了工业领域典型的八大行业,百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材七个行业均获国内第一。总计超过1100个问题,主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。

评测结果显示,GPT4表现最佳,国内头部大模型表现亮眼,整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5,在国内大模型中排名第一。在客观题环节,评测结果显示,GPT4与文心一言表现好于其他大模型。但评测结果也同时指出,大模型普遍准确率有较大的提升空间。主观题方面,国内大模型的基础能力、语句能力与GPT4接近,概括能力、逻辑能力与GPT4有一定差距。在大模型的自我认知能力和污染问题分析能力上,GPT4相较于其他大模型表现出更好的能力。

从评测结果来看,百度文心一言在工业领域的知识问答能力方面表现突出,这也预示着人工智能在工业领域的应用将更加广泛和深入。

本页网址:https://www.xinzhibang.net/article_detail-4071.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章

相关快讯