讯飞星火V2.0升级,图文生成能力大比拼

新知榜官方账号

2023-08-16 16:15:02

讯飞星火V2.0升级,图文生成能力大比拼

科创板日报8月16日讯,讯飞星火认知大模型昨日升级2.0版本,重点增加了代码能力和多模态能力。科大讯飞董事长刘庆峰在会上表示,今年10月24日将全面对标ChatGPT,中文超越、英文相当,明年对标GPT-4。《科创板日报》第一时间对讯飞星火的图文生成能力进行了测试,并与文心一言进行对比。

讯飞星火VS文心一言:图文生成能力大比拼

讯飞星火认知大模型V2.0的一大特点是升级了多模态能力。相比之前的版本只能进行文字对话,2.0版本可对图像内容进行文字描述和理解,并生成图片。《科创板日报》记者对升级后的讯飞星火作图能力进行了测试。

先来个简单的:画一幅风景画

  • 讯飞星火:记者想测试一下讯飞星火的连续对话内容,于是让其在画中增加一个4岁女孩。结果,讯飞星火增加了三个小女孩,同时画面背景也有所变化。
  • 文心一言:在画中增加一个4岁女孩。文心一言在数量上没有犯错,增加了一个小女孩。不过,图片背景已完全换成了不同的另一张图。看来要让AI听从指令来作画依然存在难度,设计师们暂时无需太担心失业。

提问:画一张车水马龙的图

  • 讯飞星火:讯飞星火给了一张古代城市的马车街道图片。于是,《科创板日报》记者让其调整为现代城市。
  • 文心一言:暂无回答。

提问:画一张红烧狮子头

  • 讯飞星火:暂无回答。
  • 文心一言:文心一言画了一只狮子头,但并非基于之前生成的图片。

提问:画一幅画,妈妈抱着宝宝、宝宝在哭泣,宝宝6个月左右

  • 讯飞星火:从两者的回答来看,生成的图片都较为准确地完成了任务。
  • 文心一言:文心一言的回答与讯飞星火基本相同,也是画了一个妈妈抱着宝宝的场景,不过宝宝没有哭泣。

提问:画一个胸有成竹的男人

  • 讯飞星火:讯飞星火在图片中增加新内容:为画里的男人手里增加一支烟。但以失败告终。
  • 文心一言:文心一言理解了指令,画了一个手里有烟的男性。但并非基于之前生成的图片。

提问:生成一张云计算的配图

  • 讯飞星火:讯飞星火给出了一张云朵的图片。
  • 文心一言:文心一言给出了一张云计算的相关图片,比讯飞星火更胜一筹。

提问:生成一张大数据配图

  • 讯飞星火:讯飞星火给出了一张古代建筑的图片,与大数据无关。
  • 文心一言:文心一言的回答同讯飞星火,也是一个不相关的图片。

讯飞星火还准确地描述了一张现场照片的场景,并识别出了部分文字,可以直接让AI进行朗读。而文心一言目前尚未开放识图功能。

基于多模态能力升级,科大讯飞同时发布“讯飞智作2.0”工具,能进行视频分析、写文案、进行AI配音、提供配图生成、AI主播等功能。讯飞星火和华为昇腾联合发布了星火一体机,支持5种定制优化模式和10种以上即开即用的场景包,可供用户选择。

刘庆峰表示,有了这些能力,每一家企业、每一个行业、每一个学校、每个医院都有机会构建自己的专属大模型。目前,讯飞星火已完成的在金融、政务、汽车等领域的9个专属大模型的数据显示,在场景任务优化和私域知识增强等方面平均效果能够提升20%。

本页网址:https://www.xinzhibang.net/article_detail-9919.html

寻求报道,请 点击这里 微信扫码咨询

关键词

讯飞星火 图文生成 多模态能力

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯