GPT-4发布:多模态输入、超长文本、图像理解,表现优于人类

新知榜官方账号

2023-09-24 04:10:14

GPT-4发布:多模态输入、超长文本、图像理解,表现优于人类

OpenAI老板SamAltman在发布会上介绍说,GPT-4是他们迄今为止功能最强大的模型。它是一个超大的多模态模型,能够接受文字和图像输入,并能够理解图像内容。文字输入长度限制扩展到3.2万个token(约2.4万单词)。在各种职业和学术考试上,GPT-4表现和人类水平相当。

GPT-4还具有很多新的能力。它可以接受图像输入,并可以解释图像内容。它可以做进一步的计算,甚至可以处理论文截图,并给出对整篇论文的总结摘要。

GPT-4在API方面也有很大的改进。它开放了一个使用功能,允许修改系统提示。这意味着GPT-4可以展现出更多样的性格,比如扮演苏格拉底。它还可以按照指定的格式给出回答。

尽管GPT-4表现优于人类,在使用过程中还是会出现幻觉、胡说八道的毛病。为了最大程度发挥其能力,最好还是使用思维链路提示。

谷歌也在跟进,宣布将一系列即将推出的AIGC功能,应用到自家产品中。这样的竞争将会推动人工智能的发展。

本页网址:https://www.xinzhibang.net/article_detail-13329.html

寻求报道,请 点击这里 微信扫码咨询

关键词

GPT-4 人工智能 多模态

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯