OpenAI发布ChatGPT的语音和图像功能,AI个人助手即将到来

新知榜官方账号

2023-09-26 16:16:23

OpenAI发布ChatGPT的语音和图像功能,AI个人助手即将到来

9月25日,OpenAI在官网上宣布,将在未来两周内向Plus和企业用户推出ChatGPT的语音和图像功能。这意味着用户可以通过语音和图像与ChatGPT进行交互,向ChatGPT展示正在谈论的话题。语音功能将在iOS和Android平台上推出,而图像功能将登陆所有平台。

GPT-4发布时,其强大的图像能力备受关注,但由于安全和算力的限制,该功能一直未在网页端上线。此次ChatGPT的升级最重要的细节是明确了大模型进入移动终端的趋势。ChatGPT的语音对话能力仅适用于iOS和安卓移动终端,而图像功能虽然可在所有平台上使用,但在实际操作中,可能更多地应用于手机终端。此次更新后,ChatGPT的图像交互能力得到了显著提升。

通过官方使用案例可以看到,用户拍摄冰箱和食品储藏室的照片,就可以获取制作晚餐的分步食谱。用户拍摄自行车照片,ChatGPT就可以找到需要调整的零部件,并提供安装建议。拍摄自己的自行车安装说明书和工具箱的照片,ChatGPT就可以明确选出工具箱中的工具,并给出安装建议。

目前,ChatGPT仅支持用户通过语音输入文字,GPT通过文字进行回答。更新后,语音将直接作为人机交互方式,提高了智能化和便捷性,使ChatGPT成为真正的个人助手和应用流量入口。OpenAI表示,公司所有的AI功能都是逐步升级的,语音对话仅适用于语音聊天场景,输出的语音源来自与OpenAI合作的声音演员。图像领域的公司将致力于减少幻觉和高风险领域的安全使用。

随着AI技术和应用的逐渐成熟,AI的商业模式将更加清晰,以GPTPlus和微软企业版为代表的产品付费意愿将进一步提升。建议重点关注AI应用在垂直场景的落地,同时随着语言大模型、多模态和大模型的应用,算力需求将进一步提升。建议关注AI算力产业链的变化。

本页网址:https://www.xinzhibang.net/article_detail-13813.html

寻求报道,请 点击这里 微信扫码咨询

关键词

OpenAI ChatGPT 语音功能 图像功能

分享至微信: 微信扫码阅读

相关工具

相关文章