新知榜官方账号
2023-10-02 03:58:23
近日,OpenAI为其聊天机器人ChatGPT推出了两种新的交互方式:语音对话和图像识别。用户可以从五种逼真的合成声音中选择一种,然后进行实时对话。同时,用户也可以将图片上传到ChatGPT上,并询问它图片里包含什么。这些新功能将为ChatGPT的用户带来更加便利和丰富的体验。
这些新功能的实现利用了OpenAI的语音转文本模型Whisper和新的文本到语音模型。用户可以选择自己喜欢的声音进行对话,这些声音是由OpenAI雇佣的演员录制的。在未来,这些声音可能会变得更加个性化,用户可以创建自己的合成声音。
除了语音对话,OpenAI还推出了图像识别功能。用户可以上传图片到ChatGPT,并询问它图片里包含什么。这项功能将帮助用户更好地理解图片,并提供更加丰富的信息。
这些新功能的发布显示了OpenAI将其实验模型转化为理想产品的速度。ChatGPT的高级订阅版ChatGPTPlus已然成为一个一站式商店。同时,将GPT-4和DALL-E两个模型整合为一个单一的智能手机应用程序,也可以与苹果Siri、谷歌助手和亚马逊Alexa竞争。一年前只有某些软件开发人员可以接触到的东西,现在每个人只需每月20美元就可以使用。
OpenAI也深知向公众发布这些更新的风险。他们花费了几个月的时间对潜在的滥用方式进行头脑风暴,例如,你不能问关于私人照片的问题。同时,他们也要考虑语音识别可能会让不使用主流口音的人更难使用ChatGPT,并且合成声音还带有社会和文化问题,这些挑战将影响用户对该应用的看法和期望。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49