新知榜官方账号
2023-10-15 02:04:14
OpenAI在周一宣布,将在未来两周内向ChatGPTPlus和Enterprise用户推出新功能,包括语音和图片功能。语音功能可在iOS和Android上以选择加入的方式提供,而图片功能可在所有ChatGPT平台上使用。
语音聊天功能充当用户和ChatGPT之间的口头对话。用户按下按钮并说出问题,ChatGPT会以语音而不是文本形式给出答案。这类似于使用Alexa或Google助手等虚拟助手,并可能是对整个虚拟助手进行全面改进的序幕。
为了实现与ChatGPT的语音和音频通信,OpenAI使用了一种新的文本到语音模型,该模型能够仅通过文本和几秒钟的示例语音生成“类似人类的音频”。此外,它的Whisper模型可以将您的口述转录为文本。
图像功能允许您捕捉一张图像,并将其与问题或提示一起输入到ChatGPT中。您可以使用应用程序的绘图工具来帮助澄清您的问题,并与聊天机器人进行一对一的对话,直到解决您的问题。这类似于微软的Windows的新功能Copilot,它是基于OpenAI的模型构建的。
OpenAI表示,他们意识到这项功能所带来的问题,包括“恶意行为者冒充公众人物或进行欺诈的潜在可能性”。这也是该公司计划将其新功能的使用限制在“特定用例和合作伙伴”上的主要原因之一。即使这些功能更广泛地可用,也主要面向更有特权的用户,比如开发人员。
ChatGPT最初被推出时只是一个文字转语音的工具,然而OpenAI很快扩展了其功能。基于GPT-3语言模型的原始聊天机器人已经更新到GPT-3.5,现在是GPT-4,它是正在接受新功能的模型。当GPT-4在3月份首次发布时,OpenAI宣布了与多个企业的合作,比如Duolingo,该公司利用这一人工智能模型来提高语言学习应用中基于听力和口语的课程的准确性。OpenAI还与Spotify合作,将播客翻译成其他语言,同时保留播客主持人的声音。该公司还提到了与手机应用BeMyEyes的合作,该应用旨在帮助盲人和低视力人士。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16