新知榜官方账号
2023-10-15 02:04:14
OpenAI在周一宣布,将在未来两周内向ChatGPTPlus和Enterprise用户推出新功能,包括语音和图片功能。语音功能可在iOS和Android上以选择加入的方式提供,而图片功能可在所有ChatGPT平台上使用。
语音聊天功能充当用户和ChatGPT之间的口头对话。用户按下按钮并说出问题,ChatGPT会以语音而不是文本形式给出答案。这类似于使用Alexa或Google助手等虚拟助手,并可能是对整个虚拟助手进行全面改进的序幕。
为了实现与ChatGPT的语音和音频通信,OpenAI使用了一种新的文本到语音模型,该模型能够仅通过文本和几秒钟的示例语音生成“类似人类的音频”。此外,它的Whisper模型可以将您的口述转录为文本。
图像功能允许您捕捉一张图像,并将其与问题或提示一起输入到ChatGPT中。您可以使用应用程序的绘图工具来帮助澄清您的问题,并与聊天机器人进行一对一的对话,直到解决您的问题。这类似于微软的Windows的新功能Copilot,它是基于OpenAI的模型构建的。
OpenAI表示,他们意识到这项功能所带来的问题,包括“恶意行为者冒充公众人物或进行欺诈的潜在可能性”。这也是该公司计划将其新功能的使用限制在“特定用例和合作伙伴”上的主要原因之一。即使这些功能更广泛地可用,也主要面向更有特权的用户,比如开发人员。
ChatGPT最初被推出时只是一个文字转语音的工具,然而OpenAI很快扩展了其功能。基于GPT-3语言模型的原始聊天机器人已经更新到GPT-3.5,现在是GPT-4,它是正在接受新功能的模型。当GPT-4在3月份首次发布时,OpenAI宣布了与多个企业的合作,比如Duolingo,该公司利用这一人工智能模型来提高语言学习应用中基于听力和口语的课程的准确性。OpenAI还与Spotify合作,将播客翻译成其他语言,同时保留播客主持人的声音。该公司还提到了与手机应用BeMyEyes的合作,该应用旨在帮助盲人和低视力人士。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49