OpenAI推出ChatGPT新功能,支持图像和语音指令执行提示

新知榜官方账号

2023-10-15 02:04:14

OpenAI在周一宣布,将在未来两周内向ChatGPTPlus和Enterprise用户推出新功能,包括语音和图片功能。语音功能可在iOS和Android上以选择加入的方式提供,而图片功能可在所有ChatGPT平台上使用。

语音聊天功能充当用户和ChatGPT之间的口头对话。用户按下按钮并说出问题,ChatGPT会以语音而不是文本形式给出答案。这类似于使用Alexa或Google助手等虚拟助手,并可能是对整个虚拟助手进行全面改进的序幕。

为了实现与ChatGPT的语音和音频通信,OpenAI使用了一种新的文本到语音模型,该模型能够仅通过文本和几秒钟的示例语音生成“类似人类的音频”。此外,它的Whisper模型可以将您的口述转录为文本。

图像功能允许您捕捉一张图像,并将其与问题或提示一起输入到ChatGPT中。您可以使用应用程序的绘图工具来帮助澄清您的问题,并与聊天机器人进行一对一的对话,直到解决您的问题。这类似于微软的Windows的新功能Copilot,它是基于OpenAI的模型构建的。

OpenAI表示,他们意识到这项功能所带来的问题,包括“恶意行为者冒充公众人物或进行欺诈的潜在可能性”。这也是该公司计划将其新功能的使用限制在“特定用例和合作伙伴”上的主要原因之一。即使这些功能更广泛地可用,也主要面向更有特权的用户,比如开发人员。

ChatGPT最初被推出时只是一个文字转语音的工具,然而OpenAI很快扩展了其功能。基于GPT-3语言模型的原始聊天机器人已经更新到GPT-3.5,现在是GPT-4,它是正在接受新功能的模型。当GPT-4在3月份首次发布时,OpenAI宣布了与多个企业的合作,比如Duolingo,该公司利用这一人工智能模型来提高语言学习应用中基于听力和口语的课程的准确性。OpenAI还与Spotify合作,将播客翻译成其他语言,同时保留播客主持人的声音。该公司还提到了与手机应用BeMyEyes的合作,该应用旨在帮助盲人和低视力人士。

本页网址:https://www.xinzhibang.net/article_detail-16795.html

寻求报道,请 点击这里 微信扫码咨询

关键词

OpenAI ChatGPT 语音指令 图像功能 人工智能 GPT-4

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯