ChatGPT推出语音和图像功能,多模态输入输出拓展模型能力与应用范围

新知榜官方账号

2023-09-26 22:10:21

ChatGPT宣布将在未来两周内推出新的语音和图像功能,这将为用户提供更多多样化的交互方式,进一步丰富了ChatGPT的应用领域。

多模态理解力以及语音与图像处理能力对于AI在各个行业的应用具有重要意义。ChatGPT的这一新功能在教育和医疗领域可以用于图像和文字识别,帮助改善诊断和治疗,以及提供更多个性化的学习体验。在工业领域,多模态理解力可以用于场景识别,有助于提高生产效率和安全性。而在汽车自动驾驶领域,语音和图像处理能力可以增强车辆对环境的感知和决策能力,提高行驶安全性。

多模态能力的不断提升确实可以从真实世界获取更多丰富的数据,这些数据包括图片、音频、视频等非结构化数据,其数据量占据了很大的比例(约80%)。随着模型参数规模的不断增加和多模态数据的应用,AI的应用范围和任务复杂度都在不断扩大。

多模态应用方面,金山办公、万兴科技、福昕软件、同花顺、恒生电子、焦点科技、致远互联、泛微网络、航天信息等公司都在相关技术领域有所布局。而在多模态技术方面,科大讯飞、百度、云从科技、拓尔思、虹软科技、润和软件等公司都在不断优化自己的技术。此外,AI算力方面,浪潮信息、中科曙光、紫光股份、中兴通讯、烽火通信、神州数码、拓维信息、海光信息、中际旭创、新易盛等公司也在持续投入研发力量,提高算力水平。

本页网址:https://www.xinzhibang.net/article_detail-13855.html

寻求报道,请 点击这里 微信扫码咨询

关键词

ChatGPT 语音 图像

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯