HuggingFaceTransformersAgents：让ChatGPT等大模型具备多模态能力的新功能

新知榜官方账号

2023-07-08 15:32:27

HuggingFaceTransformersAgents：让ChatGPT等大模型具备多模态能力的新功能

HuggingFaceTransformersAgents是一个大模型专属的AI工具集成包，让ChatGPT等大模型具备多模态能力，包括图像、语音、文档等任何多模态任务都能解决，并能实时返还处理好的结果。

这个功能相当于给ChatGPT等大模型配备了“多模态”能力，不仅仅限于文本，而是图像、语音、文档等多种类型的任务都可以解决。

可以告诉ChatGPT“解释这张图像”，并扔给它一张海狸照片。ChatGPT就能调用图像解释器，输出“海狸正在水里游泳”。

同时，HuggingFaceTransformersAgents还支持OpenAssistant等免费大模型，TransformerAgent负责教会这些大模型直接调用HuggingFace上的任意AI模型，并输出处理好的结果。

这个新上线的功能，背后的原理是将HuggingFace上各种大大小小的AI模型，收纳在一个集成包里，并被分门别类为“图像生成器”、“图像解释器”、“文本转语音工具”等，每个工具都会有对应的文字解释，方便大模型理解自己该调用什么模型。

通过调用上面这些AI模型，包括图像问答、文档理解、图像分割、录音转文字、翻译、起标题、文本转语音、文本分类等任务都可以完成。

除此之外，HuggingFaceTransformersAgents还包含一些Transformer库以外的模型，包括从网页下载文本、文生图、图生图、文生视频等，这些模型不仅能单独调用，还可以混合在一起使用。

对于HuggingFaceTransformersAgents，也有网友指出，有点像是LangChainagents的“平替”，但HuggingFaceTransformersAgents的功能更加全面，可以解决更多类型的多模态任务。

感兴趣的读者可以通过以下链接了解更多详情：

[1]https://twitter.com/huggingface/status/1656334778407297027

[2]https://huggingface.co/docs/transformers/transformers_agents

本页网址：https://www.xinzhibang.net/article_detail-7011.html

寻求报道，请

关键词

HuggingFaceTransformersAgents ChatGPT 大模型多模态能力 AI模型 TransformersAgents

分享至微信：

相关工具

百度最新上线的AI搜索对话工具

Neeva

集成了AI问答的AI搜索引擎

Inworld

开发和创建AI虚拟角色并与其互动

Poe

问答社区Quora推出的问答机器人工具

MOSS

复旦大学团队开发的对话式大型语言模型

ChatSonic

WriteSonic出品的ChatGPT竞品

聊天机器人入口和网页版介绍

聊天机器人入口和网页版介绍随着人工智能技术的不断发展，聊天机器人已经成为了人们日常生活中不可或缺的一部分。今天，我将介绍一些聊天机器人的入口和聊天机器人网页版。聊天机器人入口对于个人用户来说，聊天机器人的入口可能很容易找到，就是在个人账号的聊天界面中，直接与聊天机器人进行对话即可。但是，对于企业用户

分类标签聊天机器人入口网页版

11-24 16:21

MLCLLM：一款轻量化的、无需联网的聊天机器人

MLCLLM：一款轻量化的、无需联网的聊天机器人目前大多数AI聊天机器人都需要连接到云端进行处理，即使可以本地运行的也配置要求极高。那么是否有轻量化的、无需联网的聊天机器人呢？一个名为MLCLLM的全新开源项目已在GitHub上线，完全本地运行无需联网，甚至集显老电脑、苹果iPhone手机都能运行。

分类标签 MLCLLM聊天机器人AI

11-24 16:20

谷歌高管回应员工的质疑：AI聊天机器人Bard不仅仅是搜索而已

谷歌高管回应员工的质疑：AI聊天机器人Bard不仅仅是搜索而已财联社3月4日电，在近日举行的全体会议上，谷歌公司的高管们回答了来自该公司员工在内部论坛Dory提出的问题，其中大多数最重要的问题与该公司先前推出的人工智能(AI)聊天机器人Bard有关。该论坛有一条问题是：“Bard和ChatGPT是大

分类标签谷歌AI聊天机器人

11-24 16:19

揭示API重要性，以AssistantsAPI为例幂简集成关注

揭示API重要性，以AssistantsAPI为例幂简集成关注API是现代软件开发中不可或缺的一部分，它可以让不同的应用程序之间实现数据交换、功能调用等操作。AssistantsAPI是一款优秀的API集成工具，它可以帮助开发者快速地实现API的集成，提高开发效率。AssistantsAPI提供了丰

分类标签 APIAssistantsAPI集成

11-18 08:03

开源还是闭源，LLM的未来在哪里？

LLM的发展现状LLM是指具有大量参数和数据的语言模型，它们可以生成流畅、连贯、有意义的文本，甚至可以完成一些复杂的任务，如编程、对话、摘要等。近年来，LLM的发展迅速，各大科技公司和研究机构都在竞相推出更大、更强的LLM，如GPT-3、T5、Megatron-LM等。然而，这些LLM往往是闭源的，

分类标签 LLM开源闭源

11-10 22:27

大模型：科技领域新风口？还是下一个泡沫？

概述大模型是当前科技领域和创投界最火的风口之一，而ChatGPT则是大模型领域的明星公司。然而，大模型的落地应用和商业变现等问题仍存在，使得业内大部分的AI企业都不赚钱。本文从多角度分析大模型行业现状和未来发展。历史回顾从人工智能的首次火爆到现在，AI行业经历了从极速繁荣到资本退潮的全历程，行业也走

分类标签大模型人工智能ChatGPT

11-04 22:25

AI情感化产品：陪伴型机器人的崛起与未来

编辑导语七夕节刚过不久，衍生出了虚拟情人这样的产品。AI人工智能已经开始融入情感化，以人的灵魂陪伴着孤独的人。AI人工智能情感化，它会带来什么故事？我们一起来看看吧。一、你寂寞吗？在当下，人们渴望在复杂世界里寻求一段稳定的关系，但是又难以付出与之相对的精力，所以「陪伴型AI」成为很多人的热门选择。大

分类标签 AI情感化陪伴型机器人

10-29 10:04

自然语言编程的发展和前景

自然语言编程的发展和前景我们生活在一个编程门槛不断降低的时代，每一步进展都让编程变得更加易于学习和应用。从最初通过手工插拔电路输入程序到冯诺依曼架构的出现，我们逐渐摆脱了繁琐的硬件操作，但编程仍然是低级的汇编语言。那个时期的程序员几乎是稀有的存在，因为编程门槛实在太高了。然而，随着高级编程语言如Fo

分类标签编程门槛自然语言编程人工智能

10-18 10:18

AI自动生成代码：现实还很遥远

最近有很多关于代码在经过训练的神经网络的帮助下自己编写代码的话题，但是除了一些有限的用例之外，它变为现实仍需要相当长的一段时间——至少对于普通的开发工作来说是这样的。尽管自动代码生成并不是一个新概念，但由于在神经网络框架中具有更好的功能和易用性，它已获得了全新的关注。但就像在其他领域，人工智能被吹捧

分类标签 AI代码生成深度学习

10-18 10:16

StabilityAI发布开源语言模型StableLM，训练数据集达825GB

StabilityAI发布开源语言模型StableLM，训练数据集达825GBStabilityAI是一家近期势头正盛的创业公司，因为开源的AI画图工具StableDiffusion而饱受好评。在本周三的发布中，该公司宣布其语言大模型StableLM现已可供开发人员在GitHub上使用和改编。Sta

分类标签 StabilityAIStableLM语言模型

10-15 16:36

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway