个人智能体PersonalAssistant:一款可与浏览器交互的AI助手

新知榜官方账号

2023-08-10 01:43:02

PersonalAssistant:一款可与浏览器交互的AI助手

DO anything在推出了一款AI写作助手之后,人工智能初创公司HyperWriteAI又走在了前面——最近,他们推出了一款可以像人类助手一样办事的数字助理PersonalAssistant。一经推出,口碑不俗。

生成式AI初创企业Cohere联合创始人兼CEOAidanGomez赞赏其为「......第一次看到真正的『个人智能体』。」网友反响也不错,声称这项工作让人震撼,浏览网页操作自动化将迎来变革。

要说个人助理,市面竞品其实不少,PersonalAssistant究竟有何独特魅力?与众不同?

公司宣称,PersonalAssistant是第一个可以与浏览器交互操作的AI智能体(AIAgent)。如果你觉得这个回答有点抽象,我们帮你问了PersonalAssistant,让它解释一下自己「与其他LLM驱动的虚拟助手最大区别是什么?」「我可以与网页浏览器交互。」它说。

其他助手基于海量的知识来生成文本和答案,而我擅长的是搜索信息、导航到某个网站、填写表格以及与网页上的各种ARIA元素交互。PersonalAssistant回答自己与其他大模型驱动的助理的最大区别。

那么,什么是智能体(Agent)?在大模型语境下,可以理解成能自主理解、规划、执行复杂任务的系统。AI智能体(AIAgent)并非ChatGPT升级版,它不仅告诉你答案,更重要的是它会帮你去做(doit),等于给双手雇了一个「跑腿」的(ChatGPT不擅长)。

给你的浏览器安装PersonalAssistant这个插件后,AI就可以帮你完成人类在网上所做的事情,无论是在上面做研究、买东西、订购服务还是浏览新闻、收集信息,等等。你要做啥,就告诉PersonalAssistant,然后做你的甩手掌柜,它会为你自动完成任务。

PersonalAssistant还能为你搜索和总结信息。我们给了它一个命令。接着,系统打开谷歌浏览页,在搜索框里自动输入相关要求,等待一段时间后,相关网页一一呈现出来,一共两页。不过,PersonalAssistant发现HyperwriteAI的产品根本未被Techcrunch报道过,所以找到另一家科技媒体的报道文章并给出内容总结。

接下来,我们尝试了PersonalAssistant的写邮件能力。我们告诉它,「NavigatetoGmailandsendacreativeonelineemailtoxxxthankingherforprettygiftformybirthday。」系统随后导航到Gmail页面,获得邮件服务授权后进入邮箱,自动填充收信人并根据你的提示撰写邮件内容。我们也可以手动这一过程,例如在通信录里选择收信人地址、让系统根据你设定的主题生成邮件内容。

PersonalAssistant可以自主操作ChatGPT,从单个提示开始构建网站。你可以使唤PersonalAssistant做很多事情,包括订披萨、在Linkedln选找合适的工程人选等。每一个应用的运作程序也都差不多。通过搜索引擎找到相应页面,浏览网站,与网站互动并完成基本的在线任务。AI能自行查找需要填写的内容,比如出发地、目的地、收获地址、填写邮编、付钱完成订单。遗憾的是,虽然官方给出的早期测试案例中,PersonalAssistant可以帮助完成发推特的活儿,但我们没有成功,系统始终无法进入推特或者微博页面进行进一步操作。

HyperWriteAI联合创始人、CEOMattShumer表示,之所以让大家先睹为快,目的在于让更多人了解这类个人助理将成为每个用户浏览体验不可或缺的一部分。

俞凯认为,大模型的使用范式会经历三个阶段。最开始是多模态专用大模型,它有可能是语言或者图像的,但都旨在解决专用任务,虽然也会彼此组合,但各个通道之间基本上彼此独立,不能两两交叉。这种使用方式早就存在。第二阶段会实现不同模态大模型之间的跨模态应用,比如通过语言对话修改化学分子的设计,或者将大模型创作的故事通过合成声音甚至数字人讲述出来。第三个阶段涉及智能体系统。大模型自身具备通识,同时还会具备调用其他大模型的能力,调用方式可能是对话,另一个大模型也有回复的方式。「未来一定是以这种方式组合智能体。」他认为。

HyperWrite也正在开发自己的大语言模型「Agent-1」,计划在未来一个月内用它来驱动AI智能体(AIAgent)。Shumer认为,类似Cohere、GPT-4通用LLM的问题在于其设计初衷都是为了完成各种任务,从写诗到解数学题,并不胜任处理操作软件,所以训练进展缓慢,成本也高。如果说,通用大模型存储了大量的知识,为推理留下较少的参数,那么,「Agent-1」侧重于浏览网页,目标是将模型的所有动力都用于动态推理,使他们的模型能够处理它从未训练过的情况,因此与其他LLM相比要简单得多,速度也更快且成本低、更可靠。「Agent-1」不依赖于对特定站点的知识,而是自己想办法使用它。建立在这个模型基础上的软件也会不断学习,而不会浪费模型参数。随着模型不断快速改进,它在更复杂软件操作上的可靠性也会提高。「我们的目标是超越人类的能力——一个可以操作任何软件并代表用户可靠地完成复杂目标的助手。」MattShumer表示。

试用地址:https://www.hyperwriteai.com/personal-assistant

本页网址:https://www.xinzhibang.net/article_detail-9644.html

寻求报道,请 点击这里 微信扫码咨询

关键词

PersonalAssistant AI智能体 浏览器交互

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯