当猩猩学会玩《我的世界》,方法居然和英伟达科学家训练GPT-4智能体的方法一致?

新知榜官方账号

2023-08-15 01:24:23

当猩猩学会玩《我的世界》,方法居然和英伟达科学家训练GPT-4智能体的方法一致?

猩猩行动计划的实验表明,训练动物玩游戏的技巧和训练人工智能的原则是相同的。本文介绍了猩猩Kanzi在《我的世界》中的学习过程以及其与GPT-4智能体的训练方法的相似之处。

Kanzi是来自ApeInitiative的一只倭黑猩猩,它是世界上最聪明的猩猩之一。经过训练后,它学会了各种技能,挑战了乡村、沙漠神殿、下界传送门等环境,一路通关到达终点。而AI专家发现,猩猩训练师教会它学技能的过程,竟然跟人类教AI玩Minecraft有诸多类似之处,比如上下文强化学习、RLHF、模仿学习、课程学习等。

猩猩行动计划的实验表明,训练动物玩游戏的技巧和训练人工智能的原则是相同的。早在今年5月,英伟达的AI智能体Voyager就通过类似的训练方法,在游戏中进行全场景的终身学习。这些训练方法包括基于上下文的强化学习、RLHF、模仿学习和课程学习。研究者们认为,这些训练方法将有助于构建更加智能化的具身智能体。

本文来自微信公众号“新智元”(ID:AI_era),作者:新智元,36氪经授权发布。

本页网址:https://www.xinzhibang.net/article_detail-9842.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章

相关快讯