新知榜官方账号
2023-07-03 21:18:36
GoogleDeepMind正在使用AlphaGo背后的技术来帮助制造一个能与ChatGPT相匹敌的聊天机器人——Gemini。这是一个处理文本的大型语言模型,目前仍在开发中,或将花费数千或数亿美元。Gemini将结合AlphaGo类系统的一些优势和大型语言模型的惊人语言能力,从而为AI系统赋予新的能力,如计划、解决问题和分析文本的能力。GoogleDeepMind的联合创始人兼首席执行官DemisHassabis表示,他们还有一些新的创新,也将是相当有趣的。
AlphaGo在ChatGPT出现之前,或许是AI领域内最耀眼的明星之一,其让大众最为熟知的成就,便是击败李世石,成为世界上第一个战胜人类围棋世界冠军的机器人。AlphaGo的成功,离不开强化学习技术,该技术通过反复尝试并接受关于其表现的反馈,可以学会处理需要选择采取何种行动的复杂问题,如围棋或视频游戏等。强化学习旨在“教”AI系统在特定情况下表现出预期的行为,对AI系统的某些行为进行“奖励”,以及对不受大众欢迎的行为进行“惩罚”。
如今,ChatGPT的核心技术之一——基于人类反馈的强化学习(RLHF)已经成为后续大型语言模型开发中不可或缺的关键技术。专业人士认为,GoogleDeepMind在强化学习方面的经验,或许可以帮助他们在生成式AI竞赛中夺得优势。
除了Gemini,GoogleDeepMind还展示了一个不需要人类监督、能不断自我学习,可以在模拟和物理环境中处理语言、图像和动作的AI模型——RoboCat。据介绍,RoboCat是第一个可以解决和适应多项任务的机器人代理,且可以把这种能力带到不同的、实体机器人中。此外,AlphaGo还使用了一种叫做“蒙特卡洛树搜索”的方法来探索和记忆棋盘上的可能动作。这是一种在完美信息博弈场景中进行决策的通用技术,除了游戏之外,还能广泛应用在很多其他现实世界场景中。
当前,语言模型的快速发展使许多AI专家担心,该技术是否会被用于恶意的用途或变得难以控制。为避免产生危险的东西,一些业内人士甚至呼吁暂停开发更强大的算法。GoogleDeepMind的任务,是加速谷歌的AI研究工作,同时也要管理未知的、潜在的严重风险。DemisHassabis认为,AI的潜在好处,如在健康或气候等领域的科学发现,使得人类必须继续发展这项技术。但他也主张负责任、计划周全地开发AI模型,以避免产生危险的风险。
微信扫码咨询
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49