浅谈MasterGo中的蒙特卡洛算法

新知榜官方账号

2023-06-30 18:36:58

什么是蒙特卡洛算法？

蒙特卡洛算法是一种在海量样本中找到最佳解决方案的算法，它无法保证找到的是最好的方案，但是样本越多，越能找到最佳的解决办法。通俗的解释：假设你需要从1000个苹果中挑出最大的一个苹果，你可以闭着眼睛每次只拿一个，不限制挑选次数。于是，你开始随机的逐一比较，每次比较后留下大的苹果，如此循环往复，拿的次数越多，挑出最大苹果的可能性也就越大。但除非你把1000个苹果都挑一遍，否则你无法确定最终挑出来的就是最大的苹果。在蒙特卡洛算法中，样本越多越能找到最佳的解决办法，不过不能保证是最好的方法。

与蒙特卡洛算法相对的是拉斯维加斯算法：假设你需要开一把锁，有1000把钥匙可供选择，但只有1把能把锁打开。于是你每次随机拿1把钥匙去尝试，直到打开为止。尝试的次数越多，打开锁的机会就越大，但在打开之前，那些错的钥匙都是没有用的。所以，拉斯维加斯算法要求尽量找到最好的解决办法，但是未必能找到。

MasterGo中的蒙特卡洛算法

MasterGo中的蒙特卡洛算法“机器人”与围棋高手的对决，曾被称为人工智能的“阿波罗计划”。传统的棋类软件，包括IBM战胜世界国际象棋冠军的深蓝计算机，一般都是采用暴力搜索，对所有可能的结果进行搜索。这种方法在象棋、跳棋等方面具有一定可实现性，但对于围棋就无法实现。MasterGo则通过蒙特卡洛树搜索算法和策略网络、估值网络这两个深度神经网络合作来完成下棋。

策略网络主要用于生成落子策略，在下棋的过程中，它不是考虑自己应该怎么下，而是学习人类的高手会怎么下。也就是说，它会根据输入棋盘当前的一个状态，预测人类下一步棋会下在哪儿，提出最符合人类思维的几种可行的下法。然而，策略网络并不知道落子的这步棋到底下得好还是不好，这时候就需要估值网络来发挥作用了。估值网络会为各个可行的下法评估整个盘面的情况，然后给出一个“胜率”，这些值会反馈到蒙特卡洛树搜索算法中，通过反复如上过程推演出“胜率”最高的走法。蒙特卡洛树搜索算法决定了策略网络仅会在“胜率”较高的地方继续推演，这样就可以抛弃某些路线，不用一条道算到黑。利用这两个工具来分析局面，MasterGo就能判断每种落子策略的优劣，就像人类棋手会判断当前局面以及推断未来的局面一样；在利用蒙特卡洛树搜索算法分析了比如未来20步的情况下，就能判断在哪里下子赢的概率会高。这就是MasterGo中的蒙特卡洛算法。

总结

蒙特卡洛树搜索算法是在海量样本中找到最佳解决方案的算法，它是MasterGo的核心之一。通过策略网络和估值网络的协作，MasterGo能够判断每种落子策略的优劣，从而在蒙特卡洛树搜索算法中找到“胜率”最高的走法。这种算法能够大幅降低运算量，并判断在哪里下子赢的概率会高。

预告：下一期，我们将为你介绍什么是强化学习和迁移学习。如果你感兴趣，请留意关注微信公众号：智能加研究院。

本页网址：https://www.xinzhibang.net/article_detail-3401.html

寻求报道，请

关键词

分享至微信：

相关工具

美图推出的AI海报设计工具，一键生成海报宣传图

Dora AI

AI在线生成精美3D动画的网站

Logomaster.ai

AI Logo生成工具

Alpaca

将生成式AI集成到Photoshop图像设计中

ColorMagic

AI调色板生成工具

Spline AI

Spline推出的AI生成3D物体、动画、材质

美团发布设计效能工具MasterGo，重点布局设计效能工具的建设和优化迭代

美团发布设计效能工具MasterGo，重点布局设计效能工具的建设和优化迭代近日，美团设计委员会在北京综合指挥中心举办了“美团设计效能工具发布会”，面向公司所有产研设团队发布了包括MasterGo在内的多款设计效能工具和能力。据了解，美团设计委员会于去年4月宣布加入“MasterGo国产设计软件共创计

分类标签美团MasterGo设计效能工具国产设计软件共创计划

12-08 16:14

免费视频翻译工具MyHeyGen的使用方法

简介近期，一款名为“视频翻译”的工具引起了广泛关注。这不是一个简单的网页应用，而是一个可以免费部署在个人电脑或服务器上的实用程序。它的强大之处在于能够翻译任意时长的视频内容。所谓的视频翻译，实际上是指同声传译。虽然这类工具并非近期才问世，市场上已有多款成熟产品，例如我之前提到的Heygen和rask

分类标签视频翻译Heygen免费工具

12-03 22:23

PikaLabs发布能编辑动画、2D动漫、卡通等多种画风的AI视频生成工具Pika1.0

PikaLabs发布能编辑动画、2D动漫、卡通等多种画风的AI视频生成工具Pika1.011月，AI视频生成领域卷到极致了！PikaLabs发布了一款能编辑动画、2D动漫、卡通等多种画风的AI视频生成工具Pika1.0，支持文本生成视频、A视频⇋B视频不同的风格转换、扩展视频画布、更改、延长视频等多

分类标签 PikaLabsAI视频生成动画2D动漫卡通

11-30 22:15

Pika1.0：AI视频拍摄会为生活带来哪些改变？

Pika1.0：AI视频拍摄会为生活带来哪些改变？随着Pika1.0的正式发布，AI视频领域再度掀起了一场震撼的浪潮。这家仅成立六个月的初创公司以其创新性和高效率引起了广泛关注，不仅获得了5500万美元的融资，估值达到近2亿美元，而且投资人名单更是硅谷半壁江山的鼎盛阵容，包括前GithubCEONa

分类标签 Pika1.0AI视频技术突破

11-30 22:14

世界首部人工智能电影《Cassandra》即将上映

世界首部人工智能电影《Cassandra》即将上映《Cassandra》是一部以人工智能故事为主线的电影，由ScuolaHolden和RaiCinema制作，将于11月27日在意大利都灵上映，并将在RaiPlay上播放。故事主要内容为：主角阿加莎是霍尔顿学校的一名年轻学生，被选中训练人工智能系统Ca

分类标签人工智能电影Cassandra意大利

11-26 16:17

人社部：1至9月全国城镇新增就业1022万人，完成全年目标任务的85%

就业形势总体改善，城镇新增就业1022万人对于当前的就业形势，王晓萍表示，“今年以来，我国就业形势总体改善，保持基本稳定。”1—9月，我国城镇新增就业1022万人，完成全年目标任务的85%。高校毕业生等青年就业基本稳定、持续好转，农村劳动力外出务工规模继续增加，3297万脱贫人口实现务工增收。今年各

分类标签就业城镇新增就业人才供需

11-18 18:16

MasterGo2.0发布会：AI时代的企业级产品设计平台

MasterGo2.0发布会：AI时代的企业级产品设计平台备受关注的“MasterGo2.0发布会”成功举办，来自各行业头部企业的300多位设计负责人、研发负责人共同见证了MasterGo2.0的发布。MasterGo在此次2.0版本的发布中，重磅推出了设计工程化、企业级解决方案，以及MasterG

分类标签 MasterGo2.0设计工程化企业级解决方案

11-13 02:19

MasterGo发布全新升级的2.0版本，正式开启MasterGoAI内测

MasterGo发布全新升级的2.0版本，正式开启MasterGoAI内测昨日，一站式产品设计协作平台MasterGo发布了全新升级的2.0版本，推出了设计工程化、企业级解决方案，并宣布正式开启MasterGoAI的内测。同时，MasterGo也正式公布了中文品牌名——“莫高设计”。MasterGo

分类标签 MasterGo产品设计协作平台设计工程化企业级解决方案AI

11-13 02:18

MasterGo2.0正式发布

MasterGo2.0正式发布MasterGo2.0是一款定位于AI时代的企业级产品设计平台，经过2年的迭代，已经服务了20个行业数百家企业。MasterGo2.0推出的三大核心功能分别是：MasterGo设计工程化MasterGo设计工程化是一项将设计团队和研发团队同频提效的功能。通过Master

分类标签 AI时代企业级产品设计平台设计团队

11-05 16:17

MasterGo发布基于人工智能技术的2.0版本，并推出中文品牌名“莫高设计”

MasterGo发布基于人工智能技术的2.0版本，并推出中文品牌名“莫高设计”11月2日下午，MasterGo对外发布了基于人工智能（AI）技术的MasterGo2.0版本，包括该版本的设计工程化、AI和本土企业级解决方案，以及发布了MasterGo中文品牌名“莫高设计”。MasterGo创始人、C

分类标签 MasterGo人工智能设计工程化

11-05 16:16