AlphaGo：如何解决围棋AI的挑战难点？

新知榜官方账号

2023-06-30 21:38:40

AlphaGo的设计

围棋对AI的挑战难点在于棋盘空间的大小，它包含10170个位置状态空间。作为比较，国际象棋的状态空间约为1043。这样的游戏都具有高分支因子，也就是当前状态下的可能下法的数量。围棋中可能的游戏场景的数量要大于宇宙中的原子数。AlphaGo的开发者设法解决了这一问题。他们设计的系统基于树搜索，由神经网络驱动。

AlphaGo实施的每一个细节都是多年研究的结果，而它们的融合才是AlphaGo成功的关键。AlphaGo的CNN的输入部分是当前的棋局，输出部分是对人类对手下一步棋的预测。AlphaGo使用神经网络来预测人类对手的下法。为了训练CNN，AlphaGo的开发者在围棋服务器KGS上选取了三万盘棋局，并从每一局中随机抽取对战的位置及棋手随后的行棋。这些应对的行棋就是神经网络预测的目标。输入位置转换为48个特征，表示每个交叉点棋子的颜色、四周相邻位置为“空”的数量和一些其他信息。这些特征都根据以前的研究结果进行了选择。因此，输入层是一个19×19×48堆栈，包括了棋盘上每个交叉点的每个特征的值。CNN有13个隐藏层，每层256个滤波器。输出层的尺寸为19×19，输出中的每个单元都包含一个人将棋子放在相应交叉点的概率。神经网络通过标准反向传播进行训练。

AlphaGo还使用了强化学习。神经网络与蒙特卡洛（MCTS）的融合图：AlphaGo中的蒙特卡洛树搜索。AlphaGo使用了各种不同的UCT规则来选择行动，优化方程式x(a)+u(a)，其中，x(a)是对行动（走法）的评估。u(a)是P(a)的一部分，即SL神经网络预测出来的概率。在一个场景中，CNN会偏向MCTS，来尝试新的走法，这些走法一般都是非常罕见的，但是对于CNN来说，却是一个最优解。虽然增强学习网络被证明比SL网络更强，但是，当走法的选择经过SL网络提升时，AlphaGo的整体表现会更好。

AlphaGo的成功关键

AlphaGo最大的优势是应用了通用算法，而不是仅局限于围棋领域的算法。AlphaGo证明了像围棋这样复杂的问题都可以通过先进的技术解决。深度学习已经被成功应用于图像及自然语言处理、生物医疗及其他领域。AlphaGo的开发者们所使用的方法或许也可被应用于上述领域。AlphaGo的成功关键在于：1）深度学习技术的应用；2）树搜索和神经网络的融合；3）强化学习的使用；4）通用算法的应用。

本页网址：https://www.xinzhibang.net/article_detail-3477.html

寻求报道，请

关键词

分享至微信：

相关工具

京东推出的商品图智能设计小工具

IconifyAI

AI App图标生成器

Spline AI

Spline推出的AI生成3D物体、动画、材质

Magic Design

在线设计工具Canva推出的AI设计工具

美图设计室

美图推出的AI海报设计工具，一键生成海报宣传图

Luma AI

AI 3D捕捉、建模和渲染

AI视频抠像教程

什么是AI视频抠像？AI视频抠像是一种使用人工智能技术（如深度学习）来自动分离图像或视频中的前景和背景的方法。与传统的手动抠图相比，ai抠图可以更快速和准确地完成抠图任务。它可以用于各种应用，例如视频编辑、平面设计和虚拟现实等。如何进行AI视频抠像？现在已经有很多剪辑软件当中都使用到了这种ai智能抠

分类标签 AI抠像视频编辑人工智能

12-07 02:13

视频翻译工具MyHeyGen使用教程

视频翻译工具MyHeyGen使用教程近期，一款名为“视频翻译”的工具引起了广泛关注。这不是一个简单的网页应用，而是一个可以免费部署在个人电脑或服务器上的实用程序。它的强大之处在于能够翻译任意时长的视频内容。所谓的视频翻译，实际上是指同声传译。虽然这类工具并非近期才问世，市场上已有多款成熟产品，例如我

分类标签视频翻译工具MyHeyGen

12-03 22:26

英特尔发布第二代Galileo主板，面向物联网开发者

英特尔发布第二代Galileo主板，面向物联网开发者去年年底，英特尔推出第一代Galileo（伽利略）微型主板，面向开发者群体，专为物联网打造。本月初，微软也向开发者免费赠送Galileo主板。现在，英特尔也发布了第二代Galileo主板，即GalileoGen2。借助英特尔Galileo主板，开发

分类标签英特尔Galileo物联网

11-20 18:11

图深度学习在电商推荐中的应用

图深度学习在电商推荐中的应用随着互联网技术的高速发展，互联网技术不断深入人民生活的方方面面。现在断网，你还能活吗？？我们生活在一个数据的世界，音、视频、图像信息及一些非结构化的数据量，每时每刻都在产生。基于数据之上的人工智能技术也在渗透我们的生活。如我们日常生活中，遇到的美颜特效相机、数字人播报新闻

分类标签深度学习机器学习图深度学习电商推荐数据挖掘人工智能

11-16 10:08

《测绘学报》构建与学术的桥梁拉近与权威的距离

《测绘学报》构建与学术的桥梁拉近与权威的距离本文介绍了卫星导航信号在卫星导航系统中的重要性以及北斗三号导航信号设计的主要需求和挑战。同时，提出了一种创新的卫星导航信号理论：多载波恒包络复合导航信号，并介绍了两种创新的导航信号结构：正交复用二进制偏移载波（QMBOC）信号和非对称恒包络二进制偏移载波（

分类标签卫星导航信号北斗三号多载波恒包络复合导航信号正交复用二进制偏移载波（QMBOC）信号非对称恒包络二进制偏移载波（ACE-BOC）信号知识产权

11-03 10:23

华为P30系列新品发布会：全面升级智能手表HUAWEIWATCHGT

华为P30系列新品发布会：全面升级智能手表HUAWEIWATCHGT华为P30系列新品发布会发布了搭载超感光徕卡四摄技术的华为P30系列旗舰新机，以及智能手表HUAWEIWATCHGT系列新成员——雅致款和活力款。新款HUAWEIWATCHGT活力款与去年发布的HUAWEIWATCHGT表盘大小一致

分类标签华为P30系列智能手表HUAWEIWATCHGT

11-03 10:21

联想Z6青春版发布会：采用华大北斗芯片，支持多种定位系统

联想Z6青春版发布会：采用华大北斗芯片，支持多种定位系统今天下午，联想在国家北斗科技园召开了旗下新机——Z6青春版的发布会。从名字就可以看出，这是一款定位中低端的机型，而且与此前发布的旗舰Z6Pro同属一个系列。按照惯例，既然是同一个系列，而且并非旗舰的情况下，这类千元机一般只会跟着旗舰机一起发布，

分类标签联想Z6青春版华大北斗定位系统

11-03 10:20

MotrrGalileo智能云台，让iPhone拍摄更加出色

MotrrGalileo智能云台，让iPhone拍摄更加出色MotrrGalileo是一款专为iPhone设计的智能云台，它内置电机，可以自动旋转来拍摄全景照片、延时摄影等，让iPhone的拍摄功能发挥到极致。不仅如此，MotrrGalileo还有20款适配APP，可以实现各种功能，如拍摄360度球

分类标签 MotrrGalileoiPhone云台全景照片延时摄影

11-03 10:19

TicWatchKids：AI智能儿童手表的全面评测

外观设计 TicWatchKids的金属包装盒采用类似涂鸦的风格设计，上面还是有非常可爱的卡通形象，更加符合小朋友的审美与喜好。同时，TicWatchKids还拥有蓝色和粉色两款配色，满足不同年龄段孩子的需求。在屏幕方面，TicWatchKids搭载了1.4英寸彩色屏幕，其分辨率达到320*320，

分类标签 TicWatchKids儿童手表AI语音助手

11-03 10:17

Quark开发者俱乐部网友设计的PM2.5室内空气质量监测和调节系统

Quark开发者俱乐部网友设计的PM2.5室内空气质量监测和调节系统PM2.5作为对人体伤害最直接的污染源，这两年PM2.5的监测和防控得到了越来越多人的重视。相比于室外无法控制的空气质量，室内空气质量是人为可控的，可以说如何经济而有效的降低室内的PM2.5是我们每个人都要面临的话题。今天我们就给大

分类标签 PM2.5室内空气质量监测和调节系统

11-03 10:16

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway