李世石
纵观全盘,计算机Alpha Go出现了两次较小的失误,最终没有影响大局;而李世石却犯下了一个重大失误,直接导致最后丢掉了比赛。
之后的比赛李世石能否捍卫人类尊严?这台在第一盘击败了韩国棋王李世石的Alpha Go到底是一台怎样的超级计算机?
据谷歌旗下DeepMind公司CEO兼谷歌副总裁戴密斯-哈萨比斯透露,DeepMind为AlphaGo输入了海量的职业棋手对局,其自我演绎的对局数更是达到了3000万局,相当于人类1000年的学习量。
Alpha Go的核心是两种不同的深度神经网络——“策略网络”(Policy network)和“价值网络”(Value network)。
“策略网络”负责减少搜索宽度,排除明显错误的着法;“值网络”负责减少搜索深度,通过对局势的判断,在明显劣势下果断抛弃某些路线,不用每条道算到黑。
通过这两个网络分析局面,Alpha Go会更像一个人类棋手,通过对当前局面的判断和对未来局面的推演,根据不同权重,在函数中算出一种赢的概率最高的着法。
看到这里不少对于人工智能不甚了解的文科生可能已经晕了——什么策略、价值,什么宽度、深度,光是这么解释完全抓不到要点!说到底这Alpha Go和十多年前的深蓝相比有哪些突破性的进步?这人工智能下围棋到底又比下象棋难在哪?且听小编来给你讲讲人话。
为什么计算机挑战国际象棋10多年前就成功,围棋却不行?
国际象棋每回合有35种可能,一盘象棋可达80回合,在计算方面,国际象棋最多会有10的47次方局面;而围棋每回合有250种可能,一盘棋可长达150回
合。对于一个19x19的围棋棋盘而言,一共有361个位置,而每个位置可以单独放置黑棋、白棋或者留空,理论上所有的可能组合是3^361种,其合法的
组合超过170位数。
170位数是什么概念呢?如果有这个数量级的水分子,将足以填满整个宇宙!
在十多年前,深蓝在国际象棋上战胜了当时的国际象棋棋王卡斯帕罗夫,其原理其实是让人工智能在计算上穷尽了所有的可能,但如果挑战项目换成围棋,170位数的可能性,无论在当时还是现在,都远远超过了计算机的计算能力。
因此,在Alpha Go每下一步围棋的时候,并不能计算尽所有的可能性下一招“必胜之棋”,而是通过上面提到的“策略网络”和“价值网络”的分析,做出一种获胜概率更高的选择。
这种从深蓝到Alpha Go的深度神经网络运用的变化,恰恰使得Alpha Go的运行方式更像人类——也就是说要进行“取舍”。
另外,除了深度神经网络算法之外,Alpha Go还通过蒙特卡罗树搜索吸收以往棋局的经验,同时另一边进行着自我对局。
蒙特卡罗树搜索是把预测走棋、采样走棋、提升速度、预测局面 的各部分连起来,组成了一个完整的系统。
下面这个是国际象棋的。
国际象棋蒙特卡洛树
这个是围棋的。
围棋蒙特卡洛树
同样,这种从局部到整体,对知识进行分层的结构计算方式与之前相比更加统一,从人类思维的角度来看,其获得的知识也就更接近围棋的本质。这也就是为什么圈内人士都认为,如果人工智能能够在围棋上战胜人类,将代表人工智能进入了一个新阶段。
最后,这个内行看门道,外行就凑个热闹。讲道理的话,小编其实还是支持我们的人类代表李世石的。
(看看新闻网记者:杨城)
剑网行动举报电话:12318(市文化执法总队)、021-64334547(市版权局)
Copyright © 2016 Kankanews.com Inc. All Rights Reserved. 看东方(上海)传媒有限公司 版权所有