欢迎访问“郑州新闻网”,在这里您可以浏览到郑州发生的大小事,我们致力于为网民提供郑州新闻、健康,娱乐 、女性、房产、影视、图片,汽车等生活信息传播服务。

主页 > 郑州新闻 > “AlphaGo首出Bug,围棋算法的死穴在哪儿?”

“AlphaGo首出Bug,围棋算法的死穴在哪儿?”

来源:郑州新闻网作者:锦体更新时间:2021-09-21 14:22:06阅读:

本篇文章3360字,读完约8分钟

ketquaminhngoc【科技在线】

在韩国围棋界,获得多项世界冠军的职业九段李世石在与谷歌电脑alphago的人机大战中,3连败后,白手起家挽回一局。

大众把这场围棋人机大战看得太重了,看成是人脑和计算机的彻底竞争,其实不然。 因为,进行比赛就像下围棋一样。 如果人类在围棋人机大战中输了,人类的大脑也并不会比不上计算机。

事实上,围棋变化多端,纷繁复杂,但理论上并不是无限的。 只不过可以看成是数学主题,用计算机编程运算得到答案。 在假时间里,人类在国际象棋这方面迟早很难与计算机匹敌。 即使李世石3连败后,挽回了2局,那又如何呢? 在围棋方面,人类迟早比不上人工智能。

围棋人工智能的第一代算法采用穷举法,计算所有的棋步,选择必胜的棋步。 但是围棋的一些变化太多了,一时半会儿不会。

第二代算法是在抽样判断中选择胜率高的算法,大幅削减运算量,使得人工智能终于能够与业余围棋选手竞争。

Googlealphago是第三代算法,利用人工智能的自我学习能力飞跃性地提高了自己的象棋实力。 看起来辗压世界职业高手的阿尔法·戈在第四局中遭到了冷遇,有什么问题呢?

阿尔法go的算法有问题。 第三代算法的问题实际上也是第二代算法的问题。 因为第三代算法基于第二代算法的采样判断进行自我学习。 即使alpha go能和自己下国际象棋提高棋艺水平,它也能这样下国际象棋是基于抽样判断的。

抽样判断有弱点。 胜率高的下法未必是正确的下法,只不过是统计。 有些冷门的方法,反而可能会赢得惊人的胜利。

阿尔法go下臭棋时,思考速度特别快恰恰证明了此时样本很少。 李世石78手是奇招,下这一手的棋手很少,阿尔法go按照程序运算后认为李世石的胜算不高,反应特别快。 这是个大错误。

在围棋程序下象棋的棋手,感觉在计算机处于劣势时的应对非常混乱。 不仅是阿尔法go,zen也是。 电脑处于胜率低的状况,已经很难考虑了。 根据样本统计,在胜率低的情况下当然输赢多,逆转取胜的样本很难找。 胜率越低的情况下,alpha go的想法越混乱。 极端的情况下,找到的样本中胜率低的一方已经认输,可能没有之后的棋谱。 我不擅长阿尔法戈该怎么办。

阿尔法GO的失败也是人类的失败,毕竟程序也是人类编的。 另一方面,由于算法基于人类样本,导致了alpha go的失败。 如果李世石手上有对应的样本,alphago也不会这样评价错误。

alpha go的父亲哈比斯说:“alpha go的训练并不是特别要和李世石比较,而是让普通棋手像比赛前一样,只做日常的准备。 阿尔法go准备就是从网上下载很多业余棋手的棋谱研究,没有什么特别之处。 之后,和某棋手进行比较准备也不容易,我们至少需要几百万到几亿的棋谱,只有整体提供给alpha go,才能接收它进行深度学习。

哈比斯的话也证实了围棋人工智能第二代第三代的死穴,也就是样本判断的问题。 李世石逆转取胜的奇招,能找到的样本很少。 阿尔法go显然有很多职业棋手的质量很高,需要参考非常全面的对局,这是行不通的。

围棋难题还得处理

第四局,李世石交手反而能赢,这很不可思议。 因为奥赛罗有先手的特点,胜率很高。

人机大战引出了长期困扰围棋界的问题。 是围棋规则中关于贴目的的规定。 不下围棋的人可能不知道,但围棋迷很清楚。 国际象棋棋手是先手,有其特点,所以为了公平起见,黑棋棋手需要盯着白棋棋。

1949年(昭和24年)日本棋院围棋规则规定,黑方贴4目半。 从1955年第三期王座战开始,黑棋贴目从4目半变更为5目半。 但据统计,黑方仍占特点。 截止到2001年底,在日本棋院近5年进行的1.5万局官方公开对局中,(黑胶5目半的情况下)黑胶胜率达到51.86% )。 虽然黑白胜率差别不大,但在激烈的围棋比赛中,这种差别是致命的。

在国际比赛中实力明显优异的韩国,在很多比赛中都转入了第6轮半制。 中国也从2002年春天开始,全部改贴3/3/4子(相当于7目半)。 日本棋院对50年来实行的黑白棋5目半的制度也进行了改革,使一部分比赛接近中韩,从2003年开始使用了所有黑白棋6目半的规则。

截止到年底,中国大陆主办的第3局和第3/4局(相当于7局半)世界锦标赛共有380局对局,其中小黑赢了200局,胜率为52.6% ( )前3局春兰杯相当于5局半,未计入)。 另一方面,在台湾举行的应氏杯( 8点贴,相当于7目半)为黑胜100局、白胜97局。 据此,即使贴上7目半,黑色似乎也有点特色。

那么,到底黑侧对白侧盯上多少才是公平的呢? 现在,这个数值是根据很多人的对局统计计算出来的,在数学上并不是完美的答案。

说不定是阿尔法go让金庸武侠小说的周伯通和郭靖左右势均力敌,用左手和右手下棋,根据大量内战结果统计了粘贴目的的合理数值? o,这也不是完美的解答。

如前所述,alpha go之所以能自己下棋,还是根据与人类对局的抽样来判断的。 这和直接统计人类对局没有区别。

完美的解答,还是要回到开头,用原始的穷举法,找到下围棋的优秀解。 这样,就可以彻底确定粘贴目的的数值。 只是,运算量这么大的工程,不知道什么时候才能实现。

想象一下围棋被彻底解读后的样子。 某国际围棋大赛开始引起全世界的关注,手持黑手的棋手获得了第一个孩子。 裁判马上宣布,手持白手的棋手不必再干了。 比赛结果已经确定,很明显是谁赢了还是打成平局。 观众发出了欢呼声。

阿尔法go打麻将是如何兼具桌游设计的随机性的?

虽然围棋人机大战人类输了,但一些网民表示,人类的智慧中还保护着中国麻将。 (详情请参阅钛媒体的文案“赢了围棋也没什么大不了的。 阿尔法狗敢挑战麻将吗? |是钛做的)。 但是,中搜网络创始人、北京围棋业余比赛陈沛对采访他的记者说:“如果是麻将,人类会输得更惨吧! 麻将一共那么多,很容易计算。

但是陈沛的话其实是错的。 如果有一棵傻大树,他麻将打得不怎么样,但是他运气好,快要爆炸了,一开局就自己摸13吗? 阿尔法go有破解度高的招数吗?

麻将之类的棋牌游戏是随机抽牌的,所以有运气的因素。

一位网友对戏言说,如果麻将时三人联手对付阿尔法go,阿尔法go会输得很惨。 这是作弊,但也有大问题。 多人游戏中,局面非常多且复杂,人工智能该如何应对呢?

例如,3只身体在和alpha go打麻将,没有人作弊,但是甲玩家技术不行,错了牌,乙玩家受益。 这是阿尔法go无法控制的。

本来,alpha go学习麻将也必须根据与众多人类对局的样本来判断。 阿尔法go只知道什么样的打法胜率高,但是麻将没有必胜的打法。

围棋棋子摆在棋盘上是有目共睹的。 你听说过倒扣将棋棋子玩的黑暗将棋吗? 陆战队员也有暗手的游戏。 麻将实际上也类似于国际象棋的游戏。 卡片加盖玩。 建造的棋牌是什么,还得推测。 阿尔法go最多通过计算来判断,被覆盖的棋牌是什么的可能性很高,无法通过正确的推论得到结果。 也就是说,阿尔法go只有永远获胜才能进化。

围棋没有运气的要素,麻将有运气的要素,哪一个都有吸引力。

从广义上说,围棋、麻将这些棋牌游戏,其实属于桌游的范畴。 围棋英语是go,阿尔法GO GO就是从那里来的。 围棋进入bgg桌游排行榜前100名,中国国际象棋卡牌类游戏排名很高。

在民间,象棋和围棋这种没有运气要素的棋牌(桌游)正在没落。 现在关注围棋人机大战的网民是围棋迷吗?

因为大众想要的是更娱乐的。 像象棋和围棋这样没有运气因素的,游戏水平比较稳定。 他是名人。 普通人不容易赢。 除非你能找到象棋力量正好和你水平差不多的东西,否则玩起来没意思。 强的东西太强了,太弱了。

因此,新兴桌游的设计宗旨必须保证随机性,具有运气因素。 像万智牌、游戏王、炉石传说那样随机抽牌,像国际象棋和大富翁一样掷骰子,都会产生随机数,带来运气成分。 如果有运气的要素,所有玩家发挥的水平就不会太大不同,可以聚在一起开心地玩。

另一方面,没有运气因素的棋牌(桌游),理论上一定会存在优秀的解,所以一旦出现优秀的解,一定会引起兴趣。 围棋变化太多,至今也没有优秀的解,所以一直活到了今天。 现在,阿尔法go并没有完全打败李世石,围棋的生命力看起来还很顽强。

标题:“AlphaGo首出Bug,围棋算法的死穴在哪儿?”

地址:http://www.jtylhs.cn/zzxw/29417.html

免责声明:郑州新闻网是全球互联网中文新闻资讯最重要的原创内容供应商之一,本站部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,郑州新闻网的作者将予以删除。

郑州新闻网介绍

郑州新闻网立足郑州,纵览世界,依托郑州资讯优势,通过互联网提供最新、最快、最鲜活新闻资讯。为促进郑州市两个文明建设和社会信息化服务,为郑州扩大开放、走向世界服务。利用网络手段综合性、多角度、全方位地介绍郑州社会经济发展的最新的新闻、信息,引导郑州新闻的舆论导向,能过多种形式的互联网发布为用户提供更有价值的多方位资讯传播服务。