另一种可能是,AlphaGo的估值网络出了问题。因为估值网络的权重是,而不管快速走子从一个局面开始重复了多少次,它的权值也是。对于一个局面,估值网络只得到一个数,而从这个局面往下走子,走多后会得到很多个数,统计上应该更为重要,但是AlphaGo不是这样想的,两边各自算得胜率后直接对半平均了。所以如果估值网络对某个局面得到的结果不对,则会极大地影响对该局面的胜率估计。注意这里得到很多个数的原因是按照文章,叶结点在积累了一定盘数后(40)才展开,而不是第一次访问就展开,以提高DCNN的效率。DarkForest没有用到估值网络,在L11的挖之后正确地返回了L12和L10这两个应手,据李喆六段说,都是正确的应手,这间接支持了这个推断。AlphaGo在87手之后才意识到自己已经大大落后,可能也是由于同样的问题,比如说把右边的黑大龙看成活的。国乒男单4强
中新网3月6日电 据外媒5日报道,津巴布韦3岁小女孩恩尤尼2月22日在河边洗澡戏水,一头巨鳄突然窜出紧咬,将其拖入水中,至今下落不明。数年前,她的祖父与叔叔也是遭巨鳄袭击死亡。支付宝崩了
“第三产业发展势头好于第二产业,关键还是市场需求结构发生了显著变化。”中国人民大学经济学院副院长刘元春告诉《经济日报》记者,近年来,人们从过去对制成品的需求逐渐转向对高品质服务的追求,这成了推动第三产业快速发展的重要动力。孙艺洲吹蜡烛