【AI】「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす
■ このスレッドは過去ログ倉庫に格納されています
米Alphabet傘下の英DeepMindは12月6日(現地時間)、「AlphaGo Zero」から進化させた強化学習採用のAI「AlphaZero」が、チェス、将棋、囲碁のそれぞれの世界最強AIを打ち負かしたと発表した。
強化学習(reinforcement learning)は大まかに言うと、学習用のデータを使わずに、AIが選択した行動が正しければ報酬を与えることで、AIの状況判断能力を上げていく機械学習方式。AlphaZeroはまた、行動の選択に「モンテカルロ木探索(MCTS)」と呼ばれる検索アルゴリズムを使う。
AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後AlphaGo Zeroに勝利した。
AlphaZeroはMCTSを使うことで、例えばチェスではチャンピオンのStockfishが1秒当たり約6000万のポジションを検索するのに対し、わずか6万しか検索せずに済むという。
また、AlphaZeroは、系列である米Googleのオリジナルプロセッサ「TPU」を5000基使っている。ちなみに、TPUは1基だけで1日当たり1億点のGoogleフォトを処理する能力がある。
DeepMindは、AlphaZeroの目的はチェスや将棋、囲碁に勝つことの先にあり、様々な実世界の問題を解決するシステムを構築することにあると語った。AlphaZeroは、単一のアルゴリズムが一連の設定で新しい知識を発見する方法を学べることを示しており、まだ初期段階ではあるが「複雑な問題に対する斬新な解決策を見いだす汎用的な学習システムを構築するというわれわれのミッションに自信を与えてくれた」という。
http://image.itmedia.co.jp/news/articles/1812/09/yu_alphazero1.jpg
3種目のチャンピオンを打ち負かした
http://image.itmedia.co.jp/news/articles/1812/09/yu_alphazero2.jpg
人間のチェスチャンピオン、AlphaZero、Stockfishの1決定当たりの検索量
https://youtu.be/7L2sUGcOgh0
動画
ITmedia 2018年12月09日 08時18分
http://www.itmedia.co.jp/news/articles/1812/09/news018.html なんでカルロ山って言うのかな。
ラリーでミニクーパーがポルシェに勝ったとこだべ。 その最強AI同士を戦わせたらどうなるの?(´・ω・`) >>1
囲碁は中国
将棋は日本
チェスはイギリス? あとは麻雀だけかな
麻雀は嶺上開花で上がれる人が強いと聞いたことあるからな >>6
そもそも戦わせて駄目な手を排除しまくったた結果だから テム・レイのあの謎装置付けたら
もっと良くなるんじゃね 将棋は真の王者決めるため、将棋崩しも
名人戦のなかに3番ほど追加しろよ
最強AIでも将棋崩しはへたっぴだろ 碁とか将棋とかもうそろそろいいからw
リアルでなんかの役に立つ段階にはいってくれや >AIが選択した行動が正しければ報酬を与える
意味がわからん チェスは引き分け多すぎ出し、先手後手の差がつきすぎだな 将棋はウソだろ。棋譜もないし最初しかやってないという噂が本当ぽい >>20
正しかったらクロック周波数をご褒美であげてやるんだろ? あれ?
将棋最強ソフトはぽんぽこじゃなかったっけ? AIが進化し続けたら、競馬とかのギャンブル
無くなるんじゃないの?
俺はギャンブルやらないから構わんが AIが凄いと言うよりマシンパワーにもの言わせ過ぎて微妙。 そもそも同じ条件でソフトを動かしてるのか? 方やスパコン、方やPCじゃあるまいな 自己学習でただ単純に囲碁・将棋・チェスで勝つなら前もやったけど
今回はより効率的に駒の動かし方から覚えて
わずか12時間で
羽生や藤井君に33−4で勝てるPonanzaを上回るElmoに33-4で勝てるまで成長したのがポイント >>33
ホントにヤバすぎ
elmoもヤバいと言われてたけどそれすら越えてくるとは >>36
計算量的にどうなんだ?
ハイパーグリッドに乗っけたから数時間です
とか言われてもそうですかとしかならないんだが しかもこれ1年前の成果が
ピアレビュー通ってScienceに載ったっていうのが本来のニュースだから
今はたぶんもっと強くなってる 人間の考えうることなんてホントに僅かしかないんだなと思うよ、全ての分野でAIが最適解を出す世の中になるんだろうなあ。。。 学習時間がチェス9時間、将棋12時間、囲碁13日間か
将棋は持ち駒があるしチェスよりずっと複雑かと思ってたが
囲碁と比べてチェスとの差はほとんどないんだな
チャンピオンソフトの完成度の差かな モンテカルロ法ってまた古いネタを持ち出してきたなあ。まあ古くても良いんだけど。 >>40
AIの話題っていつもこういう単細胞が湧くな 将棋は先手のほうが勝率が悪いのか
人間とは逆の結果だな >>42
学習時間の比率でいうと将棋はチェスの1.333…倍
これは結構な差だと思うが >>42
碁は対戦相手が同じとこで作った
AlphaGo Zeroだから同じTPU(GPU)で動かせるけど
チェスと将棋のチャンピオンソフトはCPUでしか動かないからこの差がつくみたい >>48
GPUで差がつくとか面白いね。
3次元的思考が必要なんかな? プロの棋士とか存在意義あるのか?
AIのほうが強いならいる意味無いだろ >>52
人間より馬や車の方が速いけどマラソンや短距離走は存在してるぞ >>27
youtube見ろ
素人でもわかるくらい凄いぞ >>50
昔はIBMが
スパコンのリソースぶん回しでチェスのソフト作ってたし
コンピューター将棋にもスパコン使ってたとこがあったけど
今はもうチェス・将棋は半分趣味みたいな人しか研究してないから
一般売りのCPUで動くレベルでそれぞれの世界のチャンピオンになってるってだけかと
(two 2.2GHz Intel Xeon Broadwell CPUs with 22cores とある) こんなことはいいから、早くコンピュターに人格を付与しろよ。
それでぜんぶコンピュータに仕事させて
俺たち人間は遊んで暮せばいい。 こんな高い勝率で勝つのかよw
もう将棋では人はAIに勝つことはないな 去年のPonanzaと佐藤名人の勝負ですら、名人が赤子のようだったというのに。 AIの出現で今まで人間が作り上げた常識なんて狭い世界のものだったんだなと、これからはAIという神に教えを乞う時代 プロ棋士とかさっさと消えてほしいわ
明らかにAIのほうが強いのに
藤井なんとかがもてはやされるっておかしいだろ >>20
合議に参加するAI(プログラム)の優先順位(発言権)において
正しい選択をしたAIのランクの順位が上がり、
誤った選択をしたAIのランクが順位が下がる。
各AIはそれぞれ自己学習を続ける。 藤井君は一般向けハイエンドのCPU使っててサーバー向けエントリー(マニア向けハイエンド)のCPUにしとけば良かったみたいな事最近言ってたね 見て面白ければいいんだが解析されすぎてワンパターンになったら
面白くなくなるからな。もうお金とって見せることができなくなる。
そのときはルール自体を改良しなきゃいけなくなる プロ棋士とかもういらんだろ
今までは「人間で一番強い=世界で一番強い」だったから価値があったけど
もうAI>人間が確定した以上
存在意義のない職業
こんなやつらがもてはやされるのがおかしい
これからは強いAIを作ったプログラマーをもてはやすべき >>6
初期状態で先手勝ち、後手勝ち、引き分けのいずれかが分かる >>43
全知全能の神とはよく言ったもので、全てを知った上で最善を尽くすより正しいことはない
もちろん、アルゴリズムの進化やリソースが無限であることが重要だけど 競馬は既に勝ってた人いたやん
その後税務署に負けてたけど 人間が勝つには対局中にプラズマを発生させる手技を習得するしかあるまい >>68
つまらないレスを連投すんな
いらないのはお前みたいな何も面白くない人間 >>70
データだけなら充分勝てるだろうな
だけど騎手がAIの予想に反するようにやるだろ チェス 9時間
将棋 12時間
囲碁 13日間
人間が学ぶ際の難しさの程度もこんな感じだね。 ポーカーやら麻雀とかの不確実要素の多いゲームでも
もうAIのほうが勝率高いんかな >>68
こういう人ってウサインボルトより速い2足歩行ロボットが
開発されたら同じことを言うんだろうか
研鑽を重ねた人間の知能や技術の競い合いが楽しいという
スポーツや競技の本質が理解できないんだろうね >>68
AIがやってることを解説するという仕事が残っている たしかに90年代前半の格闘ゲームのボスは強かったな
ギースとかサガットとかルガールとかジェネラルとか >>80
しかし将棋なんかは棋譜が全てだからね
スポーツとは違う 「おっけーぐーぐる」
「今日の夕食作るの何が良い?」
>”チャーハンです”
つーよーに将来なるんか?。 麻雀も河の状況や山の残りなど見えてる情報で最高効率の期待値出せるから
他の3人が期待値至上主義で頑張ってたらAIが強いだろうね
ただ一人か二人素人や癖の強い打ち手入れた時に
そいつを食い物に出来る対人で上手い人いたら人間の方が強いかも >>36
わずか12時間とかでも人間換算で5000年とかだろ モンテカルロ木探索は、ランダムに複数回試行して最良の結果を選ぶ方式なのか? 運が絡むゲームは試行回数必要だから人間の体力がもたなそう 人間同士の対局の魅力は無くならないと思う。
二日制とかでやる意味は薄れてくるし、棋理の追求という点ではグーグルの研究者に任せたほうがいいだろうけど >>89
この宇宙のものはすべて日本が起源デスマスダ 麻雀やポーカーで常勝できるようになったらすごいけどな チェスは後手、将棋は先手有利なんだな。まぁそれ以前にチェスはドロー多すぎだろ >>80
本質が理解できてないのはお前
将棋や囲碁は完全に盤上の知力勝負の世界
物理的にどう思考したかとか何を使ったかは問題ではない
そういった意味でコンピュータも人間も同列に扱える世界なんだよ
陸上競技とは根本的に異なる
それに、何も囲碁や将棋が「楽しくない」なんて言ってないから
人間同士がゲームとしてやる分には楽しいゲームとして存在意義はあるだろ
おれが言ってるのは「プロ棋士」の話だから
実際に、AI>人間が確定した職業はどんどん無くなってきている
そういった時代の流れすら理解してないのか? >>87
たとえば12の候補があったとして、その先をそれぞれ投了まで数万回とか何度もランダムに打つ
一番勝率が高かった候補手が最善手だろうと考える
みたいな感じだったと思う
AlphaZeroは学習のときだけこれをもっとマシにしたやり方を使ってたとおもう 凄えなあ
最早人間の効率化なんぞカスみたいなもんだわ >>34
学習の時はマシンパワーに物言わせるけど
たぶん試合の時にはそんなに計算コスト無いよ
昔みたいな総当たりで考えてるわけじゃないから チェスと将棋なんて囲碁よりも簡単じゃん
いいかげんグーグルのAI幻想詐欺から目を覚ませよ愚民ども >>93
やれば勝てるようになる。
あれは運の要素がでかいので常勝はできないが、回数重ねて勝率見れば、AIが勝つようになる。 ■ このスレッドは過去ログ倉庫に格納されています