【IT】Microsoftが“麻雀AI”を開発。3カ月でプロプレイヤーの腕前に
■ このスレッドは過去ログ倉庫に格納されています
Microsoftは、同社の研究開発機関Microsoft Research Asia(MSRA)が開発した麻雀AI「Microsoft Suphx(Super Phoenix)」がオンライン麻雀対戦プラットフォーム「天鳳」において、AIとして初めて10段の段位を達成したと発表した。
Suphxは、2019年3月より天鳳に参戦し、5,000回の対局ののち同6月に10段へ到達。同プラットフォーム内における10段という段位は、最高位の天鳳位に次ぐ強さ。参考までに4人麻雀で天鳳位に到達したプレイヤーは13人、過去に10段に到達したことのある(降格したプレイヤーも含む)プレイヤー数は180人ほどだという。
麻雀はその複雑さゆえにAIが学習を行なう上での課題が多かった。まず、巨大な状況空間を必要とすること。牌の数が136個と多くプレイヤーの順序が変化するため、AIにボードゲームを学習させるさいによく使われる「モンテカルロ木探索」をそのまま適用できない。
次に、「不完全情報ゲーム」であること。ボード上の情報がすべて見えている「完全情報ゲーム」である碁やチェスなどに対して、麻雀は対戦相手の手牌など見えない情報が多い不完全情報ゲームであるのに加え、ランダム性が高く運の要素が排除できない。
さらに、報酬メカニズムが複雑であること。天鳳で採用されているルールでは、役がなければ上がれないのに加えて、点数の計算が複雑である。また、1ゲームが8局で構成されるため、意図的に対局を負けることでゲーム全体の得点を引き上げるといった大局的な状況判断が必要となる。
MSRAではこれらの課題を解決するため、新たなアルゴリズムを開発した。まず、持続的な探索が行なえる新たな探索戦略を採用し、巨大な状況空間の問題に対応。これにより、効率的にリアルタイムな戦略を立てられるようになる。
次に、自己対戦戦略を取り入れ不完全情報ゲームに対応した。自分が見えない情報をすべて知っていると仮定した上で、Suphx自身の選択が最適であるかを判断する。
さらに、長期的な報酬予測ネットワークを採用し複雑な報酬メカニズムの問題を解決した。前後のラウンドの予測スコアの差を利用して、各対局の最終得点を適切に予測する。
不完全情報ゲームはAIにとって解決が困難なゲームである一方、アルゴリズムを開発する環境としては理想的で、金融投資やスマートドライビングなどといった現実世界の複雑な問題へのAIの応用にもつながるとしている。
Impress
https://pc.watch.impress.co.jp/docs/news/1204268.html >>611
アイテム使った時点で手牌ごっそり入れ換えてるに決まってるだろw 効率だけ見たらタンピン役牌で平たく待ってリャンメン以上になったら
テンパイ即リーで5200くらいを何回も上がるルーチンなのかなぁ。
なんかタコ打ちと紙一重な気がするが。 >>615
サターンのギャン自己麻雀は好きだったな
スジ良く打てばアガれるようにできてたし やっぱチャンタとか出てこなくなるんだろうか
普通にやってると揃えない役だって言うし >>619
最優先は振り込まないじゃないかなあ。
確率論で計算したらまず振り込まなさそう。 >>578
配牌・ツモ全てメルセンヌ・ツイスタ乱数にしてCPUもイカサマなしの麻雀ゲーを私的に作ったことあるが、ひたすらかったるい展開で萎えた >>592
常人でできる範囲でも電源パターンとかがあるな 十三不倒でこりゃダメだとベタ降りするか、リスク覚悟で国士狙うか、そこらへんの判断は気になるな。 オンラインゲームでやるなら牌譜沢山集めて山を予想して欲しい >>615
野球拳はクリアしなくても動画ぶっこ抜けばいいやん
つーか、3DO版のほうがエロいし
エミュレータで動かしてメモリエディタ弄れば余裕 >>582
麻雀は奥が深くないに対しての返答なんですが。 AIでクマクマタイムを自由自在に繰り出せるようになりました >>631
麻雀は奥が深くない、とか俺は言ってないけどアンカーミス? >>23
トップはオカ、ウマといったボーナスポイントが入るから差し込みやノーテン流しで確実にボーナス取りに行く。 COM相手の麻雀ゲームだと難易度や相手の強弱は結局イカサマの有無だから
萎えるんだよね
麻雀に限らず信長の野望とか戦略ゲーム全般に対してだけどプレーヤーCOMが
ゲーム管理と完全に独立していて尚且つ手強いゲームを早く出してほしい
単に強いAIでなく個性持たせて何パターンも作れば面白くなるだろうな
ネットで人間相手にやれと言われたらそれまでだけどリアル相手は嫌いなんだよ >>478
AIくんとか、片山まさゆきの漫画のキャラになりそうだけどね
ソニーくんみたいな >>636
けど昨今はぶっ飛び終了やぶっ飛ばしボーナスがあるので、攻撃が最大の防御になったりするけどね >>603
>>611
この辺はゲームによりけりだな
麻雀学園は
1.最初からテンパイしてて何巡目かにリーチするまでは上がらない。テンパイ形も決まってて待ちは変わらない。
2.最初からテンパイ形が決まっていて特定のヤオチュー牌をポンさせたらテンパイ成立
。
てパターン。この手のゲームは思考ルーチンが必要ないから開発はラク。
611が言ってるのは一応コンピュータが上がりの形を作ろうとするビデオシステムの麻雀放送局かな
>>618
危機一髪真由美ちゃんではプレイヤーが上がれないフラグが立つと和了牌が出て来ないうえに、敵の上がりの形が決まってなくて何故か手牌がごっそり変わるらしい。 >>638
オンライン対戦とかだと相手見えないし
実はもう既にある程度AIが担ってるかもよw
強すぎず弱すぎず相手の技量を量りながら
気持ちよくさせる接待プレイとかさ。 マージャンは運と他人の思考判断の上での確率論だからな。
確率計算はお手の物だとして他人の心理をどこまで読むかということになる。 >>2
上級者になれば未来視したり霊を降ろしたりできるようなる 天鳳って、無課金だとリーチ後一発で相手の当たり牌ひいてきたり
課金するとリンシャンカイホウしまくりのやつだっけ 上茶谷大河って
片山まさゆきの漫画キャラみたいなネーミングやね 負けるたびにCPUに供給される電圧を引き下げられるルールも組み込んで欲しい 確率がどうのとかより、なにが起こっても感情のブレが無く、疲れや恐れ、反省といった勝負事に御法度な要素がまるでないことの方が強いだろうな
対局して面白くもなんともないけど 捨て牌がわかるからカウンティンクしやすいし、捨て牌から相手の手牌も推測しやすい。
常に勝たなくてもいい。
相手を邪魔するのに自分だけでなく他人も操り、上がらせないだけでも勝利条件になる。
そのへんのコントロールは、AIだと独壇場になる。 >>651
天鳳で喜んでるのが雑魚だろ
麻雀はコンピュータからめたらだめだ、基本
乱数がゴミなんだから >>641
>テンパイ
パンティに空目した
疲れているのかも知れない >>602
俺は四暗刻上がったのは全自動卓の時だけ
国士上がったのは手積み時だけだな 全自動はダマが出来やすいと言うものの、手動の洗牌も積込まなくてもかなり混ざってない
試しにプログラムで擬似乱数使って配牌13個並べて、あとはひたすら自摸るだけのテストをやってみると良い
他家の河が見えないってのもあるが、18回で聴牌までたどり着くケースは驚くほど低い >>343
これ麻雀でカネをかけるかどうかにも似たように言えるな
実際に懐が痛むなら安易に役満狙って場を荒らすことはしない >>660
だから今は亡き東風荘は全ツが横行したんだよなあ なーんだ
強化学習どころか教師あり学習ですらないやん 山のカウントと河ケアだけでも完璧なら
上級者の強さはある
あとは何処まで冒険するかを教えてやら無いと
ポーカーAIみたいに完全な期待値で動いても
人間のミスと運でそれなりには動きそう
ベタオリくんになったらそれは良い >>662
ドンジャラのオンライン版を開発しないとな ■ このスレッドは過去ログ倉庫に格納されています