【IT】Microsoftが“麻雀AI”を開発。3カ月でプロプレイヤーの腕前に
■ このスレッドは過去ログ倉庫に格納されています
Microsoftは、同社の研究開発機関Microsoft Research Asia(MSRA)が開発した麻雀AI「Microsoft Suphx(Super Phoenix)」がオンライン麻雀対戦プラットフォーム「天鳳」において、AIとして初めて10段の段位を達成したと発表した。
Suphxは、2019年3月より天鳳に参戦し、5,000回の対局ののち同6月に10段へ到達。同プラットフォーム内における10段という段位は、最高位の天鳳位に次ぐ強さ。参考までに4人麻雀で天鳳位に到達したプレイヤーは13人、過去に10段に到達したことのある(降格したプレイヤーも含む)プレイヤー数は180人ほどだという。
麻雀はその複雑さゆえにAIが学習を行なう上での課題が多かった。まず、巨大な状況空間を必要とすること。牌の数が136個と多くプレイヤーの順序が変化するため、AIにボードゲームを学習させるさいによく使われる「モンテカルロ木探索」をそのまま適用できない。
次に、「不完全情報ゲーム」であること。ボード上の情報がすべて見えている「完全情報ゲーム」である碁やチェスなどに対して、麻雀は対戦相手の手牌など見えない情報が多い不完全情報ゲームであるのに加え、ランダム性が高く運の要素が排除できない。
さらに、報酬メカニズムが複雑であること。天鳳で採用されているルールでは、役がなければ上がれないのに加えて、点数の計算が複雑である。また、1ゲームが8局で構成されるため、意図的に対局を負けることでゲーム全体の得点を引き上げるといった大局的な状況判断が必要となる。
MSRAではこれらの課題を解決するため、新たなアルゴリズムを開発した。まず、持続的な探索が行なえる新たな探索戦略を採用し、巨大な状況空間の問題に対応。これにより、効率的にリアルタイムな戦略を立てられるようになる。
次に、自己対戦戦略を取り入れ不完全情報ゲームに対応した。自分が見えない情報をすべて知っていると仮定した上で、Suphx自身の選択が最適であるかを判断する。
さらに、長期的な報酬予測ネットワークを採用し複雑な報酬メカニズムの問題を解決した。前後のラウンドの予測スコアの差を利用して、各対局の最終得点を適切に予測する。
不完全情報ゲームはAIにとって解決が困難なゲームである一方、アルゴリズムを開発する環境としては理想的で、金融投資やスマートドライビングなどといった現実世界の複雑な問題へのAIの応用にもつながるとしている。
Impress
https://pc.watch.impress.co.jp/docs/news/1204268.html 兎のシャモアっていうキャラが完全なデジタル打ちだけどチームでも上位ではあるけどよく負ける
そういうことだよ 天鳳www
牌操作ありのドラマチック演出()イカサマ麻雀サイトじゃねーかよ
AIが天鳳のイカサマアルゴリズム学習しただけだろ 普通に順位や点数差計算してやるからな
直撃ねらったり、差込みとかするとかなり強いだろうな >>67
映像解析で牌追跡できるなら手積みサマありだとむしろヤバイw 若い頃は大三元などの大きな役で上がりたがるものだが七対子などの安い手で何度も上がった方が得だよ 元ニュースリリースによると
東大やドワンゴが作ったAIは天鳳6段までしかなられれれないのに、
microsoftは10段達成したんだってさ 麻雀って基本的に最善手がないからAIでも圧勝とかは難しいんじゃなかろうか?
やるなら相手に対したメタ行動ぐらいしかなさそう >>109
予算の制約と技術の制約と二つあるからな
東大とドワンゴとマイクロソフト
予算の制約でスパコン回せない可能性もある
もちろん学習アルゴリズムの問題点かもしれないけど AIじゃなくプログラム的なことでいえば、スーパーリアル麻雀P2とかのCPUがチート
1プレイごとに難易度あがるから中古基盤買った人とか泣けるらしいわ
ゲーセンでも1プレイ10円で置いてたがボタン一回も押すことなくテンホーされたりとかしてたわ >>97
人間の分からない言葉作り始めて、怖いから中止になった 数十年前のスーパーリアル麻雀の時点で人間の数倍強かったが 上級者の集まる卓なら相手もロジカルに打つからAIが通用しそうだけど
初心者と一緒でも勝てるのかどうか気になるw 将棋ほどじゃないが、麻雀も長くやると実力どおりに収まるよな。 昔Windowsにballs5とかいう五目並べがあったが
AIの最高レベルが「神」だったな >>26
ポーカーは昔からトラッカーソフトで研究されているからなぁ >>121
あー脱衣麻雀絶対にクリアするAI欲しいなぁ。 >>80
たぶん読みみたいな事がいいたいんだろうけど
地獄単騎の放銃率なんかは出てるから自分の手との比較になる
10巡目以降に3シャンテン以下とかからなら2枚切れの字牌すら切るわけないし
基本的に読みを重視して押し引きしてる強者なんていないから 天鳳だからとにかくラスを引かないように作られてるんだろうな。極論だけどラス引かなければいつかは天鳳位にもなれるわけで つーかノーテンリーチとか積み込みとかには対応できるのか?
3人ぐるで二人常にノーテンダブリーで下ろさせるとか想定できてるのかね? 子供の頃ファミコンのファミリーマージャン持ってたけどあれすら全然勝てなかった >>128
画像解析でイカサマ見抜けないと、つばめ返しでAIが飛ばされる 天鳳やMJや格闘倶楽部で戦うのが前提ならAI最強になれるだろ
所詮は疑似乱数なんだからAIなら全ての牌山パターンを記憶出来る >>78
映画のレインマンでもでてきたけど
ブラックジャックは場に出てきたすべてのカードを記憶できれば勝てるからね 麻雀って相手の実力に合わせて打ち方変えないと勝てないから難しそうだな
初心者の河を深読みしたら痛い目にあう 運もあるけど1000戦くらいやってアサピンに勝ち越すのはまず無理だ 混一色作るのが好きだが、捨て牌で読まれやすいんだよね 人のイカサマの心配よかAIがイカサマの方法を確立する可能性の方が高くね >>112
10段に到達するとか長期的みてほとんどのプレイヤーに圧勝してるわけだが AIは金かかってないから、本気になれないだろうな。
点1とピンで打ち方同じになりそう。 自然かつ適切に手加減して相手を接待する機能の実装が急がれる ここは警官が突入してきたらかわからハクハツチュンを抜くAIの開発が待たれる 俺は「意図的」よく相手のリーチ一発に振り込む
これも「大局的な状況判断」だよ
本当に大局的な状況判断なんだからね! 始まる時には46って打って
負けそうになったら即抜けするんだろ? わりとマジで個人識別までできてるのかは興味ある
半荘の間に「こいつ素人だな」とか「染めに意識をふってる」とか
「チャンタ系の迷彩が多い」とかそこまで判断してるんだろうか? 脱衣麻雀だとCPUに親が回ると天和上がるアルゴリズムがあるからMSですら勝てない。 >>155
鷲巣が地獄に落ちて鬼達と戦っているところで読むの諦めたw ああ、麻雀ね。
ゲーセンにある、100円入れると
女の子の声で「テンホー」って言ってくれる募金箱のことだろ。 >>75
どうやって最善の情報を選択するようにするんだよ
このAIはチートしてるわけじゃなく、普通の不完全情報ゲームやってるだけだぞ
単純に押し引きだけでもどこまでが最善なのかわからんゲームなのに 七対子であがった局の牌譜だけ見たいんだがどうすれば ツモ切り等捨て牌読み含む牌効率と振込み含む点計算だろ? MSが天鳳選んでくれたってところが大きいわ
麻雀といえば中国なのにな コンピュータじゃ次くる牌幾らでも操作できるから意味ないだろ リーチが二人にかかって1人はリーのみ。1人は親満と予想するのなら、リーのみに当たり牌を出すのも手である。
1人に独走されるとこっちのトップが無くなるからな。 所詮、リアル麻雀のイカサマの前には屈するしかない
麻雀は技術だよ 最善手を探すだけなら、囲碁や将棋より簡単そうだ
あとは運任せ 麻雀は同じ土台ならばプロアマの実力差か少なくね?
手積みがない条件ならば方程式を守れば差なんて無いに等しい運ゲーだしな。 そりゃコンピューターは牌のすべてが見えるんだから。人に演技で見えないふりをしてるだけ、仮にすり替えてても誰も気付かないし。
なんでもありよ。 >>181
まあ運ゲーというのは否定しないが、長期的に打てば実力差は出るよ
このAIは5000戦してる。まあ逆に言えばそれくらい打たないと差がでない運ゲーだが >>174
マイクロソフトリサーチアジアは、北京市にある
開発リーダーの名前はTie-Yan Liuだし中国人
日本の麻雀が複雑だから、天鳳選んだんじゃない?
記事にも天鳳は点数計算が複雑だとか、役がないと上がれないとか日本では当たり前のことが書いてあるし >>16
捨て牌と手牌オープンで、タイプ判定とか色々されそう。流局が最初にあると、AI強いだろうな。 >>181
まあ究極的には麻雀の技術なんてパチプロ以下だからな
麻雀みたいな浅いゲームを盛り上げる層は、パチンコのハンドル握るAIを茶化すみたいなもん デジタル打ちしかしないなら地獄待ちに簡単に振込みそう 長期だと運ゲーではなく実力ゲーだからな
ラス回避ゲーである天鳳でAIが強いとは思わなかったな
3着からトップに行けるチャンスがあったとしても
3着からラスに転落するリスクがある場合はオリないといけないシステム >>161
麻雀を運ゲーと捉えているなら賭け麻雀はやらんほうがいい。
確実にカモられる。 >>5
これを見に来た。
ちなみに俺はファイナルロマンスが好きだった >>169
ごめん。そこまでは読んだw
息を吹き返してからが知りたかったの 自分が全ての情報を知っていると仮定したうえで最適戦略を予測する、か
爆牌理論だな >>191
ネットだから乱数の偏りを看破するとかしないと >>181
てかプロがまともな職業として成り立ってないから相対的にレベルが低い
囲碁将棋の棋士連中とかなら1ヶ月でプロプレイヤーの腕前になれそう 将棋や囲碁と違って麻雀は打ち回しの上手さだけじゃどうにもならん
より確率の高い打ち回しになるんだろうけど薄いほうを切っても裏目に出ることは多々ある ■ このスレッドは過去ログ倉庫に格納されています