最強のデッキは存在するか
2015年8月10日 ◆【EDH】考察
以前のジャミラはこのように考えていました。
「ある大会に参加している全プレイヤーが勝利のために最善を尽くした場合、その大会には一種類のデッキしか存在しない」
最近になって気づいたのですが、これは間違っています。
代わりに、今のジャミラはこう考えています。
「最善のデッキは存在しないが、最善のデッキ選択は存在する」
「最善のデッキ選択とは、例えば[3%の確率で双子、2.5%の確率でトロン、1.53%の確率で親和、0.25%の確率でカンパニー、(etc)…を使用する]という形で表現することができる」
「最善のデッキ選択を全プレイヤーが採用する結果として、ある大会のデッキ分布は上記の確率と同じ割合になる」
以上のことを説明します。そのために、ゲーム理論の学術用語を使用します。これらはよく研究されていて、定義がはっきりしているからです。私も入門書を一冊かじった程度ですが、なんとか説明したいと思います。
目的は勝利とします。
どのようにデッキを選べば、勝率を最大化できるでしょうか。
まず、ルールで許されるデッキ選択肢を全部書き出します。基本土地は何枚でも入れられるしデッキ枚数は60枚である必要がないので、デッキとなるカードの組み合わせは無限通りになります。しかし、1000枚デッキなどについては考える必要がないとすぐに分かりますよね。とりあえず、約15000種類のカードを4枚オーバーしないようにメイン60回とサイド15回選択すればおよそ網羅できていると思います。だいたい15000の75乗個くらいのデッキがあるとお考えください。
それを横軸と縦軸にとった行列を作ります。(ヘタですが添付画像を見てください)そして、相性を書き込みます。例えば、双子はトロンに対して8回勝つために2回負けるとするなら(8,2)と書きます。勝ち負けは表裏一体なので、片方が4ならもう片方は6。つまり、合計は常に10で一定とします。これを全マッチングについて行い、行列を完成させます。ものすごく大きな行列になりますね。
改めて確認すると、考えるべきことは利得が大きくなる戦略です。そのために、自分の優位を表す数(つまり各マスに書いてある左側の数字)に注目します。これを大きくするデッキ選択戦略を、行列の左側に書かれている大量のデッキの内から考えることになります。
相手の各戦略に対して、自分の利得を最大にする戦略を最適反応戦略といいます。例えば相手がトロンを選ぶ戦略である場合、この図の中では双子が最適反応戦略となり、利得を最大化します。しかし、相手がトロンを選ぶとは限りません。最適反応戦略の考え方だけでは、相手の戦略が分からない場合に、何が最善の戦略なのか説明できないんですね。
そこで混合戦略の考え方を取り入れます。つまり、相手がとる各戦略について、その戦略をとる確率を記号に置き換えることを考えます。「双子を使う確率d%、トロンの確率e%、バーンの確率f%、…」これが混合戦略です。次に、自分の混合戦略の確率にも記号を割り振って、双子、トロン、バーンについてそれぞれ今度はa,b,cとします。すると、自分の期待利得を表現できるようになります。「対戦利得×対戦確率」を全マッチについて考えて、全部足します。「5ad+8ae+7af+2bd+5be+6bf+…」というように。ここで、自分が関与することができる記号(今回でいえばabc)についてまとめて「(5d+8e+7f)a+(2d+5e+6f)b+…」こんな感じにします。その後、記号を消去するために、相手も同じように考えていることを踏まえながら不等式を使って計算するらしいんですが…
私には難しくて、よく分かりませんでした。
(´>ω∂`)てへぺろ
この計算が実際に可能であることによって、自分の期待利得を最大化するような確率を各戦略に割り当てることができると思われます。このように確率を割り当てられた混合戦略こそが最善のデッキ選択戦略であると考えています。
自分と相手の戦略がお互いの戦略に対して自身の利得を最大化する(=最適反応戦略である)とき、その戦略の組はナッシュ均衡である、と言います。戦略を選択するゲームは、混合戦略まで考えた場合、必ずナッシュ均衡があるらしいです。
単に「双子を使う」「バーンを使う」といったデッキ選択戦略は、勝率を最大化できないようです。最善のデッキ選択をするためには、混合戦略を使う必要があります。どんなに頑張っても、デッキ構築から運の要素をなくすことはできないということですね。そして、完璧な頭脳が一堂に会して大会を構成したとしても、デッキ分布はマチマチになります。
理論上の終着点にあるMTG大会では、「このデッキがいちばん強いからこれを使おう」と言っているプレイヤーが、「どのデッキが強いかは確率によるからクジ引きで決めよう」と言っているプレイヤーに淘汰されると予想しています。
コメント歓迎します。(・ω・)ノ
「ある大会に参加している全プレイヤーが勝利のために最善を尽くした場合、その大会には一種類のデッキしか存在しない」
最近になって気づいたのですが、これは間違っています。
代わりに、今のジャミラはこう考えています。
「最善のデッキは存在しないが、最善のデッキ選択は存在する」
「最善のデッキ選択とは、例えば[3%の確率で双子、2.5%の確率でトロン、1.53%の確率で親和、0.25%の確率でカンパニー、(etc)…を使用する]という形で表現することができる」
「最善のデッキ選択を全プレイヤーが採用する結果として、ある大会のデッキ分布は上記の確率と同じ割合になる」
以上のことを説明します。そのために、ゲーム理論の学術用語を使用します。これらはよく研究されていて、定義がはっきりしているからです。私も入門書を一冊かじった程度ですが、なんとか説明したいと思います。
戦略…行動方針
利得…目的(勝利)への貢献度
期待利得…利得の期待値
支配…ある戦略と比べて、別の戦略の利得が大きくなること
最適反応戦略…相手のある戦略のもとで自らの利得を最大にする戦略
ナッシュ均衡…お互いのとる戦略がそれぞれ相手の戦略に対する最適反応戦略になっている戦略の組
純粋戦略…普通の戦略(例:双子を使う)
混合戦略…戦略を確率的に混合して用いる戦略(例:1/2の確率で双子、1/2の確率でトロンを使う)
目的は勝利とします。
どのようにデッキを選べば、勝率を最大化できるでしょうか。
まず、ルールで許されるデッキ選択肢を全部書き出します。基本土地は何枚でも入れられるしデッキ枚数は60枚である必要がないので、デッキとなるカードの組み合わせは無限通りになります。しかし、1000枚デッキなどについては考える必要がないとすぐに分かりますよね。とりあえず、約15000種類のカードを4枚オーバーしないようにメイン60回とサイド15回選択すればおよそ網羅できていると思います。だいたい15000の75乗個くらいのデッキがあるとお考えください。
それを横軸と縦軸にとった行列を作ります。(ヘタですが添付画像を見てください)そして、相性を書き込みます。例えば、双子はトロンに対して8回勝つために2回負けるとするなら(8,2)と書きます。勝ち負けは表裏一体なので、片方が4ならもう片方は6。つまり、合計は常に10で一定とします。これを全マッチングについて行い、行列を完成させます。ものすごく大きな行列になりますね。
改めて確認すると、考えるべきことは利得が大きくなる戦略です。そのために、自分の優位を表す数(つまり各マスに書いてある左側の数字)に注目します。これを大きくするデッキ選択戦略を、行列の左側に書かれている大量のデッキの内から考えることになります。
相手の各戦略に対して、自分の利得を最大にする戦略を最適反応戦略といいます。例えば相手がトロンを選ぶ戦略である場合、この図の中では双子が最適反応戦略となり、利得を最大化します。しかし、相手がトロンを選ぶとは限りません。最適反応戦略の考え方だけでは、相手の戦略が分からない場合に、何が最善の戦略なのか説明できないんですね。
そこで混合戦略の考え方を取り入れます。つまり、相手がとる各戦略について、その戦略をとる確率を記号に置き換えることを考えます。「双子を使う確率d%、トロンの確率e%、バーンの確率f%、…」これが混合戦略です。次に、自分の混合戦略の確率にも記号を割り振って、双子、トロン、バーンについてそれぞれ今度はa,b,cとします。すると、自分の期待利得を表現できるようになります。「対戦利得×対戦確率」を全マッチについて考えて、全部足します。「5ad+8ae+7af+2bd+5be+6bf+…」というように。ここで、自分が関与することができる記号(今回でいえばabc)についてまとめて「(5d+8e+7f)a+(2d+5e+6f)b+…」こんな感じにします。その後、記号を消去するために、相手も同じように考えていることを踏まえながら不等式を使って計算するらしいんですが…
私には難しくて、よく分かりませんでした。
(´>ω∂`)てへぺろ
追記:計算方法の概略
ここは自分でもよく分かっていないので、他人が読んでも意味が通らないと思います。そのため、この部分の精読はお控えください。
両者の期待利得を数式化しました。
全ての確率の合計は1になるので、お互い、最後の記号=「1-他の記号」になります。また、全ての確率は0〜1の間にあります。
いくつ記号があっても(おそらく)関係ありません。相手が関与できる記号でまとめたカッコ内が正負入れ替わる値を境に、自分の記号がとる値を場合分けします。そして、自分の記号の値それぞれに対して「自分の利得が最小となる相手の記号の値」を確定します。これを逆の立場である相手にも行います。
そうすると両者ともに、全ての記号の値の組(a,b,x,y)=(0~0.5,0~0.5,0.2,0.8)などのような組を無数にもつことになります。相手の持つ組と自分の持つ組の中で一致しているものが、ナッシュ均衡です。相手が自分の期待利得を減らせないように、記号の値を決定しました。これをマックスミニ戦略と言います。
この計算が実際に可能であることによって、自分の期待利得を最大化するような確率を各戦略に割り当てることができると思われます。このように確率を割り当てられた混合戦略こそが最善のデッキ選択戦略であると考えています。
自分と相手の戦略がお互いの戦略に対して自身の利得を最大化する(=最適反応戦略である)とき、その戦略の組はナッシュ均衡である、と言います。戦略を選択するゲームは、混合戦略まで考えた場合、必ずナッシュ均衡があるらしいです。
単に「双子を使う」「バーンを使う」といったデッキ選択戦略は、勝率を最大化できないようです。最善のデッキ選択をするためには、混合戦略を使う必要があります。どんなに頑張っても、デッキ構築から運の要素をなくすことはできないということですね。そして、完璧な頭脳が一堂に会して大会を構成したとしても、デッキ分布はマチマチになります。
理論上の終着点にあるMTG大会では、「このデッキがいちばん強いからこれを使おう」と言っているプレイヤーが、「どのデッキが強いかは確率によるからクジ引きで決めよう」と言っているプレイヤーに淘汰されると予想しています。
コメント歓迎します。(・ω・)ノ
コメント