読み込み中...
読み込み中...
準備中...
「囚人のジレンマ・シミュレーター」は、ゲーム理論の最も有名な問題である 「囚人のジレンマ」を、AI戦略と対戦する形で体験できるインタラクティブコンテンツです。
5つの異なるAI戦略(しっぺ返し、常に協力、常に裏切り、ランダム、しっぺ返し+許し)を相手に 20ラウンドの繰り返しゲームをプレイし、「協力」と「裏切り」の選択がもたらす結果を リアルタイムで確認できます。
囚人のジレンマ(Prisoner's Dilemma)は、1950年にRAND研究所のメリル・フラッドとメルビン・ドレシャーが考案し、 アルバート・タッカーが「囚人」の物語として定式化したゲーム理論の基本モデルです。
このゲームのナッシュ均衡は「双方裏切り」です。相手がどちらを選んでも、自分は裏切った方が得点が高い (相手が協力なら5点>3点、相手が裏切りなら1点>0点)ため、合理的な個人は裏切りを選びます。 しかし、双方が裏切ると各1点で、双方協力の各3点より悪い結果になります。 これが「個人の合理性が集団の合理性に反する」というジレンマの本質です。
1回きりのゲームでは裏切りが支配戦略ですが、同じ相手と何度も対戦する「繰り返しゲーム」では状況が変わります。 将来の協力関係を考慮すると、協力が合理的になる場合があります。 これは「フォーク定理」として知られ、十分に将来を重視するプレイヤー間では、 協力を含む多くの結果がナッシュ均衡になり得ることが証明されています。
政治学者ロバート・アクセルロッドは1980年代に「囚人のジレンマ・トーナメント」を開催し、 世界中の研究者から戦略を募集しました。結果、アナトール・ラポポートが提出した 「しっぺ返し(Tit-for-Tat)」が最も高い成績を収めました。
しっぺ返し戦略の特徴は、(1) 最初は協力する(善良性)、(2) 裏切られたら裏切り返す(報復性)、 (3) 相手が協力に戻れば自分も協力に戻る(寛容性)、(4) ルールが単純で相手に理解されやすい(明快性)の4点です。
企業間の価格競争は典型的な囚人のジレンマです。各企業が値下げ(裏切り)すれば短期的には顧客を獲得できますが、 全社が値下げすると業界全体の利益が減少します。寡占市場での暗黙の協調や、 繰り返し取引における信頼構築がゲーム理論で分析されています。
軍備競争は国家間の囚人のジレンマの代表例です。各国が軍備拡張(裏切り)すれば安全保障上有利ですが、 全国が軍拡すると安全保障は改善せず軍事費だけが増大します。 軍縮条約は「協力」を制度化する試みと言えます。 冷戦期の米ソ関係は、まさに繰り返し囚人のジレンマとして分析されてきました。
進化生物学者ジョン・メイナード・スミスは、動物の行動を進化的ゲーム理論で分析しました。 吸血コウモリの血液共有、霊長類の毛づくろい交換、さらには細菌間の協力行動まで、 自然界には繰り返し囚人のジレンマの構造が広く見られます。 リチャード・ドーキンスの「利己的な遺伝子」でも、しっぺ返し戦略の進化的安定性が論じられています。
Q. 囚人のジレンマで最強の戦略は何ですか?
繰り返しゲームでは「しっぺ返し(Tit-for-Tat)」が最も安定して高い成績を収めることが、アクセルロッドのトーナメントで実証されました。ただし、絶対的に最強の戦略は存在せず、相手の戦略によって最適な対応は変わります。
Q. 得点はどのように決まりますか?
双方協力で各3点、一方裏切りで裏切った方が5点・裏切られた方が0点、双方裏切りで各1点です。これは標準的な囚人のジレンマの利得行列で、DC > CC > DD > CD の順序を満たします。
Q. なぜ20ラウンドなのですか?
繰り返しゲームの効果を体感するのに十分な回数であり、かつ飽きずにプレイできる長さとして20ラウンドを設定しています。アクセルロッドのトーナメントでは200ラウンドが使用されました。
Q. ナッシュ均衡とは何ですか?
ジョン・ナッシュが提唱した概念で、各プレイヤーが他のプレイヤーの戦略を所与として、自分の戦略を変更するインセンティブがない状態のことです。囚人のジレンマでは「双方裏切り」がナッシュ均衡ですが、「双方協力」の方が双方にとって良い結果になるというパラドックスがあります。
各プレイヤーが相手の戦略を所与として最適な戦略をとっている状態。囚人のジレンマでは双方裏切りがナッシュ均衡だが、双方協力の方がパレート効率的。
最初は協力し、以後は相手の前回の行動をコピーする戦略。善良性・報復性・寛容性・明快性の4つの特徴を持ち、アクセルロッドのトーナメントで最高成績を収めた。
誰かの利得を減らさない限り、他の誰かの利得を増やせない状態。囚人のジレンマでは双方協力(各3点)がパレート最適だが、ナッシュ均衡(双方裏切り・各1点)はパレート最適ではない。
ゲーム理論において、各プレイヤーの戦略の組み合わせに対する得点(利得)を表形式でまとめたもの。囚人のジレンマの本質を数学的に表現する基本ツール。
無限に繰り返されるゲームでは、プレイヤーが十分に将来を重視する場合、協力を含む多くの結果が均衡として成立しうることを示す定理。繰り返し囚人のジレンマで協力が維持される理論的根拠。
教育現場での活用アイデアをまとめました。
5つのAI戦略すべてと対戦し、各戦略への最適対応を考察するクラス対抗トーナメント。
進め方:
議論テーマ例:
囚人のジレンマの枠組みを使って、環境問題や国際関係などの社会問題を分析するプロジェクト。
進め方:
議論テーマ例:
スタンフォード哲学百科事典による囚人のジレンマの包括的な解説(英語)。
囚人のジレンマと信頼の進化をインタラクティブに学べるWebコンテンツ(英語/日本語対応)。
ゲーム理論の基本概念、歴史、応用分野を概説する日本語Wikipedia記事。
アクセルロッドの名著「つきあい方の科学」(原書)。囚人のジレンマ・トーナメントの詳細を収録。