いまさら聞けない囚人のジレンマ。ゲーム理論の過去問と教科書。

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

2016年のセンター試験の「政治・経済」では、ゲーム理論の問題が出題されていたことが話題になりました。難問などともいわれましたが、実はゲーム理論の中でも囚人のジレンマ自体は政治・経済や現代社会の教科書にも安全保障ジレンマなどとして紹介されていて、特に高校生レベルを超えているとか、珍しいということはありません。センター試験や各大学の試験での小論文の頻出のキーワードです。しかし、少し真新しい感じに捉える学生もいるようです。例えば、こんなツイートがありました。

ゲーム理論はどのように教科書に取り上げられたか

安全保障のジレンマ

安全保障のジレンマ

では、教科書ではどのように扱われていたかというと、東京書籍の『現代社会』では、主要な教科書の記述の最後のページに付け加えるように、「平和のためにできること」の中で取り上げられています。教科書の最後のほうのページって要チェックですね。

A国・B国はともに軍縮・軍拡のどちらも選択できるものとした場合、両国とも軍縮を選べば平和が訪れることになる。しかし、いっぱんには自国が軍縮を選んでも相手国が軍拡を選ぶのではという懸念から、A国・B国ともに相手国の政策について最悪の場合を想定し、軍拡を選ぶことになる。その結果、際限のない軍拡による「恐怖の均衡」が成立する。
出典: 『現代社会』東京書籍

この教科書の記述は安全保障のジレンマと呼ばれる考え方で、1951年にジョン・ハーツが著書『政治的現実主義と政治的理想主義』で用いたことで知られています。これは、1950年に数学者のアルバート・タッカーが考案した囚人のジレンマを外交問題に応用したものです。囚人のジレンマは社会学や国際政治学に応用されています。

囚人のジレンマとは

囚人のジレンマとは、何なのでしょうか。一般的な例として、このように説明されています。

ゲームの理論における重要な概念の一つ。二人の容疑者が別室で尋問され、一方が自白し、もう一方が黙秘の場合、前者は釈放、後者は10年の懲役となり、二人とも黙秘の場合は懲役1年、二人とも自白の場合は懲役5年となるとする。この条件のもとで二人が最大の利益を得るためには二人とも黙秘することだが、相手の裏切りを恐れて結果的にどちらも自白するというジレンマが生じる。個人が自らの利益のみを追求している限り、必ずしも全体の合理的な選択に結び付くわけではないことを示している。
出典:デジタル大辞泉

個人が自らの利益のみを追求している限り、必ずしも全体の合理的な選択に結び付くわけではない」というポイントです。ツイートのセンター試験の2016年の過去問でいえば、お互いの国が相手の国の2つの出方の場合、それぞれを考えて自国の安全の「ポイント」を高めようとすれば、結果的に双方を合計したときのポイントは低いということになります。A国から見れば、B国が「協調」だとすれば、自国は「非協調」ならば15点が得られ、「協調」の10点を選ぶよりも良いポイントを得ることができ、また、B国が「非協調」だとすれば、自国は「非協調」ならば5点が得られ、「協調」の1点を選ぶよりも良いポイントになります。相手の出方に関わらず、「非協調」を選ぶことは自国の利益になります。しかし、全体を見ると両国が「協調」を選んで合計20点を得るの最も高い合計点になります。全体としては合理的な選択ができていないことになります。

問題はほとんど文章の読解のレベルの問題なので、こうした知識がなくても解けるでしょう。

2011年の過去問ではこのように出題

2011年の政治・経済の本試験ではこのように出題されています。

国家間の協調的政策の実現について考えるために,次の表であらわされる国家間ゲームを考える。このゲームでは,A国とB国の二つの国家が,互いに相談できない状況で,「協調的」もしくは「非協調的」のいずれか一方の政策を1回のみ同時に選択する。そして,各国は表中の該当するマスに示された点数をえる。ここで各国は自国の点数の最大化だけに関心をもつとする。このゲームの表から読みとれる内容として最も適当なものを,下の①~④のうちから一つ選べ。

B 国
協 調 的 非協調的
A

協 調 的 A国に4点 A国に1点
B国に4点 B国に5点
非協調的 A国に5点 A国に2点
B国に1点 B国に2点

① A国とB国がともに「協調的」政策を選ぶことがゲームの結果となるので,国家間の協調的政策が実現する。

② A国が「協調的」政策を,B国が「非協調的」政策を選ぶことがゲームの結果となるので,国家間の協調的政策の実現には新たな仕組みが必要である。

③ A国が「非協調的」政策を,B国が「協調的」政策を選ぶことがゲームの結果となるので,国家間の協調的政策の実現には新たな仕組みが必要である。

④ A国とB国がともに「非協調的」政策を選ぶことがゲームの結果となるので,国家間の協調的政策の実現には新たな仕組みが必要である。

出典: 大学入試センター試験 政治・経済2011年度本試験

いままでの説明で、正解は分かりますよね。小論文の問題ならばこの「国家間の協調的政策の実現には新たな仕組み」はどのようなものが考えられるかという設問であったりします。ちなみに、教科書どおりの解答を考えるならば、両国の文化交流で信頼を醸成し、経済的な相互依存を深めることで軍事的な対立が共通のデメリットになるようにすることや、具体例としてはFTPやEPAなどの自由貿易協定の締結、首脳間でのホットラインの開設などがあります。

小論文の出題では頻出のキーワードです。医学部や獣医学部、農学部など、人文・社会学系以外の学部の小論文入試でも使用されやすいです。

もともとの囚人のジレンマの場合に、このジレンマを回避する方法はちょっと恐ろしいです。そういう出題はまずないと思いますが、何回も逮捕されて経験するとか、自白したものを私的に制裁するなどがあります(笑)。

東京大学の2次試験でも出題されたことが

この囚人のジレンマは1997年の東京大学の後期日程の入学試験でも出題され、旧ソ連を舞台に指揮者とチャイコフスキーがスパイ容疑で逮捕され、「もし、両者が自白しなければ、両者とも3年の刑になる。また、一方が自白し、一方が自白しなければ、自白した方は1年の刑で、自白しなかったほうは25年の刑になる。さらに、両者が自白すれば、両者とも10の刑になる。」という設定が説明されています。『戦略的思考とは何か―エール大学式「ゲーム理論」の発想法』が題材になっており、高速道路の渋滞の例や核軍縮の例があわせて示されて、これ以外の例を問う設問や、「高速道路の渋滞」の例で解決策を問うています。

ゲーム理論の用語を抑えておこう

また、念のためゲーム理論でよく使われる用語も抑えておきましょう。前述の囚人のジレンマの説明でも、「個人が自らの利益のみを追求」という部分は「他のプレーヤーの戦略を所与とした場合、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせ」という点でナッシュ均衡と呼ばれます。

ナッシュ均衡
アメリカの数学者 J =ナッシュによるゲーム理論の概念。すべてのプレーヤーが相手の戦略のもとで自分の利益を最大化するように行動しているとき成立する均衡状態。
出典:三省堂 大辞林

加えて、「必ずしも全体の合理的な選択に結び付くわけではない」という部分は、「ある集団が1つの選択をするとき、集団内の誰かの満足度を犠牲にしなければ他の誰かの満足度を高めることができない状態」という点で、パレート最適ではないといえます。

パレート最適
他の経済状態を悪化させることなしには,もはや何人の経済状態も改善できないという状態にあること。資源利用に無駄のない最適な状態をさす。パレートが提示。パレート効率。
出典:大辞泉

中高生にも分かるゲーム理論の入門書は多く出ているので、経営戦略に生かしたいビジネスマンも入り口として読んでおくとよいでしょう。

以上です。囚人のジレンマやゲーム理論のような考え方は医学部や農学部などの理系の小論文問題でも取り上げられることがありますし、実ビジネスの世界でも特にミクロ経済学の一つと考えられていますので、知っていて損はない知識です。