囚人のジレンマとは、経済活動を数理的に分析する「ゲーム理論」の例題の一つ。合理的な戦略を積み上げた結果が、必ずしも最善の選択とはならない典型例として知られている。
今、殺人事件の捜査で、A、B二人の容疑者(囚人)が逮捕され、それぞれ別室で取り調べを受けているとする。決定的な証拠はなく、頼りになるのは自白だけ。もし、二人とも黙秘を貫けば殺人事件での立件はできず、暴行事件で懲役1年の罪にしかならないとしよう。
そこで警察は自白を引き出すために、取引を持ちかける。もし、相棒が黙秘する中で自白をしたら、捜査協力の見返りとして釈放しようというのだ。しかし、釈放されるのは一人が自白した場合だけ。二人とも自白した場合には、通常の刑期である懲役10年となる。また、相棒が自白したのに、自分だけ黙秘を続けた場合には、ペナルティーとして通常の2倍の懲役20年を科すという。
ここで容疑者Aは考える。容疑者Bが自白すると仮定した場合、自分も自白すると懲役10年、黙秘を続けると懲役20年となるので、自白したほうが有利だ。次に容疑者Bが黙秘した場合を考える。自分も黙秘すると懲役1年だが、自白してしまえば釈放を勝ち取れるので、やはり自白を選択する。ところが、状況は容疑者Bも同じだから、同様に自白を選択するだろう。この結果、二人の容疑者は共に自白、懲役10年の刑に処せられることになるというわけだ。このように、互いが相手の戦略を考慮しつつ、自身にとって最も合理的な選択をしたときの安定状態を「ナッシュ均衡」と呼ぶ。
ゲーム理論はこうした行動を数理的に解析する。人や企業の行動を「ゲーム」と考え、それによる損得を行列式(マトリックス)で表し、参加者や選択肢が多数存在する複雑な事例の最適戦略を、高度な数学を駆使して導き出す。ただし、導き出された戦略は合理的ではあっても、最善になるとは限らない。
二人の容疑者にとっての最善の戦略は、共に黙秘して懲役1年に止めること。しかし、お互いが合理的な選択をした結果が、最善の選択とはならなかった。牛丼戦争に置き換えれば、「自白」が「値下げ」、「黙秘」が「据え置き」となる。ライバル同士が価格を据え置くことが最善の戦略だが、結局は双方が「自白」、つまり値下げを選択せざるを得ない。
囚人のジレンマは、様々な場面に登場する。軍拡競争もその一例。お互いに軍縮をするほうが望ましいにもかかわらず、相手の出方が分からない中、やむなく軍拡競争が生まれてしまう。
囚人のジレンマを解消する方法は話し合いだ。二人の容疑者が話し合って黙秘を誓い合い、国のトップが直接交渉して軍拡を止める合意を交わせば、囚人のジレンマは解消される(牛丼の場合は、消費者の利益を損なう「価格カルテル」だとして摘発される恐れもあるが…)。
合理的な戦略が引き起こす囚人のジレンマにどう対処するかは、企業や個人、そして国家にとっての大きな課題なのである。