繰り返し囚人のジレンマ - りおパパの日記

繰り返し囚人のジレンマの記事を読んだ。ゲーム理論でいう囚人のジレンマは1回こっきりの話。個人にとって合理的な判断が全体利得最大にならないという非ゼロサムゲームの話だが、囚人のジレンマを繰り返し実施した時に、どういう判断のアルゴリズムが最大利得につながるかという話。アルゴリズムのコンテストで優勝したのは

1.まずは強調する

2.前回相手が裏切った場合は裏切り、協調した場合は強調

3.以後同じ判断を繰り返す

というもの。裏切りには裏切りをということで、売られた喧嘩はしっかり買う。そして、一度裏切られても、次に協調した場合はしっかり強調する寛容性を持つということ。これは、仏教の輪廻転生にもつながる話として説明されていたけど、なるほどと思いました。