Η ΑΠΟΚΑΛΥΨΗ ΤΟΥ ΕΝΑΤΟΥ ΚΥΜΑΤΟΣ: Θεωρία παιγνίων

Θεωρία παιγνίων – Ισορροπία Nash στην καθημερινή ζωή

Η θεωρία παιγνίων (game theory) ξεκίνησε σαν κλάδος των οικονομικών με το βιβλίο των Τζον φον Νόιμαν (John von Neumann) και Όσκαρ Μόργκενστερν (Oskar Morgenstern) Theory of Games and Economic Behaviour (Θεωρία Παιγνίων και Οικονομική Συμπεριφορά) πάνω σε παιχνίδια μηδενικού αθροίσματος (zero-sum games). Το κύριο αντικείμενό της είναι η ανάλυση των αποφάσεων σε καταστάσεις (παιχνίδια) στρατηγικής αλληλεπίδρασης (strategic interdependence).

Τα παίγνια είναι μία μέθοδος ανάλυσης προβλημάτων που έχουν σχέση με τον τρόπο λήψης αποφάσεων σε καταστάσεις σύγκρουσης και συνεργασίας. Παίκτης μπορεί να είναι ένα πρόσωπο, μία οργάνωση, ένα κράτος ή ένας συνασπισμός. Ως αντικείμενο έρευνας μπορούν να θεωρηθούν διάφορα προβλήματα πολιτικής, ψυχολογικής, κοινωνικής, οικονομικής μορφής.

Για τη λύση των προβλημάτων αυτών θεωρείται προηγουμένως απαραίτητη η ανάλυση καταστάσεων, όπου δύο ή περισσότεροι δρώντες (παίκτες) βρίσκονται αντιμέτωποι και ακολουθούν συνεργατικές στρατηγικές. Κάθε παίκτης προσπαθεί να χρησιμοποιήσει όλα τα μέσα που διαθέτει, για να εμποδίσει τον αντίπαλό του να αποκτήσει πλεονεκτήματα που θα περιορίσουν τα κέρδη του. Επομένως, οι ενέργειές του εξαρτώνται άμεσα από τη θέση (στρατηγική) που θα επιλέξει ο αντίπαλος.

Χαρακτηρισμός ενός παιγνίου: Υποθέτουμε αρχικά ότι υπάρχει μία κατάσταση, όπου ορισμένοι δρώντες (παίκτες) παίρνουν αποφάσεις, οι οποίες οδηγούν σε ορισμένα αποτελέσματα (consequence). Οι δρώντες αυτοί μπορεί να είναι δύο ή και περισσότεροι. Στην πρώτη περίπτωση εμφανίζονται τα «δύο προσώπων παίγνια» (two-person-games), και στη δεύτερη περίπτωση τα «παίγνια ν-προσώπων» (n-person-games). Αυτοί που συμμετέχουν σε ένα παίγνιο περισσότερων προσώπων μπορούν να σχηματίσουν κατά τη διάρκεια του παιγνίου μία «συμμαχία» διαρκείας ή περιορισμένου χρόνου, οπότε μεταφερόμαστε πάλι στα «παίγνια δύο προσώπων». Φυσικά ένα παίγνιο διαφέρει από μία πραγματική κατάσταση απλού ανταγωνισμού ή σύγκρουσης στο ότι η πραγμάτωσή του γίνεται ακριβώς κάτω από ορισμένες συνθήκες και σύμφωνα με ορισμένους κανόνες. Όλα τα παίγνια περιέχουν το χαρακτηριστικό του ανταγωνισμού μεταξύ των παικτών τους και το αποτελέσμά του οδηγεί σε «κέρδη» ή «απώλειες».

Στους περαιτέρω θεμελιωτές ανήκουν

Ο Τζων Φορμπς Νας (John Forbes Nash) (η ζωή του έγινε θέμα της ταινίας «ένας υπέροχος άνθρωπος»), ο οποίος γενίκευσε το πρόβλημα σε παιχνίδια μη μηδενικού αθροίσματος και πρόσφερε σαν λύση την ισορροπία Νας (Nash Equilibrium)

Ο Ράινχαρντ Ζέλτεν (Reinhard Selten) άνοιξε το δρόμο για ικανοποιητική λύση του προβλήματος σε δυναμικά παιχνίδια με την έννοια της ισορροπίας στα υποπαιχνίδια (Subgame Perfect Nash Equilibrium) και της ισορροπίας τρεμάμενου χεριού (trembling hand perfect equilibrium)

Ο Τζων Χαρσάνυι (John Harsanyi) ασχολήθηκε με παιχνίδια υπό μερική πληροφόρηση (Incomplete Information).

Για τις εργασίες τους τιμήθηκαν οι τρεις τελευταίοι το 1994 με το βραβείο της Σουηδικής Ακαδημίας Επιστημών στην μνήμη του Άλφρεντ Νομπέλ (Alfred Bernhard Nobel). Είναι σίγουρο βέβαια ότι αν ο Τζων φον Νόιμαν ζούσε θα μοιραζόταν και αυτός το βραβείο.

Τα τελευταία 30 χρόνια, η θεωρία παιγνίων έχει βρει ευρύτατη εφαρμογή στα οικονομικά, όπου ολόκληροι κλάδοι στηρίζονται στις μεθόδους της, όπως π.χ. η βιομηχανική οργάνωση (industrial organisation), ο σχεδιασμός μηχανισμών (mechanism design) με σπουδαιότερο υποκλάδο τον σχεδιασμό δημοπρασιών (auctions) κ.α.

Επίσης, η θεωρία παιγνίων χρησιμοποιείται και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης (Collective action), όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών. Στη συγκεκριμένη εκδοχή, μιλάμε για παίγνια συνεργασίας (Cooperative Game Theory). Αυτό βρίσκεται σε άμεση συσχέτιση με τον ρόλο του κράτους και των θεσμών σε θέματα συνεργασίας. Χαρακτηριστικό παράδειγμα είναι η παροχή δημόσιων αγαθών και η φορολογία.

Επιπρόσθετα χρησιμοποιείται όμως ευρέως και σε άλλες επιστήμες, όπως εξελικτική βιολογία, ψυχολογία, κοινωνιολογία κλπ.

Το 2005 οι θεωρητικοί παιγνίων Τόμας Σέλλινγκ (Thomas Schelling) και Ρόμπερτ Άουμαν (Robert Aumann) κέρδισαν το Βραβείο Νομπέλ για τις Οικονομικές Επιστήμες.

Θεωρία παιγνίων – Ισορροπία Nash στην καθημερινή ζωή
(Μεταπτυχιακή Διατριβή της Βλαχοπούλου Αθανασίας, 2010)

Η θεωρία παιγνίων έχει μεγάλη γκάμα εφαρμογών. Θα λέγαμε πως όλα έχουν κάποια σχέση με την θεωρία παιγνίων αφού έχει εφαρμογές στην οικονομία, στις επιχειρήσεις, στην πληροφορική, στις τηλεπικοινωνίες, στην πολιτική, στην κοινωνιολογία, στη βιολογία και φυσικά στην καθημερινότητα. Μια σύγχρονη μαθηματική θεωρία μπορεί να αναλύσει κάθε είδος αναμέτρησης , από την ντάμα και το σκάκι μέχρι τον τζόγο ή έναν πυρηνικό πόλεμο, και να προβλέψει τον νικητή». Η θεωρία παιγνίων είναι μια μεθοδολογία ανάλυσης καταστάσεων μεταξύ μιας ομάδας λογικών ατόμων η οποία ανταγωνίζεται με σκοπό ο κάθε ένας να αποκτήσει το μεγαλύτερο όφελος.

Σκοπός της είναι να μας βοηθήσει να καταλάβουμε διάφορες καταστάσεις στις οποίες αλληλεπιδρούν δύο ή περισσότερες οντότητες, κάθε μία από τις οποίες συμπεριφέρεται με στρατηγικό τρόπο και προσπαθεί να πάρει κάποιες αποφάσεις. Η μεμονωμένη οντότητα στην συγκεκριμένη περίπτωση ονομάζεται παίκτης, και είναι αυτός που παίρνει αποφάσεις. Σκοπός του κάθε παίκτη είναι να μεγιστοποιήσει το κέρδος του, το οποίο μετράται σε μια κλίμακα ωφέλειας.

Επομένως το παίγνιο που αναφέρεται στην θεωρία παιγνίων αντιπροσωπεύει την κατάσταση κατά την οποία δύο ή περισσότεροι παίκτες επιλέγουν τρόπους ενέργειας, που δημιουργούν καταστάσεις αλληλεξάρτησης.

Η πρώτη γνωστή αναφορά στη Θεωρία Παιγνίων έγινε τον 18ο αιώνα (1838) από τον Γάλλο οικονομολόγο Augustin Cournot ο οποίος κατάφερε να αναλύσει ολιγοπωλιακές καταστάσεις με τρόπο παρόμοιο με τις σύγχρονες μεθόδους της θεωρίας παιγνίων.

Ωστόσο η ουσιαστική της ανάπτυξη αποδίδεται στον Ούγγρο φυσικό και μαθηματικό, John von Neumann, ο οποίος το 1928 απέδειξε ότι τα παιχνίδια μηδενικού αθροίσματος έχουν πάντα λύση και ότι η απώλεια ενός παίκτη είναι ίση με το κέρδος του δεύτερου. Καθοριστική στην μετέπειτα ανάπτυξη της θεωρίας παιγνίων ήταν η δημοσίευση του βιβλίου “Theory of Games & Economic Behavior”, το 1944, από τους John von Neumann και Oskar Morgenstern.

Στις αρχές της δεκαετίας του 1950 ο Αμερικανός μαθηματικός και οικονομολόγος John Nash εισήγαγε μια ισορροπία για παιχνίδια μη-μηδενικού αθροίσματος, γνωστή σαν ισορροπία Nash. Πρόκειται για μια κατάσταση, όπως θα δούμε και παρακάτω, από την οποία κανέναν παίκτη δεν τον συμφέρει να απομακρυνθεί, δεδομένων των επιλογών των αντιπάλων τους. Η ζωή του έγινε θέμα της ταινίας “Ένας υπέροχος άνθρωπος” με τον Russel Crow, όχι μόνο για όλα όσα προσέφερε στη θεωρία παιγνίων, αλλά και επειδή έπασχε από σύνδρομο καταδίωξης και σχιζοφρένειας από την ηλικία των 29 ετών.

Από εκείνο το σημείο και μετά η θεωρία παιγνίων είχε αλματώδη ανάπτυξη και άρχισε να εφαρμόζεται σε όλους τους τομείς και τις πολιτικές επιστήμες, ενώ πληθώρα ερευνητικών πειραμάτων ξεκίνησαν προσπαθώντας να βρουν λύση σε όλο και περισσότερα προβλήματα. Το 1965 ο Reinhard Selten μελέτησε τα δυναμικά παίγνια (αυτά που εξελίσσονται στο χρόνο) εισάγοντας την έννοια της ισορροπίας στα υποπαίγνια (subgame perfect equilibrium) και της ισορροπίας τρεμάμενου χεριού(trembling hand perfect equilibrium), ενώ το 1975 ο John Harsanyi γενίκευσε τις ιδέες του John Nash και μελέτησε παίγνια μη-πλήρους πληροφόρησης.

Για τις εργασίες τους, οι τρεις αυτοί άνθρωποι τιμήθηκαν αργότερα, το 1994, με το βραβείο Νόμπελ της Σουηδικής Ακαδημίας Επιστημών.

Τη δεκαετία του 1970 άρχισε να εφαρμόζεται και στον κλάδο της βιολογίας, σαν αποτέλεσμα της εργασίας του John Maynard Smith σχετικά με την έννοια της «εξελικτικά σταθερής στρατηγικής» (evolutionary stable strategy).

Στα τέλη της δεκαετίας του 1990 η θεωρία παιγνίων εφαρμόστηκε στον σχεδιασμό δημοπρασιών. Πάνω σε αυτό ασχολήθηκαν διάφοροι επιστήμονες για την κατανομή δικαιωμάτων χρήσης του ηλεκτρομαγνητικού φάσματος στη βιομηχανία των κινητών τηλεπικοινωνιών.

Το 2005 ο Αμερικανός επιστήμονας Tomas Schelling και ο Γερμανός θεωρητικός παιγνίων Robert Aumann κέρδισαν το βραβείο Νόμπελ για τις Οικονομικές επιστήμες επειδή εμπλούτισαν την αντίληψη μας σχετικά με τις έννοιες του ανταγωνισμού και της συνεργασίας μέσω της παιγνιοθεωρητικής ανάλυσης». Τους ακολούθησαν το 2007 οι Roger Myerson, Leonid Hurwicz και Eric Maskin “για τη θεμελίωση της θεωρίας σχεδιασμού μηχανισμών”.

Εφαρμογές στην καθημερινή ζωή: Όπως είδαμε μέχρι τώρα και θα δούμε και παρακάτω, η θεωρία παιγνίων έχει μεγάλη γκάμα εφαρμογών. Θα λέγαμε πως όλα έχουν κάποια σχέση με την θεωρία παιγνίων αφού έχει εφαρμογές στην οικονομία, στις επιχειρήσεις, στην πληροφορική, στις τηλεπικοινωνίες, στην πολιτική, στην κοινωνιολογία, στη βιολογία και φυσικά στην καθημερινότητα. Μια σύγχρονη μαθηματική θεωρία μπορεί να αναλύσει κάθε είδος αναμέτρησης, από την ντάμα και το σκάκι μέχρι τον τζόγο ή έναν πυρηνικό πόλεμο, και να προβλέψει τον νικητή.

Οι οικονομολόγοι εδώ και πολύ καιρό χρησιμοποιούν τη θεωρία παιγνίων(έχοντας ως υλικά υποστήριξης τα πέντε βραβεία Νόμπελ στα οικονομικά) για να αναλύσουν διάφορους κλάδους όπως για παράδειγμα η βιομηχανική οργάνωση, ο σχεδιασμός μηχανισμών(mechanism design) με υποκλάδο τις δημοπρασίες, τις συμφωνίες, τα ολιγοπώλια, τα μονοπώλια, (ο Γάλλος μαθηματικός Κουρνό το 1838 έγραψε το πρώτο μοντέλο δυοπωλίου ) τα συστήματα για να μπορεί κάποιος να ψηφίσει και πολλά άλλα. Οι έρευνες αυτές για να πραγματοποιηθούν εστιάζουν στην ισορροπία που υπάρχει στα παιχνίδια, την οποία θα σχολιάσουμε παρακάτω.

Επιπρόσθετα παίζει σημαντικό ρόλο στην παγκόσμια διπλωματία και στις πολεμικές στρατηγικές, επηρεάζοντας τη μοίρα των διαφόρων χωρών ακόμη και αν δεν είναι άμεσα ορατό.

Χρησιμοποιείται όμως και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης (Co11ective action), όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών. Αυτό βρίσκεται σε άμεση συσχέτιση με τον ρόλο του κράτους και των θεσμών σε θέματα συνεργασίας. Χαρακτηριστικό παράδειγμα είναι η παροχή δημόσιων αγαθών και η φορολογία.

Στη βιολογία η θεωρία παιγνίων έχει χρησιμοποιηθεί για να κατανοήσουμε διάφορα φαινόμενα. Πρωτοχρησιμοποιήθηκε για να εξηγήσει την εξέλιξη (και την σταθερότητα) της αναλογίας 1 προς 1 στα φύλα. Ο Ronald Fisher (1930) πρότεινε ότι αυτή η αναλογία είναι αποτέλεσμα εξελικτικών δυνάμεων που δρουν μεμονωμένα, προσπαθώντας να μεγιστοποιήσουν τον αριθμό των εγγονιών! Συμπληρωματικά οι επιστήμονες προσπάθησαν να εξηγήσουν την εμφάνιση της επικοινωνίας στα ζώα, ενώ ανέλυσαν και την επιθετική συμπεριφορά τους.

Είναι ξεκάθαρο ότι μπορούμε να αναφέρουμε άπειρες εφαρμογές της θεωρίας παιγνίων σε διάφορους τομείς ακόμη και στην καθημερινότητα μας, από τα πιο πολύπλοκα έως τα πιο απλά όπως για παράδειγμα πιο αυτοκίνητο να αγοράσουμε, που θα πάμε το βράδυ ή τι θα φορέσουμε.

Βασικές έννοιες της θεωρίας παιγνίων: Θεμέλιο λίθο στην θεωρία παιγνίων αποτελούν τα βασικά χαρακτηριστικά του παιγνίου. Ως στοιχεία του παιγνίου θεωρούνται το σύνολο των παικτών, το σύνολο των πιθανών ενεργειών που θα πραγματοποιήσουν οι παίκτες(οι στρατηγικές τους), οι πληροφορίες που υπάρχουν κατά τη διάρκεια του παιχνιδιού, τα αποτελέσματα που μπορεί να αποκομίσει ο παίκτης για κάθε ενέργεια του, καθώς επίσης και οι προτιμήσεις των παικτών με βάσει τα αποτελέσματα. Το αποτέλεσμα που μπορεί να αποκομίσει ο παίκτης(outcome), εξαρτάται από τις στρατηγικές που θα ακολουθήσει και από τις αποδόσεις που μπορεί να λάβει. Η απόδοση (payoff), είναι η αριθμητική αποτίμηση των στόχων του, η χρησιμότητα που θα αποκτήσει όταν το παιχνίδι θα τελειώσει.

Με τον όρο στρατηγική ορίζουμε το σύνολο των κανόνων σχετικά με το ποια επιλογή πρέπει να ακολουθήσει ο παίκτης, ποιες είναι οι επιλογές του στο κάθε παίγνιο ξεχωριστά, έχοντας όμως υπόψη του και όλες τις κινήσεις του αντιπάλου.

Μια διάκριση που μπορεί να γίνει στις στρατηγικές είναι σε αμιγείς^Μ^’και σε μεικτές “mixed” στρατηγικές. Μια αμιγής (καθαρή) στρατηγική είναι εκείνη στην οποία κάθε μία από τις δυνατές επιλογές που έχει ο παίκτης επιλέγεται στο ακέραιο. Αντίθετα μεικτή είναι η στρατηγική η οποία περιλαμβάνει συνδυασμό επιλογών, από τις οποίες τουλάχιστον μία επιλέγεται με μη ακέραιες τιμές. Οι μεικτές στρατηγικές δηλαδή καθορίζουν ότι η στρατηγική που θα διαλέξει ο παίκτης θα επιλεγεί τυχαία από το σύνολο των καθαρών στρατηγικών που έχει, με κάποια πιθανότητα. Επομένως μια μεικτή στρατηγική είναι μια κατανομή πιθανοτήτων πάνω στις καθαρές στρατηγικές που έχει ο παίκτης.

Ένα παίγνιο στο οποίο οι παίκτες παίζουν ταυτόχρονα, μπορεί να απεικονιστεί ως “κανονική”(normal) ή “στρατηγική”(strategic) μορφή χρησιμοποιώντας έναν πίνακα ο οποίος συσχετίζει τις στρατηγικές των παικτών με τις αποδόσεις που θα έχουν.

Ένα στρατηγικό παιχνίδι είναι ένα μοντέλο όπου έχουμε Ν παίκτες, καθένας από τους οποίους διαλέγει μόνο μία στρατηγική, η οποία δεν αλλάζει. Σε ένα στρατηγικό παιχνίδι υπάρχουν διάφορες συμπεριφορές παικτών:

• Το παιχνίδι παίζεται μόνο μία φορά.

• Κάθε παίκτης “ξέρει” το παιχνίδι (κάθε παίκτης γνωρίζει όλες τις κινήσεις και τις αποδόσεις του παιχνιδιού).

• Οι παίκτες είναι ορθολογικοί. Ένας ορθολογικός παίκτης είναι ένας παίκτης που παίζει εγωιστικά, θέλοντας να μεγιστοποιήσει το κέρδος του στο παιχνίδι, ενώ ταυτόχρονα γνωρίζει πως και οι αντίπαλοι του είναι ορθολογιστές.

• Όλοι οι παίκτες διαλέγουν τις κινήσεις τους ταυτόχρονα χωρίς όμως να γνωρίζουν τις επιλογές των άλλων παικτών.

Για να κατανοήσουμε καλύτερα την κανονική μορφή των παιγνίων, παραθέτουμε το τέταρτο παίγνιο του ερωτηματολογίου το οποίο θα χρησιμοποιήσουμε σαν παράδειγμα για να εξηγήσουμε τα στρατηγικά παίγνια. [Εικ. 1η]

Όπως είδαµε µέχρι τώρα και θα δούµε και παρακάτω, η θεωρία παιγνίων έχει µεγάλη γκάµα εφαρµογών. Θα λέγαµε πως όλα έχουν κάποια σχέση µε την θεωρία Η θεωρία παιγνίων αφού έχει εφαρμογές στην οικονομία, στις επιχειρήσεις, στην πληροφορική, στις τηλεπικοινωνίες, στην πολιτική, στην κοινωνιολογία, στη βιολογία και φυσικά στην καθημερινότητα. Μια σύγχρονη μαθηματική θεωρία μπορεί να αναλύσει κάθε είδος αναμέτρησης , από την ντάμα και το σκάκι μέχρι τον τζόγο ή έναν πυρηνικό πόλεμο, και να προβλέψει τον νικητή

Το συγκεκριμένο παίγνιο είναι δύο γραμμών επί δύο στηλών και έχουμε δύο παίκτες, τον Α και τον Β. Ο Α παίκτης ονομάζεται “παίκτης γραμμής”, ενώ ο Β “παίκτης στήλης”. Οι επικεφαλίδες των στηλών και των γραμμών είναι οι στρατηγικές του κάθε παίκτη. Η πρώτη στρατηγική επιλογή του Α παίκτη είναι η πρώτη γραμμή, η οποία ονομάζεται α1, ενώ η δεύτερη στρατηγική του είναι η α2. Ομοίως για τον παίκτη Β η πρώτη στρατηγική επιλογή του είναι η πρώτη στήλη, δηλαδή η β1, ενώ η δεύτερη στρατηγική του είναι η δεύτερη στήλη, η β2. Στα κελιά του κάθε πίνακα υπάρχουν αριθμοί που δείχνουν το κέρδος (όφελος, payoff) κάθε παίκτη για κάθε συνδυασμό στρατηγικών. Το πρώτο νούμερο σε κάθε κελί αντιστοιχεί στον παίκτη γραμμής, ενώ το δεύτερο ανήκει στον παίκτη στήλης.

Το παιχνίδι ξεκινάει και οι παίκτες διαλέγουν ταυτόχρονα μία στρατηγική. Το κελί που αντιστοιχεί στο σημείο τομής των δύο επιλογών δείχνει το κέρδος που έχουν οι δύο παίκτες. Αν για παράδειγμα, ο Α παίκτης διαλέξει την πρώτη στρατηγική επιλογή (α1) και ο Β επίσης την πρώτη (β1) τότε το κέρδος τους θα είναι 5 μονάδες για τον καθένα.

Οι παίκτες πριν πάρουν κάποια απόφαση και διαλέξουν ποια στρατηγική θα ακολουθήσουν, κοιτάνε ποια στρατηγική πραγματικά τους ωφελεί, με ποια θα έχουν το μεγαλύτερο δυνατό κέρδος ότι και να κάνει ο αντίπαλος τους. Σε αυτό το σημείο η επιλογή γίνεται με βάση την κυριαρχία των στρατηγικών.

Μια στρατηγική λέμε ότι είναι κυρίαρχη “dominant” εάν για όλους τους συνδυασμούς στρατηγικών των άλλων παικτών έχει το μεγαλύτερο όφελος σε σχέση με τις υπόλοιπες. Είναι πάντα καλύτερη ότι και να κάνει ο άλλος παίκτης αφού έχει το μεγαλύτερο κέρδος σε σχέση με τις άλλες εναλλακτικές επιλογές του. Αντιθέτως μια στρατηγική χαρακτηρίζεται ως κυριαρχούμενη “dominated” όταν υπάρχει κάποια άλλη στρατηγική που είναι πάντα καλύτερη ότι και να κάνει ο άλλος παίκτης.

Στο παραπάνω παράδειγμα βλέπουμε πως για τον Β παίκτη η στρατηγική β1 κυριαρχεί της στρατηγικής β2, αφού (5>4)και (1>0), δηλαδή αν ο Α παίκτης διαλέξει την α1 στρατηγική, ο Β θα επιλέξει την β1και το ίδιο θα κάνει αν ο Α διαλέξει την α2. Επομένως η καλύτερη κίνηση του είναι να επιλέξει την β1 στρατηγική.

Για τις στρατηγικές του παίκτη Α όμως δεν παρατηρούμε το ίδιο. Αυτό γιατί αν ο Α ξέρει πως ο Β θα επιλέξει την β1 στρατηγική, τον συμφέρει να διαλέξει την α1, αφού (5>0) εάν όμως ο Β διαλέξει την β2, ο Α δεν θα επιλέξει πάλι την α1 αλλά την α2 αφού (-100<0). Επομένως για τον Α παίκτη καμιά στρατηγική δεν κυριαρχεί της άλλης.

Αν κάποιος παίκτης έχει κυρίαρχη στρατηγική την ακολουθεί και τότε το παιχνίδι έχει λύση κυρίαρχης στρατηγικής. Όπως είδαμε όμως είναι πολύ πιθανό να μην υπάρχουν πάντα κυρίαρχες στρατηγικές αλλά να υπάρχουν ασθενείς κυριαρχίες.

Μια στρατηγική κυριαρχεί ασθενώς “weakly dominates” εάν για κάθε μία από τις εναλλακτικές στρατηγικές του παίκτη έχει τουλάχιστον ίση απολαβή για όλους τους συνδυασμούς στρατηγικών των υπολοίπων παικτών και καλύτερη απολαβή για τουλάχιστον έναν συνδυασμό στρατηγικών των άλλων παικτών. Όλες οι άλλες εναλλακτικές στρατηγικές ονομάζονται ασθενώς κυριαρχούμενες “weakly dominated strategy”. Στο παραπάνω παίγνιο η στρατηγική α1 κυριαρχεί ασθενώς της α2 αφού (5>-100) και (0=0).

Ο συνδυασμός των στρατηγικών που επιλέχθηκαν από κάθε παίκτη μας δίνει την έννοια της ισορροπίας “equilibrium”. Η ισορροπία στο παίγνιο δηλαδή προέρχεται από τις καλύτερες στρατηγικές μία για κάθε παίκτη στο παιχνίδι. Στο παράδειγμα μας η ισορροπία βρίσκεται στο κελί (α1, β1) δηλαδή στη λύση (5, 5) αφού η καλύτερη επιλογή για τον Α παίκτη είναι η α1, για τον Β παίκτη η β1 και η τομή τους είναι το κελί (α1, β1).

Για να βρούμε αυτήν την ισορροπία εάν υπάρχει κυρίαρχη στρατηγική για κάποιον παίκτη τότε επιλέγεται, όπως αναφέραμε και παραπάνω. Σε περίπτωση όμως που δεν υπάρχει, ο περιορισμός των κυριαρχούμενων στρατηγικών “dominated” μπορεί να οδηγήσει στη δημιουργία νέων κυριαρχούμενων στρατηγικών, οι οποίες με τη σειρά τους θα απαλειφθούν κι αυτές. Ξεκινώντας το παιχνίδι διαγράφονται μία μια οι ασθενώς κυριαρχούμενες στρατηγικές από τις επιλογές του παίκτη και αυτό συνεχίζεται μέχρι να βρεθεί μόνο μία στρατηγική για κάθε παίκτη.

Η διαδικασία αυτή ονομάζεται απαλοιφή κυριαρχούμενων στρατηγικών “Iterated Elimination of Dominated Strategies, IEDS”. Η διαδικασία αυτή είναι απολύτως λογική αφού και οι παίκτες είναι λογικοί και γνωρίζουν πως και οι αντίπαλοι τους είναι λογικοί γεγονός που δείχνει ότι κανένας από αυτούς δεν θα επιλέξει μια στρατηγική η οποία είναι ασθενώς κυριαρχούμενη. Αν απαλείψουμε μόνο κυριαρχούμενες στρατηγικές, η σειρά της απαλοιφής δεν επηρεάζει το αποτέλεσμα. Ο κίνδυνος υπάρχει μόνο αν απαλείψουμε με λάθος σειρά ασθενώς κυριαρχούμενες στρατηγικές, οδηγώντας μας σε λάθος αποτέλεσμα. Σωστή σειρά θεωρείται η ταυτόχρονη απαλοιφή για όλους τους παίκτες σε κάθε γύρο.

Η σημαντικότερη έννοια ισορροπίας στη θεωρία παιγνίων είναι η ισορροπία Nash που θα αναλύσουμε στην συνέχεια.

Κατηγορίες παιγνίων: Τα παίγνια μπορούν να ταξινομηθούν σε διάφορες κατηγορίες με βάση διάφορα είδη κριτηρίων. Εδώ θα προσπαθήσουμε να τα χωρίσουμε σε κάποιες κατηγορίες. Έτσι λοιπόν έχουμε τους εξής διαχωρισμούς:

Σύμφωνα με τον αριθμό των παικτών που παίρνουν μέρος. Αν υπάρχουν δύο παίκτες τότε ονομάζονται “παίγνια δύο παικτών”, ενώ αν οι παίκτες είναι περισσότεροι(έστω n), τότε έχουμε “παίγνια n παικτών”, τα οποία βέβαια δεν έχουν μελετηθεί τόσο πολύ όσο τα πρώτα. Υπάρχει φυσικά και η περίπτωση που υπάρχει μόνο ένας παίκτης έχοντας σαν αντίπαλο του “τη φύση”, όπως για παράδειγμα ισχύει στην πασιέντζα. Τα παίγνια αυτά βέβαια θεωρούνται πως ανήκουν στην πρώτη κατηγορία των παιγνίων με δύο παίκτες.

Σύμφωνα με τη δυνατότητα συνεργασίας. Οι παίκτες (δύο ή περισσότεροι) πριν παίξουν το παίγνιο έχουν τη δυνατότητα να συνεργαστούν και να κάνουν συμφωνίες μεταξύ τους για τις στρατηγικές που θα ακολουθήσουν. Αυτά ονομάζονται «συνεργατικά παίγνια» (cooperative games) σε αντίθεση με τα παίγνια όπου ο παίκτης παίρνει τις αποφάσεις χωρίς να συνεννοηθεί με τους άλλους, τα οποία ονομάζονται «μη συνεργατικά» (non cooperative games).

Σύμφωνα με τα χαρακτηριστικά των αποδοχών τους. Όταν το κέρδος ενός παίκτη είναι ίσο με την απώλεια του αντιπάλου του, το παίγνιο ονομάζεται «παίγνιο μηδενικού αθροίσματος» (zero-sum games). Σε αυτά τα παίγνια το άθροισμα των αμοιβών είναι ίσο με μηδέν με αποτέλεσμα η συνεργασία για τους παίκτες να είναι ανέφικτη. Αντίστοιχα υπάρχουν «παίγνια μη-μηδενικού αθροίσματος» (non zero-sum games) στα οποία το άθροισμα των αμοιβών είναι διάφορο του μηδενός. Το κέρδος κάποιου δεν σημαίνει απαραίτητα τη ζημιά κάποιου ανταγωνιστή και οι δύο μπορεί να κερδίσουν ή και να χάσουν αντίστοιχα.

Σύμφωνα με τη σειρά που παίρνονται οι αποφάσεις. Αν οι αντίπαλοι κινηθούν ταυτόχρονα επιλέγοντας μια στρατηγική στην αρχή του παιχνιδιού, χωρίς ο ένας να γνωρίζει τι θα πράξει ο άλλος, τότε μιλάμε για «στατικό παίγνιο» ή «στρατηγικό παίγνιο» ή «παίγνιο σε κανονική μορφή». Στην αντίθεση περίπτωση έχουμε τα «δυναμικά παίγνια» ή «παίγνια σε εκτεταμένη μορφή» όπου οι παίκτες έχουν κάποια γνώση για τις προηγούμενες ενέργειες και έτσι η σειρά με την οποία λαμβάνονται οι αποφάσεις έχει σημασία. Στα παίγνια αυτά η αναπαράσταση γίνεται με τη βοήθεια δέντρου.

Σύμφωνα με τον αριθμό των στρατηγικών. Τα παίγνια σε αυτήν την κατηγορία χωρίζονται σε «πεπερασμένα» και σε «μη πεπερασμένα». Τα πεπερασμένα παίγνια τελειώνουν σε ένα μετρήσιμο αριθμό κινήσεων, σε αντίθεση με τα άλλα τα οποία διαρκούν για άπειρες κινήσεις και ο νικητής γίνεται γνωστός αφού όλες αυτές οι κινήσεις τελειώσουν.

Τέλος σύμφωνα με την πληροφόρηση που παρέχουν. Λέμε ότι έχουμε «παίγνια πλήρους πληροφόρησης» όταν οι παίκτες είναι πλήρως ενημερωμένοι για τις κινήσεις των αντιπάλων. Έτσι μόνο τα δυναμικά παίγνια μπορεί να είναι παίγνια πλήρους πληροφόρησης, μιας και στα στατικά οι παίκτες δεν είναι ενημερωμένοι. Όταν οι παίκτες είναι μερικώς ενημερωμένοι λέμε ότι έχουμε «παίγνια ατελούς πληροφόρησης»

Θεωρία παιγνίων – Ισορροπία Nash – Μαθηματικά: Στους βασικούς θεμελιωτές της θεωρίας παιγνίων ανήκει ο John Nash [εικ. 8] ο οποίος εισήγαγε στα παίγνια την ιδέα της ισορροπίας η οποία χρησιμοποιείται πλέον ευρέως σε όλους τους κλάδους της σύγχρονης επιστήμης.

Ο Nash γεννήθηκε στη Δυτική Βιρτζίνια το 1928. Αν και ενδιαφερόταν για τα μαθηματικά, αποφάσισε να γίνει ηλεκτρολόγος μηχανικός όπως και ο πατέρας του. Όταν το 1945 γράφτηκε στο “Carnegie Institute of Technology” στο Pittsburgh αποφάσισε να γίνει χημικός μηχανικός, κάτι που στην πορεία δεν του άρεσε και έτσι επέστρεψε στα μαθηματικά με τα οποία ασχολήθηκε.

Όταν πήγε το 1948 στο Princeton ήταν ήδη ένας από τους κορυφαίους στην θεωρία παιγνίων και είχε ήδη ασχοληθεί με «προβλήματα συμφωνιών» δηλαδή προβλήματα στα οποία οι παίκτες μοιράζονται κάποια κοινά συμφέροντα. Με τη φράση «αυτός ο άντρας είναι ιδιοφυία» περιέγραψε τον John Nash στους υπόλοιπους καθηγητές του Princeton University, ο καθηγητής R. L. Duffin.

Η σημαντικότερη του εργασία όμως ήταν αυτή που ασχολήθηκε με την ισορροπία στη θεωρία παιγνίων και χάρη στην πολύτιμη συμβολή του πήρε το όνομα «Nash ισορροπία». Ο Nash δημοσίευσε την ιδέα του για την ισορροπία αμέσως σε ηλικία 21 ετών! Μιαδισέλιδηαναφοράέγινετο 1950 στο «Proceedings of the National Academy of Sciences». Με τίτλο “Equilibrium Points in n-Person Games”, το άρθρο δημοσίευσε περιληπτικά την ύπαρξη λύσεων για παίγνια με ν παίκτες. Επέκτεινε την έρευνα του και μια μεγαλύτερη έκδοση δημοσιεύτηκε το 1951 στο “Annals of Mathematics” με τίτλο “Non-cooperative Games”.

Αν και δεν έτυχε ευρείας υποδοχής στην αρχή, η προσέγγιση του Nash για την θεωρία παιγνίων, τον οδήγησε στην απόκτηση του βραβείου Νόμπελ στα οικονομικά το 1994. Δεν υπάρχει όμως καμιά αμφιβολία ότι η ανάπτυξη της θεωρίας παιγνίων σε όλους τους τομείς έγινε εφικτή χάρη στην ανακάλυψη του Nash.

Ο Nash σκαρφίστηκε μια γενική λύση για όλα τα (πεπερασμένα) παίγνια και απέδειξε ότι κάθε τέτοιο παίγνιο διαθέτει τουλάχιστον μια τέτοια λύση. Έτσι κατάφερε ένα μεγάλο χτύπημα στην απροσδιοριστία.

Προσέγγιση της ισορροπίας Nash: Το θεώρημα που διατύπωσε ο Nash και έγινε γνωστό σε όλο τον κόσμο αναφέρει πως κάθε παίγνιο με πεπερασμένο πλήθος παικτών και ενεργειών έχει τουλάχιστον ένα σημείο ισορροπίας, σύμφωνα με το οποίο όλοι οι παίκτες επιλέγουν τις πιο συμφέρουσες για αυτούς ενέργειες, γνωρίζοντας και τις επιλογές των αντιπάλων τους. Οι παίκτες σκέφτονται τι μπορεί να διαλέξει ο αντίπαλος τους, προσπαθούν να καταλάβουν τη συμπεριφορά των άλλων και επιλέγουν την στρατηγική τους σύμφωνα με αυτό. Δηλαδή η στρατηγική ενός παίκτη αποτελεί την καλύτερη αντίδραση (απόκριση) στην στρατηγική του άλλου παίκτη. Αυτός ο συνδυασμός στρατηγικών αποτελεί ισορροπία Nash.

Ο παίκτης επιλέγει εκείνη από τις δικές του στρατηγικές, η οποία είναι η καλύτερη απάντηση στην στρατηγική που νομίζει ότι θα επιλέξει ο άλλος παίκτης. Επομένως κανένας παίκτης δεν έχει κίνητρο να φύγει μονομερώς από αυτήν την ισορροπία που έχει δημιουργηθεί. Οι παίκτες καταλαβαίνουν πως βρίσκονται σε ισορροπία αν μια αλλαγή στις στρατηγικές από οποιονδήποτε από αυτούς, οδηγήσει σε χαμηλότερο κέρδος από αυτό που θα είχαν αν παρέμεναν στη σωστή στρατηγική.

Δεδομένου των επιλογών των αντιπάλων, ο παίκτης δεν έχει να κερδίσει κάποιο μεγαλύτερο όφελος και για αυτό δεν αλλάζει στρατηγική.

Όπως είναι φανερό η θεωρία για την ισορροπία Nash, έχει δύο συνιστώσες: πρώτα κάθε παίκτης κάνει την επιλογή του βασιζόμενος στην ορθολογική απόφαση που προέρχεται από τις πεποιθήσεις του για το τι θα πράξει ο αντίπαλος και δεύτερον κάθε πεποίθηση του παίκτη για την επιλογή του αντιπάλου του είναι σωστή. Για να κατανοήσουμε πλήρως την έννοια της ισορροπίας Nash, θα χρησιμοποιήσουμε πάλι το πιο πάνω παίγνιο [εικ. 1].

Ξεκινώντας με τον Α παίκτη βρίσκουμε ποια στρατηγική θα επιλέξει σε συγκεκριμένη στρατηγική του αντιπάλου. Έστω ότι ο Α πιστεύει ότι ο Β θα επιλέξει την β1 στρατηγική. Τότε προφανώς θα επιλέξει εκείνη από τις δύο δικές του στρατηγικές που θα του δώσει το μεγαλύτερο όφελος. Η α1 θα του δώσει 5 μονάδες ωφέλειας, ενώ η α2 θα του δώσει 0 (όπως αναφέραμε και πιο πριν οι πρώτοι αριθμοί σε κάθε κελί αντιστοιχούν στον παίκτη γραμμής, δηλαδή στον Α). Άρα θα επιλέξει την α1 στρατηγική με κέρδος 5. Αυτό το νούμερο το κυκλώνουμε. Αν ο Α πιστεύει πως ο Β θα διαλέξει την β2 στρατηγική αυτός φυσικά θα προτιμήσει την α2 αφού το κέρδος του θα είναι μεγαλύτερο (-100<0), άσχετα αν πρόκειται για 0 μονάδες.

Ύστερα από τις επιλογές του παίκτη Α, ο πίνακας παρουσιάζεται ως εξής: [εικ.2]

Ομοίως κάνουμε και για τον παίκτη Β. Αν αυτός νομίζει ότι ο Α θα επιλέξει την α1 στρατηγική, θα προτιμήσει την β1 στρατηγική που θα του δώσει κέρδος 5 μονάδες και όχι 4 μονάδες (οι δεύτεροι αριθμοί σε κάθε κελί είπαμε πως αναφέρονται στον παίκτη στήλης, δηλαδή στον Β). Αν ο Β νομίζει για τον Α πως θα ακολουθήσει την α2 στρατηγική, θα προτιμήσει και πάλι την β1 αφού θα έχει κέρδος 1 μονάδα αντί για 0 μονάδες. Αυτά τα νούμερα τα βάζουμε σε ένα μπλε τετράγωνο.

Ύστερα και από τις επιλογές του Β παίκτη ο πίνακας έχει ως εξής: [εικ. 3]

Η ισορροπία Nash υπάρχει όταν η καλύτερη απόκριση του παίκτη Α είναι ίδια με την καλύτερη απόκριση του παίκτη Β, όταν δηλαδή σε ένα κελί υπάρχουν οι επιλογές και των δύο παικτών. Αυτό είναι και το σημείο ισορροπίας. Στο παράδειγμα μας ισορροπία έχουμε στο κελί (α1, β1)=(5, 5).

Υπάρχουν παιχνίδια που έχουν παραπάνω από μία ισορροπίες Nash, ενώ υπάρχουν και παιχνίδια χωρίς κανένα σημείο ισορροπίας Nash.

Έχουμε αναφέρει πως εκτός από τις καθαρές στρατηγικές έχουμε και τις μικτές. Είπαμε πως η επιλογή μικτής στρατηγικής ισοδυναμεί με το να επιλέξει ο παίκτης τυχαία μεταξύ συγκεκριμένων καθαρών στρατηγικών. Για παράδειγμα μπορούμε να πούμε πως ο παίκτης Α θα επιλέξει την α1 στρατηγική με πιθανότητα p ή την α2 με πιθανότητα p-1. Ο παίκτης δηλαδή που διαλέγει μικτή στρατηγική επιλέγει τις πιθανότητες καθεμιάς από τις καθαρές στρατηγικές που εμπεριέχονται στην συγκεκριμένη μικτή στρατηγική, αφήνοντας τα υπόλοιπα στην τύχη. Όσο και αν φαίνεται παράξενο υπάρχουν πολλές περιπτώσεις στην καθημερινή ζωή όπου οι παίκτες προτιμούν να χρησιμοποιήσουν μικτές στρατηγικές.

Ο Nash κατάφερε επίσης να αποδείξει πως όλα τα πεπερασμένα παίγνια εμπεριέχουν τουλάχιστον ένα σύνολο μικτών στρατηγικών (μία ανά παίκτη) που συνιστά ισορροπία Nash σε μικτές στρατηγικές (ΙΝΜΣ) Όταν υπάρχουν πολλές ισορροπίες Nash (σε καθαρές στρατηγικές), τη λύση δίνει η ισορροπία Nash σε μικτές στρατηγικές.

Ακόμη και αν δεν υπάρχει ισορροπία σε καθαρές στρατηγικές, υπάρχει μία μοναδική ισορροπία σε μικτές στρατηγικές.

Η ισορροπία σε καθαρές στρατηγικές φαίνεται πιο ελκυστική πρόταση από την ισορροπία στις μικτές, αφού δεν χρειάζεται οι παίκτες να επιλέγουν στην τύχη. Όμως από τη στιγμή που δεν υπάρχει ισορροπία σε κάθε παιχνίδι, η ισορροπία σε μικτές στρατηγικές αποκτάει μεγαλύτερη αξία αφού πλέον για κάθε παιχνίδι υπάρχει σίγουρα μία ισορροπία.

Εξέταση διαφόρων παιγνίων: Ένα από τα παράδοξα της ισορροπίας Nash που μπορεί να θεωρηθεί και σαν αδυναμία της είναι ότι σε κάποια παίγνια οι παίκτες έχουν μεγαλύτερο όφελος αν δεν διαλέξουν την ισορροπία Nash και διαλέξουν άλλη στρατηγική. Ενώ η ισορροπία Nash δίνει την ελκυστικότερη λύση για όλους τους παίκτες, οδηγώντας στο σημείο ισορροπίας, εντούτοις υπάρχουν κάποια διάσημα παίγνια που είναι εξαίρεση στον κανόνα. Κάποια από αυτά τα παίγνια χρησιμοποιήθηκαν στην έρευνα και θα αναλυθούν στη συνέχεια.

Το δίλημμα του φυλακισμένου “Prisoner’s dilemma”

Το πιο γνωστό και σημαντικό παίγνιο στην ιστορία της θεωρίας παιγνίων είναι το παίγνιο του διλήμματος του φυλακισμένου (Prisoner,s dilemma).

Τον Ιανουάριο του 1950 οι Melvin Dresher και Merrill Flood επινόησαν το συγκεκριμένο παίγνιο και το χρησιμοποίησαν σαν παράδειγμα στο RAND Corporation. Αργότερα όταν παρουσιάστηκε αυτό το παράδειγμα σε ένα σεμινάριο στο Stanford University, ο Albert W. Tucker σκαρφίστηκε μία ιστορία πάνω στην οποία βάσισε όλη του την διάλεξη. Το παίγνιο αυτό έμεινε από τότε στην ιστορία κάνοντας την θεωρία παιγνίων γνωστή σε όλες τις κοινωνικές επιστήμες, ενώ και πάρα πολλοί μελετητές έχουν ασχοληθεί με αυτό γράφοντας διάφορα βιβλία .

Η ιστορία του Tucker έχει ως εξής: Δύο ύποπτοι για ένα έγκλημα συλλαμβάνονται από την αστυνομία και κρατούνται σε διαφορετικά κελιά, ώστε να μην έχουν μεταξύ τους επικοινωνία. Οι αστυνομικοί είναι σίγουροι για την ενοχή τους αλλά ελλείψει αποδεικτικών στοιχείων τους προσφέρουν μια συμφωνία: αν και οι δύο ομολογήσουν ότι διέπραξαν το έγκλημα θα καταδικαστούν μόνο σε τρία χρόνια φυλάκισης. Αν μόνο ο ένας ομολογήσει θα αφεθεί ελεύθερος ενώ ο άλλος που θα αρνηθεί θα φυλακιστεί για πέντε χρόνια. Τέλος, αν κανένας δεν ομολογήσει, και οι δύο θα περάσουνε έναν χρόνο στη φυλακή.

Το παραπάνω πρόβλημα μπορεί να παρουσιαστεί στον επόμενο πίνακα [εικ. 4]

Το δίλημμα αυτό παίρνει τη μορφή του παρακάτω παιγνίου, όπου τα νούμερα είναι η ωφέλεια που αποκομίζει ο παίκτης. [εικ.5]

Θεωρία παιγνίων – Ισορροπία Nash: Το δίλημμα εμφανίζεται όταν κάποιος υποθέτει ότι και οι δύο φυλακισμένοι νοιάζονται μόνο για να ελαχιστοποιήσουν την ποινή τους. Κάθε παίκτης έχει δύο στρατηγικές επιλογές: είτε να ομολογήσει και να συνεργαστεί με την αστυνομία (confess), είτε να παραμείνει σιωπηλός (not confess). Για παράδειγμα το καλύτερο αποτέλεσμα για τον παίκτη Α είναι να ομολογήσει και ο παίκτης Β να μείνει σιωπηλός. Το επόμενο καλύτερο αποτέλεσμα για τον Α είναι να μη μιλήσει κανένας από τους δύο, ενώ το χειρότερο σενάριο είναι να μιλήσει ο Β ενώ ο Α θα παραμείνει σιωπηλός.

Το αντίστοιχο ισχύει και για τον παίκτη Β. Είναι λοιπόν φανερό πως οτιδήποτε και να σκοπεύει να κάνει ο Β, ο παίκτης Α θα πρέπει να επιλέξει την πρώτη στρατηγική (να ομολογήσει δηλαδή), αφού έτσι θα έχει καλύτερα αποτελέσματα. Ομοίως ισχύει και για τον Β παίκτη ο οποίος θα προτιμήσει και αυτός να μη μιλήσει. Σε αυτό το σημείο υπάρχει το δίλημμα αφού από τον πίνακα φαίνεται πως οι παίκτες θα αποκομίσουν μεγαλύτερο όφελος αν και οι δύο επιλέξουν να μη μιλήσουν από το να τα ομολογήσουν όλα. . Έτσι η καλύτερη στρατηγική για τον καθένα ξεχωριστά, παράγει ένα αποτέλεσμα που δεν είναι καλό για την ομάδα, κάνοντας τα ατομικά κίνητρα να υπονομεύουν το κοινό συμφέρον.

Πρόκειται για ένα παιχνίδι όπου τα κέρδη προέρχονται από τη συνεργασία. Το καλύτερο αποτέλεσμα και για τους δύο παίκτες είναι να μη μιλήσουν στους αστυνομικούς. Παρόλα αυτά, κάθε παίκτης έχει ένα μεγάλο κίνητρο να γίνει προδότης. Οτιδήποτε και να κάνει ο ένας παίκτης, ο αντίπαλος προτιμάει να ομολογήσει. Έτσι το παίγνιο αυτό έχει μία μοναδική Nash ισορροπία, μία κυρίαρχη στρατηγική, η οποία είναι η λύση (Α1,Β1)=(1,1), η από κοινού ομολογία.

Σε κάθε παίγνιο η λύση παρουσιάζεται και με τη βοήθεια του προγράμματος Gambit, το οποίο είναι χρήσιμο εργαλείο στη θεωρία παιγνίων αφού έχει πολλές εφαρμογές και βρίσκει τις ισορροπίες Nash και σε καθαρές και σε μεικτές στρατηγικές. Στην εικόνα 6 βλέπουμε τη λύση που δίνει το πρόγραμμα για το συγκεκριμένο παίγνιο.

Είναι φανερό πως σε κάθε συναλλαγή ή σύγκρουση ατομικών συμφερόντων που θίγει τους ανθρώπους, υπάρχει κάπου εκεί το δίλημμα του φυλακισμένου. Τα παραδείγματα ποικίλλουν από τα πολιτικά παζάρια και τους πλειστηριασμούς έως την συμπεριφορά των οδηγών στους δρόμους και την επιλογή δύο αντιμαχόμενων μερών για το αν θα χρησιμοποιήσουν δικηγόρους ή/ και θα καταφύγουν στα δικαστήρια για να λύσουν τις διαφορές τους. Το κοινό στοιχείο σε όλα αυτά τα παραδείγματα είναι ότι αν ο καθένας δράσει συνεργατικά θα υπάρξει το καλύτερο αποτέλεσμα. Δυστυχώς σχεδόν όλοι σκέφτονται μόνο το προσωπικό συμφέρον, με αποτέλεσμα να οδηγηθούν σε μη επιθυμητά αποτελέσματα.

Τα κόκκινα νούμερα αντιπροσωπεύουν τον Α παίκτη ενώ τα μπλε τον Β. Και εδώ η λύση είναι η επιλογή (Α1, Β1)=(1, 1) αφού η ανάλυση δείχνει πως ο πρώτος παίκτης (ο Α) επιλέγει την πρώτη του στρατηγική επιλογή (την Α1) και ο δεύτερος παίκτης (ο Β) επιλέγει την πρώτη του κι αυτός στρατηγική επιλογή (την Β1).

Το παράδοξο του αποτελέσματος εξηγείται από το γεγονός ότι οι φυλακισμένοι βρίσκονται σε ξεχωριστά κελιά και δεν μπορούν να επικοινωνήσουν μεταξύ τους για να αποφασίσουν από κοινού τι θα κάνουν. Αν μπορούσαν να το συζητήσουν ίσως να έβλεπαν πως η καλύτερη λύση είναι να μη μιλήσει κανένας τους. Αλλά ακόμη και με μια προφορική συμφωνία οι φυλακισμένοι ίσως προσπαθήσουν να προδώσουν τον υποτιθέμενο αντίπαλο τους, προλαβαίνοντας τον από μια πιθανή προδοσία. Εδώ επέρχεται ο παράγοντας της αξιοπιστίας: υπάρχει μια έφεση προς συνεργασία με εκείνους που πιστεύουμε ότι έχουν αντίστοιχη έφεση να συνεργαστούν. Ανορθόδοξη επίσης είναι η απόφαση να προδώσουν ο ένας τον άλλον, μιας και η σιωπή αποτελεί ύψιστη τιμή σε τέτοιες κοινωνικές ομάδες.

Μια άλλη περίπτωση είναι οι δύο ύποπτοι να μην ομολογήσουν, μόνο αν έχουν ξαναπεράσει όλο αυτό και γνωρίζουν πως δεν πρόκειται να προδοθούν Αυτή η ισορροπία λέγεται «υπό-παιγνιακή τέλεια ισορροπία Nash» όπου οι φυλακισμένοι έχουν μάθει να μην καρφώνουν ο ένας τον άλλον και έτσι ελαχιστοποιούν την συλλογική ποινή τους.

Όταν το δίλημμα του φυλακισμένου αφορά πάνω από δύο πρόσωπα ονομάζεται free rider problem^ πρόβλημα των τζαμπατζήδων. Έχει την ίδια δομή με το δίλημμα του φυλακισμένου αφού και εδώ η κυρίαρχη ατομική στρατηγική υπερέχει της κοινής λογικής. Αφορά όλες τις περιπτώσεις δημοσίων αγαθών (όλοι τα εκμεταλλεύονται άσχετα αν έχουν πληρώσει γι’ αυτά, όπως για παράδειγμα η καθαρή ατμόσφαιρα) όπου η πρόσβαση δεν μπορεί να περιοριστεί σε αυτούς που έχουν πληρώσει και στους άλλους, τους τζαμπατζήδες, οι οποίοι δεν συνεισφέρουν αλλά τα χρησιμοποιούν.

Το πιο διάσημο παιχνίδι στην ιστορία της θεωρίας παιγνίων μελετήθηκε εκτενέστατα από πάρα πολλούς ανθρώπους, ανάμεσα τους ο John Nash (που αναφέρθηκε παραπάνω) και ο Robert Axelrod. Στα τέλη της δεκαετίας του 70 ο Axelrod προσπάθησε να προσεγγίσει το πρόβλημα όταν αυτό επαναλαμβάνεται, αφού έτσι γίνεται πιο περίπλοκο και δεν είναι απόλυτα σαφές ποια στρατηγική είναι βέλτιστη. Έτσι λοιπόν οργάνωσε ένα πρωτάθλημα όπου κάλεσε θεωρητικούς των παιγνίων να δημιουργήσουν αλγορίθμους που να περιέχουν από μία στρατηγική και τους έβαλε να διαγωνιστούν για έναν καθορισμένο αριθμό γύρων. Οι «άπληστες» στρατηγικές έτειναν να έχουν άσχημη έκβαση, σε αντίθεση με τις πιο αλτρουιστικές που τα πήγαν καλύτερα. Νικητής αναδείχτηκε ο Anatol Rapoport που δημιούργησε τον πιο απλό αλγόριθμο, τον Tit for Tat, δηλαδή “μία σου και μία μου”.

Πρόκειται για μία στρατηγική δεσμευμένης συνεργασίας όπου ο παίκτης ξεκινάει με συνεργασία, σαν κίνηση καλής θέλησης, και έπειτα αντιγράφει την στρατηγική που επέλεξε ο αντίπαλος στον προηγούμενο γύρο. Το πείραμα επαναλήφθηκε και για την περίπτωση όπου η ακολουθία των αγώνων μεταξύ των δύο παικτών θα τερματιζόταν τυχαία με νικητή πάλι τον ίδιο αλγόριθμο. Η «σοφία» αυτής της στρατηγικής έχει να κάνει με τον συνδυασμό αυστηρότητας απέναντι στους αποστάτες (αφού τους τιμωρείς άμεσα) αλλά και ηπιότητας (αφού μέσα σε έναν γύρο μπορείς να τον συγχωρήσεις). Τελικά φαίνεται πως αυτός που δεν συμπεριφέρεται εγωιστικά, είναι αυτός που κερδίζει.

Το δίλημμα του φυλακισμένου αν και φαίνεται άσχετο με την καθημερινότητα του ανθρώπου, μπορούμε να το διακρίνουμε παντού, σε όλα τα κοινωνικά φαινόμενα. Υπάρχει μια τεράστια βιβλιογραφία που το αναλύει και μάλιστα πολλοί πιστεύουν πως αποτελεί τον κεντρικό πυρήνα της κοινωνικής ζωής. Οι εφαρμογές του λοιπόν στην καθημερινότητα ποικίλλουν από την οικονομία, την πολιτική και την κοινωνιολογία έως την εθνολογία και την εξελικτική βιολογία.

Στην πολιτική για παράδειγμα αυτό το παίγνιο χρησιμοποιείται για να επεξηγήσει το πρόβλημα που έχουν δύο κράτη με την απόκτηση όπλων. Υπάρχουν δύο στρατηγικές επιλογές για τα κράτη: είτε να αυξήσουν την στρατιωτική τους δύναμη και να αγοράσουν καινούριο εξοπλισμό, είτε να κάνουν μια συμφωνία έτσι ώστε να μειώσουν την χρησιμοποίηση όπλων. Κανένα κράτος δεν είναι βέβαιο ότι το άλλο θα κρατήσει την υπόσχεση του και επομένως και τα δύο κλίνουν στο να αγοράσουν τελικά τα όπλα. Παράδειγμα για αυτήν την περίπτωση αποτελεί η διαμάχη Αμερικής -Ρωσίας τη δεκαετία του 50 (όταν πρωτομελετήθηκε το συγκεκριμένο παίγνιο) για την απόκτηση πυρηνικού εξοπλισμού.

Επίσης στον αθλητισμό πολλοί παλαιστές καταφεύγουν στο χάσιμο πολλών κιλών με σκοπό να διαγωνιστούν με ελαφρύτερους αντιπάλους, πηγαίνοντας στην μικρότερη κατηγορία. Αυτό μπορεί να το κάνουν πολλοί διαγωνιζόμενοι με αποτέλεσμα να υποβαθμίζεται ο συναγωνισμός. Ακόμη όμως και αν κάποιος διαγωνιζόμενος παραμείνει στο αρχικό του βάρος, είναι πολύ πιθανό να συναγωνιστεί κάποιον που έχει χάσει αρκετό βάρος.

businesslife

ΑΠΟΚΑΛΥΨΗ ΤΟ ΕΝΑΤΟ ΚΥΜΑ

Η ΑΠΟΚΑΛΥΨΗ ΤΟΥ ΕΝΑΤΟΥ ΚΥΜΑΤΟΣ

Παρασκευή 5 Δεκεμβρίου 2014

Θεωρία παιγνίων – Ισορροπία Nash

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου