Théorie des jeux ? Argh .. encore des maths ?
Bon, des maths oui, mais ça va se résumé à savoir faire une fraction
.
Qu’est-ce que la théorie des jeux ?
C’est la traduction mathématique et logique de problèmes qui peuvent être économiques, sociales, diplomatiques, etc. et de leurs solutions possibles, suivant plusieurs critères. Bon, pour être moins vagues, donnont l’exemple le plus connu du dilemne du prisonnier. Soit deux criminels qui vont passer séparemment un intérogatoire. La police n’a aucune preuve contre aucun des deux, elle souhaite donc des aveux. Si aucun des deux n’avouent, ils écoppent de 6 mois de prison. Si un des deux avoue, il est immédiatemment libéré, et l’autre suspect écoppent de 15 ans de prison. Si les deux avouent, ils partent chacun pour 8 ans de prison. Bien evidemment, les deux interrogatoires se déroulent simultanément.
Le suspect est donc confronté à un choix difficile. Dans le doute, il avouera, et l’autre, anticipant sa décision, avouera aussi pour éviter de prendre 15 ans. Ils prendront donc chacun 8 ans. Si ils avaient coopéré, ils n’auraient passé que 6 mois en prison.
La solution la plus probable ( appelée Equilibre de Nash ) n’est donc pas forcément la meilleure des solutions.
Avant de prendre un autre exemple, donnons quelques précisions. Chaque “participants”, précédemment les suspects, sont appelés “joueurs”. Chaque joueur a un éventail de stratégie, supposé connu par lui même et par les autres joueurs. Le jeu est dit à informations complètes. Chaque joueur essaye de jouer de sorte à maximiser ses gains. Chaque joueur peut anticiper les décisions des autres joueurs. Pour l’instant, le jeu n’est pas “dynamique”, c’est à dire que les décisions sont prises simultanément.
Prenons un second exemple. Le problème des marchands de glaces.
Supposons une plage de dimension 1, et deux marchands de glaces. La plage est remplie de touristes, qui vont aller acheter leur glace au marchand le plus proche. Logiquement, les marchands ( Joueur 1 et Joueur 2 ) vont se placer respectivement à 1/4 et 3/4 de la plage ( voir diagramme suivant ).
Cependant, le joueur 1 peut réfléchir et se dire que plus il va se rapprocher du joueur 2, plus il augmentera son nombre de client, et donc ses gains ( les gains sont supposés être une fonction croissante du nombre de client, donc de la zone “desservie” ). Le joueur 2 va également se dire la même chose. Au final, ils vont tout les deux se retrouver au milieu de la plage, comme le montre le diagramme suivant :
Cette solution correspondra l’équilibre de Nash. Je vous passe la démonstration, mais il est démontré que cet équilibre est unique. Pourtant, pour les groupes de touristes situés tout à gauche et tout à droite de la plage, cette solution n’est pas la meilleure, puisqu’ils doivent parcourir une plus grande distance.
L’équilibre de Nash, et donc la solution qui arrivera réellement n’est donc pas forcément la meilleure solution d’un point de vue social.
Dans un troisième exemple, nous allons maintenant considéré un jeu où le joueur 2 prend une décision après le joueur 1.
Le joueur 1 a deux stratégie, A et B. Le joueur 2 a lui aussi deux stratégie, C et D.
La matrice des gains est donnée par
(A,C) = (2,0)
(A,D) = (2,1)
(B,C) = (1,1)
(B,D) = (3,0) où 3 est le gain du joueur 1 et 0 le gain du joueur 2 .
On voit donc que la meilleur issue pour le joueur 1 est (B,D). Cependant, si il joue B, il sera logique pour le joueur 2 de jouer C, pour maximiser ses gains. Le joueur 1 ne remportera alors qu’un gain de 1. Partant de là, il peut se dire que si il joue 1, le joueur 2 va joueur D pour maximiser ses gains. Le joueur 1 aura alors un gain de 2. La combinaison qui sera très certainement jouer est donc (A,D).
Dans l’application au modèle commercial, le duopole de Cournot considère n entreprises qui vendent une quantitée Qi d’un produit à un certain prix p. La décision de la quantitée vendu est prise simultanément. On arrive aux résultats suivants :
Quand n tend vers l’infini, le prix de vente tend vers le prix de fabrication, et donc les gains tendent vers 0.
Toutes les entreprises gagneront autant, tout en vendant la même quantité. Si une entreprise signe un accord avec une autre, elles maximisent leurs profits.
Ensuite, le duopole de Stackelberg considère lui une entreprise qui vend d’abord une certaine quantité, puis une seconde entreprise qui vont une autre quantité, fonction de la première. On appelle alors meneur ( leader ) et suiveur ( follower ) la première et la seconde entreprise respectivement.
Et bien ce duopole montre que les gains de la première et de la seconde entreprise ne seront pas les mêmes.
On peut ainsi voir qu’une prise de décision simultanée et une dynamique n’aboutissent pas au même résultat.
( Je ne développe pas ici ces deux duopoles, mais vous invitent à lire des articles qui s’y rapportent, qui seront surement bien plus clair que mes explications ).
Pour terminer, nous allons aborder la théorie de l’engagement. Les joueurs peuvent s’engager à ne pas modifier certaine variable, pour maximier leurs gains. A priori, cette affirmation peut sembler fausse, mais revenons à notre exemple des marchands de glaces.
Nous allons maintenant considéré que pour s’implanter, un marchand de glace paye son installation C, valeur comprise entre 1/6 et 1/4 . Si les marchands ne font aucun engagement, l’équilibre de Nash sera comme le montre le diagramme suivant, deux marchands à 1/4 et deux autres à 3/4 :
Le gain de chacun sera alors de g = 1/4 – C ( > 0 ).
Maintenant, les marchands se fixent en localisation, c’est à dire qu’une fois qu’ils se sont mis a un endroit, ils ne bougeront plus.
Les deux premiers marchand qui arrivent se mettent chacun à une distance C du bord de la plage, pour s’assurer un gain qui ne sera pas négatif. Un troisième marchand qui arrivent se placera au milieu de la plage pour s’assurer d’avoir un maximum de gain. Un quatrième marchand qui arrivent ne pourra alors trouver d’endroit où s’implanter et espéré avoir un gain positif; en effet, même si il se met au milieu, son gain sera alors de g = 1/4 – 2C ( <0 ). Il ne viendra donc pas. Les gains des trois autres marchand seront donc supérieur à la première situation ( un marchand de plus est un manque-à-gagner pour les autres marchands ).
Cet exemple montre donc qu’il est possible d’augmenter ses profits en “s’engageant” à ne pas modifier certaines variables. En effet, si la localisation était restée variable, on se serait retrouver dans la première situation.
Ce dernier exemple conclu une ( petite ) introduction à la théorie des jeux.
A bientôt, bonne vacances à tous
!



