Antagonistisches Spiel. Matrix-antagonistische Spiele lösen Prinzipien zum Lösen von matrix-antagonistischen Spielen

Die Spieltheorie ist eine Theorie mathematischer Modelle der Entscheidungsfindung unter Konflikt- oder Unsicherheitsbedingungen. Es wird davon ausgegangen, dass die Aktionen der Parteien im Spiel durch bestimmte Strategien - Aktionsregelsätze - gekennzeichnet sind. Wenn der Gewinn der einen Seite zwangsläufig zum Verlust der anderen Seite führt, spricht man von antagonistischen Spielen. Wenn der Satz von Strategien begrenzt ist, wird das Spiel als Matrixspiel bezeichnet und die Lösung kann sehr einfach erhalten werden. Die mit Hilfe der Spieltheorie gewonnenen Lösungen sind nützlich, um Pläne angesichts möglicher Widerstände von Wettbewerbern oder Unsicherheiten im externen Umfeld zu erstellen.


Wenn das Bimatrix-Spiel antagonistisch ist, dann wird die Auszahlungsmatrix von Spieler 2 vollständig durch die Auszahlungsmatrix von Spieler 1 bestimmt (die entsprechenden Elemente dieser beiden Matrizen unterscheiden sich nur in den Vorzeichen). Daher wird ein antagonistisches Bimatrix-Spiel vollständig durch eine einzige Matrix (die Auszahlungsmatrix von Spieler 1) beschrieben und wird dementsprechend als Matrixspiel bezeichnet.

Dieses Spiel ist antagonistisch. Darin j \u003d x2 - O, P und R (O, O] \u003d H (P, P) \u003d -I und R (O, P) \u003d R (P, O) \u003d 1 oder in Matrixform o p

Lassen Sie eine Klasse von Spielen Г "spiegelgeschlossen" sein, d.h. zusammen mit jedem seiner Spiele ein spiegelisomorphes Spiel enthält (da alle Spiele, die zu einem gegebenen spiegelisomorph sind, zueinander isomorph sind, können wir entsprechend dem eben Gesagten von einem spiegelisomorphen Spiel sprechen). Eine solche Klasse ist beispielsweise die Klasse aller antagonistischen Spiele oder die Klasse aller Matrixspiele.

Unter Hinweis auf die Definition akzeptabler Situationen im antagonistischen Spiel erhalten wir, dass die Situation (X, Y) in der gemischten Erweiterung des Matrixspiels für Spieler 1 genau dann akzeptabel ist, wenn für jedes x G x die Ungleichung gilt

Der Prozess der Umwandlung von Spielen in symmetrische Spiele wird als Symmetrisierung bezeichnet. Wir beschreiben hier eine Methode der Symmetrisierung. Eine andere, grundlegend andere Version der Symmetrisierung wird in Abschnitt 26.7 gegeben. Diese beiden Varianten der Symmetrisierung sind eigentlich auf beliebige antagonistische Spiele anwendbar, werden aber nur für Matrixspiele formuliert und bewiesen.

Somit stimmen die anfänglichen Begriffe und Bezeichnungen der Theorie der allgemeinen antagonistischen Spiele mit den entsprechenden Begriffen und Bezeichnungen der Theorie der Matrixspiele überein.

Für endliche antagonistische (Matrix-)Spiele wurde die Existenz dieser Extrema von uns in Kapitel 10 bewiesen. 1, und der springende Punkt war, ihre Gleichheit herzustellen oder zumindest Wege zu finden, ihre Ungleichheit zu überwinden.

Schon die Betrachtung von Matrixspielen zeigt, dass es antagonistische Spiele ohne Gleichgewichtssituationen (und sogar ohne e-Gleichgewichtssituationen für hinreichend kleine e > 0) in den anfangs gegebenen Strategien der Spieler gibt.

Aber jedes endliche (Matrix-)Spiel kann zum Beispiel zu einem unendlichen Spiel erweitert werden, indem jedem Spieler eine beliebige Anzahl dominierter Strategien zur Verfügung gestellt wird (siehe 22 Kap. 1). Offensichtlich bedeutet eine solche Erweiterung des Strategiesatzes des Spielers nicht wirklich eine Erweiterung seiner Möglichkeiten, und sein tatsächliches Verhalten im erweiterten Spiel sollte sich nicht von seinem Verhalten im ursprünglichen Spiel unterscheiden. So erhielten wir sofort eine ausreichende Anzahl von Beispielen unendlicher antagonistischer Spiele, die keine Sattelpunkte haben. Es gibt auch Beispiele dieser Art.

Um also das Maximin-Prinzip in einem unendlichen antagonistischen Spiel zu implementieren, ist wie im Fall eines endlichen (Matrix-)Spiels eine gewisse Erweiterung der strategischen Fähigkeiten der Spieler erforderlich. Für 96

Wie bei den Matrixspielen (vgl. Kap. 1, 17) spielt auch bei allgemeinen antagonistischen Spielen der Begriff des gemischten Strategiespektrums eine wichtige Rolle, der hier allerdings allgemeiner definiert werden muss.

Beachten Sie schließlich, dass die Menge aller gemischten Strategien von Spieler 1 in einem beliebigen antagonistischen Spiel wie in der Matrix ist

Schon eine Betrachtung antagonistischer Spiele zeigt, dass eine Vielzahl solcher Spiele, auch endlicher, Matrixspiele Gleichgewichtssituationen nicht in den ursprünglichen, reinen Strategien haben, sondern nur in verallgemeinerten, gemischten Strategien. Daher ist es für allgemeine, nicht antagonistische, nicht kooperative Spiele naheliegend, gerade in gemischten Strategien nach Gleichgewichtssituationen zu suchen.

So haben wir zum Beispiel (siehe Abb. 3.1) bereits festgestellt, dass der „Auftragnehmer“ fast nie mit Verhaltensunsicherheit zu kämpfen hat. Aber wenn wir die konzeptionelle Ebene des Typs "Administrator" nehmen, dann ist alles genau umgekehrt. In der Regel ist die Hauptart der Ungewissheit, der sich ein solcher „unser Entscheidungsträger“ stellen muss, „Konflikt“. Jetzt können wir klarstellen, dass dies normalerweise eine nicht strikte Rivalität ist. Etwas seltener trifft der "Administrator" Entscheidungen unter Bedingungen "natürlicher Ungewissheit", und noch seltener trifft er auf einen strengen, antagonistischen Konflikt. Zudem tritt der Interessenkonflikt bei der Entscheidungsfindung durch den „Administrator“ sozusagen „einmal“ auf, d.h. er spielt in unserer Einteilung oft nur eine (teilweise sehr geringe Anzahl) Partien des Spiels. Skalen zur Bewertung von Folgen sind häufiger qualitativ als quantitativ. Die strategische Unabhängigkeit des „Administrators“ ist eher eingeschränkt. Unter Berücksichtigung des oben Gesagten lässt sich argumentieren, dass Problemsituationen dieser Größenordnung meist mit nicht-kooperativen nicht-antagonistischen Bi-Matrix-Spielen analysiert werden müssen, zudem in reinen Strategien.

Prinzipien zur Lösung von Matrix-antagonistischen Spielen

Infolgedessen ist zu erwarten, dass die Gegner in dem oben beschriebenen Spiel an ihren gewählten Strategien festhalten. Antagonistisches Matrixspiel, bei dem max min fiv = min max Aiy>

Allerdings sind nicht alle matrixantagonistischen Spiele ganz eindeutig, und das im Allgemeinen

Um also ein matrixantagonistisches Spiel der Dimension /uxl zu lösen, ist es im allgemeinen Fall notwendig, ein Paar dualer linearer Programmierprobleme zu lösen, was zu einem Satz optimaler Strategien , / und den Kosten des Spiels v führt.

Wie ist das matrixantagonistische Spiel zweier Personen definiert?

Was sind die Methoden zur Vereinfachung und Lösung von matrixantagonistischen Spielen?

Bei einem Spiel mit zwei Personen ist es natürlich, ihre Interessen als direkt gegensätzlich zu betrachten – das Spiel ist antagonistisch. Somit ist die Auszahlung des einen Spielers gleich dem Verlust des anderen (die Summe der Auszahlungen beider Spieler ist Null, daher der Name Nullsummenspiel). Wir werden Spiele betrachten, bei denen jeder Spieler eine endliche Anzahl von Alternativen hat. Die Auszahlungsfunktion für ein solches Nullsummenspiel für zwei Personen kann in Matrixform (in Form einer Auszahlungsmatrix) angegeben werden.

Wie bereits erwähnt, heißt das letzte antagonistische Spiel Matrix.

MATRIX-SPIELE – eine Klasse von antagonistischen Spielen, an denen zwei Spieler teilnehmen und jeder Spieler eine endliche Anzahl von Strategien hat. Wenn ein Spieler m Strategien hat und der andere Spieler n Strategien, dann können wir eine Spielmatrix der Dimension txn konstruieren. M.i. kann einen Sattelpunkt haben oder nicht. Im letzteren Fall

Moskauer Institut für Energietechnik

(Technische Universität)

Laborbericht

in der Spieltheorie

„Ein Suchprogramm für optimale Strategien für ein paarweise antagonistisches Spiel in Matrixform“

Von Studenten ausgefüllt

Gruppe A5-01

Aschrapow Daler

Ashrapova Olga

Grundbegriffe der Spieltheorie

Spieltheorie zur Lösung Konfliktsituationen , d.h. Situationen, in denen die Interessen zweier oder mehrerer Parteien mit unterschiedlichen Zielen kollidieren.

Wenn die Ziele der Parteien direkt entgegengesetzt sind, dann reden sie darüber Antagonistischer Konflikt .

Spiel ein vereinfachtes formalisiertes Modell einer Konfliktsituation genannt.

Ein Spiel einmal von Anfang bis Ende zu spielen nennt man Party . Das Ergebnis der Party ist Zahlung (oder gewinnen ).

Die Partei besteht aus bewegt , d.h. Auswahl von Spielern aus einer Menge möglicher Alternativen.

Bewegungen können sein persönlich und zufällig.persönlicher Umzug , im Gegensatz zu zufällig , impliziert eine bewusste Wahl einer Option durch den Spieler.

Spiele, in denen es mindestens einen persönlichen Zug gibt, werden aufgerufen strategisch .

Es werden Spiele aufgerufen, bei denen alle Züge zufällig sind Glücksspiel .

Wenn sie einen persönlichen Schritt machen, sprechen sie auch darüber Strategien Spieler, d. h. über die Regel oder den Satz von Regeln, die die Wahl des Spielers bestimmen. Gleichzeitig sollte die Strategie umfassend sein, d.h. die Wahl muss für jede mögliche Situation im Laufe des Spiels getroffen werden.

Spieltheoretische Herausforderung– Finden der optimalen Strategien der Spieler, d.h. Strategien, die ihnen den maximalen Gewinn oder minimalen Verlust verschaffen.

Klassifikation spieltheoretischer Modelle

Spiel n Personen werden üblicherweise als bezeichnet, wo
ist die Strategiemenge des i-ten Spielers,
- Spielzahlung.

Entsprechend dieser Bezeichnung lässt sich folgende Klassifikation spieltheoretischer Modelle vorschlagen:

Diskret (Gruppen von Strategien diskret)

Finale

Endlos

Kontinuierlich (Sätze von Strategien kontinuierlich)

Endlos

n Personen (
)

Koalition (Genossenschaft)

Nicht kooperativ (nicht kooperativ)

2 Personen (gepaart)

Antagonistisch (Nullsummenspiele)

(die Interessen der Parteien sind gegensätzlich, d.h. der Verlust des einen Spielers ist gleich dem Gewinn des anderen)

Nicht antagonistisch

Mit vollständiger Information (wenn der Spieler, der einen persönlichen Zug macht, den gesamten Spielverlauf kennt, also alle Züge des Gegners)

Mit unvollständigen Angaben

Mit Nullbetrag (Gesamtzahlung ist Null)

Mit einer Summe ungleich Null

Einweg (Lotterien)

Mehrweg

Matrixdarstellung eines gepaarten antagonistischen Spiels

In diesem Tutorial werden wir betrachten antagonistische Spiele zweier Personen in Matrixform angegeben. Das heißt, wir kennen die Strategie des ersten Spielers (player EIN){ EIN ich }, ich = 1,…, m und der Strategiesatz des zweiten Spielers (player B){ B j }, j = 1,..., n, und die Matrix EIN = || a ij || die Auszahlungen des ersten Spielers. Da es sich um ein antagonistisches Spiel handelt, wird angenommen, dass der Gewinn des ersten Spielers gleich dem Verlust des zweiten ist. Wir betrachten das als das Matrixelement a ij ist die Auszahlung des ersten Spielers, wenn er eine Strategie wählt EIN ich und die Antwort des zweiten Spielers mit der Strategie B j. Wir bezeichnen ein solches Spiel als
, wo m - Anzahl der Spielerstrategien ABER,n - Anzahl der Spielerstrategien BEI. Im Allgemeinen kann es durch die folgende Tabelle dargestellt werden:

B 1

B j

B n

EIN 1

EIN ich

EIN m

Beispiel 1

Betrachten Sie als einfaches Beispiel ein Spiel, bei dem das Spiel aus zwei Zügen besteht.

1. Zug: Spieler ABER wählt eine der Zahlen (1 oder 2), ohne dem Gegner seine Wahl mitzuteilen.

2. Zug: Spieler BEI wählt eine der Nummern (3 oder 4).

Ergebnis: Spielerauswahl ABER und BEI addieren. Wenn die Summe gerade ist, dann BEI zahlt seinen Wert an den Spieler ABER, wenn ungerade - umgekehrt, ABER zahlt den Spieler BEI.

Dieses Spiel kann dargestellt werden als
auf die folgende Weise:

(Wahl 3)

(Wahl 4)

(Wahl 1)

(Wahl 2)

Das ist leicht zu sehen dieses Spiel ist antagonistisch, außerdem ist es ein Spiel mit unvollständigen Informationen, da Spieler BEI, Bei einem persönlichen Zug ist nicht bekannt, welche Wahl der Spieler getroffen hat ABER.

Wie oben erwähnt, besteht die Aufgabe der Spieltheorie darin, die optimalen Strategien der Spieler zu finden, d.h. Strategien, die ihnen den maximalen Gewinn oder minimalen Verlust verschaffen. Dieser Vorgang wird aufgerufen Spielentscheidung .

Beim Lösen eines Spiels in Matrixform sollte man das Spiel auf Anwesenheit prüfen Sattelpunkt . Dazu werden zwei Werte eingeführt:

ist die Untergrenze für den Preis des Spiels, und

ist die obere Schätzung des Preises des Spiels.

Der erste Spieler wird höchstwahrscheinlich die Strategie wählen, bei der er unter allen möglichen Antworten des zweiten Spielers den maximalen Gewinn erzielt, und der zweite wird im Gegenteil diejenige wählen, die seinen eigenen Verlust minimiert, d.h. möglicher Sieg des ersten.

Das lässt sich belegen α ≤ v ≤ β , wo vSpielpreis , d.h. die wahrscheinliche Auszahlung des ersten Spielers.

Wenn die Beziehung α = β = v, dann sagen sie das Das Spiel hat einen Sattelpunkt
, und in reinen Strategien gelöst . Mit anderen Worten, es gibt ein paar Strategien
, gibt dem Spieler ABERv.

Beispiel 2

Kehren wir zu dem Spiel zurück, das wir in Beispiel 1 betrachtet haben, und überprüfen es auf das Vorhandensein eines Sattelpunkts.

(Wahl 3)

(Wahl 4)

(Wahl 1)

(Wahl 2)

Für dieses Spiel
= -5,
= 4,
, hat also keinen Sattelpunkt.

Beachten Sie erneut, dass dieses Spiel ein unvollständiges Informationsspiel ist. In diesem Fall können Sie den Spieler nur beraten ABER wähle eine Strategie , Weil In diesem Fall kann er jedoch die größte Auszahlung erhalten, vorausgesetzt, der Spieler entscheidet sich dafür BEI Strategien .

Beispiel 3

Nehmen wir einige Änderungen an den Spielregeln aus Beispiel 1 vor. Geben wir dem Spieler BEI Informationen zur Spielerauswahl ABER. Dann BEI Es gibt zwei zusätzliche Strategien:

- eine Strategie, die von Vorteil ist ABER. Wenn Wahl A - 1, dann BEI wählt 3 wenn Wahl A - 2, dann BEI wählt 4;

- eine Strategie, die nicht vorteilhaft ist ABER. Wenn Wahl A - 1, dann BEI wählt 4 wenn Wahl A - 2, dann BEI wählt 3.

(Wahl 3)

(Wahl 4)

(Wahl 1)

(Wahl 2)

Dieses Spiel ist voller Informationen.

In diesem Fall
= -5,
= -5,
, daher hat das Spiel einen Sattelpunkt
. Dieser Sattelpunkt entspricht zwei Paaren optimaler Strategien:
und
. Spielpreis v= -5. Es ist offensichtlich, dass für ABER dieses Spiel ist nutzlos.

Die Beispiele 2 und 3 sind eine gute Illustration des folgenden spieltheoretisch bewiesenen Satzes:

Satz 1

Jedes gepaarte antagonistische Spiel mit perfekten Informationen wird in reinen Strategien gelöst.

Dass. Satz 1 besagt, dass jedes Zwei-Personen-Spiel mit perfekter Information einen Sattelpunkt hat und es ein Paar reine Strategien gibt
, gibt dem Spieler ABER nachhaltiger Gewinn in Höhe des Spielpreises v.

Im Falle des Fehlens eines Sattelpunktes, der sog gemischte Strategien :, wo p ich undq j sind die Wahrscheinlichkeiten, Strategien zu wählen EIN ich und B j der erste und der zweite Spieler. Die Lösung des Spiels ist in diesem Fall ein Paar gemischter Strategien
Maximierung der mathematischen Erwartung des Spielpreises.

Eine Verallgemeinerung von Satz 1 auf den Fall eines Spiels mit unvollständiger Information ist der folgende Satz:

Satz 2

Jedes gepaarte antagonistische Spiel hat mindestens eine optimale Lösung, dh im allgemeinen Fall ein Paar gemischter Strategien
, gibt dem Spieler ABER nachhaltiger Gewinn in Höhe des Spielpreises v, Außerdem α ≤ v ≤ β .

In einem speziellen Fall, für ein Spiel mit einem Sattelpunkt, sieht die Lösung in gemischten Strategien wie ein Paar von Vektoren aus, in denen ein Element gleich eins ist und der Rest gleich Null ist.

Der einfachste, in der Spieltheorie ausführlich ausgearbeitete Fall ist ein Nullsummen-Finite-Pair-Spiel (ein antagonistisches Spiel zweier Personen oder zweier Koalitionen). Betrachten Sie dieses Spiel G, in dem zwei Spieler ABER und BEI, gegensätzliche Interessen haben: Der Gewinn des einen ist gleich dem Verlust des anderen. Da die Auszahlung des Spielers ABER entspricht der Auszahlung des Spielers Rein mit Bei entgegengesetztem Vorzeichen kann uns nur die Auszahlung interessieren a Spieler ABER. Natürlich, ABER will maximieren und BEI - minimieren a. Identifizieren wir uns der Einfachheit halber mental mit einem der Spieler (lass es sein ABER) und wir nennen ihn "wir" und den Spieler BEI -"Gegner" (natürlich keine wirklichen Vorteile für ABER folgt daraus nicht). Lass uns haben t mögliche Strategien ABER 1 , EIN 2 , ..., ABER m, und der Feind n mögliche Strategien BEI 1 , BEI 2 , ..; BEI n(Ein solches Spiel nennt man ein Spiel t × n). Bezeichnen a ij unsere Auszahlung, wenn wir die Strategie anwenden EIN ich , und der Feind ist eine Strategie B j .

Tabelle 26.1

EIN ich

B j

B 1

B 2

B n

EIN 1

EIN 2

EIN m

a 11

a 21

a m1

a 21

a m

a 1 n

a 2 n

a Mn

Angenommen, für jedes Strategiepaar A<, BEI, gewinnen (oder durchschnittlicher Gewinn) a, j wir wissen. Dann ist es im Prinzip möglich, eine rechteckige Tabelle (Matrix) zu erstellen, die die Strategien der Spieler und die entsprechenden Auszahlungen auflistet (siehe Tabelle 26.1).

Wenn eine solche Tabelle zusammengestellt wird, dann sagen wir, dass das Spiel G auf eine Matrixform reduziert werden (das Spiel allein in eine solche Form zu bringen, kann aufgrund der Vielzahl von Strategien bereits eine schwierige Aufgabe und manchmal fast unmöglich sein). Beachten Sie, dass, wenn das Spiel auf eine Matrixform reduziert wird, das Multi-Move-Spiel tatsächlich auf ein One-Move-Spiel reduziert wird – der Spieler muss nur einen Zug machen: eine Strategie wählen. Wir bezeichnen kurz die Spielmatrix ( a ij).

Betrachten Sie ein Beispielspiel G(4×5) in Matrixform. Uns stehen (zur Auswahl) vier Strategien zur Verfügung, der Feind hat fünf Strategien. Die Spielmatrix ist in Tabelle 26.2 angegeben

Lassen Sie uns darüber nachdenken, welche Strategie wir (der Spieler ABER) ausnutzen? Matrix 26.2 hat die verlockende Auszahlung „10“; Wir werden angezogen, um eine Strategie zu wählen ABER 3 , an dem wir diesen "Leckerbissen" bekommen. Aber halt, der Feind ist auch nicht dumm! Wenn wir eine Strategie wählen ABER 3 , Er wird, uns zum Trotz, eine Strategie wählen BEI 3 , und wir bekommen eine miserable Auszahlung "1". Nein, wählen Sie eine Strategie ABER 3 es ist verboten! Wie sein? Offensichtlich müssen wir auf der Grundlage des Vorsichtsprinzips (und es ist das Hauptprinzip der Spieltheorie) wählen

Tabelle 26.2

B j

EIN ich

B 1

B 2

B 3

B 4

B 5

EIN 1

EIN 2

EIN 3

EIN 4

die Strategie, dass unser minimaler Gewinn ist maximal. Das ist das sogenannte „Minimax-Prinzip“: Handeln Sie so, dass Sie mit dem für Sie schlechtesten Verhalten des Feindes den maximalen Gewinn erzielen.

Wir schreiben Tabelle 26.2 um und schreiben in die rechte zusätzliche Spalte den Mindestwert der Auszahlung in jeder Zeile (Zeilenminimum); benennen wir es für ich-te Reihe α ich(siehe Tabelle 26.3).

Tabelle 26.3

B j

EIN ich

B 1

B 2

B 3

B 4

B 5

EIN 1

EIN 2

EIN 3

EIN 4

β j

Von allen Werten α ich(rechte Spalte) die größte (3) ist hervorgehoben. Es passt zur Strategie EIN vier . Wenn wir uns für diese Strategie entschieden haben, können wir auf jeden Fall sicher sein, dass wir (für jedes Verhalten des Feindes) nicht weniger als 3 gewinnen werden. Dieser Wert ist unser garantierter Gewinn; Wenn wir vorsichtig sind, können wir nicht weniger bekommen (ich bekomme vielleicht mehr). Diese Auszahlung wird der niedrigere Preis des Spiels genannt (oder "Maximin" - das Maximum der minimalen Auszahlungen). Wir werden es bezeichnen a. In unserem Fall α = 3.

Nehmen wir nun den Standpunkt des Feindes ein und argumentieren für ihn. Er ist keine Spielfigur, sondern auch vernünftig! Wenn er eine Strategie wählt, möchte er weniger geben, aber er muss sich auf unser Verhalten verlassen, das für ihn am schlimmsten ist. Wenn er sich für eine Strategie entscheidet BEI 1 , wir werden ihm antworten ABER 3 , und er wird 10 geben; wenn er wählt B 2 - wir werden ihm antworten ABER 2 , und er wird 8 geben usw. Wir fügen eine zusätzliche untere Zeile zu Tabelle 26.3 hinzu und schreiben die Maxima der Spalten β hinein j. Offensichtlich sollte ein vorsichtiger Gegner die Strategie wählen, die diesen Wert minimiert (der entsprechende Wert von 5 ist in Tabelle 26.3 hervorgehoben). Dieser Wert von β ist der Wert des Gewinns, mehr als den wird uns ein vernünftiger Gegner sicher nicht geben. Es wird der obere Preis des Spiels genannt (oder "Minimax" - das Minimum der maximalen Gewinne). In unserem Beispiel ist β = 5 und wird mit der Strategie des Gegners erreicht B 3 .

Ausgehend vom Vorsichtsprinzip (Rückversicherungsregel „rechnen Sie immer mit dem Schlimmsten!“) müssen wir uns also für eine Strategie entscheiden ABER 4 , und der Feind - Strategie BEI 3 . Solche Strategien nennt man „Minimax“ (in Anlehnung an das Minimax-Prinzip). Solange beide Parteien in unserem Beispiel an ihren Minimax-Strategien festhalten, wird sich das auszahlen a 43 = 3.

Stellen Sie sich nun für einen Moment vor, wir hätten erfahren, dass der Feind eine Strategie verfolgt BEI 3 . Komm schon, bestrafen wir ihn dafür und wählen eine Strategie ABER 1 - wir bekommen 5, was nicht so schlimm ist. Aber der Feind ist schließlich auch kein Fehlschuss; lassen Sie ihn wissen, dass unsere Strategie ABER 1 ; er ist auch schnell in der auswahl BEI 4 , Reduzierung unserer Auszahlung auf 2 usw. (Partner „übereilten Strategien“). Kurz gesagt, Minimax-Strategien in unserem Beispiel instabil gegenüber zu Informationen über das Verhalten der anderen Partei; diese Strategien haben nicht die Gleichgewichtseigenschaft.

Ist das immer so? Nein nicht immer. Betrachten Sie ein Beispiel mit der in Tabelle 26.4 angegebenen Matrix.

In diesem Beispiel ist der niedrigere Preis des Spiels gleich dem oberen: α = β = 6. Was folgt daraus? Minimax-Spielerstrategien ABER und BEI wird nachhaltig sein. Solange sich beide Spieler daran halten, beträgt die Auszahlung 6. Mal sehen, was passiert, wenn wir (ABER) wissen, dass der Feind (BEI)

Tabelle 26.4

Bj

EIN ich

B 1

B 2

B 3

B 4

EIN 1

EIN 2

EIN 3

β j

hält an der Strategie fest B 2 ? Und genau daran wird sich nichts ändern. Denn jede Abweichung von der Strategie ABER 2 kann unsere Situation nur verschlimmern. Ebenso werden Informationen, die der Feind erhält, ihn nicht dazu bringen, sich von seiner Strategie zurückzuziehen. BEI 2 . Paar Strategien ABER 2 , B 2 besitzt die Eigenschaft des Gleichgewichts (ein ausgeglichenes Strategiepaar), und die mit diesem Strategiepaar erzielte Auszahlung (in unserem Fall 6) wird als „Sattelpunkt der Matrix“ bezeichnet 1). Ein Zeichen für das Vorhandensein eines Sattelpunkts und eines ausgewogenen Strategiepaars ist die Gleichheit der unteren und oberen Preise des Spiels; Der gemeinsame Wert von α und β wird als Preis des Spiels bezeichnet. Wir werden es beschriften v:

α = β = v

Strategien EIN ich , B j(in diesem Fall ABER 2 , BEI 2 ), für die diese Auszahlung erreicht wird, werden optimale reine Strategien genannt, und ihre Gesamtheit wird als Lösung des Spiels bezeichnet. In diesem Fall soll das Spiel selbst in reinen Strategien gelöst werden. Beide Seiten ABER und BEI man kann ihre optimalen Strategien angeben, unter denen ihre Position die bestmögliche ist. Was ist ein Spieler ABER In diesem Fall gewinnt 6 und der Spieler BEI - verliert 6,- naja, das sind die Bedingungen des Spiels: sie sind vorteilhaft für ABER und nachteilig für BEI

1) Der Begriff „Sattelpunkt“ stammt aus der Geometrie – so bezeichnet man den Punkt auf der Oberfläche, an dem gleichzeitig das Minimum entlang einer Koordinate und das Maximum entlang der anderen erreicht wird.

Der Leser hat vielleicht eine Frage: Warum werden optimale Strategien als „rein“ bezeichnet? Lassen Sie uns ein wenig vorausschauend diese Frage beantworten: Es gibt "gemischte" Strategien, die darin bestehen, dass der Spieler nicht eine Strategie verwendet, sondern mehrere, die er zufällig abwechselt. Also, wenn wir neben reinen auch gemischte Strategien zulassen, irgendwelche Spiel beenden hat eine Lösung - einen Gleichgewichtspunkt. Aber wir reden immer noch über das Atom.

Das Vorhandensein eines Sattelpunktes im Spiel ist bei weitem nicht die Regel, sondern eher die Ausnahme. Die meisten Spiele haben keinen Sattelpunkt. Allerdings gibt es eine Vielzahl von Spielen, die immer einen Sattelpunkt haben und daher in reinen Strategien gelöst werden. Dies sind die sogenannten „Spiele mit vollständigen Informationen“. Ein Spiel mit einem Informationsregal ist ein Spiel, bei dem jeder Spieler die gesamte Geschichte seiner Entwicklung kennt, dh die Ergebnisse aller vorherigen Züge, sowohl persönliche als auch zufällige, bei jedem persönlichen Zug. Beispiele für Spiele mit vollständigen Informationen sind Dame, Schach, Tic-Tac-Toe usw.

In der Spieltheorie ist das bewiesen jedes Spiel mit vollständigen Informationen hat einen Sattelpunkt, und kann daher in reinen Strategien gelöst werden. In jedem Spiel mit perfekten Informationen gibt es ein Paar optimaler Strategien, die eine stabile Auszahlung in Höhe der Kette des Spiels liefern v. Wenn ein solches Spiel nur aus persönlichen Zügen besteht, dann muss es, wenn jeder Spieler seine eigene optimale Strategie anwendet, auf ganz bestimmte Weise enden – mit einer Auszahlung in Höhe des Spielpreises. Wenn also die Lösung des Spiels bekannt ist, verliert das Spiel selbst seine Bedeutung!

Nehmen wir ein elementares Beispiel für ein Spiel mit vollständigen Informationen: Zwei Spieler legen abwechselnd Nickel auf einen runden Tisch und wählen dabei willkürlich die Position der Mitte der Münze (ein gegenseitiges Überlappen von Münzen ist nicht erlaubt). Der Gewinner ist derjenige, der den letzten Cent setzt (wenn kein Platz für andere ist). Es ist leicht zu erkennen, dass das Ergebnis dieses Spiels im Wesentlichen eine ausgemachte Sache ist. Es gibt eine bestimmte Strategie, die sicherstellt, dass der Spieler gewinnt, der zuerst die Münze legt. Er muss nämlich zuerst einen Nickel in die Mitte des Tisches legen und dann auf jeden Zug des Gegners mit einem symmetrischen Zug reagieren. Ganz gleich, wie sich der Gegner verhält, er kann offensichtlich nicht vermeiden, zu verlieren. Точно так же обстоит дело и с шахматами и вообще играми с полной информацией: любая из них, записанная в матричной форме, имеет седловую точку, и значит, решение в чистых стратегиях, а, следовательно, имеет смысл только до тех пор, пока это решение nicht gefunden. Nehmen wir an, ein Schachspiel ist beides stets endet mit Weißgewinn, oder stets - Schwarz gewinnt, oder stets - Unentschieden, nur wodurch genau - wir wissen es noch nicht (zum Glück für Schachliebhaber). Fügen wir noch etwas hinzu: Wir werden es in absehbarer Zeit kaum wissen, denn die Anzahl der Strategien ist so riesig, dass es äußerst schwierig (wenn nicht unmöglich) ist, das Spiel auf eine Matrixform zu reduzieren und darin einen Sattelpunkt zu finden.

Fragen wir uns nun, was zu tun ist, wenn das Spiel keinen Sattelpunkt hat: α ≠ β ? Nun, wenn jeder Spieler gezwungen ist, sich für eine zu entscheiden - die einzige reine Strategie, dann gibt es nichts zu tun: Man muss sich am Minimax-Prinzip orientieren. Eine andere Sache ist, wenn es möglich ist, eine Reihe von Strategien zu „mischen“, abwechselnd zufällig mit einigen Wahrscheinlichkeiten. Die Verwendung gemischter Strategien ist so konzipiert: Das Spiel wird viele Male wiederholt; vor jeder Partie des Spiels, wenn dem Spieler ein persönlicher Zug gegeben wird, "vertraut" er seine Wahl dem Zufall an, "wirft Lose" und nimmt die Strategie, die herausgefallen ist (wir wissen bereits, wie man das Los aus dem vorherigen Kapitel organisiert). ).

Gemischte Strategien in der Spieltheorie sind ein Modell veränderbarer, flexibler Taktiken, wenn keiner der Spieler weiß, wie sich der Gegner in einem bestimmten Spiel verhalten wird. Diese Taktik (allerdings meist ohne mathematische Begründung) wird häufig bei Kartenspielen angewandt. Lassen Sie uns gleichzeitig anmerken, dass der beste Weg, Ihr Verhalten vor dem Feind zu verbergen, darin besteht, ihm einen zufälligen Charakter zu geben und daher nicht im Voraus zu wissen, was Sie tun werden.

Lassen Sie uns also über gemischte Strategien sprechen. Wir werden die gemischten Strategien der Spieler bezeichnen ABER und BEI beziehungsweise S A = ( p 1 , R 2 , ..., p m), S B = (q 1 , q 2 , …, q n), wo p 1 , p 2 , …, p m(bildet insgesamt eins) - die Wahrscheinlichkeiten des Spielers, der verwendet ABER Strategien ABER 1 , EIN 2 ,… , EIN m ; q 1 , q 2 , …, q n- Nutzungswahrscheinlichkeiten durch den Spieler BEI Strategien BEI 1 , BEI 2 , ..., BEI n . In einem bestimmten Fall, wenn alle Wahrscheinlichkeiten bis auf eine gleich Null sind und diese gleich eins ist, wird die gemischte Strategie zu einer reinen.

Es gibt ein grundlegendes Theorem der Spieltheorie: Jedes endliche Nullsummenspiel für zwei Personen hat mindestens eine Lösung - Paar optimaler Strategien, im Allgemeinen gemischt
und entsprechenden Preis v.

Paar optimale Strategien
Das Bilden der Lösung des Spiels hat die folgende Eigenschaft: Wenn einer der Spieler an seiner optimalen Strategie festhält, kann es für den anderen nicht rentabel sein, von seiner eigenen abzuweichen. Dieses Strategiepaar bildet eine Art Gleichgewicht im Spiel: Der eine Spieler will den Gewinn auf ein Maximum drehen, der andere auf ein Minimum, jeder zieht in seine eigene Richtung und bei vernünftigem Verhalten beider ein Gleichgewicht und einen Stall Gewinn festgestellt werden. v. Wenn ein v > 0, dann ist das Spiel für uns profitabel, wenn v< 0 - für den Feind; bei v= 0 ist das Spiel „fair“, für beide Teilnehmer gleichermaßen vorteilhaft.

Betrachten Sie ein Beispiel für ein Spiel ohne Sattelpunkt und geben Sie (ohne Beweis) dessen Lösung an. Das Spiel ist wie folgt: zwei Spieler ABER und BEI gleichzeitig und ohne ein Wort zu sagen einen, zwei oder drei Finger zeigen. Der Gewinn wird durch die Gesamtzahl der Finger entschieden: Wenn es gerade ist, gewinnt ABER und erhält von BEI ein Betrag in Höhe dieser Zahl; wenn ungerade, dann umgekehrt ABER zahlt BEI einen Betrag gleich dieser Zahl. Was sollen die Spieler tun?

Lassen Sie uns eine Spielmatrix erstellen. In einem Spiel hat jeder Spieler drei Strategien: einen, zwei oder drei Finger zeigen. Die 3×3-Matrix ist in Tabelle 26.5 angegeben; die zusätzliche rechte Spalte zeigt die Zeilenminima und die zusätzliche untere Zeile zeigt die Spaltenmaxima.

Der niedrigere Preis des Spiels α = - 3 und entspricht der Strategie EIN 1 . Das bedeutet, dass wir bei vernünftigem, vorsichtigem Verhalten garantieren, dass wir nicht mehr als 3 verlieren. Kleiner Trost, aber immer noch besser als beispielsweise ein Gewinn von 5, der in einigen Zellen der Matrix vorkommt. Schlecht für uns, den Spieler ABER... Aber trösten wir uns:

Die Position des Gegners scheint sogar noch schlechter zu sein: Die niedrigeren Kosten des Spiels sind β = 4, d.h. bei vernünftigem Verhalten wird er uns mindestens 4 geben. Im Allgemeinen ist die Position nicht sehr gut - weder für einen noch für den Andere Seite. Aber mal sehen, ob es verbessert werden kann? Es stellt sich heraus, dass Sie es können. Wenn jede Seite nicht eine reine Strategie verwendet, sondern eine gemischte, in der

Tabelle 26.5

Bj

EIN ich

B 1

B 2

B 3

EIN 1

EIN 2

EIN 3

β j

der erste und dritte treten mit Wahrscheinlichkeit 1/4 ein, und der zweite - mit Wahrscheinlichkeit 1/2, d.h.

dann ist die durchschnittliche Auszahlung konstant gleich Null (was bedeutet, dass das Spiel „fair“ und für beide Seiten gleichermaßen vorteilhaft ist). Strategien
Bilden Sie eine Lösung für das Spiel und seinen Preis v= 0. Wie haben wir diese Lösung gefunden? Dies ist eine andere Frage. Im nächsten Abschnitt zeigen wir, wie endliche Spiele allgemein gelöst werden.

Betrachten Sie ein endliches Nullsummenpaarspiel. Bezeichne mit a Auszahlung des Spielers EIN, Und durch b- Spieler gewinnt B. Als a = –b, dann müssen bei der Analyse eines solchen Spiels nicht beide Zahlen berücksichtigt werden - es reicht aus, die Auszahlung eines der Spieler zu berücksichtigen. Sei es zum Beispiel EIN. Im Folgenden wird zur Vereinfachung der Darstellung die Seite EIN wir werden bedingt nennen " wir„Und die Seite B – "Feind".

Lass uns haben m mögliche Strategien EIN 1 , EIN 2 , …, Bin, und der Feind n mögliche Strategien B 1 , B 2 , …, B n(Ein solches Spiel nennt man ein Spiel m×n). Angenommen, jede Seite hat eine bestimmte Strategie gewählt: Wir haben gewählt Ai, Gegner Bj. Wenn das Spiel nur aus persönlichen Zügen besteht, dann die Wahl der Strategien Ai und Bj bestimmt eindeutig das Ergebnis des Spiels - unsere Auszahlung (positiv oder negativ). Lassen Sie uns diesen Gewinn als bezeichnen aij(gewinnen, wenn wir die Strategie wählen Ai, und der Feind - Strategien Bj).

Wenn das Spiel zusätzlich zu persönlichen Zufallszügen die Auszahlung für ein Paar Strategien enthält Ai, Bj ist eine Zufallsvariable, die von den Ergebnissen aller zufälligen Bewegungen abhängt. In diesem Fall ist die natürliche Schätzung der erwarteten Auszahlung mathematische Erwartung eines zufälligen Gewinns. Der Einfachheit halber werden wir mit bezeichnen aij sowohl die Auszahlung selbst (in einem Spiel ohne zufällige Züge) als auch seine mathematische Erwartung (in einem Spiel mit zufälligen Zügen).

Angenommen, wir kennen die Werte aij für jedes Strategiepaar. Diese Werte können als Matrix geschrieben werden, deren Zeilen unseren Strategien entsprechen ( Ai), und die Spalten zeigen die Strategien des Gegners ( Bj):

B j EIN ich B 1 B 2 B n
EIN 1 a 11 a 12 a 1n
EIN 2 a 21 a 22 a 2n
Bin bin 1 bin 2 amn

Eine solche Matrix heißt Auszahlungsmatrix des Spiels oder einfach Spiel Matrix.

Beachten Sie, dass die Konstruktion einer Auszahlungsmatrix für Spiele mit einer großen Anzahl von Strategien eine schwierige Aufgabe sein kann. Zum Beispiel für Schachspiel die Anzahl der möglichen Strategien ist so groß, dass die Konstruktion der Auszahlungsmatrix praktisch unmöglich ist. Im Prinzip kann jedoch jedes endliche Spiel auf eine Matrixform reduziert werden.

In Betracht ziehen Beispiel 1 4×5 antagonistisches Spiel. Uns stehen vier Strategien zur Verfügung, der Feind hat fünf Strategien. Die Spielmatrix ist wie folgt:

B j EIN ich B 1 B 2 B 3 B 4 B 5
EIN 1
EIN 2
EIN 3
EIN 4

Welche Strategie sollten wir (d.h. der Spieler EIN) benutzen? Welche Strategie wir auch immer wählen, ein vernünftiger Gegner wird darauf mit der Strategie reagieren, für die unsere Auszahlung minimal sein wird. Zum Beispiel, wenn wir die Strategie wählen EIN 3 (durch einen Gewinn von 10 in Versuchung geführt), wird der Gegner als Antwort eine Strategie wählen B 1 , und unsere Auszahlung wird nur 1 sein. Offensichtlich müssen wir basierend auf dem Prinzip der Vorsicht (und es ist das Hauptprinzip der Spieltheorie) die Strategie wählen, in der unser minimaler Gewinn ist maximal.

Bezeichne mit ein ich Mindestauszahlungswert für die Strategie Ai:

und fügen Sie der Spielmatrix eine Spalte mit diesen Werten hinzu:

B j EIN ich B 1 B 2 B 3 B 4 B 5 Minimum in Reihen ein ich
EIN 1
EIN 2
EIN 3
EIN 4 maximieren

Bei der Auswahl einer Strategie müssen wir diejenige auswählen, für die der Wert gilt ein ich maximal. Lassen Sie uns diesen Maximalwert mit bezeichnen α :

Wert α genannt geringerer Spielpreis oder maximieren(maximaler minimaler Gewinn). Spielerstrategie EIN entsprechend dem Maximin α , wird genannt Maximin-Strategie.

In diesem Beispiel ist die Maximin α gleich 3 ist (die entsprechende Zelle in der Tabelle ist grau hervorgehoben) und die Maximin-Strategie ist EIN vier . Wenn wir uns für diese Strategie entschieden haben, können wir sicher sein, dass wir für jedes Verhalten des Feindes nicht weniger als 3 gewinnen (und vielleicht mehr mit dem „unvernünftigen“ Verhalten des Feindes. Dieser Wert ist unser garantiertes Minimum, das wir sicherstellen können uns selbst, wobei wir an der vorsichtigsten Strategie ("Rückversicherung") festhalten.

Jetzt werden wir ähnliche Überlegungen für den Feind anstellen B B EIN B 2 - wir werden ihm antworten EIN .

Bezeichne mit βj EIN B) für die Strategie Ai:



βj β :

7. WAS IST DAS OBERE WERTSPIEL Jetzt werden wir ähnliche Überlegungen für den Gegner anstellen B. Er ist daran interessiert, unseren Gewinn zu minimieren, dh uns weniger zu geben, aber er muss sich auf unser Verhalten verlassen, das für ihn am schlimmsten ist. Zum Beispiel, wenn er die Strategie wählt B 1 , dann werden wir ihm mit einer Strategie antworten EIN 3 , und er wird uns 10 geben. Wenn er will B 2 - wir werden ihm antworten EIN 2 , und er gibt 8 usw. Offensichtlich muss ein vorsichtiger Gegner die Strategie wählen, in der unser maximaler Gewinn wird minimal sein.

Bezeichne mit βj die Maximalwerte in den Spalten der Auszahlungsmatrix (die maximale Auszahlung des Spielers EIN, oder, was dasselbe ist, der maximale Verlust des Spielers B) für die Strategie Ai:

und fügen Sie der Spielmatrix eine Zeile mit diesen Werten hinzu:

Bei der Wahl einer Strategie wird der Feind diejenige bevorzugen, für die der Wert besteht βj Minimum. Bezeichnen wir es mit β :

Wert β genannt Top Spielpreis oder Minimax(minimaler maximaler Gewinn). Die dem Minimax entsprechende Strategie des Gegners (Spielers). B), wird genannt Minimax-Strategie.

Minimax ist der Wert des Gewinns, mehr als den ein vernünftiger Gegner uns sicherlich nicht geben wird (mit anderen Worten, ein vernünftiger Gegner wird nicht mehr verlieren als β ). In diesem Beispiel minimax β ist gleich 5 (die entsprechende Zelle in der Tabelle ist grau hinterlegt) und wird mit der Strategie des Gegners erreicht B 3 .

Daher müssen wir uns nach dem Vorsichtsprinzip („immer mit dem Schlimmsten rechnen!“) für eine Strategie entscheiden EIN 4 und der Feind - eine Strategie B 3 . Das Vorsichtsprinzip ist grundlegend in der Spieltheorie und heißt Minimax-Prinzip.

In Betracht ziehen Beispiel 2. Lassen Sie die Spieler EIN und BEI eine von drei Zahlen wird gleichzeitig und unabhängig voneinander geschrieben: entweder "1" oder "2" oder "3". Wenn die Summe der geschriebenen Zahlen gerade ist, dann der Spieler B zahlt den Spieler EIN diese Menge. Wenn der Betrag ungerade ist, zahlt der Spieler diesen Betrag EIN Spieler BEI.

Lassen Sie uns die Auszahlungsmatrix des Spiels aufschreiben und die unteren und oberen Preise des Spiels finden (die Strategienummer entspricht der geschriebenen Zahl):

Spieler EIN muss sich an die Maximin-Strategie halten EIN 1, um mindestens -3 zu gewinnen (d. h. höchstens 3 zu verlieren). Minimax-Spielerstrategie B jede der Strategien B 1 und B 2 , was garantiert, dass er nicht mehr als 4 geben wird.

Wir erhalten das gleiche Ergebnis, wenn wir die Auszahlungsmatrix aus der Sicht des Spielers schreiben BEI. Tatsächlich wird diese Matrix erhalten, indem die aus der Sicht des Spielers konstruierte Matrix transponiert wird EIN, und das Ändern der Vorzeichen der Elemente in das Gegenteil (da die Auszahlung des Spielers EIN ist der Verlust des Spielers BEI):

Basierend auf dieser Matrix folgt, dass der Spieler B muss einer der Strategien folgen B 1 und B 2 (und dann verliert er nicht mehr als 4) und der Spieler EIN- Strategien EIN 1 (und dann verliert er nicht mehr als 3). Wie Sie sehen können, ist das Ergebnis genau dasselbe wie das oben erhaltene, sodass die Analyse aus Sicht des Spielers, den wir durchführen, keine Rolle spielt.

8 WAS IST EIN WERTVOLLES SPIEL.

9. WAS BEDEUTET DAS MINIMAX-PRINZIP. 2. Unterer und oberer Preis des Spiels. Minimax-Prinzip

Betrachten Sie ein Matrixspiel des Typs mit Auszahlungsmatrix

Wenn der Spieler ABER wird eine Strategie wählen Ein ich, dann sind alle möglichen Auszahlungen Elemente ich-te Zeile der Matrix AUS. Das Schlimmste für einen Spieler ABER Fall, wenn der Spieler BEI wendet eine geeignete Strategie an Minimum Element dieser Linie, die Auszahlung des Spielers ABER wird gleich der Zahl sein.

Daher muss der Spieler, um die maximale Auszahlung zu erhalten ABER Sie müssen eine der Strategien auswählen, für die die Nummer gilt maximal.

Das im Rahmen des Systemansatzes betrachtete Entscheidungsproblem enthält drei Hauptkomponenten: Das System, das Steuerungssubsystem und die Umwelt werden darin unterschieden. Nun wenden wir uns der Untersuchung von Entscheidungsproblemen zu, bei denen das System nicht von einem, sondern von mehreren Steuerungssubsystemen beeinflusst wird, von denen jedes seine eigenen Ziele und Handlungsmöglichkeiten hat. Diese Herangehensweise an die Entscheidungsfindung wird als Spieltheorie bezeichnet, und die mathematischen Modelle der entsprechenden Interaktionen werden aufgerufen Spiele. Aufgrund der unterschiedlichen Ziele der Steuerungs-Subsysteme sowie gewisser Beschränkungen der Möglichkeit, Informationen zwischen ihnen auszutauschen, sind diese Interaktionen konflikthaft. Daher ist jedes Spiel ein mathematisches Konfliktmodell. Wir beschränken uns auf den Fall, dass es zwei Regelsubsysteme gibt. Wenn die Ziele der Systeme gegensätzlich sind, wird der Konflikt als antagonistisch bezeichnet und das mathematische Modell eines solchen Konflikts genannt Antagonistisches Spiel..

In der spieltheoretischen Terminologie wird das 1. Steuerungssubsystem genannt Spieler 1, 2. Regelteilsystem - Spieler 2, setzt

ihre alternativen Aktionen werden aufgerufen Sätze von Strategien diese Spieler. Lassen X- Satz von Strategien für Spieler 1, Y- viele Strategien

Spieler 2. Der Zustand des Systems wird eindeutig durch die Wahl der Kontrollaktionen der Subsysteme 1 und 2 bestimmt, dh durch die Wahl der Strategien

xX und jY. Lassen F(x,j) - Nutzenschätzung für Spieler 1 dieses Staates

das System, auf das es übergeht, wenn Spieler 1 eine Strategie wählt X und

Spieler 2 Strategie bei. Nummer F(x,j) wird genannt gewinnen Spieler 1 in der Situation ( x,j) und die Funktion F- Spieler 1 Auszahlungsfunktion. Spieler gewinnen

1 ist auch der Verlust von Spieler 2, dh der Wert, den der erste Spieler zu erhöhen versucht, und der zweite - zu verringern. Das ist es

Manifestation des antagonistischen Charakters des Konflikts: Die Interessen der Spieler sind völlig gegensätzlich (was einer gewinnt, verliert der andere).

Ein antagonistisches Spiel ist natürlich vom System vorgegeben G=(X, Y, F).

Beachten Sie, dass das antagonistische Spiel formal genauso gestellt ist wie das Problem, eine Entscheidung unter Bedingungen der Ungewissheit zu treffen – wenn

Identifizieren des Steuersubsystems 2 mit der Umgebung. Der wesentliche Unterschied zwischen dem Kontrollsubsystem und der Umgebung besteht darin

das Verhalten des ersten ist zielgerichtet. Wenn wir beim Erstellen eines mathematischen Modells eines realen Konflikts einen Grund (oder die Absicht) haben, die Umgebung als Gegner zu betrachten, deren Zweck es ist, zu bringen

uns den maximalen Schaden, dann kann eine solche Situation als antagonistisches Spiel dargestellt werden. Mit anderen Worten, das antagonistische Spiel kann als Extremfall der ZPR unter Unsicherheitsbedingungen interpretiert werden,


dadurch gekennzeichnet, dass die Umwelt als Gegner mit einem Ziel gesehen wird. Gleichzeitig müssen wir die Arten von Hypothesen über das Verhalten der Umwelt einschränken.


Am stichhaltigsten ist hier die Hypothese der äußersten Vorsicht, wenn wir uns bei einer Entscheidung auf das denkbar schlechteste Szenario für unser Handeln in der Umwelt verlassen.

Definition. Wenn ein X und Y endlich sind, dann heißt das antagonistische Spiel Matrix. Beim Matrixspiel können wir davon ausgehen X={1,…,n},

Y={1,…,m) und legen aij=F(ich, j). Somit wird das Matrixspiel vollständig von der Matrix bestimmt A=(aij), ich=1,…,NJ=1,…,m.

Beispiel 3.1. Spiel mit zwei Fingern.

Zwei Personen zeigen gleichzeitig einen oder zwei Finger und rufen die Nummer 1 oder 2, was laut Sprecher die Nummer bedeutet

Finger, die anderen gezeigt werden. Nachdem die Finger gezeigt und die Zahlen genannt wurden, werden die Gewinne nach folgenden Regeln verteilt:

Wenn beide erraten haben oder beide nicht erraten haben, wie viele Finger ihr Gegner gezeigt hat, ist die Auszahlung für jeden gleich Null; wenn nur einer richtig geraten hat, zahlt der Gegner dem Rater den Geldbetrag proportional zur Gesamtzahl der gezeigten

Dies ist ein antagonistisches Matrixspiel. Jeder Spieler hat vier Strategien: 1- 1 Finger zeigen und 1 sagen, 2- 1 Finger zeigen und 2 sagen, 3-

Zeigen Sie 2 Finger und sagen Sie 1, 4 - Zeigen Sie 2 Finger und sagen Sie 2. Dann die Auszahlungsmatrix A=(aij), i= 1,…, 4, j= 1,…, 4 ist wie folgt definiert:

a12= 2, a21 = – 2, a13=a42=–3, a24=a31= 3, a34 = – 4, a43= 4,aij= 0 sonst.

Beispiel 3.2. Diskretes Duell-Spiel.

Duellartige Aufgaben beschreiben beispielsweise den Kampf zweier Spieler,

die jeweils eine einmalige Aktion durchführen wollen (Freigabe einer Warensendung auf dem Markt, Antrag auf Kauf bei einer Auktion) und sich dafür einen Zeitpunkt aussuchen. Lassen Sie die Spieler aufeinander zu bewegen n Schritte. Nach jedem ausgeführten Schritt kann der Spieler auf den Gegner schießen oder nicht. Jede Person kann nur einen Schuss haben. Es wird angenommen, dass die Wahrscheinlichkeit, den Feind zu treffen, wenn Sie vorbeikommen k n = 5 hat die Form




 
Artikel an Thema:
Alles, was Sie über SD-Speicherkarten wissen müssen, damit Sie beim Kauf von Connect SD nichts vermasseln
(4 Bewertungen) Wenn Sie nicht genügend internen Speicher auf Ihrem Gerät haben, können Sie die SD-Karte als internen Speicher für Ihr Android-Telefon verwenden. Diese Funktion namens Adoptable Storage ermöglicht es dem Android-Betriebssystem, externe Medien zu formatieren
Wie man die Räder in GTA Online dreht und mehr in den häufig gestellten Fragen zu GTA Online
Warum verbindet sich gta online nicht?Es ist einfach, der Server ist vorübergehend ausgeschaltet / inaktiv oder funktioniert nicht. Gehen Sie zu einem anderen So deaktivieren Sie Online-Spiele im Browser. Wie deaktiviere ich den Start der Online Update Clinet-Anwendung im Connect-Manager? ... auf skkoko weiß ich, wann es dir etwas ausmacht
Ace of Spades in Kombination mit anderen Karten
Die häufigsten Interpretationen der Karte sind: das Versprechen einer angenehmen Bekanntschaft, unerwartete Freude, bisher unerfahrene Emotionen und Empfindungen, ein Geschenk erhalten, ein Besuch bei einem Ehepaar. Herz-Ass, die Bedeutung der Karte, wenn Sie eine bestimmte Person charakterisieren
Wie man ein Umzugshoroskop richtig erstellt Erstellen Sie eine Karte nach Geburtsdatum mit Dekodierung
Das Geburtshoroskop spricht von den angeborenen Qualitäten und Fähigkeiten seines Besitzers, das lokale Horoskop spricht von lokalen Umständen, die durch den Ort der Handlung initiiert wurden. Sie sind gleich wichtig, weil das Leben vieler Menschen an ihrem Geburtsort vergeht. Folgen Sie der lokalen Karte