antagonistinis žaidimas. Matricinių antagonistinių žaidimų sprendimas Matricinių antagonistinių žaidimų sprendimo principai

Žaidimo teorija yra matematinių sprendimų priėmimo modelių teorija konflikto ar neapibrėžtumo sąlygomis. Daroma prielaida, kad žaidimo šalių veiksmams būdingos tam tikros strategijos – veiksmų taisyklių rinkiniai. Jei vienos pusės pelnas neišvengiamai veda prie kitos pusės praradimo, tada jie kalba apie antagonistinius žaidimus. Jei strategijų rinkinys yra ribotas, tai žaidimas vadinamas matriciniu žaidimu ir sprendimą galima gauti labai paprastai. Žaidimų teorijos pagalba gauti sprendimai yra naudingi kuriant planus esant galimam konkurentų pasipriešinimui ar neapibrėžtumui išorinėje aplinkoje.


Jei bimatricinis žaidimas yra antagonistinis, tai 2 žaidėjo išmokėjimo matricą visiškai lemia 1 žaidėjo išmokėjimo matrica (atitinkami šių dviejų matricų elementai skiriasi tik ženklais). Todėl bimatricinis antagonistinis žaidimas yra visiškai aprašytas viena matrica (1 žaidėjo išmokėjimo matrica) ir atitinkamai vadinamas matriciniu žaidimu.

Šis žaidimas yra antagonistinis. Jame j \u003d x2 - O, P ir R (O, O] \u003d H (P, P) \u003d -I ir R (O, P) \u003d R (P, O) \u003d 1, arba matricos pavidalu o p

Tegul kuri nors žaidimų klasė Г būna „veidrodinė“, t.y. kartu su kiekvienu žaidimu yra veidrodinis izomorfinis žaidimas (kadangi visi žaidimai, kurie yra veidrodiniai izomorfiniai tam tikram žaidimui, yra izomorfiniai vienas kitam, mes, pagal ką tik pasakytą, galime kalbėti apie vieną veidrodinį izomorfinį žaidimą). Tokia klasė yra, pavyzdžiui, visų antagonistinių žaidimų klasė arba visų matricinių žaidimų klasė.

Prisimindami priimtinų situacijų apibrėžimą antagonistiniame žaidime, gauname, kad situacija (X, Y) mišriame matricos žaidimo išplėtime yra priimtina 1 žaidėjui tada ir tik tada, jei bet kuriai x G x nelygybė.

Žaidimų pavertimo simetriniais procesas vadinamas simetrizavimu. Čia aprašome vieną simetrijos metodą. Kitas, iš esmės kitoks simetrijos variantas bus pateiktas 26.7 skyriuje. Abu šie simetrijos variantai iš tikrųjų taikomi savavališkiems antagonistiniams žaidimams, tačiau bus suformuluoti ir įrodyti tik matriciniams žaidimams.

Taigi pradiniai bendrųjų antagonistinių žaidimų teorijos terminai ir pavadinimai sutampa su atitinkamais matricinių žaidimų teorijos terminais ir pavadinimais.

Baigtinių antagonistinių (matricinių) žaidimų atveju šių ekstremalių egzistavimą įrodėme 10 skyriuje. 1, o esmė buvo nustatyti jų lygybę arba bent jau rasti būdų, kaip įveikti jų nelygybę.

Matricinių žaidimų svarstymas jau rodo, kad iš pradžių pateiktose žaidėjų strategijose yra antagonistinių žaidimų be pusiausvyros situacijų (ir net be e-pusiausvyros situacijų esant pakankamai mažam e > 0).

Bet kiekvienas baigtinis (matricinis) žaidimas gali būti išplėstas iki begalinio žaidimo, pavyzdžiui, kiekvienam žaidėjui suteikiant bet kokį dominuojančių strategijų skaičių (žr. 22 sk. 1). Akivaizdu, kad toks žaidėjo strategijų rinkinio išplėtimas tikrai nereikš jo galimybių išplėtimo, o tikrasis jo elgesys išplėstame žaidime neturėtų skirtis nuo elgesio pradiniame žaidime. Taigi iš karto gavome pakankamai daug begalinių antagonistinių žaidimų, neturinčių balno taškų, pavyzdžių. Yra ir tokių pavyzdžių.

Taigi, norint įgyvendinti maksimino principą begaliniame antagonistiniame žaidime, būtina, kaip ir baigtinio (matricinio) žaidimo atveju, šiek tiek išplėsti žaidėjų strategines galimybes. Už 96

Kaip ir matricinių žaidimų atveju (žr. 1, 17 skyrius), bendriesiems antagonistiniams žaidimams svarbų vaidmenį atlieka mišraus strategijos spektro samprata, kuriai čia vis dėlto reikia suteikti bendresnį apibrėžimą.

Galiausiai atkreipkite dėmesį, kad visų 1 žaidėjo mišrių strategijų rinkinys savavališkame antagonistiniame žaidime yra kaip matricoje.

Net ir nagrinėjant antagonistinius žaidimus matyti, kad daug tokių žaidimų, įskaitant baigtinius, matricinius žaidimus turi pusiausvyros situacijas ne originaliose, grynosiose strategijose, o tik apibendrintose, mišriose strategijose. Todėl bendriems, neantagonistiniams, nebendradarbiavimo žaidimams natūralu pusiausvyros situacijų ieškoti būtent mišriose strategijose.

Taigi, pavyzdžiui (žr. 3.1 pav.), mes jau pažymėjome, kad „Rangovas“ beveik niekada neturi susidurti su elgesio netikrumu. Bet jei paimtume konceptualų „Administratoriaus“ tipo lygmenį, tada viskas yra kaip tik priešingai. Paprastai pagrindinis neapibrėžtumo tipas, su kuriuo turi susidurti toks „mūsų sprendimų priėmėjas“, yra „konfliktas“. Dabar galime paaiškinti, kad tai paprastai nėra griežta konkurencija. Kiek rečiau „Administratorius“ sprendimus priima „natūralaus neapibrėžtumo“ sąlygomis, dar rečiau susiduria su griežtu, antagonistiniu konfliktu. Be to, interesų susidūrimas priimant sprendimus „Administratoriui“ įvyksta, taip sakant, „vieną kartą“, t.y., mūsų klasifikacijoje, jis dažnai žaidžia tik vieną (kartais labai nedidelį skaičių) žaidimo žaidimų. Pasekmių vertinimo skalės dažniau yra kokybinės nei kiekybinės. „Administratoriaus“ strateginė nepriklausomybė yra gana ribota. Atsižvelgiant į tai, kas išdėstyta, galima teigti, kad tokio masto problemines situacijas dažniausiai tenka analizuoti naudojant nebendradarbiaujančius neantagonistinius dvimatricinius žaidimus, be to, grynosios strategijos.

Matricinių antagonistinių žaidimų sprendimo principai

Dėl to pagrįstai galima tikėtis, kad aukščiau aprašytame žaidime varžovai laikysis savo pasirinktų strategijų. Matricos antagonistinis žaidimas, kuriam max min fiv = min max Aiy>

Tačiau ne visi matriciniai antagonistiniai žaidimai yra gana konkretūs ir apskritai

Taigi, bendruoju atveju, norint išspręsti matricos antagonistinį žaidimą, kurio matmenys /uxl, reikia išspręsti porą dvigubo linijinio programavimo uždavinių, dėl kurių susidaro optimalių strategijų rinkinys / ir žaidimo kaina v.

Kaip apibrėžiamas dviejų asmenų matricinis antagonistinis žaidimas?

Kokie yra matricinių antagonistinių žaidimų supaprastinimo ir sprendimo metodai

Dviejų asmenų žaidimo atveju natūralu, kad jų interesai yra visiškai priešingi – žaidimas yra antagonistinis. Taigi vieno žaidėjo laimėjimas yra lygus kito praradimui (abiejų žaidėjų išmokėjimų suma lygi nuliui, iš čia ir pavadinimas, nulinės sumos žaidimas). Mes apsvarstysime žaidimus, kuriuose kiekvienas žaidėjas turi ribotą skaičių alternatyvų. Tokio nulinės sumos dviejų asmenų žaidimo išmokėjimo funkcija gali būti pateikta matricos forma (išmokėjimo matricos forma).

Kaip jau minėta, galutinis antagonistinis žaidimas vadinamas matrica.

MATRIX GAMES – antagonistinių žaidimų klasė, kurioje dalyvauja du žaidėjai, o kiekvienas žaidėjas turi ribotą skaičių strategijų. Jei vienas žaidėjas turi m strategijų, o kitas žaidėjas turi n strategijų, tada galime sukurti žaidimo matricą, kurios matmenys yra txn. M.i. gali turėti arba neturėti balno taško. Pastaruoju atveju

Maskvos energetikos institutas

(Technikos universitetas)

Laboratorijos ataskaita

žaidimų teorijoje

"Paieškos programa optimalioms strategijoms poriniam antagonistiniam žaidimui, pateikta matricos forma"

Baigė studentai

grupė A5-01

Ašrapovas Daleris

Ašrapova Olga

Pagrindinės žaidimų teorijos sąvokos

Žaidimo teorija, skirta išspręsti konfliktines situacijas , t.y. situacijos, kai susiduria dviejų ar daugiau skirtingų tikslų siekiančių šalių interesai.

Jei šalių tikslai yra tiesiogiai priešingi, jie kalba apie antagonistinis konfliktas .

žaidimas vadinamas supaprastintu formalizuotu konfliktinės situacijos modeliu.

Žaidimas vieną kartą nuo pradžios iki pabaigos vadinamas vakarėlis . Vakarėlio rezultatas yra mokėjimas (arba laimėti ).

Vakarėlis susideda iš juda , t.y. žaidėjų pasirinkimas iš galimų alternatyvų rinkinio.

Judesiai gali būti Asmeninis ir atsitiktinis.asmeninis žingsnis , Skirtingai nei atsitiktinis , reiškia sąmoningą žaidėjo tam tikro pasirinkimo pasirinkimą.

Vadinami žaidimai, kuriuose yra bent vienas asmeninis ėjimas strateginis .

Vadinami žaidimai, kuriuose visi judesiai yra atsitiktiniai azartinių lošimų .

Darydami asmeninį žingsnį jie taip pat kalba apie strategijos žaidėjas, t.y. apie taisyklę ar taisyklių rinkinį, lemiantį žaidėjo pasirinkimą. Kartu strategija turėtų būti visapusiška, t.y. pasirinkimas turi būti nustatytas bet kuriai galimai situacijai žaidimo eigoje.

Žaidimo teorijos iššūkis– optimalių žaidėjų strategijų suradimas, t.y. strategijas, kurios suteikia jiems didžiausią pelną arba minimalų nuostolį.

Žaidimų teorinių modelių klasifikacija

žaidimas n asmenys paprastai vadinami, kur
yra i-ojo žaidėjo strategijų rinkinys,
- žaidimo apmokėjimas.

Remiantis šiuo pavadinimu, galima pasiūlyti tokią žaidimų teorinių modelių klasifikaciją:

Diskretinė (strategijų rinkiniai diskretus)

Galutinis

Begalinis

Nuolatinis (strategijų rinkiniai nuolatinis)

Begalinis

n asmenys (
)

Koalicija (kooperatyvas)

Nebendradarbiaujantis (nebendradarbiaujantis)

2 asmenys (pora)

Antagonistiniai (nulinės sumos žaidimai)

(šalių interesai yra priešingi, t. y. vieno žaidėjo praradimas yra lygus kito laimėjimui)

Neantagonistinis

Su visa informacija (jei žaidėjas, atliekantis asmeninį ėjimą, žino visą žaidimo istoriją, t. y. visus priešininko ėjimus)

Su nepilna informacija

Su nuline suma (bendras mokėjimas lygus nuliui)

Su ne nuline suma

Vienpusis (loterijos)

daugiakryptis

Suporuoto antagonistinio žaidimo matrica

Šioje pamokoje mes apsvarstysime antagonistiniai dviejų asmenų žaidimai pateikta matricos forma. Tai reiškia, kad mes žinome pirmojo žaidėjo (žaidėjo A){ A i }, i = 1,…, m ir antrojo žaidėjo strategijų rinkinys (žaidėjas B){ B j }, j = 1,..., n, ir matrica A = || a ij || pirmojo žaidėjo išmokos. Kadangi kalbame apie antagonistinį žaidimą, daroma prielaida, kad pirmojo žaidėjo pelnas yra lygus antrojo praradimui. Manome, kad matricos elementas a ij yra pirmojo žaidėjo, kai jis pasirenka strategiją, atlyginimas A i ir antrojo žaidėjo atsakymas su strategija B j. Mes nurodysime tokį žaidimą kaip
, kur m - žaidėjų strategijų skaičius BET,n - žaidėjų strategijų skaičius AT. Apskritai jį galima pavaizduoti šioje lentelėje:

B 1

B j

B n

A 1

A i

A m

1 pavyzdys

Kaip paprastą pavyzdį apsvarstykite žaidimą, kuriame žaidimas susideda iš dviejų ėjimų.

1 ėjimas: Žaidėjas BET pasirenka vieną iš skaičių (1 arba 2), nepasakydamas priešininkui apie savo pasirinkimą.

2-as ėjimas: Žaidėjas AT pasirenka vieną iš skaičių (3 arba 4).

Rezultatas: žaidėjo pasirinkimas BET ir AT Pridėti. Jei suma lygi, tada AT sumoka savo vertę žaidėjui BET, jei nelyginis - atvirkščiai, BET moka žaidėjui AT.

Šį žaidimą galima pavaizduoti kaip
tokiu būdu:

(3 pasirinkimas)

(4 pasirinkimas)

(1 pasirinkimas)

(2 pasirinkimas)

Tai nesunku pastebėti Šis žaidimas yra antagonistinis, be to, tai žaidimas su nepilna informacija, nes žaidėjas AT, darydamas asmeninį ėjimą, nežinoma, kokį žaidėjo pasirinkimą padarė BET.

Kaip buvo pažymėta aukščiau, žaidimo teorijos uždavinys yra surasti optimalias žaidėjų strategijas, t.y. strategijas, kurios suteikia jiems didžiausią pelną arba minimalų nuostolį. Šis procesas vadinamas žaidimo sprendimas .

Sprendžiant žaidimą matricos forma, reikia patikrinti žaidimo buvimą balno taškas . Tam įvedamos dvi vertės:

yra apatinė žaidimo kainos riba ir

yra viršutinė žaidimo kainos sąmata.

Pirmasis žaidėjas greičiausiai pasirinks strategiją, kurioje gaus maksimalų pelną tarp visų galimų antrojo žaidėjo atsakymų, o antrasis, priešingai, pasirinks tokią, kuri sumažins jo paties nuostolius, t.y. galimas pirmojo laimėjimas.

Tai galima įrodyti α ≤ V ≤ β , kur Vžaidimo kaina , t.y., tikėtinas pirmojo žaidėjo atlyginimas.

Jei santykis α = β = V, tada jie taip sako žaidimas turi balno tašką
, ir išspręstos grynomis strategijomis . Kitaip tariant, yra keletas strategijų
, suteikiant žaidėjui BETV.

2 pavyzdys

Grįžkime prie žaidimo, kurį nagrinėjome 1 pavyzdyje, ir patikrinkime, ar jame nėra balno taško.

(3 pasirinkimas)

(4 pasirinkimas)

(1 pasirinkimas)

(2 pasirinkimas)

Šiam žaidimui
= -5,
= 4,
, todėl jis neturi balno taško.

Vėlgi, atkreipkite dėmesį, kad šis žaidimas yra nepilnas informacinis žaidimas. Tokiu atveju galite tik patarti žaidėjui BET pasirinkti strategiją , nes šiuo atveju jis gali gauti didžiausią atlygį, tačiau su sąlyga, kad žaidėjas pasirenka AT strategijos .

3 pavyzdys

Pakeiskime žaidimo taisykles iš 1 pavyzdžio. Duokime žaidėjui ATžaidėjų pasirinkimo informacija BET. Tada AT Yra dvi papildomos strategijos:

- strategija, kuri yra naudinga BET. Jei pasirinkimas A-1, tada AT pasirenka 3, jei pasirenkama A-2, tada AT pasirenka 4;

- strategija, kuri nėra naudinga BET. Jei pasirinkimas A-1, tada AT pasirenka 4, jei pasirenkama A-2, tada AT pasirenka 3.

(3 pasirinkimas)

(4 pasirinkimas)

(1 pasirinkimas)

(2 pasirinkimas)

Šis žaidimas yra pilnas informacijos.

Tokiu atveju
= -5,
= -5,
, taigi žaidimas turi balno tašką
. Šis balno taškas atitinka dvi optimalių strategijų poras:
ir
. Žaidimo kaina V= -5. Akivaizdu, kad už BETšis žaidimas nenaudingas.

2 ir 3 pavyzdžiai puikiai iliustruoja šią teoremą, įrodytą žaidimų teorijoje:

1 teorema

Kiekvienas suporuotas antagonistinis žaidimas su tobula informacija išsprendžiamas grynomis strategijomis.

Tai. 1 teorema sako, kad bet koks dviejų asmenų žaidimas su tobula informacija turi balno tašką ir yra pora grynų strategijų.
, suteikiant žaidėjui BET tvarus pelnas, lygus žaidimo kainai V.

Tuo atveju, kai nėra balno taško, vadinamasis mišrios strategijos :, kur p i irq j yra strategijų pasirinkimo tikimybė A i ir B j atitinkamai pirmasis ir antrasis žaidėjai. Žaidimo sprendimas šiuo atveju yra mišrių strategijų pora
maksimaliai padidinant matematinius lūkesčius dėl žaidimo kainos.

1 teoremos apibendrinimas žaidimo su nepilna informacija atveju yra tokia teorema:

2 teorema

Bet kuris suporuotas antagonistinis žaidimas turi bent vieną optimalų sprendimą, t. y. porą mišrių strategijų bendruoju atveju
, suteikiant žaidėjui BET tvarus pelnas, lygus žaidimo kainai V, be to α ≤ V ≤ β .

Ypatingu atveju žaidimo su balno tašku sprendimas mišriose strategijose atrodo kaip vektorių pora, kurioje vienas elementas yra lygus vienetui, o likusieji yra lygūs nuliui.

Paprasčiausias atvejis, detaliai aprašytas žaidimo teorijoje, yra nulinės sumos baigtinių porų žaidimas (antagoniškas dviejų asmenų arba dviejų koalicijų žaidimas). Apsvarstykite šį žaidimą G, kuriame du žaidėjai BET ir AT, turintys priešingus interesus: vieno pelnas lygus kito praradimui. Nuo žaidėjo atlyginimo BET yra lygus žaidėjo atlyginimui Kartu su priešingas ženklas, mus domina tik atsipirkimas ažaidėjas BET. Natūralu, BET nori maksimaliai padidinti ir AT – sumažinti a. Kad būtų paprasčiau, mintyse susitapatinkime su vienu iš žaidėjų (tebūnie BET) ir mes jį vadinsime „mes“, ir žaidėju AT –„priešininkas“ (žinoma, jokių realių pranašumų BET iš to neišplaukia). Leiskite mums t galimos strategijos BET 1 , A 2 , ..., BET m, ir priešas n galimos strategijos AT 1 , AT 2 , ..; AT n(toks žaidimas vadinamas žaidimu t × n). Pažymėti a ij mūsų atlyginimas, jei naudosime strategiją A i , o priešas yra strategija B j .

26.1 lentelė

A i

B j

B 1

B 2

B n

A 1

A 2

A m

a 11

a 21

a m1

a 21

a m

a 1 n

a 2 n

a mn

Tarkime, kad kiekvienai strategijų porai A<, AT, laimėjimas (arba vidutinis laimėjimas) a, j mes žinome. Tada iš esmės galima sudaryti stačiakampę lentelę (matricą), kurioje surašytos žaidėjų strategijos ir atitinkami laimėjimai (žr. 26.1 lentelę).

Jei tokia lentelė yra sudaryta, mes sakome, kad žaidimas G sumažintas iki matricos formos (savaime žaidimo perkėlimas į tokią formą jau gali būti sudėtinga užduotis, o kartais beveik neįmanoma dėl daugybės strategijų). Atkreipkite dėmesį, kad jei žaidimas yra sumažintas iki matricos formos, tada kelių judesių žaidimas iš tikrųjų sumažinamas iki vieno ėjimo žaidimo – žaidėjas turi atlikti tik vieną ėjimą: pasirinkti strategiją. Trumpai pažymėsime žaidimo matricą ( a ij).

Apsvarstykite žaidimo pavyzdį G(4×5) matricos pavidalu. Mūsų žinioje (galima pasirinkti iš) keturios strategijos, priešas turi penkias strategijas. Žaidimo matrica pateikta 26.2 lentelėje

Pagalvokime, kokią strategiją mes (žaidėjas BET) pasinaudoti? Matrica 26.2 turi viliojantį laimėjimą „10“; mus traukia pasirinkti strategiją BET 3 , pas kurį gausime šį „kąsnį“. Bet palaukite, priešas taip pat nėra kvailas! Jei pasirinksime strategiją BET 3 , jis, nepaisydamas mūsų, pasirinks strategiją AT 3 , ir mes gauname apgailėtiną atlygį „1“. Ne, pasirinkite strategiją BET 3 tai uždrausta! Kaip būti? Akivaizdu, kad vadovaudamiesi atsargumo principu (ir tai yra pagrindinis žaidimo teorijos principas), turime pasirinkti

26.2 lentelė

B j

A i

B 1

B 2

B 3

B 4

B 5

A 1

A 2

A 3

A 4

ta strategija mūsų minimalus pelnas yra didžiausias. Tai yra vadinamasis „minimax principas“: elkitės taip, kad blogiausiu priešo elgesiu gautumėte didžiausią naudą.

Perrašome 26.2 lentelę ir dešiniajame papildomame stulpelyje užrašome minimalią išmokėjimo reikšmę kiekvienoje eilutėje, (eilutės minimumas); paskirkime jį i- α eilutė i(žr. 26.3 lentelę).

26.3 lentelė

B j

A i

B 1

B 2

B 3

B 4

B 5

A 1

A 2

A 3

A 4

β j

Iš visų vertybių α i(dešinysis stulpelis) paryškinamas didžiausias (3). Tai atitinka strategiją A keturi . Pasirinkę šią strategiją, bet kuriuo atveju galime būti tikri, kad (už bet kokį priešo elgesį) gausime ne mažiau nei 3. Ši vertė yra mūsų garantuotas pelnas; Būdami atsargūs, negalime gauti mažiau nei ši (galiu gauti daugiau). Šis laimėjimas vadinamas mažesne žaidimo kaina (arba „maximin“ – minimalių išmokėjimų maksimumu). Mes tai pažymėsime a. Mūsų atveju α = 3.

Dabar pažiūrėkime į priešą ir pasiginčykime už jį. Jis nėra kažkoks pėstininkas, bet ir protingas! Pasirinkdamas strategiją, jis norėtų duoti mažiau, tačiau turi pasikliauti mūsų elgesiu, kuris jam yra pats blogiausias. Jeigu jis pasirenka strategiją AT 1 , mes jam atsakysime BET 3 , ir jis duos 10; jei jis pasirinks B 2 - atsakysime jam BET 2 , o jis duos 8 ir t.t. Prie 26.3 lentelės pridedame papildomą apatinę eilutę ir įrašome stulpelių maksimumus β j. Akivaizdu, kad atsargus priešininkas turėtų pasirinkti strategiją, kuri sumažina šią reikšmę (atitinkama 5 reikšmė paryškinta 26.3 lentelėje). Ši β reikšmė yra pelno vertė, kurios protingas oponentas mums tikrai neduos. Ji vadinama viršutine žaidimo kaina (arba „minimax“ – didžiausio laimėjimo minimumu). Mūsų pavyzdyje β = 5 ir pasiekiama naudojant priešininko strategiją B 3 .

Taigi, vadovaudamiesi atsargumo principu (perdraudimo taisyklė „visada tikėkis blogiausiu!“), turime pasirinkti strategiją. BET 4 , o priešas – strategija AT 3 . Tokios strategijos vadinamos „minimax“ (vadovaudamosi minimax principu). Tol, kol abi mūsų pavyzdyje pateiktos šalys laikysis savo minimalių strategijų, atsipirks a 43 = 3.

Dabar trumpam įsivaizduokite, kad sužinojome, kad priešas laikosi strategijos AT 3 . Nagi, nubauskime jį už tai ir išsirinkime strategiją BET 1 - gausime 5, o tai nėra taip blogai. Bet juk priešas taip pat nėra misija; leiskite jam žinoti, kad mūsų strategija BET 1 ; jis taip pat greitai pasirenka AT 4 , sumažinti mūsų atlygį iki 2 ir tt (partneriai „skubėjo dėl strategijų“). Žodžiu, mūsų pavyzdyje minimax strategijos nestabilus atžvilgiuį informacija apie kitos šalies elgesį;šios strategijos neturi pusiausvyros savybės.

Ar visada taip? Ne ne visada. Apsvarstykite pavyzdį su 26.4 lentelėje pateikta matrica.

Šiame pavyzdyje mažesnė žaidimo kaina yra lygi viršutinei: α = β = 6. Kas iš to išplaukia? Minimax žaidėjų strategijos BET ir AT bus tvarus. Kol abu žaidėjai jų laikosi, atlygis yra 6. Pažiūrėkime, kas nutiks, jei mes (BET)žinok, kad priešas (AT)

26.4 lentelė

Bj

A i

B 1

B 2

B 3

B 4

A 1

A 2

A 3

β j

laikosi strategijos B 2 ? Ir tiksliai niekas nepasikeis. Kadangi bet koks nukrypimas nuo strategijos BET 2 gali tik pabloginti mūsų padėtį. Taip pat informacija, kurią gauna priešas, neprivers jo pasitraukti nuo savo strategijos. AT 2 . Strategijų pora BET 2 , B 2 turi pusiausvyros savybę (subalansuota strategijų pora), o pelnas (mūsų atveju 6), gautas naudojant šią strategijų porą, vadinamas „matricos balno tašku“ 1). Balno taško ir subalansuotos strategijų poros buvimo ženklas yra apatinės ir viršutinės žaidimo kainų lygybė; bendra α ir β reikšmė vadinama žaidimo kaina. Pažymėsime v:

α = β = v

Strategijos A i , B j(tokiu atveju BET 2 , AT 2 ), kurioms šis atlygis pasiekiamas, vadinamos optimaliomis grynosiomis strategijomis, o jų visuma – žaidimo sprendimu. Šiuo atveju sakoma, kad pats žaidimas sprendžiamas grynomis strategijomis. Abi pusės BET ir AT galima nurodyti jų optimalias strategijas, pagal kurias jų padėtis yra geriausia įmanoma. Kas yra žaidėjas BETšiuo atveju 6 laimėjimai, o žaidėjas AT – pralaimi 6, - na, tokios yra žaidimo sąlygos: jos naudingos BET ir nepalankus AT

1) Terminas „balnelio taškas“ paimtas iš geometrijos – taip vadinamas taškas paviršiuje, kuriame vienu metu pasiekiamas minimumas išilgai vienos koordinatės ir maksimumas išilgai kitos.

Skaitytojui gali kilti klausimas: kodėl optimalios strategijos vadinamos „grynosiomis“? Žvelgdami šiek tiek į priekį, atsakykime į šį klausimą: yra „mišrios“ strategijos, kurios susideda iš to, kad žaidėjas naudoja ne vieną strategiją, o kelias, jas keisdamas atsitiktinai. Taigi, jei leisime, be grynųjų, dar ir mišrias strategijas, bet kokias pabaigos žaidimas turi sprendimą – pusiausvyros tašką. Bet mes vis dar kalbame apie atomą.

Balno taško buvimas žaidime toli gražu nėra taisyklė; greičiau tai išimtis. Dauguma žaidimų neturi balno taško. Tačiau yra įvairių žaidimų, kurie visada turi balno tašką ir todėl yra sprendžiami grynomis strategijomis. Tai vadinamieji „žaidimai su visa informacija“. Žaidimas su informacijos lentyna yra žaidimas, kuriame kiekvienas žaidėjas žino visą savo vystymosi istoriją, tai yra visų ankstesnių asmeninių ir atsitiktinių ėjimų rezultatus kiekviename asmeniniame ėjime. Žaidimų su visa informacija pavyzdžiai yra šaškės, šachmatai, „tic-tac-toe“ ir kt.

Žaidimų teorijoje tai įrodyta kiekvienas žaidimas su visa informacija turi balno tašką, ir todėl gali būti išspręstos grynomis strategijomis. Kiekviename žaidime su tobula informacija yra pora optimalių strategijų, kurios suteikia stabilų atlyginimą, lygų žaidimo grandinei v. Jei toks žaidimas susideda tik iš asmeninių ėjimų, tai kai kiekvienas žaidėjas taiko savo optimalią strategiją, jis turi baigtis gana apibrėžtu būdu – žaidimo kainai prilygstančiu atsipirkimu. Taigi, jei žaidimo sprendimas yra žinomas, pats žaidimas praranda prasmę!

Paimkime elementarų žaidimo su visa informacija pavyzdį: du žaidėjai pakaitomis deda nikelius ant apvalaus stalo, savavališkai pasirinkdami monetos centro padėtį (monetų tarpusavio sutapimas neleidžiamas). Laimi tas, kuris įdeda paskutinį centą (kai nebelieka vietos kitiems). Nesunku suprasti, kad šio žaidimo baigtis iš esmės yra iš anksto nustatyta. Egzistuoja tam tikra strategija, kuri užtikrina, kad žaidėjas, kuris pirmas įdeda monetą, laimi. Būtent jis pirmiausia turi padėti nikelį ant stalo centro, o tada į kiekvieną priešininko judesį atsakyti simetrišku ėjimu. Akivaizdu, kad ir kaip elgtųsi varžovas, jis negali išvengti pralaimėjimo. Lygiai ta pati situacija yra su šachmatais ir žaidimais su visa informacija apskritai: bet kuris iš jų, parašytas matricos forma, turi balno tašką, todėl sprendimas yra grynosios strategijos, todėl prasmingas tik tol, kol tai sprendimas nerastas. Tarkime, šachmatų žaidimas yra arba visada baigiasi baltojo laimėjimu, arba visada - juodieji laimi, arba visada - lygiosios, tik pagal ką tiksliai – kol kas nežinome (šachmatų mėgėjų laimei). Pridurkime dar vieną dalyką: artimiausiu metu vargu ar sužinosime, nes strategijų skaičius yra toks didžiulis, kad žaidimą redukuoti į matricinę formą ir rasti jame balno tašką yra nepaprastai sunku (jei ne neįmanoma).

Dabar paklauskime savęs, ką daryti, jei žaidimas neturi balno taško: α ≠ β ? Na, o jei kiekvienas žaidėjas yra priverstas pasirinkti vieną – vienintelę gryną strategiją, tai nėra ką daryti: reikia vadovautis minimax principu. Kitas dalykas, jei įmanoma „sumaišyti“ strategijų rinkinį, atsitiktinai kaitalioti su tam tikromis tikimybėmis. Mišrių strategijų panaudojimas sumanytas taip: žaidimas kartojamas daug kartų; prieš kiekvieną žaidimo žaidimą, kai žaidėjui duodamas asmeninis ėjimas, jis „paveda“ savo pasirinkimą atsitiktinumui, „meta lotus“ ir pasirenka tą strategiją, kuri iškrito (kaip organizuoti lotą jau žinome iš ankstesnio skyriaus ).

Mišrios strategijos žaidimo teorijoje yra kintančios, lanksčios taktikos modelis, kai nė vienas iš žaidėjų nežino, kaip priešininkas elgsis tam tikrame žaidime. Ši taktika (nors dažniausiai be jokio matematinio pagrindimo) dažnai naudojama kortų žaidimuose. Kartu atkreipkime dėmesį, kad geriausias būdas paslėpti savo elgesį nuo priešo yra suteikti jam atsitiktinį charakterį ir todėl iš anksto nežinoti, ką darysite.

Taigi, pakalbėkime apie mišrias strategijas. Pažymėsime mišrias žaidėjų strategijas BET ir AT atitinkamai S A = ( p 1 , R 2 , ..., p m), S B = (q 1 , q 2 , …, q n), kur p 1 , p 2 , …, p m(iš viso sudaro vieną) – žaidėjo naudojimosi tikimybė BET strategijos BET 1 , A 2 ,… , A m ; q 1 , q 2 , …, q n- žaidėjo naudojimo tikimybė AT strategijos AT 1 , AT 2 , ..., AT n . Konkrečiu atveju, kai visos tikimybės, išskyrus vieną, lygios nuliui, o ši – vienetui, mišri strategija virsta grynąja viena.

Yra pagrindinė žaidimų teorijos teorema: bet kuris dviejų asmenų nulinės sumos baigtinis žaidimas turi bent vieną sprendimą - optimalių strategijų pora, paprastai mišri
ir atitinkama kaina v.

Pora optimalių strategijų
žaidimo sprendimo sudarymas turi tokią savybę: jei vienas iš žaidėjų laikosi savo optimalios strategijos, tada kitam negali būti naudinga nukrypti nuo savo.Ši strategijų pora sudaro tam tikrą žaidimo pusiausvyrą: vienas žaidėjas nori padidinti pelną iki maksimumo, kitas iki minimumo, kiekvienas traukia savo kryptimi ir, esant protingam abiejų elgesiui, sukuria pusiausvyrą ir stabilumą. yra nustatytas pelnas. v. Jeigu v > 0, tada žaidimas mums pelningas, jei v< 0 - priešui; adresu v= 0 žaidimas yra „sąžiningas“, vienodai naudingas abiem dalyviams.

Apsvarstykite žaidimo be balno taško pavyzdį ir pateikite (be įrodymų) jo sprendimą. Žaidimas yra toks: du žaidėjai BET ir AT tuo pačiu metu ir nesakydamas nė žodžio parodyk vieną, du ar tris pirštus. Laimėjimas nustatomas pagal bendrą pirštų skaičių: jei jis lygus, laimi BET ir gauna iš AT suma lygi šiam skaičiui; jei nelyginis, tada atvirkščiai BET moka AT suma lygi tam skaičiui. Ką turėtų daryti žaidėjai?

Sukurkime žaidimo matricą. Viename žaidime kiekvienas žaidėjas turi tris strategijas: parodyti vieną, du ar tris pirštus. 3×3 matrica pateikta 26.5 lentelėje; papildomame dešiniajame stulpelyje rodomi eilutės minimumai, o papildomoje apatinėje eilutėje – stulpelio maksimumai.

Mažesnė žaidimo kaina α = - 3 ir atitinka strategiją A 1 . Tai reiškia, kad protingai, atsargiai elgdamiesi mes garantuojame, kad neprarasime daugiau nei 3. Maža paguoda, bet vis tiek geriau nei, tarkime, 5 laimėjimas, kuris atsiranda kai kuriose matricos ląstelėse. Blogai mums, žaidėjui BET... Bet paguoskime save:

varžovo padėtis atrodo dar prastesnė: mažesnė žaidimo kaina yra β = 4, t.y., protingai elgdamasis, jis duos mums mažiausiai 4. Apskritai padėtis nėra labai gera – nei vienam, nei žaidėjui. Kita pusė. Bet pažiūrėkime, ar galima jį patobulinti? Pasirodo, gali. Jei kiekviena pusė naudoja ne vieną gryną strategiją, o mišrią, kurioje

26.5 lentelė

Bj

A i

B 1

B 2

B 3

A 1

A 2

A 3

β j

pirmas ir trečias įeina su tikimybe 1/4, o antrasis – su tikimybe 1/2, t.y.

tada vidutinis laimėjimas bus pastoviai lygus nuliui (tai reiškia, kad žaidimas yra „sąžiningas“ ir vienodai naudingas abiem pusėms). Strategijos
formuoti žaidimo sprendimą ir jo kainą v= 0. Kaip radome šį sprendimą? Tai kitas klausimas. Kitame skyriuje parodysime, kaip paprastai sprendžiami baigtiniai žaidimai.

Apsvarstykite baigtinės nulinės sumos poros žaidimą. Pažymėti ažaidėjo atlyginimas A, ir per b- žaidėjo laimėjimas B. Nes a = –b, tuomet analizuojant tokį žaidimą nereikia svarstyti abiejų šių skaičių – pakanka atsižvelgti į vieno iš žaidėjų atsipirkimą. Tegul tai būna pvz. A. Toliau, pateikimo patogumui, pusė A mes sąlyginai pavadinsime " mes“ ir pusė B – "priešas".

Leiskite mums m galimos strategijos A 1 , A 2 , …, Esu, ir priešas n galimos strategijos B 1 , B 2 , …, B n(toks žaidimas vadinamas žaidimu m×n). Tarkime, kad kiekviena pusė pasirinko tam tikrą strategiją: mes pasirinkome Ai, priešininkas Bj. Jei žaidimas susideda tik iš asmeninių ėjimų, tada pasirenkamos strategijos Ai ir Bj vienareikšmiškai lemia žaidimo baigtį – mūsų laimėjimą (teigiamą ar neigiamą). Pažymime šį pelną kaip aij(laimi, kai pasirenkame strategiją Ai, o priešas – strategijos Bj).

Jei žaidime, be asmeninių atsitiktinių judesių, yra išmokėjimas už strategijų porą Ai, Bj yra atsitiktinis dydis, priklausantis nuo visų atsitiktinių judesių rezultatų. Šiuo atveju natūralus tikėtino pelno įvertinimas yra matematinis atsitiktinio laimėjimo lūkestis. Patogumui pažymėsime aij tiek pats laimėjimas (žaidime be atsitiktinių ėjimų), tiek jo matematinis lūkestis (žaidime su atsitiktiniais ėjimais).

Tarkime, mes žinome vertybes aij kiekvienai strategijų porai. Šios reikšmės gali būti parašytos kaip matrica, kurios eilutės atitinka mūsų strategijas ( Ai), o stulpeliai rodo priešininko strategijas ( Bj):

B j A i B 1 B 2 B n
A 1 a 11 a 12 a 1n
A 2 a 21 a 22 a 2n
Esu esu 1 esu 2 amn

Tokia matrica vadinama žaidimo išmokėjimo matrica arba tiesiog žaidimo matrica.

Atminkite, kad žaidimų su daugybe strategijų išmokų matricos sukūrimas gali būti sudėtinga užduotis. Pavyzdžiui, už šachmatų žaidimas galimų strategijų skaičius yra toks didelis, kad išmokėjimo matricos sudarymas praktiškai neįmanomas. Tačiau iš esmės bet koks baigtinis žaidimas gali būti redukuotas į matricos formą.

Apsvarstykite 1 pavyzdys 4 × 5 antagonistinis žaidimas. Mes turime keturias strategijas, o priešas turi penkias strategijas. Žaidimo matrica yra tokia:

B j A i B 1 B 2 B 3 B 4 B 5
A 1
A 2
A 3
A 4

Kokią strategiją turėtume (t. y. žaidėjas A) naudoti? Kad ir kokią strategiją pasirinktume, protingas priešas į ją atsakys ta strategija, kurią taikant mūsų atlygis bus minimalus. Pavyzdžiui, jei pasirenkame strategiją A 3 (vilioja laimėjimu 10), oponentas pasirinks atsakymo strategiją B 1 , o mūsų atlygis bus tik 1. Akivaizdu, kad remiantis atsargumo principu (ir tai yra pagrindinis žaidimo teorijos principas), turime pasirinkti strategiją, kurioje mūsų minimalus pelnas yra didžiausias.

Pažymėti a i minimali strategijos atsipirkimo vertė Ai:

ir pridėkite stulpelį su šiomis reikšmėmis prie žaidimo matricos:

B j A i B 1 B 2 B 3 B 4 B 5 mažiausiai eilėmis a i
A 1
A 2
A 3
A 4 maksimalus

Renkantis strategiją, turime pasirinkti tą, kurios vertė a i maksimalus. Pažymime šią didžiausią reikšmę α :

Vertė α paskambino mažesnė žaidimo kaina arba maksimalus(maksimalus minimalus laimėjimas). Žaidėjo strategija A atitinkantis maksiminą α , vadinamas maksimino strategija.

Šiame pavyzdyje maksimalus α yra lygus 3 (atitinkamas langelis lentelėje paryškintas pilkai), o maksimali strategija yra A keturi . Pasirinkę šią strategiją galime būti tikri, kad už bet kokį priešo elgesį laimime ne mažiau nei 3 (o gal ir daugiau su „neprotingu“ priešo elgesiu) Ši vertė yra mūsų garantuotas minimumas, kurį galime užtikrinti patys, laikydamiesi atsargiausios („perdraudimo“) strategijos.

Dabar mes atliksime panašius priešo samprotavimus B B A B 2 - mes jam atsakysime A .

Pažymėti βj A B) strategijai Ai:



βj β :

7. KAS YRA AUKŠTINĖS VERTĖS ŽAIDIMAS Dabar mes atliksime panašius priešininko samprotavimus B. Jis suinteresuotas sumažinti mūsų naudą, tai yra, duoti mums mažiau, tačiau jis turi pasikliauti mūsų elgesiu, kuris jam yra blogiausias. Pavyzdžiui, jei jis pasirenka strategiją B 1 , tada atsakysime jam strategija A 3 , ir jis duos mums 10. Jei pasirinks B 2 - mes jam atsakysime A 2, o jis duos 8 ir tt Akivaizdu, kad atsargus varžovas turi pasirinkti strategiją, kurioje mūsų didžiausias pelnas bus minimalus.

Pažymėti βj didžiausios vertės išmokėjimo matricos stulpeliuose (maksimali žaidėjo išmoka A, arba, kas yra tas pats, didžiausias žaidėjo pralaimėjimas B) strategijai Ai:

ir pridėkite eilutę su šiomis reikšmėmis prie žaidimo matricos:

Pasirinkęs strategiją, priešas pirmenybę teiks tajai, kuriai vertė βj minimumas. Pažymėkime tai β :

Vertė β paskambino aukščiausia žaidimo kaina arba minimalus maks(minimalus maksimalus laimėjimas). Minimax atitinkanti varžovo (žaidėjo) strategija B), vadinamas Minimax strategija.

Minimax yra pelno vertė, kurios daugiau protingas oponentas mums tikrai neduos (kitaip tariant, protingas priešininkas praras ne daugiau kaip β ). Šiame pavyzdyje minimax β yra lygus 5 (atitinkamas langelis lentelėje paryškintas pilkai) ir jis pasiekiamas naudojant priešininko strategiją B 3 .

Taigi, vadovaudamiesi atsargumo principu („visada tikėkis blogiausio!“), turime pasirinkti strategiją A 4 , o priešas – strategija B 3 . Atsargumo principas yra esminis žaidimų teorijoje ir vadinamas Minimax principas.

Apsvarstykite 2 pavyzdys. Tegul žaidėjai A ir AT vienas iš trijų skaičių rašomas vienu metu ir nepriklausomai vienas nuo kito: arba "1", arba "2", arba "3". Jei parašytų skaičių suma lygi, tai žaidėjas B moka žaidėjui Aši suma. Jei suma yra nelyginė, žaidėjas sumoka šią sumą Ažaidėjas AT.

Užsirašykime žaidimo išmokėjimo matricą ir suraskime apatinę ir viršutinę žaidimo kainas (strategijos numeris atitinka užrašytą skaičių):

Žaidėjas A turi laikytis maximin strategijos A 1 laimėti bent -3 (tai yra, pralaimėti daugiausia 3). Minimax žaidėjo strategija B bet kuri iš strategijų B 1 ir B 2, kuris garantuoja, kad jis duos ne daugiau kaip 4.

Tą patį rezultatą gausime, jei išmokėjimo matricą parašysime žaidėjo požiūriu AT. Tiesą sakant, ši matrica gaunama perkeliant matricą, sukurtą žaidėjo požiūriu A, ir elementų ženklų keitimas į priešingą (nuo žaidėjo išmokėjimo A yra žaidėjo praradimas AT):

Remiantis šia matrica, darytina išvada, kad žaidėjas B turi laikytis bet kurios iš strategijų B 1 ir B 2 (ir tada jis praras ne daugiau kaip 4), o žaidėjas A– strategijos A 1 (ir tada jis praras ne daugiau kaip 3). Kaip matote, rezultatas yra lygiai toks pat, kaip ir gautas aukščiau, todėl analizei nesvarbu, kurio žaidėjo požiūriu mes ją atliekame.

8 KAS YRA VERTINGAS ŽAIDIMAS.

9. IŠ KO SUDĖTI MINIMAX PRINCIPAS. 2. Žemutinė ir viršutinė žaidimo kaina. Minimax principas

Apsvarstykite tokio tipo matricinį žaidimą su išmokėjimo matrica

Jei žaidėjas BET pasirinks strategiją A i, tada visi galimi jo atpirkimai bus elementai i- matricos eilutė NUO. Blogiausia žaidėjui BET atvejis, kai žaidėjas AT taiko tinkamą strategiją minimumasšios linijos elementas, žaidėjo atlygis BET bus lygus skaičiui.

Todėl, norėdamas gauti didžiausią atlygį, žaidėjas BET reikia pasirinkti vieną iš strategijų, kurioms skaičius maksimalus.

Sisteminio požiūrio rėmuose nagrinėjamą sprendimų priėmimo problemą sudaro trys pagrindiniai komponentai: joje išskiriama sistema, valdymo posistemis ir aplinka. Dabar kreipiamės į sprendimų priėmimo problemų tyrimą, kai sistemą veikia ne viena, o keletas valdymo posistemių, kurių kiekviena turi savo tikslus ir veikimo galimybes. Toks sprendimų priėmimo metodas vadinamas žaidimo teoretiniu, o atitinkamų sąveikų matematiniai modeliai vadinami žaidimai. Dėl valdymo posistemių tikslų skirtumo, taip pat tam tikrų apribojimų, susijusių su galimybe keistis informacija tarp jų, šios sąveikos yra konfliktinio pobūdžio. Todėl bet koks žaidimas yra matematinis konflikto modelis. Mes apsiribojame tuo atveju, kai yra dvi valdymo posistemės. Jei sistemų tikslai yra priešingi, konfliktas vadinamas antagonistiniu, o matematinis tokio konflikto modelis. antagonistinis žaidimas..

Žaidimų teorinėje terminologijoje 1-asis valdymo posistemis vadinamas žaidėjas 1, 2-asis valdymo posistemis - žaidėjas 2, rinkiniai

jų alternatyvūs veiksmai vadinami strategijų rinkiniusšie žaidėjai. Leisti X- 1 žaidėjo strategijų rinkinys, Y- daug strategijų

2 žaidėjas. Sistemos būseną vienareikšmiškai lemia 1 ir 2 posistemių valdymo veiksmų pasirinkimas, tai yra strategijų pasirinkimas

xX ir yY. Leisti F(x,y) – naudingumo įvertinimas 1 tos valstybės žaidėjui

sistema, kuriai ji pereina, kai 1 žaidėjas pasirenka strategiją X ir

2 žaidėjo strategija adresu. Skaičius F(x,y) vadinamas laimėtižaidėjas 1 situacijoje ( x,y), ir funkcija F- žaidėjo 1 išmokėjimo funkcija. Žaidėjas laimi

1 taip pat yra 2 žaidėjo praradimas, tai yra vertė, kurią pirmasis žaidėjas siekia padidinti, o antrasis - sumažinti. Štai kas yra

konflikto antagonistinio pobūdžio pasireiškimas: žaidėjų interesai visiškai priešingi (ką laimi vienas, tą pralaimi).

Antagonistinį žaidimą natūraliai nustato sistema G=(X, Y, F).

Atkreipkite dėmesį, kad formaliai antagonistinis žaidimas iš tikrųjų nustatomas taip pat, kaip ir sprendimo priėmimo netikrumo sąlygomis problema – jei

2 valdymo posistemį tapatinti su aplinka. Esminis skirtumas tarp valdymo posistemio ir aplinkos yra tas

pirmojo elgesys yra tikslingas. Jei, sudarydami realaus konflikto matematinį modelį, turime priežastį (ar ketinimą) laikyti aplinką prieše, kurios tikslas yra

mums didžiausią žalą, tada tokia situacija gali būti vaizduojama kaip antagonistinis žaidimas. Kitaip tariant, antagonistinis žaidimas gali būti interpretuojamas kaip kraštutinis ZPR atvejis neapibrėžtumo sąlygomis,


pasižymi tuo, kad į aplinką žiūrima kaip į priešą, turintį tikslą. Kartu turime apriboti hipotezių tipus apie aplinkos elgesį.


Labiausiai čia pasitvirtina ypatingo atsargumo hipotezė, kai, priimdami sprendimą, pasikliaujame pačiu blogiausiu scenarijumi, kad galėtume veikti aplinkoje.

Apibrėžimas. Jeigu X ir Y yra baigtiniai, tada antagonistinis žaidimas vadinamas matrica. Matricos žaidime galime tai manyti X={1,…,n},

Y={1,…,m) ir įdėti aij=F(aš, j). Taigi, matricos žaidimas yra visiškai nulemtas matricos A=(aij), i=1,…,n, j=1,…,m.

3.1 pavyzdys. Žaidimas dviem pirštais.

Du žmonės vienu metu rodo vieną ar du pirštus ir skambina numeriu 1 arba 2, kurie, pasak kalbėtojo, reiškia skaičių

kitiems rodomi pirštai. Parodžius pirštus ir įvardijus skaičius, laimėjimai paskirstomi pagal šias taisykles:

jei abu atspėjo arba abu neatspėjo, kiek pirštų parodė priešininkas, kiekvieno atlygis lygus nuliui; jei tik vienas atspėjo teisingai, tada oponentas moka atspėjusiajam pinigų sumą, proporcingą bendram parodytam skaičiui

Tai antagonistinis matricos žaidimas. Kiekvienas žaidėjas turi keturias strategijas: 1 – parodyk 1 pirštą ir pasakyk 1, 2 – parodyk 1 pirštą ir pasakyk 2, 3 –

parodyk 2 pirštus ir pasakyk 1, 4 – parodyk 2 pirštus ir sakyk 2. Tada išmokėjimo matrica A=(aij), i= 1,…, 4, j= 1,…, 4 apibrėžiamas taip:

a12= 2, a21 = – 2, a13=a42=–3, a24=a31= 3, a34 = – 4, a43= 4,aij= 0 kitaip.

3.2 pavyzdys. Diskretiškas dvikovos tipo žaidimas.

Dvikovos tipo užduotys apibūdina, pavyzdžiui, dviejų žaidėjų kovą,

kurių kiekvienas nori atlikti kokį nors vienkartinį veiksmą (prekių siuntos išleidimas į rinką, paraiška pirkti aukcione) ir pasirenka tam laiką. Leiskite žaidėjams judėti vienas kito link nžingsniai. Po kiekvieno žingsnio žaidėjas gali šaudyti į priešininką arba ne. Kiekvienas žmogus gali turėti tik vieną šūvį. Manoma, kad tikimybė pataikyti į priešą, jei pažengsite į priekį k n =5 turi formą




 
Straipsniai įjungta tema:
Viskas, ką reikia žinoti apie SD atminties korteles, kad nesuklystumėte pirkdami Connect sd
(4 įvertinimai) Jei įrenginyje nepakanka vidinės atminties, galite naudoti SD kortelę kaip vidinę savo Android telefono atmintį. Ši funkcija, vadinama Adoptable Storage, leidžia Android OS formatuoti išorinę laikmeną
Kaip pasukti ratus „GTA Online“ ir daugiau – „GTA Online“ DUK
Kodėl neprisijungia gta online? Tai paprasta, serveris laikinai išjungtas / neaktyvus arba neveikia. Eikite į kitą Kaip išjungti internetinius žaidimus naršyklėje. Kaip išjungti „Online Update Clinet“ programos paleidimą „Connect Manager“? ... ant skkoko aš žinau, kada tu galvoji
Pikų tūzas kartu su kitomis kortomis
Dažniausios kortos interpretacijos: malonios pažinties pažadas, netikėtas džiaugsmas, anksčiau nepatirtos emocijos ir pojūčiai, dovanos gavimas, apsilankymas susituokusioje poroje. Širdelių tūzas, kortos reikšmė apibūdinant konkretų asmenį
Kaip teisingai sudaryti perkėlimo horoskopą Padarykite žemėlapį pagal gimimo datą su dekodavimu
Gimimo diagrama kalba apie įgimtas jo savininko savybes ir sugebėjimus, vietinė diagrama kalba apie vietines aplinkybes, kurias sukelia veiksmo vieta. Jie yra vienodos svarbos, nes daugelio žmonių gyvenimas praeina iš jų gimimo vietos. Sekite vietinį žemėlapį