антагонист тоглоом. Матрицын антагонист тоглоомуудыг шийдвэрлэх нь Матрицын антагонист тоглоомуудыг шийдвэрлэх зарчим

Тоглоомын онол нь зөрчилдөөн эсвэл тодорхойгүй байдлын нөхцөлд шийдвэр гаргах математик загваруудын онол юм. Тоглоом дахь талуудын үйлдэл нь тодорхой стратеги - үйлдлийн дүрмийн багцаар тодорхойлогддог гэж үздэг. Хэрэв нэг талын ашиг нь нөгөө талдаа ялагдал хүлээхэд хүргэдэг бол тэд антагонист тоглоомын тухай ярьдаг. Хэрэв стратегийн багц хязгаарлагдмал бол тоглоомыг матриц тоглоом гэж нэрлэдэг бөгөөд шийдлийг маш энгийнээр олж авах боломжтой. Тоглоомын онолын тусламжтайгаар олж авсан шийдлүүд нь өрсөлдөгчдийн эсэргүүцэл эсвэл гадаад орчны тодорхойгүй байдлын үед төлөвлөгөө гаргахад тустай.


Хэрэв биматрицын тоглоом нь антагонист байвал 2-р тоглогчийн өгөөжийн матрицыг 1-р тоглогчийн үр өгөөжийн матрицаар бүрэн тодорхойлно (эдгээр хоёр матрицын харгалзах элементүүд нь зөвхөн тэмдгээр ялгаатай). Иймд биматрицын антагонист тоглоомыг нэг матрицаар (1-р тоглогчийн өгөөжийн матриц) бүрэн дүрсэлсэн бөгөөд үүний дагуу матрицын тоглоом гэж нэрлэдэг.

Энэ тоглоом нь антагонист юм. Үүнд j \u003d x2 - O, P, ба R (O, O] \u003d H (P, P) \u003d -I ба R (O, P) \u003d R (P, O) \u003d 1, эсвэл матриц хэлбэрээр o p

Зарим төрлийн тоглоом Г "толин тусгал хаалттай" байг, өөрөөр хэлбэл. Тоглоом тус бүр нь толин тусгал изоморф тоглоомыг агуулдаг (өгөгдсөн тоглоомд толин тусгал изоморф байдаг бүх тоглоомууд бие биендээ изоморф байдаг тул бид саяхан хэлсэн зүйлийн дагуу нэг толин тусгал изоморф тоглоомын тухай ярьж болно). Ийм анги нь жишээлбэл, бүх антагонист тоглоомуудын ангилал эсвэл бүх матриц тоглоомуудын ангилал юм.

Антагонист тоглоомын хүлээн зөвшөөрөгдөх нөхцөл байдлын тодорхойлолтыг эргэн санахад, матрицын тоглоомын холимог өргөтгөл дэх нөхцөл байдал (X, Y) нь 1-р тоглогчийн хувьд зөвхөн ямар нэгэн x G x тэгш бус байдлын хувьд зөвшөөрөгдөх боломжтой болохыг олж мэдэв.

Тоглоомыг тэгш хэмтэй болгон хувиргах үйл явцыг тэгш хэмжилт гэж нэрлэдэг. Энд бид тэгш хэмийн нэг аргыг тайлбарлав. Симметрийн өөр өөр хувилбарыг 26.7-д өгнө. Тэгш хэмжилтийн эдгээр хоёр хувилбар нь дурын антагонист тоглоомуудад үнэн хэрэгтээ хамааралтай боловч зөвхөн матрицын тоглоомуудад зориулагдсан бөгөөд нотлогдох болно.

Тиймээс ерөнхий антагонист тоглоомын онолын анхны нэр томъёо, тэмдэглэгээ нь матриц тоглоомын онолын холбогдох нэр томъёо, тэмдэглэгээтэй давхцаж байна.

Хязгаарлагдмал антагонист (матриц) тоглоомуудын хувьд эдгээр экстремумууд байгааг бид 10-р бүлэгт нотолсон. 1, бүх гол зорилго нь тэдний тэгш байдлыг тогтоох, эсвэл ядаж тэдний тэгш бус байдлыг даван туулах арга замыг олох явдал байв.

Матрицын тоглоомуудыг авч үзэх нь тоглогчдын анх өгөгдсөн стратегиудад тэнцвэрийн нөхцөлгүй (мөн хангалттай бага e > 0 үед ч гэсэн цахим тэнцвэрт байдал байхгүй) антагонист тоглоомууд байдгийг аль хэдийн харуулж байна.

Гэхдээ төгсгөлтэй (матриц) тоглоом бүрийг хязгааргүй тоглоом болгон өргөжүүлж болно, жишээлбэл, тоглогч бүрд хэдэн ч давамгайлсан стратеги өгөх замаар (22 Бүлэг 1-ийг үзнэ үү). Мэдээжийн хэрэг, тоглогчийн стратегийн багцыг ингэж өргөжүүлэх нь түүний боломжуудыг өргөжүүлэх гэсэн үг биш бөгөөд өргөтгөсөн тоглоом дахь түүний бодит зан байдал нь анхны тоглоомын зан төлөвөөс ялгаатай байх ёсгүй. Тиймээс бид нэн даруй эмээлийн цэггүй, хязгааргүй антагонист тоглоомуудын хангалттай тооны жишээг олж авсан. Энэ төрлийн жишээнүүд бас бий.

Ийнхүү хязгааргүй антагонист тоглоомд максимин зарчмыг хэрэгжүүлэхийн тулд төгсгөлтэй (матриц) тоглоомын нэгэн адил тоглогчдын стратегийн чадавхийг тодорхой хэмжээгээр өргөжүүлэх шаардлагатай байна. 96-д зориулагдсан

Матриц тоглоомуудын нэгэн адил (1, 17-р бүлгийг үзнэ үү) ерөнхий антагонист тоглоомуудын хувьд холимог стратегийн спектрийн тухай ойлголт чухал үүрэг гүйцэтгэдэг бөгөөд энд илүү ерөнхий тодорхойлолтыг өгөх ёстой.

Эцэст нь дурын антагонист тоглоомын 1-р тоглогчийн бүх холимог стратегиудын багц нь матриц дээрхтэй адил болохыг анхаарна уу.

Антагонист тоглоомуудыг авч үзсэн ч гэсэн ийм олон тооны тоглоомууд, түүний дотор хязгаарлагдмал тоглоомууд нь анхны, цэвэр стратегиудад бус, зөвхөн ерөнхий, холимог стратегиудад тэнцвэртэй нөхцөл байдгийг харуулж байна. Тиймээс ерөнхий, антагонист бус, хамтын ажиллагаагүй тоглоомуудын хувьд тэнцвэрийн нөхцөл байдлыг холимог стратегиас хайх нь зүйн хэрэг юм.

Тиймээс, жишээ нь (Зураг 3.1-ийг үз), "Гүйцэтгэгч" нь зан үйлийн тодорхойгүй байдлыг бараг хэзээ ч шийдвэрлэх шаардлагагүй гэдгийг бид аль хэдийн тэмдэглэсэн. Гэхдээ бид "Администратор" төрлийн үзэл баримтлалын түвшинг авч үзвэл бүх зүйл эсрэгээрээ байна. Дүрмээр бол ийм "манай шийдвэр гаргагчид" тулгардаг тодорхойгүй байдлын гол төрөл бол "Зөрчилдөөн" юм. Энэ нь ихэвчлэн хатуу бус өрсөлдөөн гэдгийг одоо бид тодруулж болно. "Администратор" нь "байгалийн тодорхойгүй байдлын" нөхцөлд шийдвэр гаргах нь бага зэрэг тохиолддог бөгөөд тэр ч байтугай хатуу, антагонист зөрчилдөөнтэй тулгардаг. Нэмж дурдахад, "Администратор" шийдвэр гаргахдаа ашиг сонирхлын зөрчилдөөн үүсдэг, өөрөөр хэлбэл "нэг удаа", өөрөөр хэлбэл бидний ангилалд тэрээр зөвхөн нэг (заримдаа маш цөөн тооны) тоглоом тоглодог. Үр дагаврыг үнэлэх хэмжүүр нь тоон үзүүлэлтээс илүү чанарын шинж чанартай байдаг. "Администратор" -ын стратегийн бие даасан байдал нэлээд хязгаарлагдмал. Дээр дурдсан зүйлийг харгалзан үзвэл ийм хэмжээний асуудлын нөхцөл байдлыг ихэвчлэн хамтын бус антагонист бус хоёр матрицын тоглоом, түүнчлэн цэвэр стратеги ашиглан шинжлэх шаардлагатай гэж үзэж болно.

Матрицын антагонист тоглоомуудыг шийдвэрлэх зарчим

Үүний үр дүнд дээр дурдсан тоглоомонд өрсөлдөгчид сонгосон стратегиа баримтална гэж хүлээх нь үндэслэлтэй юм. Макс мин тав = мин макс Aiy> гэсэн матрицын антагонист тоглоом

Гэсэн хэдий ч бүх матрицын антагонист тоглоомууд нь маш тодорхой биш бөгөөд ерөнхий тохиолдолд

Тиймээс ерөнхий тохиолдолд хэмжээст /uxl матрицын антагонист тоглоомыг шийдэхийн тулд хос шугаман програмчлалын асуудлыг шийдвэрлэх шаардлагатай бөгөөд үр дүнд нь оновчтой стратеги, / болон тоглоомын өртөг v.

Хоёр хүний ​​матрицын антагонист тоглоомыг хэрхэн тодорхойлсон бэ?

Матрицын антагонист тоглоомуудыг хялбарчлах, шийдвэрлэх ямар аргууд байдаг вэ?

Хоёр хүний ​​​​тоглоомын хувьд тэдний ашиг сонирхлыг шууд эсрэг гэж үзэх нь зүйн хэрэг юм - тоглоом нь антагонист юм. Тиймээс нэг тоглогчийн өгөөж нь нөгөө тоглогчийн алдагдалтай тэнцүү байна (хоёр тоглогчийн өгөөжийн нийлбэр нь тэг тул тэг нийлбэртэй тоглоом гэж нэрлэсэн). Тоглогч бүр хязгаарлагдмал тооны хувилбартай тоглоомуудыг бид авч үзэх болно. Ийм тэг нийлбэртэй хоёр хүний ​​тоглоомын төлбөрийн функцийг матриц хэлбэрээр (өгөөжийн матриц хэлбэрээр) өгч болно.

Өмнө дурьдсанчлан эцсийн антагонист тоглоомыг матриц гэж нэрлэдэг.

MATRIX GAMES - хоёр тоглогч оролцдог антагонист тоглоомуудын ангилал бөгөөд тоглогч бүр хязгаарлагдмал тооны стратегитай байдаг. Хэрэв нэг тоглогч m стратеги, нөгөө тоглогч n стратегитай бол бид txn хэмжээст тоглоомын матрицыг байгуулж болно. М.и. эмээлийн цэгтэй ч байж болно, үгүй ​​ч байж болно. Сүүлчийн тохиолдолд

Москвагийн эрчим хүчний инженерийн дээд сургууль

(Техникийн их сургууль)

Лабораторийн тайлан

тоглоомын онолд

"Матриц хэлбэрээр өгөгдсөн хосолсон антагонист тоглоомын оновчтой стратеги хайх програм"

Оюутнууд бөглөсөн

бүлэг А5-01

Ашрапов Далер

Ашрапова Ольга

Тоглоомын онолын үндсэн ойлголтууд

шийдвэрлэх зорилготой тоглоомын онол зөрчилдөөнтэй нөхцөл байдал , өөрөөр хэлбэл өөр өөр зорилготой хоёр буюу түүнээс дээш талуудын ашиг сонирхол мөргөлдөх нөхцөл байдал.

Хэрэв талуудын зорилго шууд эсрэгээрээ байвал тэд ярьдаг антагонист мөргөлдөөн .

тоглоом зөрчилдөөний нөхцөл байдлын хялбаршуулсан албан ёсны загвар гэж нэрлэдэг.

Тоглоомыг эхнээс нь дуустал нэг удаа тоглохыг нэрлэдэг үдэшлэг . Намын үр дүн төлбөр (эсвэл ялна ).

Намаас бүрддэг хөдөлдөг , өөрөөр хэлбэл боломжит хувилбаруудаас тоглогчдыг сонгох.

Хөдөлгөөн байж болно хувийнболон Санамсаргүй.хувийн хөдөлгөөн , ялгаатай Санамсаргүй , тоглогч ямар нэг сонголтын ухамсартай сонголтыг илэрхийлдэг.

Дор хаяж нэг хувийн хөдөлгөөнтэй тоглоомуудыг дууддаг стратегийн .

Бүх хөдөлгөөнийг санамсаргүй байдлаар хийдэг тоглоомуудыг нэрлэдэг мөрийтэй тоглоом .

Хувийн алхам хийхдээ тэд бас ярьдаг стратеги тоглогч, өөрөөр хэлбэл. тоглогчийн сонголтыг тодорхойлдог дүрэм эсвэл багц дүрмийн тухай. Үүний зэрэгцээ стратеги нь цогц байх ёстой, i.e. Тоглолтын явцад гарч болох аливаа нөхцөл байдлын хувьд сонголтыг тодорхойлох ёстой.

Тоглоомын онолын сорилт- тоглогчдын оновчтой стратегийг олох, жишээлбэл. тэдэнд хамгийн их ашиг эсвэл хамгийн бага алдагдлыг өгдөг стратеги.

Тоглоомын онолын загваруудын ангилал

тоглоом nхүмүүсийг ихэвчлэн хаана гэж нэрлэдэг
i-р тоглогчийн стратегийн багц юм.
- тоглоомын төлбөр.

Энэхүү тэмдэглэгээний дагуу тоглоомын онолын загваруудын дараахь ангиллыг санал болгож болно.

Салангид (стратегийн багц салангид)

Финал

Төгсгөлгүй

Тасралтгүй (стратегийн багц Үргэлжилсэн)

Төгсгөлгүй

nхүмүүс (
)

эвсэл (хоршоо)

Хоршооллын бус (хоршоодын бус)

2 хүн (хосолсон)

Антагонист (тэг нийлбэртэй тоглоом)

(талуудын ашиг сонирхол эсрэгээрээ, өөрөөр хэлбэл нэг тоглогчийн алдагдал нь нөгөө тоглогчийн ашигтай тэнцүү байна)

Антагонист бус

Бүрэн мэдээлэлтэй (хэрэв хувийн нүүдэл хийж байгаа тоглогч тоглолтын түүхийг бүхэлд нь, өөрөөр хэлбэл өрсөлдөгчийнхөө бүх нүүдлийг мэддэг бол)

Бүрэн бус мэдээлэлтэй

Тэг дүнгээр (нийт төлбөр тэг)

Тэг биш нийлбэртэй

Нэг талын (сугалаа)

олон талт

Хосолсон антагонист тоглоомын матриц дүрслэл

Энэ зааварт бид авч үзэх болно хоёр хүний ​​антагонист тоглоомууд матриц хэлбэрээр өгсөн. Энэ нь бид эхний тоглогчийн (тоглогч) стратегийн багцыг мэддэг гэсэн үг юм А){ А би }, би = 1,…, мба хоёр дахь тоглогчийн стратегийн багц (тоглогч Б){ Б j }, j = 1,..., n, болон матриц А = || а ij || анхны тоглогчийн ашиг. Бид антагонист тоглоомын тухай ярьж байгаа тул эхний тоглогчийн ашиг хоёр дахь тоглогчийн алдагдалтай тэнцүү байна гэж үздэг. Бид матрицын элемент гэж үздэг а ijнь стратеги сонгохдоо эхний тоглогчийн өгөөж юм А бистратеги бүхий хоёр дахь тоглогчийн хариулт Б j. Бид ийм тоглоомыг дурдах болно
, хаана м - тоглогчдын стратегийн тоо ГЭХДЭЭ,n - тоглогчдын стратегийн тоо AT.Ерөнхийдөө үүнийг дараах хүснэгтээр илэрхийлж болно.

Б 1

Б j

Б n

А 1

А би

А м

Жишээ 1

Энгийн жишээ болгон, тоглоом нь хоёр хөдөлгөөнөөс бүрддэг тоглоомыг авч үзье.

1-р алхам: Тоглогч ГЭХДЭЭөрсөлдөгчдөө сонголтоо хэлэлгүйгээр тоонуудын аль нэгийг (1 эсвэл 2) сонгоно.

2 дахь алхам: Тоглогч ATтоонуудын аль нэгийг сонгоно (3 эсвэл 4).

Үр дүн: Тоглогчийн сонголт ГЭХДЭЭболон ATнэмэх. Хэрэв нийлбэр тэгш байвал ATтоглогчид үнэ цэнээ төлдөг ГЭХДЭЭ, хэрэв сондгой бол - эсрэгээр, ГЭХДЭЭтоглогчид мөнгө төлдөг AT.

Энэ тоглоомыг төлөөлж болно
дараах байдлаар:

(3-р сонголт)

(4-р сонголт)

(1-р сонголт)

(сонголт 2)

Үүнийг харахад амархан энэ тоглоомантагонист байна, Үүнээс гадна, Энэ нь бүрэн бус мэдээлэл нь тоглоом юм, оноос хойш тоглогч AT,хувийн нүүдэл хийхдээ тоглогч ямар сонголт хийсэн нь тодорхойгүй байна ГЭХДЭЭ.

Дээр дурдсанчлан тоглоомын онолын даалгавар бол тоглогчдын оновчтой стратегийг олох явдал юм. тэдэнд хамгийн их ашиг эсвэл хамгийн бага алдагдлыг өгдөг стратеги. Энэ процессыг нэрлэдэг тоглоомын шийдвэр .

Тоглоомыг матриц хэлбэрээр шийдвэрлэхдээ тоглоом байгаа эсэхийг шалгах хэрэгтэй эмээлийн цэг . Үүний тулд хоёр утгыг нэвтрүүлсэн:

нь тоглоомын үнийн доод хязгаар бөгөөд

тоглоомын үнийн дээд тооцоо юм.

Эхний тоглогч хоёр дахь тоглогчийн боломжит бүх хариултаас хамгийн их ашиг авах стратегийг сонгох бөгөөд хоёр дахь нь эсрэгээрээ өөрийн алдагдлыг багасгах стратегийг сонгох болно, жишээлбэл. эхний хожих боломжтой.

Үүнийг баталж болно α ≤ В ≤ β , хаана Втоглоомын үнэ , өөрөөр хэлбэл, эхний тоглогчийн боломжит ашиг.

Хэрэв харилцаа α = β = В, дараа нь тэд ингэж хэлдэг тоглоом нь эмээл цэгтэй
, ба цэвэр стратегиар шийдэгдсэн . Өөрөөр хэлбэл, хэд хэдэн стратеги байдаг
, тоглогч өгөх ГЭХДЭЭВ.

Жишээ 2

1-р жишээнд авч үзсэн тоглоом руугаа буцаж очоод эмээлийн цэг байгаа эсэхийг шалгацгаая.

(3-р сонголт)

(4-р сонголт)

(1-р сонголт)

(сонголт 2)

Энэ тоглоомын хувьд
= -5,
= 4,
, тиймээс энэ нь эмээлийн цэггүй.

Дахин хэлэхэд энэ тоглоом нь бүрэн бус мэдээллийн тоглоом гэдгийг анхаарна уу. Энэ тохиолдолд та зөвхөн тоглогчдод зөвлөгөө өгөх боломжтой ГЭХДЭЭстратеги сонгох , учир нь Энэ тохиолдолд тэрээр хамгийн их ашиг авах боломжтой, гэхдээ тоглогч сонгосон тохиолдолд ATстратеги .

Жишээ 3

1-р жишээнээс тоглоомын дүрэмд зарим өөрчлөлт оруулъя. Тоглогчоо өгье ATтоглогч сонгох мэдээлэл ГЭХДЭЭ.Дараа нь ATХоёр нэмэлт стратеги байдаг:

- ашигтай стратеги ГЭХДЭЭ.Сонголттой бол A - 1,тэгээд ATсонголттой бол 3-ыг сонгоно A - 2,тэгээд AT 4-ийг сонгоно;

- ашиггүй стратеги ГЭХДЭЭ.Сонголттой бол A - 1,тэгээд ATсонголттой бол 4-ийг сонгоно A - 2,тэгээд AT 3-ыг сонгодог.

(3-р сонголт)

(4-р сонголт)

(1-р сонголт)

(сонголт 2)

Энэ тоглоом нь мэдээллээр дүүрэн байдаг.

Энэ тохиолдолд
= -5,
= -5,
, иймээс тоглоом нь эмээлийн цэгтэй
. Энэ эмээлийн цэг нь хоёр хос оновчтой стратегитай тохирч байна:
болон
. Тоглоомын үнэ В= -5. төлөө гэдэг нь ойлгомжтой ГЭХДЭЭэнэ тоглоом ашиггүй.

Жишээ 2 ба 3 нь тоглоомын онолоор батлагдсан дараах теоремын сайн дүрслэл юм.

Теорем 1

Төгс мэдээлэл бүхий хосолсон антагонист тоглоом бүрийг цэвэр стратегиар шийддэг.

Тэр. Теорем 1-д: Төгс мэдээлэл бүхий хоёр хүний ​​тоглоом нь эмээл цэгтэй бөгөөд цэвэр стратеги хостой байдаг.
, тоглогч өгөх ГЭХДЭЭтоглоомын үнэтэй тэнцэх тогтвортой ашиг В.

Эмээлийн цэг байхгүй тохиолдолд гэж нэрлэгддэг холимог стратеги :, хаана х би болонq jстратеги сонгох магадлалууд юм А би болон Б jэхний болон хоёр дахь тоглогчид тус тус. Энэ тохиолдолд тоглоомын шийдэл бол хосолсон стратеги юм
тоглоомын үнийн математикийн хүлээлтийг дээд зэргээр нэмэгдүүлэх.

Бүрэн бус мэдээлэлтэй тоглоомын тохиолдолд Теорем 1-ийн ерөнхий дүгнэлт нь дараах теорем юм.

Теорем 2

Аливаа хосолсон антагонист тоглоом нь дор хаяж нэг оновчтой шийдэлтэй, өөрөөр хэлбэл ерөнхий тохиолдолд хосолсон стратегитай байдаг.
, тоглогч өгөх ГЭХДЭЭтоглоомын үнэтэй тэнцэх тогтвортой ашиг В, үүнээс гадна α ≤ В ≤ β .

Онцгой тохиолдолд, эмээлийн цэгтэй тоглоомын хувьд холимог стратеги дахь шийдэл нь нэг элемент нь нэг, үлдсэн хэсэг нь тэгтэй тэнцүү байх хос вектор шиг харагдаж байна.

Тоглоомын онолд нарийвчлан боловсруулсан хамгийн энгийн тохиолдол бол тэг нийлбэртэй төгсгөлтэй хос тоглоом (хоёр хүн эсвэл хоёр эвслийн эсрэг тэсрэг тоглоом) юм. Энэ тоглоомыг анхаарч үзээрэй Г, хоёр тоглогчтой ГЭХДЭЭболон AT,эсрэг ашиг сонирхолтой байх: нэгнийх нь ашиг нөгөөгийнх нь алдагдалтай тэнцүү байна. Тоглогчийн цалингаас хойш ГЭХДЭЭтоглогчийн өгөөжтэй тэнцүү байна -тэй хамтэсрэг тэмдэг, бид зөвхөн үр өгөөжийг сонирхож болно атоглогч ГЭХДЭЭ.Байгалийн, ГЭХДЭЭдээд зэргээр нэмэгдүүлэхийг хүсдэг ба AT -багасгах а.Энгийн байхын тулд өөрсдийгөө тоглогчдын аль нэгтэй нь сэтгэцгээе тодорхойлъё (үүнийг зөвшөөр ГЭХДЭЭ)мөн бид түүнийг "бид", мөн тоглогч гэж нэрлэх болно AT -"өрсөлдөгч" (мэдээжийн хэрэг, бодит давуу тал байхгүй ГЭХДЭЭүүнээс гарахгүй). Байгаа тболомжит стратеги ГЭХДЭЭ 1 , А 2 , ..., ГЭХДЭЭ м, мөн дайсан nболомжит стратеги AT 1 , АТ 2 , ..; AT n(ийм тоглоомыг тоглоом гэж нэрлэдэг т × n). Тэмдэглэх а ijстратегийг ашиглавал бидний ашиг А би , дайсан бол стратеги юм Б j .

Хүснэгт 26.1

А би

Б j

Б 1

Б 2

Б n

А 1

А 2

А м

а 11

а 21

а м1

а 21

а м

а 1 n

а 2 n

а mn

А стратеги бүрийн хувьд гэж бодъё<, AT,ялалт (эсвэл дундаж ялалт) а, jбид мэднэ. Дараа нь зарчмын хувьд тоглогчдын стратеги болон харгалзах өгөөжийг жагсаасан тэгш өнцөгт хүснэгтийг (матриц) эмхэтгэх боломжтой (хүснэгт 26.1-ийг үзнэ үү).

Хэрэв ийм хүснэгтийг эмхэтгэсэн бол бид тоглоом гэж хэлдэг Гматриц хэлбэрт шилжүүлсэн (өөрөөр хэлбэл тоглоомыг ийм хэлбэрт оруулах нь маш олон тооны стратегийн улмаас хэцүү ажил, заримдаа бараг боломжгүй байж болно). Хэрэв тоглоомыг матриц хэлбэрт оруулбал олон хөдөлгөөнт тоглоом нь нэг нүүдлийн тоглоом болж буурна гэдгийг анхаарна уу - тоглогч зөвхөн нэг нүүдэл хийх шаардлагатай: стратеги сонгох. Бид тоглоомын матрицыг товчхон тэмдэглэх болно ( а ij).

Тоглоомын жишээг авч үзье Г(4×5) матриц хэлбэрээр. Бидний мэдэлд (сонгохын тулд) дөрвөн стратеги, дайсан таван стратегитай. Тоглоомын матрицыг 26.2-р хүснэгтэд үзүүлэв

Бид ямар стратеги (тоглогч ГЭХДЭЭ)давуу талыг ашиглах уу? Матриц 26.2 нь "10" гэсэн сэтгэл татам үр өгөөжтэй; Бид стратеги сонгоход татагдаж байна ГЭХДЭЭ 3 , Үүний дараа бид энэ "мэдээлэл" авах болно. Хүлээгээрэй, дайсан ч бас тэнэг биш! Хэрэв бид стратеги сонговол ГЭХДЭЭ 3 , Тэр биднийг үл тоомсорлохын тулд стратеги сонгох болно AT 3 , Тэгээд бид "1"-ийн өрөвдөлтэй үр дүнг авдаг. Үгүй ээ, стратеги сонго ГЭХДЭЭ 3 энэ нь хориотой! Яаж байх вэ? Мэдээжийн хэрэг, болгоомжтой байх зарчим (мөн энэ нь тоглоомын онолын гол зарчим) дээр үндэслэн бид сонгох ёстой

Хүснэгт 26.2

Б j

А би

Б 1

Б 2

Б 3

Б 4

Б 5

А 1

А 2

А 3

А 4

стратеги нь бидний хамгийн бага ашиг хамгийн их байна.Энэ бол "минимакс зарчим" гэж нэрлэгддэг: дайсны хамгийн муу зан авирыг хийснээр та хамгийн их ашиг олох болно.

Бид 26.2-р хүснэгтийг дахин бичиж, баруун талын нэмэлт баганад бид мөр бүрт төлбөрийн хамгийн бага утгыг бичнэ, (мөрийн хамгийн бага); -д зориулъя би-р эгнээ α би(хүснэгт 26.3-ыг үзнэ үү).

Хүснэгт 26.3

Б j

А би

Б 1

Б 2

Б 3

Б 4

Б 5

А 1

А 2

А 3

А 4

β j

Бүх үнэт зүйлсээс α би(баруун багана) хамгийн том (3)-ыг тодруулсан. Энэ нь стратегид нийцдэг Адөрөв. Энэ стратегийг сонгосны дараа бид ямар ч тохиолдолд (дайсны аливаа зан үйлийн хувьд) 3-аас багагүй ашиг хүртэх болно гэдэгт итгэлтэй байж болно. Энэ үнэ цэнэ нь бидний баталгаатай ашиг юм; болгоомжтой байгаарай, бид үүнээс бага авч чадахгүй (би илүү авч магадгүй). Энэ өгөөжийг тоглоомын доод үнэ гэж нэрлэдэг (эсвэл "максимин" - хамгийн бага өгөөжийн дээд хэмжээ). Бид үүнийг тэмдэглэх болно а.Манай тохиолдолд α = 3.

Одоо дайсны үзэл бодлыг авч, түүний төлөө мэтгэлцье. Тэр ямар нэгэн ломбард биш, бас боломжийн! Стратеги сонгохдоо тэр бага өгөхийг хүсч байгаа ч бидний зан авирыг найдах ёстой бөгөөд энэ нь түүний хувьд хамгийн муу зүйл юм. Хэрэв тэр стратеги сонгосон бол AT 1 , бид түүнд хариулах болно ГЭХДЭЭ 3 , мөн тэр 10 өгөх болно; хэрэв тэр сонгосон бол Б 2 - бид түүнд хариулах болно ГЭХДЭЭ 2 , тэр 8 гэх мэтийг өгөх болно. Бид 26.3-р хүснэгтэд нэмэлт доод мөр нэмж, β баганын дээд хэмжээг бичнэ. j. Мэдээжийн хэрэг, болгоомжтой дайсан нь энэ утгыг багасгах стратегийг сонгох ёстой (5-ын харгалзах утгыг Хүснэгт 26.3-т онцолсон болно). β-ийн энэ утга нь ашгийн үнэ цэнэ бөгөөд үүнээс илүү боломжийн өрсөлдөгч бидэнд өгөхгүй нь гарцаагүй. Үүнийг тоглоомын дээд үнэ гэж нэрлэдэг (эсвэл "minimax" - хамгийн их хожлын доод хэмжээ). Бидний жишээн дээр β = 5 бөгөөд энэ нь өрсөлдөгчийн стратегийн тусламжтайгаар хийгддэг Б 3 .

Тиймээс болгоомжтой байх зарчмыг ("үргэлж хамгийн муу зүйлд найдаж бай!" Давхар даатгалын дүрэм) үндэслэн бид стратеги сонгох ёстой. ГЭХДЭЭ 4 , ба дайсан - стратеги AT 3 . Ийм стратегийг "minimax" гэж нэрлэдэг (minimax зарчмын дагуу). Бидний жишээн дээрх хоёр тал минимакс стратегиа баримталж байгаа цагт үр дүн нь гарах болно а 43 = 3.

Одоо бид дайсан стратеги баримталж байгааг мэдсэн гэж төсөөлөөд үз дээ AT 3 . Алив, үүний төлөө түүнийг шийтгэж, стратеги сонгоцгооё ГЭХДЭЭ 1 - Бид 5-ыг авах болно, энэ нь тийм ч муу биш юм. Гэвч эцсийн эцэст, дайсан нь бас мисс биш юм; түүнд бидний стратеги гэдгийг мэдэгдээрэй ГЭХДЭЭ 1 ; Тэр бас сонгохдоо хурдан байдаг AT 4 , бидний өгөөжийг 2 болгон бууруулах гэх мэт (түншүүд "стратегийн талаар яаран"). Нэг үгээр хэлбэл, бидний жишээн дээрх минимакс стратеги -тай холбоотой тогтворгүйруу нөгөө талын зан байдлын талаархи мэдээлэл;Эдгээр стратеги нь тэнцвэрийн шинж чанартай байдаггүй.

Дандаа ийм байдаг юм уу? Үгүй ээ, үргэлж биш. Хүснэгт 26.4-т өгсөн матрицтай жишээг авч үзье.

Энэ жишээнд тоглоомын доод үнэ нь дээд үнэтэй тэнцүү байна. α = β = 6. Үүнээс юу гарах вэ? Minimax тоглогчийн стратеги ГЭХДЭЭболон ATтогтвортой байх болно. Хоёр тоглогч хоёулаа тэднийг дагаж мөрдвөл ашиг нь 6. Хэрэв бид юу болохыг харцгаая (ГЭХДЭЭ)дайсан гэдгийг мэднэ (АТ)

Хүснэгт 26.4

Бj

А би

Б 1

Б 2

Б 3

Б 4

А 1

А 2

А 3

β j

стратегийг баримталдаг Б 2 ? Тэгээд яг юу ч өөрчлөгдөхгүй. Учир нь стратегийн аливаа хазайлт ГЭХДЭЭ 2 зөвхөн бидний нөхцөл байдлыг улам дордуулж чадна. Үүний нэгэн адил дайсны хүлээн авсан мэдээлэл нь түүнийг стратегиасаа ухрахад хүргэхгүй. AT 2 . Хос стратеги ГЭХДЭЭ 2 , Б 2 тэнцвэрийн шинж чанарыг (тэнцвэртэй хос стратеги) эзэмшдэг бөгөөд энэ хос стратегиар олж авсан үр өгөөжийг (манай тохиолдолд 6) "матрицын эмээл цэг" 1 гэж нэрлэдэг). Эмээлийн цэг, тэнцвэртэй хос стратеги байгаагийн шинж тэмдэг бол тоглоомын доод ба дээд үнийн тэгш байдал юм; α ба β-ийн нийтлэг утгыг тоглоомын үнэ гэж нэрлэдэг. Бид үүнийг тэмдэглэнэ v:

α = β = v

Стратеги А би , Б j(энэ тохиолдолд ГЭХДЭЭ 2 , АТ 2 ), Үүний үр дүнд хүрэхийн тулд оновчтой цэвэр стратеги гэж нэрлэдэг бөгөөд тэдгээрийн цогцыг тоглоомын шийдэл гэж нэрлэдэг. Энэ тохиолдолд тоглоом өөрөө цэвэр стратегиар шийдэгддэг гэж хэлдэг. Хоёр тал ГЭХДЭЭболон ATТэдний байр суурь аль болох хамгийн сайн байх нь тэдний оновчтой стратегийг зааж өгч болно. Тоглогч гэж юу вэ ГЭХДЭЭэнэ тохиолдолд 6 ялалт, мөн тоглогч AT -алддаг 6, - сайн, Эдгээр нь тоглоомын нөхцөл юм: Тэд ашигтай байдаг ГЭХДЭЭболон сул талтай AT

1) "Эмээл цэг" гэсэн нэр томъёог геометрээс авсан - энэ нь нэг координатын дагуух хамгийн бага, нөгөөгийн дагуух хамгийн дээд цэгт нэгэн зэрэг хүрэх гадаргуу дээрх цэгийн нэр юм.

Уншигчдад асуулт гарч ирж магадгүй: яагаад оновчтой стратегийг "цэвэр" гэж нэрлэдэг вэ? Урагшаа харж байгаад энэ асуултад хариулъя: "холимог" стратеги байдаг бөгөөд тэдгээр нь тоглогч нэг стратеги биш, хэд хэдэн стратеги ашигладаг бөгөөд тэдгээрийг санамсаргүй байдлаар сольж өгдөг. Тиймээс, хэрэв бид зөвшөөрвөл, цэвэр стратегиас гадна холимог стратеги, ямар ч тоглоомын төгсгөлшийдэлтэй - тэнцвэрийн цэг. Гэхдээ бид атомын тухай ярьсаар л байна.

Тоглоомонд эмээлийн цэг байх нь дүрэм биш, харин үл хамаарах зүйл юм. Ихэнх тоглоомуудад эмээлийн цэг байдаггүй. Гэсэн хэдий ч үргэлж эмээлийн цэгтэй байдаг тул цэвэр стратегиар шийдэгддэг олон төрлийн тоглоомууд байдаг. Эдгээр нь "бүрэн мэдээлэл бүхий тоглоомууд" гэж нэрлэгддэг тоглоомууд юм. Мэдээллийн тавиур бүхий тоглоом нь тоглогч бүр өөрийн хөгжлийн түүхийг бүхэлд нь, өөрөөр хэлбэл хувийн болон санамсаргүй байдлаар өмнөх бүх нүүдлийн үр дүнг мэддэг тоглоом юм. Бүрэн мэдээлэл бүхий тоглоомуудын жишээ бол даам, шатар, тик-так-тое гэх мэт тоглоомууд юм.

Тоглоомын онолын хувьд энэ нь батлагдсан бүрэн мэдээлэл бүхий тоглоом бүр эмээлийн цэгтэй,Тиймээс үүнийг цэвэр стратегиар шийдэж болно. Төгс мэдээлэл бүхий тоглоом бүрт тоглоомын гинжин хэлхээтэй тэнцэхүйц тогтвортой ашиг өгдөг хос оновчтой стратеги байдаг. v. Хэрэв ийм тоглоом нь зөвхөн хувийн нүүдлээс бүрддэг бол тоглогч бүр өөрийн оновчтой стратегийг хэрэгжүүлэхэд энэ нь тодорхой байдлаар дуусах ёстой - тоглоомын үнэтэй тэнцэх өгөөжтэй байх ёстой. Тиймээс, хэрэв тоглоомын шийдэл нь мэдэгдэж байвал тоглоом өөрөө утгаа алддаг!

Бүрэн мэдээлэл бүхий тоглоомын энгийн жишээг авч үзье: хоёр тоглогч ээлжлэн дугуй ширээн дээр никель байрлуулж, зоосны төвийн байрлалыг дур мэдэн сонгоно (зоосыг харилцан давхцахыг хориглоно). Сүүлчийн пенни (бусад явах зайгүй үед) тавьсан хүн ялагч болно. Энэ тоглоомын үр дүн нь үндсэндээ урьдчилан таамагласан дүгнэлт гэдгийг харахад хялбар байдаг. Зоосоо түрүүлж тавьсан тоглогч хождог тодорхой стратеги байдаг. Тухайлбал, тэр эхлээд ширээний голд никель тавьж, дараа нь өрсөлдөгчийнхөө хөдөлгөөн бүрт тэгш хэмтэй хөдөлгөөнөөр хариулах ёстой. Өрсөлдөгч нь яаж аашилсан ч ялагдахаас зайлсхийж чадахгүй нь ойлгомжтой. Шатар, ерөнхийдөө бүрэн мэдээлэл бүхий тоглоомуудын хувьд нөхцөл байдал яг адилхан: матриц хэлбэрээр бичигдсэн аль нэг нь эмээлийн цэгтэй тул шийдэл нь цэвэр стратеги байдаг тул зөвхөн энэ тохиолдолд л утга учиртай болно. шийдэл олдсонгүй. Шатар тоглоомыг аль аль нь гэж бодъё үргэлжЦагаан ялалтаар төгсдөг, эсвэл үргэлж -хар ялалт, эсвэл үргэлж -сугалаа, зөвхөн яг юугаар бол - бид хараахан мэдэхгүй байна (азаар шатар сонирхогчдод). Өөр нэг зүйлийг нэмж хэлье: ойрын ирээдүйд бид үүнийг мэдэхгүй, учир нь стратегийн тоо маш их тул тоглоомыг матриц хэлбэрт оруулах, эмээлийн цэгийг олоход маш хэцүү (хэрэв боломжгүй бол).

Одоо тоглоомонд эмээлийн цэг байхгүй бол яах вэ гэж өөрөөсөө асууя: α ≠ β ? За, хэрэв тоглогч бүр нэгийг нь сонгохоос өөр аргагүйд хүрвэл - цорын ганц цэвэр стратеги бол хийх зүйл байхгүй: хүн minimax зарчмаар удирдагдах ёстой. Өөр нэг зүйл бол хэд хэдэн стратегийг санамсаргүй байдлаар зарим магадлалаар "холих" боломжтой юм. Холимог стратеги ашиглах нь ийм байдлаар хийгдсэн: тоглоом олон удаа давтагддаг; Тоглолтын тоглолт бүрийн өмнө тоглогчид хувийн нүүдэл хийх үед тэр сонголтоо "даатгаж", "шөөг шидэж", унасан стратегийг авдаг (бид өмнөх бүлгээс багцаа хэрхэн зохион байгуулахаа аль хэдийн мэддэг болсон) ).

Тоглоомын онол дахь холимог стратеги нь тухайн тоглоомонд өрсөлдөгчөө хэрхэн авч явахыг тоглогчдын хэн нь ч мэдэхгүй байх үед өөрчлөгдөж болох, уян хатан тактикийн загвар юм. Энэ тактикийг (ихэвчлэн математикийн үндэслэлгүй ч) карт тоглоомонд ихэвчлэн ашигладаг. Өөрийнхөө зан авирыг дайснаас нуух хамгийн сайн арга бол түүнд санамсаргүй шинж чанар өгөх, тиймээс юу хийхээ урьдчилан мэдэхгүй байх явдал гэдгийг бид нэгэн зэрэг тэмдэглэе.

Тиймээс холимог стратегийн талаар ярилцъя. Бид тоглогчдын холимог стратегийг илэрхийлэх болно ГЭХДЭЭболон ATтус тус С A = ( х 1 , Р 2 , ..., х м), С Б = (q 1 , q 2 , …, q n), хаана х 1 , х 2 , …, х м(нийт нэгийг бүрдүүлэх) - тоглогчийн ашиглах магадлал ГЭХДЭЭстратеги ГЭХДЭЭ 1 , А 2 ,… , А м ; q 1 , q 2 , …, q n- тоглогч ашиглах магадлал ATстратеги AT 1 , AT 2 , ..., AT n . Тодорхой тохиолдолд нэгээс бусад бүх магадлал тэгтэй тэнцүү, энэ нь нэгтэй тэнцүү байх үед холимог стратеги нь цэвэр нэг болж хувирдаг.

Тоглоомын онолын үндсэн теорем байдаг: Ямар ч хоёр хүний ​​тэг нийлбэртэй төгсгөлтэй тоглоом дор хаяж нэг шийдэлтэй байдаг -хос оновчтой стратеги, ерөнхийдөө холимог
болон харгалзах үнэ v.

Хос оновчтой стратеги
Тоглоомын шийдлийг бүрдүүлэх нь дараахь шинж чанартай байдаг. Хэрэв тоглогчдын аль нэг нь оновчтой стратегиа баримталж байвал нөгөөгөөсөө өөрөөсөө хазайх нь ашигтай байж чадахгүй.Энэ хос стратеги нь тоглоомын нэг төрлийн тэнцвэрийг бүрдүүлдэг: нэг тоглогч ашгаа дээд тал руу, нөгөө нь хамгийн бага руу эргүүлэхийг хүсч, тус бүр өөрийн чиглэлд татдаг бөгөөд хоёулангийнх нь зохистой зан үйлийн дагуу тэнцвэр, тогтвортой байдлыг бий болгодог. олз тогтоогдсон. v.Хэрвээ v > 0, дараа нь тоглоом нь бидэнд ашигтай бол v< 0 - дайсны төлөө; цагт v= 0 тоглоом "шударга" бөгөөд оролцогчид хоёуланд нь адилхан ашиг тустай.

Эмээлийн цэггүй тоглоомын жишээг авч үзээд түүний шийдлийг (нотолгоогүйгээр) өг. Тоглоом дараах байдалтай байна: хоёр тоглогч ГЭХДЭЭболон ATнэгэн зэрэг, юу ч хэлэлгүйгээр нэг, хоёр, гурван хуруугаа харуул. Ялалт нь нийт хурууны тоогоор тодорхойлогддог: хэрэв тэгш бол ялна ГЭХДЭЭ-аас хүлээн авдаг ATэнэ тоотой тэнцэх дүн; сондгой бол эсрэгээрээ ГЭХДЭЭтөлдөг ATэнэ тоотой тэнцэх дүн. Тоглогчид юу хийх ёстой вэ?

Тоглоомын матриц үүсгэцгээе. Нэг тоглоомонд тоглогч бүр гурван стратегитай байдаг: нэг, хоёр, гурван хуруугаа харуул. 3×3 матрицыг Хүснэгт 26.5-д үзүүлэв; баруун талын нэмэлт багана нь мөрний минимумыг, нэмэлт доод мөрөнд баганын максимумыг харуулна.

Тоглоомын доод үнэ α = - 3 бөгөөд стратегитай тохирч байна А 1 . Энэ нь боломжийн, болгоомжтой зан үйлийн хувьд бид 3-аас илүүг алдахгүй гэсэн үг юм. Жижиг тайтгарал, гэхдээ матрицын зарим эсэд тохиолддог 5-ын ялалтаас илүү сайн хэвээр байна. Тоглогч бидний хувьд муу ГЭХДЭЭ...Гэхдээ өөрсдийгөө тайвшруулцгаая:

Өрсөлдөгчийн байр суурь бүр ч дордох шиг байна: тоглоомын бага өртөг нь β = 4, өөрөөр хэлбэл, боломжийн зан авиртай бол тэр бидэнд дор хаяж 4 өгөх болно. Ерөнхийдөө энэ байр суурь тийм ч сайн биш - нэг ч биш, нөгөө нь ч биш. нөгөө тал. Гэхдээ үүнийг сайжруулах боломжтой эсэхийг харцгаая? Чи чадна гэж харагдаж байна. Хэрэв тал бүр нэг цэвэр стратеги биш, харин холимог стратеги ашигладаг бол

Хүснэгт 26.5

Бj

А би

Б 1

Б 2

Б 3

А 1

А 2

А 3

β j

эхний болон гурав дахь нь 1/4 магадлалаар, хоёр дахь нь 1/2 магадлалаар ордог, өөрөөр хэлбэл.

тэгвэл дундаж ашиг нь тэгтэй тэнцүү байх болно (энэ нь тоглоом "шударга" бөгөөд хоёр талдаа адилхан ашигтай гэсэн үг). Стратеги
тоглоомын шийдлийг бүрдүүлэх, түүний үнэ v= 0. Бид энэ шийдлийг хэрхэн олсон бэ? Энэ бол өөр асуулт юм. Дараагийн хэсэгт бид хязгаарлагдмал тоглоомууд ерөнхийдөө хэрхэн шийдэгддэгийг харуулах болно.

Хязгаарлагдмал тэг нийлбэртэй хос тоглоомыг авч үзье. -ээр тэмдэглээрэй атоглогчийн ашиг А, мөн дамжуулан б- тоглогч ялна Б. Учир нь а = –б, дараа нь ийм тоглоомд дүн шинжилгээ хийхдээ эдгээр тоонуудыг хоёуланг нь авч үзэх шаардлагагүй - тоглогчдын аль нэгнийх нь үр ашгийг харгалзан үзэх нь хангалттай юм. Жишээлбэл, ийм байг. А. Дараах зүйлд танилцуулахад тохиромжтой байх үүднээс тал АБид нөхцөлтэйгээр нэрлэх болно" бид"ба тал Б – "дайсан".

Байгаа мболомжит стратеги А 1 , А 2 , …, А м, мөн дайсан nболомжит стратеги Б 1 , Б 2 , …, Б н(ийм тоглоомыг тоглоом гэж нэрлэдэг m×n). Тал бүр тодорхой стратеги сонгосон гэж бодъё: бид сонгосон Ай, дайсан Бж. Хэрэв тоглоом нь зөвхөн хувийн хөдөлгөөнөөс бүрддэг бол стратеги сонгох хэрэгтэй Айболон БжТоглоомын үр дүнг өвөрмөц байдлаар тодорхойлдог - бидний ашиг (эерэг эсвэл сөрөг). Энэ олзыг гэж тэмдэглэе айж(Бид стратеги сонгох үед ялах Ай, мөн дайсан - стратеги Бж).

Хэрэв тоглоом нь хувийн санамсаргүй нүүдлээс гадна хос стратегийн ашиг тусыг агуулна Ай, Бжбүх санамсаргүй нүүдлийн үр дүнгээс хамаарах санамсаргүй хэмжигдэхүүн юм. Энэ тохиолдолд хүлээгдэж буй үр өгөөжийн байгалийн тооцоолол санамсаргүй ялалтын математикийн хүлээлт. Тохиромжтой болгох үүднээс бид үүнийг тэмдэглэнэ айжөгөөж нь өөрөө (санамсаргүй нүүдэлгүй тоглоомд) болон түүний математикийн хүлээлт (санамсаргүй нүүдэлтэй тоглоомд).

Бид үнэ цэнийг мэддэг гэж бодъё айжстратегийн хос бүрийн хувьд. Эдгээр утгыг мөр нь бидний стратегид нийцсэн матриц хэлбэрээр бичиж болно ( Ай), баганууд нь өрсөлдөгчийн стратегийг харуулдаг ( Бж):

B j A i Б 1 Б 2 Б н
А 1 а 11 а 12 а 1n
А 2 а 21 а 22 а 2n
А м а м 1 а м 2 амн

Ийм матрицыг нэрлэдэг тоглоомын үр ашгийн матрицэсвэл зүгээр л тоглоомын матриц.

Олон тооны стратеги бүхий тоглоомуудын үр ашгийн матрицыг бий болгох нь хэцүү ажил байж болохыг анхаарна уу. Жишээ нь, төлөө шатрын тоглоомБоломжит стратегийн тоо маш их байгаа тул үр ашгийн матрицыг барих нь бараг боломжгүй юм. Гэсэн хэдий ч зарчмын хувьд аливаа хязгаарлагдмал тоглоомыг матриц хэлбэрт оруулж болно.

Санаж үз жишээ 1 4×5 антагонист тоглоом. Бидний мэдэлд дөрвөн стратеги байгаа, дайсан таван стратегитай. Тоглоомын матриц нь дараах байдалтай байна.

B j A i Б 1 Б 2 Б 3 Б 4 Б 5
А 1
А 2
А 3
А 4

Бид ямар стратеги (жишээ нь, тоглогч А) хэрэглэх? Бидний сонгосон стратеги хамаагүй, боломжийн дайсан түүнд хариу өгөх стратеги нь бидний ашиг хамгийн бага байх болно. Жишээлбэл, хэрэв бид стратеги сонгох юм бол А 3 (10-ын ялалтад уруу татагдсан), өрсөлдөгч нь хариу арга хэмжээ авах стратеги сонгох болно Б 1 , бидний ашиг зөвхөн 1 байх болно. Мэдээжийн хэрэг, болгоомжтой байх зарчим (мөн энэ нь тоглоомын онолын гол зарчим) дээр үндэслэн бид стратегийг сонгох ёстой. бидний хамгийн бага ашиг хамгийн их байна.

-ээр тэмдэглээрэй a iстратегийн хамгийн бага өгөөжийн үнэ цэнэ Ай:

тоглоомын матрицад эдгээр утгыг агуулсан баганыг нэмнэ үү:

B j A i Б 1 Б 2 Б 3 Б 4 Б 5 эгнээнд хамгийн бага a i
А 1
А 2
А 3
А 4 максимин

Стратегийг сонгохдоо бид үнэ цэнэтэй стратегийг сонгох ёстой a iдээд тал нь. Энэ хамгийн их утгыг -ээр тэмдэглэе α :

Үнэ цэнэ α дуудсан тоглоомын үнэ багаэсвэл максимин(хамгийн их хамгийн бага ялалт). Тоглогчийн стратеги Амаксиминтай тохирч байна α , гэж нэрлэдэг максимин стратеги.

Энэ жишээнд максимин α нь 3-тай тэнцүү (хүснэгтийн харгалзах нүдийг саарал өнгөөр ​​тодруулсан) ба максимин стратеги нь Адөрөв. Энэхүү стратегийг сонгосноор бид дайсны аливаа үйлдэлд 3-аас доошгүй ялна гэдэгт итгэлтэй байж болно (мөн дайсны "үндэслэлгүй" зан авираас илүү байж магадгүй). өөрсдөө хамгийн болгоомжтой ("давхар даатгал") стратегийг баримталж байна.

Одоо бид дайсантай ижил төстэй үндэслэлийг хийх болно Б Б А Б 2 - бид түүнд хариулах болно А .

-ээр тэмдэглээрэй βj А Б) стратегийн хувьд Ай:



βj β :

7. ДЭЭД ҮНЭТЭЙ ТОГЛОЛТ ЮУ ВЭ? Б. Тэр бидний ашгийг багасгах, өөрөөр хэлбэл бидэнд бага өгөх сонирхолтой боловч бидний зан авирыг найдах ёстой бөгөөд энэ нь түүний хувьд хамгийн муу зүйл юм. Жишээлбэл, хэрэв тэр стратегийг сонгосон бол Б 1 , дараа нь бид түүнд стратегиар хариулах болно А 3 , тэгээд тэр бидэнд өгөх болно 10. Тэр сонгосон бол Б 2 - бид түүнд хариулах болно А 2 , тэр 8 гэх мэтийг өгөх болно.Мэдээж болгоомжтой өрсөлдөгч нь ямар стратегийг сонгох ёстой. бидний хамгийн их ашиг хамгийн бага байх болно.

-ээр тэмдэглээрэй βjөгөөжийн матрицын баганууд дахь хамгийн их утгууд (тоглогчийн хамгийн их ашиг А, эсвэл, аль нь адилхан, тоглогчийн хамгийн их алдагдал Б) стратегийн хувьд Ай:

тоглоомын матрицад эдгээр утгыг агуулсан мөрийг нэмнэ үү:

Стратегийг сонгохдоо дайсан нь үнэ цэнэтэй стратегийг илүүд үзэх болно βjхамгийн бага. -ээр тэмдэглэе β :

Үнэ цэнэ β дуудсан тоглоомын дээд үнээсвэл хамгийн бага(хамгийн бага ялалт). Өрсөлдөгчийн (тоглогчийн) стратеги нь минимакстай тохирч байна Б), гэж нэрлэдэг минимакс стратеги.

Минимакс гэдэг нь боломжийн өрсөлдөгч бидэнд өгөхгүй байх ашгийн үнэ цэнэ юм (өөрөөр хэлбэл боломжийн өрсөлдөгч үүнээс илүүг алдахгүй. β ). Энэ жишээнд minimax β нь 5-тай тэнцүү (хүснэгтийн харгалзах нүдийг саарал өнгөөр ​​тодруулсан) бөгөөд үүнийг өрсөлдөгчийн стратеги ашиглан гүйцэтгэдэг. Б 3 .

Тиймээс болгоомжтой байх зарчимд тулгуурлан ("үргэлж хамгийн мууг хүлээж бай!") стратеги сонгох ёстой А 4, дайсан бол стратеги юм Б 3 . Анхааралтай байх зарчим нь тоглоомын онолын үндэс суурь бөгөөд үүнийг нэрлэдэг минимакс зарчим.

Санаж үз жишээ 2. Тоглогчдыг зөвшөөр Аболон ATгурван тооны аль нэгийг нь нэгэн зэрэг, бие биенээсээ хамааралгүйгээр бичдэг: "1", "2", эсвэл "3". Хэрэв бичигдсэн тоонуудын нийлбэр тэгш бол тоглогч Бтоглогчид мөнгө төлдөг Аэнэ хэмжээ. Хэрэв дүн нь сондгой байвал тоглогч энэ дүнг төлнө Атоглогч AT.

Тоглоомын өгөөжийн матрицыг бичиж, тоглоомын доод ба дээд үнийг олцгооё (стратегийн дугаар нь бичсэн тоотой тохирч байна):

Тоглогч Амаксимин стратегийг дагаж мөрдөх ёстой А 1-ээс доошгүй ялах -3 (өөрөөр хэлбэл хамгийн ихдээ 3 хожих). Minimax тоглогчийн стратеги Баль нэг стратеги Б 1 ба Б 2 , энэ нь тэр 4-өөс илүүгүй өгөх болно гэдгийг баталгаажуулдаг.

Тоглогчийн байр сууринаас өгөөжийн матрицыг бичвэл бид ижил үр дүнд хүрнэ AT. Үнэн хэрэгтээ энэ матрицыг тоглогчийн байр сууринаас барьсан матрицыг шилжүүлснээр олж авдаг. А, мөн элементүүдийн тэмдгүүдийг эсрэгээр нь өөрчлөх (тоглогчийн ашиг орсноос хойш Атоглогчийн алдагдал юм AT):

Энэ матриц дээр үндэслэн тоглогч дараах болно Бстратегийн аль нэгийг дагаж мөрдөх ёстой Б 1 ба Б 2 (дараа нь тэр 4-өөс илүүгүй алдах болно), мөн тоглогч А- стратегиуд А 1 (дараа нь тэр 3-аас илүүгүй алдах болно). Таны харж байгаагаар үр дүн нь дээр дурдсантай яг ижил байгаа тул дүн шинжилгээ хийх нь бидний аль тоглогчийн үүднээс авч үзэх нь хамаагүй.

8 ҮНЭТЭЙ ТОГЛООМ ГЭЖ ЮУ ВЭ.

9. МИНИМАКС ЗАРЧИМ ЮУ ЗҮЙЛЭЭС БҮРДЭДЭГ ВЭ. 2. Тоглоомын доод ба дээд үнэ. Минимакс зарчим

Төлбөрийн матрицтай төрлийн матриц тоглоомыг авч үзье

Хэрэв тоглогч бол ГЭХДЭЭстратеги сонгох болно А и, тэгвэл түүний бүх боломжит ашиг нь элементүүд байх болно би- матрицын р эгнээ FROM. Тоглогчийн хувьд хамгийн муу ГЭХДЭЭтоглогч байх үед ATтохирох стратегийг хэрэгжүүлдэг хамгийн багаЭнэ шугамын элемент, тоглогчийн ашиг ГЭХДЭЭтоотой тэнцүү байх болно.

Тиймээс, хамгийн их ашиг авахын тулд тоглогч ГЭХДЭЭТа дугаарыг сонгох стратегийн аль нэгийг сонгох хэрэгтэй дээд тал нь.

Системийн хандлагын хүрээнд авч үзсэн шийдвэр гаргах асуудал нь систем, хяналтын дэд систем, хүрээлэн буй орчин гэсэн гурван үндсэн бүрэлдэхүүн хэсгийг агуулдаг. Одоо бид шийдвэр гаргах асуудлын судалгаанд шилжиж, системд нэг биш, харин хэд хэдэн хяналтын дэд системүүд нөлөөлдөг бөгөөд тус бүр нь өөрийн гэсэн зорилго, үйл ажиллагааны боломжуудтай байдаг. Шийдвэр гаргах энэ хандлагыг тоглоомын онол гэж нэрлэдэг бөгөөд харгалзах харилцан үйлчлэлийн математик загварууд гэж нэрлэдэг. тоглоомууд. Хяналтын дэд системүүдийн зорилгын ялгаа, тэдгээрийн хооронд мэдээлэл солилцох боломжийн тодорхой хязгаарлалтаас шалтгаалан эдгээр харилцан үйлчлэл нь зөрчилдөөнтэй байдаг. Тиймээс аливаа тоглоом бол зөрчилдөөний математик загвар юм. Хоёр хяналтын дэд систем байгаа тохиолдолд бид өөрсдийгөө хязгаарладаг. Хэрэв системийн зорилго нь эсрэгээрээ байвал зөрчилдөөнийг антагонист гэж нэрлэдэг бөгөөд ийм зөрчилдөөний математик загварыг нэрлэдэг. антагонист тоглоом..

Тоглоомын онолын нэр томъёонд 1-р хяналтын дэд системийг нэрлэдэг тоглогч 1, 2-р хяналтын дэд систем - тоглогч 2, багц

Тэдний альтернатив үйлдлүүд гэж нэрлэдэг стратегийн багцэдгээр тоглогчид. Болъё X- 1-р тоглогчийн стратеги, Ю- олон стратеги

тоглогч 2. Системийн төлөв байдал нь 1 ба 2-р дэд системүүдийн хяналтын үйлдлүүдийн сонголтоор тодорхойлогддог, өөрөөр хэлбэл стратегийн сонголтоор тодорхойлогддог.

xXболон yЮ. Болъё Ф(x,y) - тухайн муж улсын 1-р тоглогчийн хэрэглээний тооцоо

1-р тоглогч стратеги сонгох үед дамжуулдаг систем Xболон

тоглогч 2 стратеги цагт. Тоо Ф(x,y) гэж нэрлэдэг ялалтнөхцөл байдалд байгаа тоглогч 1 ( x,y), функц Ф- тоглогч 1 төлбөрийн функц. Тоглогч ялна

1 нь мөн 2-р тоглогчийн алдагдал, өөрөөр хэлбэл эхний тоглогчийн нэмэгдүүлэхийг эрэлхийлж буй үнэ цэнэ, хоёр дахь нь - бууруулах. Ийм л байна

мөргөлдөөний антагонист шинж чанарын илрэл: тоглогчдын ашиг сонирхол бүрэн эсрэгээрээ (нэг нь юу хожсон, нөгөө нь алддаг).

Антагонист тоглоом нь угаасаа системээр тогтдог G=(X, Y, F).

Албан ёсоор антагонист тоглоом нь тодорхойгүй нөхцөлд шийдвэр гаргах асуудалтай яг ижил байдлаар тавигддаг болохыг анхаарна уу - хэрэв

хяналтын дэд систем 2-г хүрээлэн буй орчинтой тодорхойлох. Хяналтын дэд систем ба хүрээлэн буй орчны хоорондох үндсэн ялгаа нь

Эхнийх нь зан үйл нь зорилготой юм. Хэрэв бодит зөрчилдөөний математик загварыг боловсруулахдаа хүрээлэн буй орчныг дайсан гэж үзэх шалтгаан (эсвэл санаа) байгаа бол түүний зорилго нь авчрах явдал юм.

Бидэнд хамгийн их хохирол учруулдаг бол ийм нөхцөл байдлыг антагонист тоглоом гэж илэрхийлж болно. Өөрөөр хэлбэл, антагонист тоглоомыг тодорхойгүй байдлын нөхцөлд ZPR-ийн онцгой тохиолдол гэж тайлбарлаж болно.


хүрээлэн буй орчин нь зорилго бүхий дайсан мэт харагдсанаар тодорхойлогддог. Үүний зэрэгцээ бид хүрээлэн буй орчны зан үйлийн талаархи таамаглалын төрлийг хязгаарлах ёстой.


Энд хамгийн үндэслэлтэй зүйл бол шийдвэр гаргахдаа хүрээлэн буй орчинд ажиллах хамгийн муу хувилбарт тулгуурладаг хэт болгоомжтой байх таамаглал юм.

Тодорхойлолт.Хэрвээ Xболон Юнь хязгаарлагдмал бол антагонист тоглоомыг матриц гэж нэрлэдэг. Матрицын тоглоомд бид үүнийг таамаглаж болно X={1,…,n},

Ю={1,…,м) ба тавь aij=F(i,j). Тиймээс матрицын тоглоом нь матрицаар бүрэн тодорхойлогддог A=(айж), би=1,…,n, j=1,…,м.

Жишээ 3.1. Хоёр хуруутай тоглоом.

Хоёр хүн нэгэн зэрэг нэг эсвэл хоёр хуруугаа харуулж, 1 эсвэл 2 гэсэн дугаарыг дууддаг бөгөөд энэ нь илтгэгчийн хэлснээр тухайн дугаарыг илэрхийлдэг.

хуруугаа бусдад харуулав. Хуруунуудыг харуулж, тоонуудыг нэрлэсний дараа хожлыг дараах дүрмийн дагуу хуваарилна.

хэрэв хоёулаа тааварласан эсвэл хоёулаа өрсөлдөгчөө хэдэн хуруу харуулсныг тааварлаагүй бол тус бүрийн ашиг нь тэгтэй тэнцүү байна; Хэрэв зөвхөн нэг нь зөв таасан бол өрсөлдөгч нь тааварлагчдад үзүүлсэн нийт тоотой пропорциональ мөнгөний хэмжээг төлнө.

Энэ бол антагонист матриц тоглоом юм. Тоглогч бүр дөрвөн стратегитай байдаг: 1- 1 хуруугаа харуулж, 1, 2- 1 хуруугаа харуулж, 2, 3- гэж хэлэх.

2 хуруугаа үзүүлээд 1, 4 гэж хэл - 2 хуруугаа үзүүлээд 2 гэж хэлээрэй. Дараа нь үр ашгийн матриц A=(aij), i= 1,…, 4, j= 1,…, 4-ийг дараах байдлаар тодорхойлно.

a12= 2, a21 = – 2, a13=a42=–3, a24=a31= 3, a34 = – 4, a43= 4,aij= 0 өөрөөр.

Жишээ 3.2. Дискрет дуэлийн төрлийн тоглоом.

Дуэлийн төрлийн даалгаварууд нь жишээлбэл, хоёр тоглогчийн тэмцлийг дүрсэлдэг.

тус бүр нь нэг удаагийн арга хэмжээ (барааны багцыг зах зээлд гаргах, дуудлага худалдаагаар худалдаж авах өргөдөл) хийхийг хүсч, үүний тулд цагийг сонгоно. Тоглогчид бие бие рүүгээ урагшил nалхам. Алхам болгоны дараа тоглогч өрсөлдөгч рүүгээ буудаж болно, үгүй ​​ч байж болно. Хүн бүр зөвхөн нэг буудлага хийх боломжтой. Хэрэв та урагшлах юм бол дайсныг цохих магадлал өндөр байдаг гэж үздэг к n =5 хэлбэртэй байна




 
Нийтлэл дээрсэдэв:
SD санах ойн картын талаар мэдэх ёстой бүх зүйл нь Connect sd-г худалдаж авахдаа алдаа гаргахгүйн тулд
(4 үнэлгээ) Хэрэв таны төхөөрөмжид хангалттай дотоод санах ой байхгүй бол та SD картыг Android утасныхаа дотоод санах ой болгон ашиглаж болно. Adoptable Storage гэж нэрлэгддэг энэхүү функц нь Android үйлдлийн системд гадаад медиаг форматлах боломжийг олгодог
GTA Online-д дугуйг хэрхэн эргүүлэх талаар болон GTA Online-н түгээмэл асуултуудад илүү ихийг мэдэж аваарай
Яагаад gta online холбогдоогүй байна вэ? Энэ нь энгийн, сервер түр унтарсан / идэвхгүй эсвэл ажиллахгүй байна. Өөр рүү оч. Хөтөч дээрх онлайн тоглоомуудыг хэрхэн идэвхгүй болгох вэ. Connect менежер дэх Online Update Clinet програмыг ажиллуулахыг хэрхэн идэвхгүй болгох вэ? ... skkoko дээр чамайг хэзээ санаа зовохыг би мэднэ
Ace of Spades нь бусад картуудтай хослуулсан
Картын хамгийн түгээмэл тайлбарууд нь: тааламжтай танилын амлалт, гэнэтийн баяр баясгалан, урьд өмнө тохиолдож байгаагүй сэтгэл хөдлөл, мэдрэмжүүд, бэлэг хүлээн авах, гэрлэсэн хосуудад зочлох явдал юм. Зүрхний хөзрийн тамга нь таныг тодорхой хүнийг тодорхойлохдоо картын утга юм
Нүүлгэн шилжүүлэх зурхайг хэрхэн зөв барих вэ Төрсөн он, сар, өдрөөр газрын зургийг тайлж тайлах
Төрөхийн зураг нь эзнийхээ төрөлхийн чанар, чадварыг, орон нутгийн диаграмм нь үйл ажиллагааны газраас эхлүүлсэн орон нутгийн нөхцөл байдлын талаар өгүүлдэг. Олон хүний ​​амьдрал төрсөн газраасаа өнгөрдөг тул тэд ижил ач холбогдолтой. Орон нутгийн газрын зургийг дагаж мөрдөөрэй