permainan antagonis. Menyelesaikan game antagonis matriks Prinsip untuk menyelesaikan game antagonis matriks

Teori permainan adalah teori model matematika pengambilan keputusan dalam kondisi konflik atau ketidakpastian. Diasumsikan bahwa tindakan para pihak dalam permainan dicirikan oleh strategi tertentu - seperangkat aturan tindakan. Jika keuntungan salah satu pihak pasti mengarah pada kerugian pihak lain, maka mereka berbicara tentang permainan antagonis. Jika kumpulan strategi terbatas, maka permainan tersebut disebut permainan matriks dan solusinya dapat diperoleh dengan sangat sederhana. Solusi yang diperoleh dengan bantuan teori permainan berguna dalam menyusun rencana dalam menghadapi kemungkinan oposisi dari pesaing atau ketidakpastian di lingkungan eksternal.


Jika permainan bimatrix bersifat antagonis, maka matriks pembayaran pemain 2 sepenuhnya ditentukan oleh matriks pembayaran pemain 1 (elemen yang sesuai dari kedua matriks ini hanya berbeda dalam tanda). Oleh karena itu, permainan antagonis bimatriks sepenuhnya dijelaskan oleh matriks tunggal (matriks hasil pemain 1) dan, karenanya, disebut permainan matriks.

Permainan ini bersifat antagonis. Di dalamnya j \u003d x2 - O, P, dan R (O, O] \u003d H (P, P) \u003d -I dan R (O, P) \u003d R (P, O) \u003d 1, atau dalam bentuk matriks o p

Biarkan beberapa kelas permainan menjadi "mirror-closed", mis. bersama dengan masing-masing gimnya berisi gim isomorfik cermin (karena semua gim yang isomorfik cermin satu sama lain adalah isomorfik satu sama lain, kami, sesuai dengan apa yang baru saja dikatakan, dapat berbicara tentang satu gim isomorfik cermin). Kelas seperti itu, misalnya, kelas semua game antagonis atau kelas semua game matriks.

Mengingat definisi situasi yang dapat diterima dalam permainan antagonis, kami memperoleh bahwa situasi (X, Y) dalam ekstensi campuran dari permainan matriks dapat diterima untuk pemain 1 jika dan hanya jika untuk setiap x G x pertidaksamaan

Proses mengubah game menjadi simetris disebut simetrisasi. Kami menjelaskan di sini salah satu metode simetri. Versi lain yang berbeda secara fundamental dari simetri akan diberikan dalam Bagian 26.7. Kedua varian simetri ini sebenarnya berlaku untuk game antagonis arbitrer, tetapi akan dirumuskan dan dibuktikan hanya untuk game matriks.

Dengan demikian, istilah dan sebutan awal teori permainan antagonis umum bertepatan dengan istilah dan sebutan yang sesuai dari teori permainan matriks.

Untuk game finite antagonistic (matriks), keberadaan ekstrim ini telah kita buktikan di Bab 10. 1, dan intinya adalah untuk membangun kesetaraan mereka, atau setidaknya menemukan cara untuk mengatasi ketidaksetaraan mereka.

Pertimbangan permainan matriks sudah menunjukkan bahwa ada permainan antagonis tanpa situasi ekuilibrium (dan bahkan tanpa situasi e-ekuilibrium untuk e > 0) yang cukup kecil dalam strategi pemain yang diberikan pada awalnya.

Tetapi setiap permainan yang terbatas (matriks) dapat diperluas ke permainan yang tidak terbatas, misalnya, dengan memberikan setiap pemain sejumlah strategi yang didominasi (lihat 22 Bab 1). Jelas, perluasan set strategi pemain seperti itu tidak akan berarti perluasan kemungkinannya, dan perilakunya yang sebenarnya dalam permainan yang diperluas seharusnya tidak berbeda dari perilakunya dalam permainan aslinya. Dengan demikian, kami segera memperoleh cukup banyak contoh permainan antagonis tak terbatas yang tidak memiliki titik pelana. Ada juga contoh semacam ini.

Jadi, untuk menerapkan prinsip maximin dalam permainan antagonis tak terbatas, perlu, seperti dalam kasus permainan terbatas (matriks), beberapa perluasan kemampuan strategis para pemain. Untuk 96

Seperti dalam kasus permainan matriks (lihat Bab 1, 17), untuk permainan antagonis umum, peran penting dimainkan oleh konsep spektrum strategi campuran, yang di sini, bagaimanapun, harus diberikan definisi yang lebih umum.

Akhirnya, perhatikan bahwa himpunan semua strategi campuran pemain 1 dalam permainan antagonis sewenang-wenang adalah, seperti dalam matriks

Bahkan pertimbangan permainan antagonis menunjukkan bahwa sejumlah besar permainan seperti itu, termasuk yang terbatas, permainan matriks memiliki situasi ekuilibrium tidak dalam strategi asli dan murni, tetapi hanya dalam strategi campuran yang digeneralisasi. Oleh karena itu, untuk permainan umum, non-antagonis, non-kooperatif, adalah wajar untuk mencari situasi ekuilibrium secara tepat dalam strategi campuran.

Jadi, misalnya (lihat Gambar 3.1), kita telah mencatat bahwa "Kontraktor" hampir tidak pernah berurusan dengan ketidakpastian perilaku. Tetapi jika kita mengambil tingkat konseptual dari tipe "Administrator", maka semuanya justru sebaliknya. Biasanya, jenis ketidakpastian utama yang harus dihadapi oleh "pengambil keputusan kita" adalah "Konflik". Sekarang kami dapat mengklarifikasi bahwa ini biasanya merupakan persaingan yang tidak ketat. Agak jarang, "Administrator" membuat keputusan dalam kondisi "ketidakpastian alami", dan bahkan lebih jarang menghadapi konflik antagonis yang ketat. Selain itu, bentrokan kepentingan ketika membuat keputusan oleh "Administrator" terjadi, sehingga dapat dikatakan, "sekali", yaitu dalam klasifikasi kami, ia sering hanya memainkan satu (kadang-kadang jumlah yang sangat kecil) dari permainan permainan. Skala untuk mengevaluasi konsekuensi lebih sering bersifat kualitatif daripada kuantitatif. Independensi strategis "Administrator" cukup terbatas. Mempertimbangkan hal di atas, dapat dikatakan bahwa situasi masalah sebesar ini paling sering harus dianalisis menggunakan permainan bi-matriks non-antagonistik non-kooperatif, apalagi, dalam strategi murni.

Prinsip-prinsip untuk menyelesaikan permainan antagonis matriks

Akibatnya, masuk akal untuk mengharapkan bahwa dalam permainan yang dijelaskan di atas, lawan akan mematuhi strategi yang mereka pilih. Game antagonis matriks yang maks min fiv = min max Aiy>

Namun, tidak semua permainan antagonis matriks cukup pasti, dan dalam kasus umum

Jadi, dalam kasus umum, untuk menyelesaikan permainan matriks antagonis berdimensi /uxl, perlu untuk memecahkan sepasang masalah pemrograman linier ganda , menghasilkan satu set strategi yang optimal , / dan biaya permainan v.

Bagaimana permainan antagonis matriks dua orang didefinisikan?

Apa metode untuk menyederhanakan dan menyelesaikan permainan antagonis matriks?

Dalam kasus permainan dua orang, wajar untuk menganggap minat mereka sebagai lawan langsung - permainannya antagonis. Dengan demikian, hasil dari satu pemain sama dengan kerugian yang lain (jumlah dari hasil kedua pemain adalah nol, maka namanya, permainan zero-sum). Kami akan mempertimbangkan permainan di mana setiap pemain memiliki sejumlah alternatif yang terbatas. Fungsi pembayaran untuk permainan dua orang zero-sum seperti itu dapat diberikan dalam bentuk matriks (dalam bentuk matriks hasil).

Seperti yang telah disebutkan, permainan antagonis terakhir disebut matriks.

GAME MATRIX - kelas permainan antagonis di mana dua pemain berpartisipasi, dan setiap pemain memiliki sejumlah strategi yang terbatas. Jika satu pemain memiliki m strategi dan pemain lain memiliki n strategi, maka kita dapat membuat matriks permainan berdimensi txn. M.i. mungkin atau mungkin tidak memiliki titik pelana. Dalam kasus terakhir

Institut Teknik Tenaga Moskow

(Universitas Teknik)

Laporan lab

dalam teori permainan

"Program pencarian untuk strategi optimal untuk permainan antagonis berpasangan yang diberikan dalam bentuk matriks"

Diselesaikan oleh siswa

grup A5-01

Ashrapov Daler

Ashrapova Olga

Konsep dasar teori permainan

Teori permainan yang dirancang untuk diselesaikan situasi konflik , yaitu situasi di mana kepentingan dua pihak atau lebih yang mengejar tujuan yang berbeda bertabrakan.

Jika tujuan para pihak secara langsung berlawanan, maka mereka berbicara tentang konflik antagonis .

permainan disebut model formal yang disederhanakan dari situasi konflik.

Memainkan game sekali dari awal hingga akhir disebut berpesta . Hasil pestanya adalah pembayaran (atau menang ).

Pesta terdiri dari bergerak , yaitu memilih pemain dari serangkaian kemungkinan alternatif.

Bergerak bisa pribadi dan acak.langkah pribadi , Tidak seperti acak , menyiratkan pilihan sadar oleh pemain dari beberapa pilihan.

Game di mana setidaknya ada satu gerakan pribadi disebut strategis .

Game yang semua gerakannya acak disebut berjudi .

Saat melakukan langkah pribadi, mereka juga berbicara tentang strategi pemain, yaitu tentang aturan atau seperangkat aturan yang menentukan pilihan pemain. Pada saat yang sama, strategi harus komprehensif, yaitu. pilihan harus ditentukan untuk setiap kemungkinan situasi selama permainan.

Tantangan teori permainan– menemukan strategi optimal para pemain, mis. strategi yang memberi mereka keuntungan maksimum atau kerugian minimum.

Klasifikasi model teori permainan

permainan n orang biasanya disebut sebagai, di mana
adalah set strategi pemain ke-i,
- pembayaran permainan.

Sesuai dengan penunjukan ini, klasifikasi model teori permainan berikut dapat diusulkan:

Diskrit (set strategi diskrit)

Terakhir

tak berujung

Berkelanjutan (set strategi kontinu)

tak berujung

n orang (
)

Koalisi (koperasi)

Tidak kooperatif (tidak kooperatif)

2 orang (berpasangan)

Antagonis (permainan zero-sum)

(kepentingan para pihak berlawanan, yaitu kerugian satu pemain sama dengan keuntungan yang lain)

Non-antagonis

Dengan informasi lengkap (jika pemain yang melakukan gerakan pribadi mengetahui seluruh sejarah permainan, yaitu semua gerakan lawan)

Dengan informasi yang tidak lengkap

Dengan jumlah nol (total pembayaran nol)

Dengan jumlah bukan nol

Satu arah (lotere)

multi-arah

Representasi matriks dari game antagonis berpasangan

Dalam tutorial ini, kami akan mempertimbangkan permainan antagonis dua orang diberikan dalam bentuk matriks. Artinya kita mengetahui set strategi pemain pertama (player SEBUAH){ SEBUAH saya }, saya = 1,…, m dan set strategi pemain kedua (pemain B){ B j }, j = 1,..., n, dan matriks SEBUAH = || sebuah aku j || hadiah dari pemain pertama. Karena kita berbicara tentang permainan antagonis, diasumsikan bahwa keuntungan pemain pertama sama dengan kerugian pemain kedua. Kami menganggap bahwa elemen matriks sebuah aku j adalah hasil dari pemain pertama ketika dia memilih strategi SEBUAH saya dan jawaban pemain kedua dengan strategi B j. Kami akan merujuk ke permainan seperti
, di mana m - jumlah strategi pemain TETAPI,n - jumlah strategi pemain PADA. Secara umum, dapat diwakili oleh tabel berikut:

B 1

B j

B n

SEBUAH 1

SEBUAH saya

SEBUAH m

Contoh 1

Sebagai contoh sederhana, pertimbangkan permainan di mana permainan terdiri dari dua gerakan.

langkah pertama: Pemain TETAPI memilih salah satu nomor (1 atau 2) tanpa memberi tahu lawan tentang pilihannya.

gerakan ke-2: Pemain PADA memilih salah satu nomor (3 atau 4).

Hasil: Pemilihan pemain TETAPI dan PADA menjumlahkan. Jika jumlahnya genap, maka PADA membayar nilainya kepada pemain TETAPI, jika ganjil - sebaliknya, TETAPI membayar pemain PADA.

Game ini dapat direpresentasikan sebagai
dengan cara berikut:

(pilihan 3)

(pilihan 4)

(pilihan 1)

(pilihan 2)

Sangat mudah untuk melihatnya permainan ini antagonis, selain itu, ini adalah permainan dengan informasi yang tidak lengkap, karena pemain PADA, membuat langkah pribadi, tidak diketahui pilihan apa yang dibuat pemain TETAPI.

Seperti disebutkan di atas, tugas teori permainan adalah menemukan strategi optimal para pemain, mis. strategi yang memberi mereka keuntungan maksimum atau kerugian minimum. Proses ini disebut keputusan permainan .

Saat memecahkan game dalam bentuk matriks, seseorang harus memeriksa game untuk kehadirannya titik pelana . Untuk ini, dua nilai diperkenalkan:

adalah batas bawah untuk harga game, dan

adalah perkiraan atas harga game.

Pemain pertama kemungkinan besar akan memilih strategi di mana ia akan mendapatkan keuntungan maksimum di antara semua kemungkinan jawaban dari pemain kedua, dan yang kedua, sebaliknya, akan memilih salah satu yang meminimalkan kerugiannya sendiri, yaitu. kemungkinan kemenangan pertama.

Dapat dibuktikan bahwa α ≤ V ≤ β , di mana Vharga permainan , yaitu, kemungkinan hasil dari pemain pertama.

Jika hubungannya α = β = V, lalu mereka mengatakan bahwa permainan memiliki titik pelana
, dan diselesaikan dalam strategi murni . Dengan kata lain, ada beberapa strategi
, memberikan pemain TETAPIV.

Contoh 2

Mari kembali ke permainan yang kita bahas di Contoh 1 dan periksa keberadaan titik pelana.

(pilihan 3)

(pilihan 4)

(pilihan 1)

(pilihan 2)

Untuk permainan ini
= -5,
= 4,
, oleh karena itu, ia tidak memiliki titik pelana.

Sekali lagi, perhatikan bahwa game ini adalah game informasi yang tidak lengkap. Dalam hal ini, Anda hanya dapat menyarankan pemain TETAPI memilih strategi , karena dalam hal ini, dia bisa mendapatkan hasil terbesar, asalkan pemain memilih PADA strategi .

Contoh 3

Mari kita membuat beberapa perubahan pada aturan main dari contoh 1. Ayo berikan pemainnya PADA informasi pemilihan pemain TETAPI. Kemudian PADA Ada dua strategi tambahan:

- strategi yang bermanfaat untuk TETAPI. Jika pilihan A - 1, kemudian PADA memilih 3 jika pilihan A - 2, kemudian PADA memilih 4;

- strategi yang tidak menguntungkan bagi TETAPI. Jika pilihan A - 1, kemudian PADA memilih 4 jika pilihan A - 2, kemudian PADA memilih 3.

(pilihan 3)

(pilihan 4)

(pilihan 1)

(pilihan 2)

Permainan ini penuh dengan informasi.

Pada kasus ini
= -5,
= -5,
, maka permainan memiliki titik pelana
. Titik pelana ini sesuai dengan dua pasang strategi optimal:
dan
. Harga permainan V= -5. Jelas bahwa untuk TETAPI permainan ini tidak berguna.

Contoh 2 dan 3 adalah ilustrasi yang baik dari teorema berikut, terbukti dalam teori permainan:

Teorema 1

Setiap permainan antagonis berpasangan dengan informasi sempurna diselesaikan dalam strategi murni.

Itu. Teorema 1 mengatakan bahwa setiap permainan dua orang dengan informasi yang sempurna memiliki titik pelana dan ada sepasang strategi murni
, memberikan pemain TETAPI keuntungan berkelanjutan sama dengan harga game V.

Dalam hal tidak adanya titik pelana, yang disebut strategi campuran :, di mana p saya danq j adalah probabilitas memilih strategi SEBUAH saya dan B j masing-masing pemain pertama dan kedua. Solusi dari permainan dalam hal ini adalah sepasang strategi campuran
memaksimalkan ekspektasi matematis dari harga game.

Generalisasi Teorema 1 untuk kasus permainan dengan informasi yang tidak lengkap adalah teorema berikut:

Teorema 2

Setiap permainan antagonis berpasangan memiliki setidaknya satu solusi optimal, yaitu, sepasang strategi campuran dalam kasus umum
, memberikan pemain TETAPI keuntungan berkelanjutan sama dengan harga game V, lebih-lebih lagi α ≤ V ≤ β .

Dalam kasus khusus, untuk permainan dengan titik pelana, solusi dalam strategi campuran terlihat seperti sepasang vektor di mana satu elemen sama dengan satu, dan sisanya sama dengan nol.

Kasus paling sederhana, diuraikan secara rinci dalam teori permainan, adalah permainan pasangan berhingga zero-sum (permainan antagonis dua orang atau dua koalisi). Pertimbangkan permainan ini G, di mana dua pemain TETAPI dan PADA, memiliki kepentingan yang berlawanan: keuntungan yang satu sama dengan kerugian yang lain. Sejak bayaran pemain TETAPI sama dengan hadiah pemain dengan tanda yang berlawanan, kita hanya bisa tertarik pada hasilnya sebuah pemain TETAPI. Tentu saja, TETAPI ingin memaksimalkan dan PADA - memperkecil sebuah. Untuk kesederhanaan, mari kita secara mental mengidentifikasi diri kita dengan salah satu pemain (biarkan saja TETAPI) dan kami akan memanggilnya "kami", dan pemain PADA -"lawan" (tentu saja, tidak ada keuntungan nyata untuk TETAPI tidak mengikuti dari ini). Mari kita miliki t kemungkinan strategi TETAPI 1 , SEBUAH 2 , ..., TETAPI m, dan musuh n kemungkinan strategi PADA 1 , PADA 2 , ..; PADA n(permainan seperti itu disebut permainan t × n). Menunjukkan sebuah aku j hasil kami jika kami menggunakan strategi SEBUAH saya , dan musuh adalah strategi B j .

Tabel 26.1

SEBUAH saya

B j

B 1

B 2

B n

SEBUAH 1

SEBUAH 2

SEBUAH m

sebuah 11

sebuah 21

sebuah m1

sebuah 21

sebuah m

sebuah 1 n

sebuah 2 n

sebuah M N

Misalkan untuk setiap pasangan strategi A<, PADA, menang (atau rata-rata menang) sebuah, j kita tahu. Kemudian, pada prinsipnya, dimungkinkan untuk menyusun tabel persegi panjang (matriks), yang mencantumkan strategi para pemain dan hasil yang sesuai (lihat tabel 26.1).

Jika tabel seperti itu dikompilasi, maka kami mengatakan bahwa game G direduksi menjadi bentuk matriks (dengan sendirinya, membawa permainan ke bentuk seperti itu sudah bisa menjadi tugas yang sulit, dan terkadang hampir tidak mungkin, karena banyaknya strategi). Perhatikan bahwa jika game direduksi menjadi bentuk matriks, maka game multi-langkah sebenarnya direduksi menjadi game satu langkah - pemain hanya perlu melakukan satu langkah: pilih strategi. Kami akan secara singkat menunjukkan matriks permainan ( sebuah aku j).

Pertimbangkan contoh permainan G(4×5) dalam bentuk matriks. Yang kami miliki (untuk memilih dari) empat strategi, musuh memiliki lima strategi. Matriks permainan diberikan dalam tabel 26.2

Mari kita pikirkan strategi apa yang kita (pemain .) TETAPI) mengambil keuntungan? Matrix 26.2 memiliki hasil menarik "10"; kita tertarik untuk memilih strategi TETAPI 3 , di mana kita akan mendapatkan "berita gembira" ini. Tapi tunggu, musuh juga tidak bodoh! Jika kita memilih strategi TETAPI 3 , dia, untuk membenci kita, akan memilih strategi PADA 3 , dan kita mendapatkan hasil yang menyedihkan "1". Tidak, pilih strategi TETAPI 3 itu dilarang! Bagaimana menjadi? Jelas, berdasarkan prinsip kehati-hatian (dan itu adalah prinsip utama teori permainan), kita harus memilih

Tabel 26.2

B j

SEBUAH saya

B 1

B 2

B 3

B 4

B 5

SEBUAH 1

SEBUAH 2

SEBUAH 3

SEBUAH 4

strategi yang keuntungan minimum kami adalah maksimum. Inilah yang disebut "prinsip minimax": bertindak sedemikian rupa sehingga, dengan perilaku musuh terburuk untuk Anda, Anda mendapatkan keuntungan maksimal.

Kami menulis ulang tabel 26.2 dan di kolom tambahan kanan kami menuliskan nilai minimum pembayaran di setiap baris, (minimum baris); mari kita tentukan untuk saya-baris ke saya(lihat tabel 26.3).

Tabel 26.3

B j

SEBUAH saya

B 1

B 2

B 3

B 4

B 5

SEBUAH 1

SEBUAH 2

SEBUAH 3

SEBUAH 4

β j

Dari semua nilai α saya(kolom kanan) yang terbesar (3) disorot. Itu cocok dengan strategi SEBUAH empat. Setelah memilih strategi ini, kita, bagaimanapun, dapat yakin bahwa (untuk setiap perilaku musuh) kita akan mendapatkan tidak kurang dari 3. Nilai ini adalah keuntungan yang dijamin; hati-hati, kita tidak bisa mendapatkan kurang dari ini (saya mungkin mendapatkan lebih banyak). Imbalan ini disebut harga yang lebih rendah dari permainan (atau "maximin" - maksimum dari hasil minimum). Kami akan menunjukkannya sebuah. Dalam kasus kami α = 3.

Sekarang mari kita mengambil sudut pandang musuh dan berdebat untuknya. Dia bukan semacam pion, tapi juga masuk akal! Memilih strategi, dia ingin memberi lebih sedikit, tetapi dia harus mengandalkan perilaku kita, yang merupakan yang terburuk baginya. Jika dia memilih strategi PADA 1 , kami akan menjawabnya TETAPI 3 , dan dia akan memberikan 10; jika dia memilih B 2 - kami akan menjawabnya TETAPI 2 , dan dia akan memberikan 8, dll. Kami menambahkan baris bawah tambahan ke tabel 26.3 dan menulis di dalamnya maksimum kolom j. Jelas, musuh yang berhati-hati harus memilih strategi yang meminimalkan nilai ini (nilai yang sesuai dari 5 disorot dalam Tabel 26.3). Nilai ini adalah nilai keuntungan, lebih dari itu lawan yang masuk akal pasti tidak akan memberi kita. Ini disebut harga tertinggi permainan (atau "minimax" - minimum dari kemenangan maksimum). Dalam contoh kita, = 5 dan dicapai dengan strategi lawan B 3 .

Jadi, berdasarkan prinsip kehati-hatian (aturan reasuransi “selalu mengandalkan yang terburuk!”), Kita harus memilih strategi TETAPI 4 , dan musuh - strategi PADA 3 . Strategi seperti itu disebut "minimax" (mengikuti prinsip minimax). Selama kedua belah pihak dalam contoh kita tetap berpegang pada strategi minimax mereka, hasilnya akan sebuah 43 = 3.

Sekarang bayangkan sejenak bahwa kita telah mengetahui bahwa musuh sedang mengejar strategi PADA 3 . Ayo, mari kita hukum dia untuk ini dan pilih strategi TETAPI 1 - kita akan mendapatkan 5, yang tidak terlalu buruk. Tapi bagaimanapun juga, musuh juga tidak ketinggalan; beri tahu dia bahwa strategi kami TETAPI 1 ; dia juga cepat memilih PADA 4 , mengurangi hasil kami menjadi 2, dll. (mitra "bergegas tentang strategi"). Singkatnya, strategi minimax dalam contoh kita tidak stabil dalam kaitannya dengan ke informasi tentang perilaku pihak lain; strategi ini tidak memiliki properti ekuilibrium.

Apakah selalu seperti ini? Tidak tidak selalu. Perhatikan sebuah contoh dengan matriks yang diberikan pada Tabel 26.4.

Dalam contoh ini, harga permainan yang lebih rendah sama dengan yang atas: α = = 6. Apa yang mengikuti dari ini? Strategi Pemain Minimax TETAPI dan PADA akan berkelanjutan. Selama kedua pemain tetap berpegang pada mereka, hasilnya adalah 6. Mari kita lihat apa yang terjadi jika kita (TETAPI) tahu bahwa musuh (PADA)

Tabel 26.4

Bj

SEBUAH saya

B 1

B 2

B 3

B 4

SEBUAH 1

SEBUAH 2

SEBUAH 3

β j

tetap pada strategi B 2 ? Dan sebenarnya tidak ada yang akan berubah. Karena setiap penyimpangan dari strategi TETAPI 2 hanya bisa memperburuk keadaan kita. Demikian juga, informasi yang diterima musuh tidak akan membuatnya mundur dari strateginya. PADA 2 . Sepasang strategi TETAPI 2 , B 2 memiliki properti keseimbangan (sepasang strategi yang seimbang), dan hasil (dalam kasus kami, 6) dicapai dengan pasangan strategi ini disebut "titik pelana matriks" 1). Tanda adanya titik pelana dan pasangan strategi yang seimbang adalah kesetaraan harga bawah dan atas permainan; nilai umum dan disebut harga permainan. Kami akan memberi label v:

α = β = v

Strategi SEBUAH saya , B j(pada kasus ini TETAPI 2 , PADA 2 ), yang hasil ini dicapai disebut strategi murni optimal, dan totalitasnya disebut solusi untuk permainan. Dalam hal ini, permainan itu sendiri dikatakan diselesaikan dalam strategi murni. Kedua sisi TETAPI dan PADA seseorang dapat menunjukkan strategi optimal mereka di mana posisi mereka adalah yang terbaik. Apa itu pemain? TETAPI dalam hal ini, 6 menang, dan pemain PADA - kalah 6,- nah, ini syarat mainnya: menguntungkan buat TETAPI dan merugikan bagi PADA

1) Istilah "titik pelana" diambil dari geometri - ini adalah nama titik di permukaan, di mana minimum di sepanjang satu koordinat dan maksimum di sepanjang yang lain dicapai secara bersamaan.

Pembaca mungkin memiliki pertanyaan: mengapa strategi optimal disebut "murni"? Melihat ke depan sedikit, mari kita jawab pertanyaan ini: ada strategi "campuran", yang terdiri dari fakta bahwa pemain tidak menggunakan satu strategi, tetapi beberapa, bergantian secara acak. Jadi, jika kita mengizinkan, selain yang murni, juga strategi campuran, apa saja akhir permainan memiliki solusi - titik kesetimbangan. Tapi kita masih berbicara tentang atom.

Kehadiran titik pelana dalam permainan jauh dari aturan, melainkan pengecualian. Sebagian besar game tidak memiliki titik pelana. Namun, ada berbagai permainan yang selalu memiliki titik pelana dan, oleh karena itu, diselesaikan dengan strategi murni. Inilah yang disebut "permainan dengan informasi lengkap". Permainan dengan rak informasi adalah permainan di mana setiap pemain mengetahui seluruh sejarah perkembangannya, yaitu hasil dari semua gerakan sebelumnya, baik pribadi maupun acak, pada setiap gerakan pribadi. Contoh permainan dengan informasi yang lengkap adalah catur, catur, tic-tac-toe, dll.

Dalam teori permainan, terbukti bahwa setiap permainan dengan informasi lengkap memiliki titik pelana, dan karenanya dapat diselesaikan dalam strategi murni. Dalam setiap permainan dengan informasi yang sempurna, ada sepasang strategi optimal yang memberikan hasil yang stabil sama dengan rantai permainan v. Jika permainan seperti itu hanya terdiri dari gerakan pribadi, maka ketika setiap pemain menerapkan strategi optimalnya sendiri, itu harus berakhir dengan cara yang cukup pasti - dengan hasil yang sama dengan harga permainan. Jadi, jika solusi permainan diketahui, permainan itu sendiri kehilangan maknanya!

Mari kita ambil contoh dasar permainan dengan informasi lengkap: dua pemain secara bergantian menempatkan uang receh di atas meja bundar, memilih secara sewenang-wenang posisi pusat koin (saling tumpang tindih koin tidak diperbolehkan). Pemenangnya adalah orang yang menempatkan sen terakhir (ketika tidak ada ruang untuk orang lain). Sangat mudah untuk melihat bahwa hasil dari permainan ini pada dasarnya adalah kesimpulan yang sudah pasti. Ada strategi tertentu yang memastikan bahwa pemain yang menempatkan koin terlebih dahulu menang. Yaitu, ia harus terlebih dahulu menempatkan satu nikel di tengah meja, dan kemudian menanggapi setiap gerakan lawan dengan gerakan simetris. Jelas, tidak peduli bagaimana lawan berperilaku, dia tidak bisa menghindari kekalahan. Situasinya persis sama dengan catur dan permainan dengan informasi lengkap pada umumnya: salah satu dari mereka, ditulis dalam bentuk matriks, memiliki titik pelana, dan karenanya solusinya adalah dalam strategi murni, dan, oleh karena itu, masuk akal hanya selama ini solusi tidak ditemukan. Katakanlah permainan catur juga selalu berakhir dengan kemenangan Putih, atau selalu - kemenangan hitam, atau selalu - seri, hanya dengan apa - kami belum tahu (untungnya bagi pecinta catur). Mari kita tambahkan satu hal lagi: kita hampir tidak akan tahu di masa mendatang, karena jumlah strategi sangat besar sehingga sangat sulit (jika bukan tidak mungkin) untuk mengurangi permainan menjadi bentuk matriks dan menemukan titik pelana di dalamnya.

Sekarang mari kita bertanya pada diri sendiri apa yang harus dilakukan jika permainan tidak memiliki titik pelana: ≠ ? Nah, jika setiap pemain dipaksa untuk memilih satu - satu-satunya strategi murni, maka tidak ada yang bisa dilakukan: seseorang harus dipandu oleh prinsip minimax. Hal lain adalah jika mungkin untuk "mencampur" serangkaian strategi, bergantian secara acak dengan beberapa probabilitas. Penggunaan strategi campuran dipahami dengan cara ini: permainan diulang berkali-kali; sebelum setiap permainan permainan, ketika pemain diberikan langkah pribadi, dia "mempercayakan" pilihannya pada kesempatan, "melempar banyak", dan mengambil strategi yang jatuh (kita sudah tahu cara mengatur lot dari bab sebelumnya ).

Strategi campuran dalam teori permainan adalah model taktik yang dapat diubah dan fleksibel, ketika tidak ada pemain yang tahu bagaimana lawan akan berperilaku dalam permainan tertentu. Taktik ini (walaupun biasanya tanpa pembenaran matematis) sering digunakan dalam permainan kartu. Mari kita perhatikan pada saat yang sama bahwa cara terbaik untuk menyembunyikan perilaku Anda dari musuh adalah dengan memberinya karakter acak dan, oleh karena itu, tidak mengetahui sebelumnya apa yang akan Anda lakukan.

Jadi, mari kita bicara tentang strategi campuran. Kami akan menunjukkan strategi campuran para pemain TETAPI dan PADA masing-masing S A = ( p 1 , R 2 , ..., p m), S B = (q 1 , q 2 , …, q n), di mana p 1 , p 2 , …, p m(membentuk total satu) - probabilitas pemain menggunakan TETAPI strategi TETAPI 1 , SEBUAH 2 ,… , SEBUAH m ; q 1 , q 2 , …, q n- probabilitas penggunaan oleh pemain PADA strategi PADA 1 , PADA 2 , ..., PADA n . Dalam kasus tertentu, ketika semua probabilitas, kecuali satu, sama dengan nol, dan yang ini sama dengan satu, strategi campuran berubah menjadi murni.

Ada teorema dasar teori permainan: permainan berhingga dua orang zero-sum memiliki setidaknya satu solusi - sepasang strategi optimal, umumnya campuran
dan harga yang sesuai v.

Sepasang strategi optimal
membentuk solusi permainan memiliki properti berikut: jika salah satu pemain menganut strategi optimalnya, maka tidak mungkin menguntungkan bagi yang lain untuk menyimpang dari miliknya. Sepasang strategi ini membentuk semacam keseimbangan dalam permainan: satu pemain ingin mengubah keuntungan menjadi maksimum, yang lain menjadi minimum, masing-masing menarik ke arahnya sendiri, dan, dengan perilaku yang wajar dari keduanya, keseimbangan dan stabilitas. keuntungan ditetapkan. v. Jika sebuah v > 0, maka permainan tersebut menguntungkan bagi kita jika v< 0 - untuk musuh; pada v= 0 permainan itu “adil”, sama-sama menguntungkan bagi kedua peserta.

Pertimbangkan contoh permainan tanpa titik pelana dan berikan (tanpa bukti) solusinya. Permainannya adalah sebagai berikut: dua pemain TETAPI dan PADA pada saat yang sama dan tanpa mengucapkan sepatah kata pun, tunjukkan satu, dua atau tiga jari. Kemenangan ditentukan oleh jumlah total jari: jika genap, menang TETAPI dan menerima dari PADA jumlah yang sama dengan jumlah ini; jika ganjil, maka sebaliknya TETAPI membayar PADA jumlah yang sama dengan jumlah tersebut. Apa yang harus dilakukan para pemain?

Mari kita buat matriks permainan. Dalam satu permainan, setiap pemain memiliki tiga strategi: menunjukkan satu, dua atau tiga jari. Matriks 3x3 diberikan pada Tabel 26.5; kolom kanan ekstra menunjukkan minimum baris, dan baris bawah ekstra menunjukkan maksimum kolom.

Harga permainan yang lebih rendah = - 3 dan sesuai dengan strategi SEBUAH 1 . Ini berarti bahwa dengan perilaku yang wajar dan hati-hati, kami menjamin bahwa kami tidak akan kehilangan lebih dari 3. Penghiburan kecil, tetapi masih lebih baik daripada, katakanlah, kemenangan 5, yang terjadi di beberapa sel matriks. Buruk bagi kami, pemain TETAPI... Tapi mari kita menghibur diri kita sendiri:

posisi lawan tampaknya lebih buruk: biaya permainan yang lebih rendah adalah = 4, yaitu, dengan perilaku yang masuk akal, dia akan memberi kita setidaknya 4. Secara umum, posisinya tidak terlalu bagus - baik untuk satu maupun untuk sisi lain. Tapi mari kita lihat apakah itu bisa diperbaiki? Ternyata Anda bisa. Jika masing-masing pihak tidak menggunakan satu strategi murni, tetapi strategi campuran, di mana

Tabel 26.5

Bj

SEBUAH saya

B 1

B 2

B 3

SEBUAH 1

SEBUAH 2

SEBUAH 3

β j

yang pertama dan ketiga masuk dengan probabilitas 1/4, dan yang kedua - dengan probabilitas 1/2, yaitu.

maka hasil rata-rata akan tetap sama dengan nol (yang berarti bahwa permainan itu “adil” dan sama-sama menguntungkan kedua belah pihak). Strategi
membentuk solusi untuk permainan, dan harganya v= 0. Bagaimana kita menemukan solusi ini? Ini adalah pertanyaan yang berbeda. Di bagian berikutnya, kami menunjukkan bagaimana permainan hingga umumnya diselesaikan.

Pertimbangkan permainan pasangan zero-sum yang terbatas. Dilambangkan dengan sebuah imbalan pemain SEBUAH, dan melalui b- pemain menang B. Karena sebuah = –b, maka saat menganalisis permainan seperti itu tidak perlu mempertimbangkan kedua angka ini - cukup mempertimbangkan hasil dari salah satu pemain. Biarlah misalnya SEBUAH. Berikut ini, untuk kenyamanan presentasi, sisi SEBUAH kami akan memberi nama " kami"dan samping B – "musuh".

Mari kita miliki m kemungkinan strategi SEBUAH 1 , SEBUAH 2 , …, Saya, dan musuh n kemungkinan strategi B 1 , B 2 , …, B n(permainan seperti itu disebut permainan m×n). Asumsikan bahwa masing-masing pihak telah memilih strategi tertentu: kami telah memilih ai, musuh Bj. Jika permainan hanya terdiri dari gerakan pribadi, maka pilihan strategi ai dan Bj secara unik menentukan hasil permainan - hasil kami (positif atau negatif). Mari kita nyatakan keuntungan ini sebagai aij(menang ketika kita memilih strategi ai, dan musuh - strategi Bj).

Jika permainan berisi, selain gerakan acak pribadi, maka imbalan untuk sepasang strategi ai, Bj adalah variabel acak yang bergantung pada hasil dari semua gerakan acak. Dalam hal ini, estimasi alami dari hasil yang diharapkan adalah: harapan matematis dari kemenangan acak. Untuk kenyamanan, kami akan dilambangkan dengan aij baik hasil itu sendiri (dalam game tanpa gerakan acak) dan ekspektasi matematisnya (dalam game dengan gerakan acak).

Misalkan kita mengetahui nilai aij untuk setiap pasangan strategi. Nilai-nilai ini dapat ditulis sebagai matriks yang barisnya sesuai dengan strategi kami ( ai), dan kolom menunjukkan strategi lawan ( Bj):

B j A i B 1 B 2 B n
SEBUAH 1 sebuah 11 sebuah 12 sebuah 1n
SEBUAH 2 sebuah 21 sebuah 22 sebuah 2n
Saya saya 1 saya 2 amn

Matriks seperti itu disebut matriks hasil permainan atau hanya matriks permainan.

Perhatikan bahwa konstruksi matriks hasil untuk permainan dengan sejumlah besar strategi bisa menjadi tugas yang sulit. Misalnya untuk permainan catur jumlah strategi yang mungkin sangat besar sehingga konstruksi matriks hasil hampir tidak mungkin. Namun, pada prinsipnya setiap permainan berhingga dapat direduksi menjadi bentuk matriks.

Mempertimbangkan Contoh 1 Permainan antagonis 4x5. Kami memiliki empat strategi yang kami miliki, musuh memiliki lima strategi. Matriks permainan adalah sebagai berikut:

B j A i B 1 B 2 B 3 B 4 B 5
SEBUAH 1
SEBUAH 2
SEBUAH 3
SEBUAH 4

Strategi apa yang harus kita (yaitu, pemain SEBUAH) menggunakan? Strategi apa pun yang kita pilih, musuh yang masuk akal akan menanggapinya dengan strategi yang hasil kita akan minimal. Misalnya, jika kita memilih strategi SEBUAH 3 (tergoda dengan kemenangan 10), lawan akan memilih strategi sebagai tanggapan B 1 , dan hasil kita hanya 1. Jelas, berdasarkan prinsip kehati-hatian (dan itu adalah prinsip utama teori permainan), kita harus memilih strategi di mana keuntungan minimum kami adalah maksimum.

Dilambangkan dengan aku nilai hasil minimum untuk strategi ai:

dan tambahkan kolom yang berisi nilai-nilai ini ke matriks game:

B j A i B 1 B 2 B 3 B 4 B 5 minimum dalam baris aku
SEBUAH 1
SEBUAH 2
SEBUAH 3
SEBUAH 4 maksimal

Saat memilih strategi, kita harus memilih salah satu yang nilainya aku maksimum. Mari kita nyatakan nilai maksimum ini dengan α :

Nilai α ditelepon harga permainan yang lebih rendah atau maksimal(maksimum minimal menang). Strategi pemain SEBUAH sesuai dengan maximin α , disebut strategi maksimal.

Dalam contoh ini, maksimin α sama dengan 3 (sel yang sesuai dalam tabel disorot dalam warna abu-abu), dan strategi maximin adalah SEBUAH empat. Dengan memilih strategi ini, kita dapat yakin bahwa untuk setiap perilaku musuh kita akan menang tidak kurang dari 3 (dan mungkin lebih dengan perilaku musuh yang “tidak masuk akal”). diri kita sendiri, mengikuti strategi ("reasuransi") yang paling hati-hati.

Sekarang kita akan melakukan alasan yang sama untuk musuh B B SEBUAH B 2 - kami akan menjawabnya SEBUAH .

Dilambangkan dengan j SEBUAH B) untuk strategi ai:



j β :

7. APA GAME NILAI ATAS Sekarang kita akan melakukan alasan yang sama untuk lawan B. Dia tertarik untuk meminimalkan keuntungan kita, yaitu memberi kita lebih sedikit, tetapi dia harus mengandalkan perilaku kita, yang merupakan yang terburuk baginya. Misalnya, jika dia memilih strategi B 1 , maka kami akan menjawabnya dengan strategi SEBUAH 3 , dan dia akan memberi kita 10. Jika dia memilih B 2 - kami akan menjawabnya SEBUAH 2 , dan dia akan memberikan 8, dan seterusnya. Jelas, lawan yang berhati-hati harus memilih strategi di mana keuntungan maksimum kami akan minimum.

Dilambangkan dengan j nilai maksimum di kolom matriks hasil (hasil maksimum pemain SEBUAH, atau, yang sama, kerugian maksimum pemain B) untuk strategi ai:

dan tambahkan baris yang berisi nilai-nilai ini ke matriks game:

Memilih strategi, musuh akan lebih memilih yang nilainya j minimum. Mari kita tunjukkan dengan β :

Nilai β ditelepon harga permainan teratas atau minimal(minimal menang maksimal). Strategi lawan (pemain) sesuai dengan minimax B), disebut strategi minimax.

Minimax adalah nilai keuntungan, lebih dari itu lawan yang wajar pasti tidak akan memberi kita (dengan kata lain, lawan yang masuk akal akan kalah tidak lebih dari β ). Dalam contoh ini, minimax β sama dengan 5 (sel yang sesuai dalam tabel disorot dengan warna abu-abu) dan itu dicapai dengan strategi lawan B 3 .

Jadi, berdasarkan prinsip kehati-hatian ("selalu mengharapkan yang terburuk!"), kita harus memilih strategi SEBUAH 4 , dan musuh - sebuah strategi B 3 . Prinsip kehati-hatian adalah dasar dalam teori permainan dan disebut prinsip minimal.

Mempertimbangkan contoh 2. Biarkan para pemain SEBUAH dan PADA salah satu dari tiga angka ditulis secara bersamaan dan independen satu sama lain: baik "1", atau "2", atau "3". Jika jumlah angka yang tertulis genap, maka pemain tersebut B membayar pemain SEBUAH jumlah ini. Jika jumlahnya ganjil, maka pemain membayar jumlah ini SEBUAH pemain PADA.

Mari kita tuliskan matriks hasil permainan dan temukan harga yang lebih rendah dan lebih tinggi dari permainan (nomor strategi sesuai dengan nomor tertulis):

Pemain SEBUAH harus mematuhi strategi maximin SEBUAH 1 untuk menang setidaknya -3 (yaitu, kalah paling banyak 3). Strategi Pemain Minimax B salah satu strategi B 1 dan B 2 , yang menjamin bahwa ia akan memberikan tidak lebih dari 4.

Kami akan mendapatkan hasil yang sama jika kami menulis matriks pembayaran dari sudut pandang pemain PADA. Faktanya, matriks ini diperoleh dengan mentranspos matriks yang dibangun dari sudut pandang pemain SEBUAH, dan mengubah tanda elemen menjadi kebalikannya (karena hasil dari pemain SEBUAH adalah hilangnya pemain PADA):

Berdasarkan matriks ini, maka pemain B harus mengikuti salah satu strategi B 1 dan B 2 (dan kemudian dia akan kalah tidak lebih dari 4), dan pemain SEBUAH- strategi SEBUAH 1 (dan kemudian dia akan kehilangan tidak lebih dari 3). Seperti yang Anda lihat, hasilnya persis sama dengan yang diperoleh di atas, jadi analisis tidak masalah dari sudut pandang pemain mana yang kami lakukan.

8 APA ITU PERMAINAN BERHARGA.

9. TERDIRI DARI APA PRINSIP MINIMAX. 2. Harga game yang lebih rendah dan lebih tinggi. Prinsip Minimax

Pertimbangkan jenis permainan matriks dengan matriks hasil

Jika pemain TETAPI akan memilih strategi saya, maka semua kemungkinan hasil adalah elemen saya-baris matriks DARI. Terburuk untuk seorang pemain TETAPI kasus ketika pemain PADA menerapkan strategi yang tepat untuk minimum elemen baris ini, hadiah pemain TETAPI akan sama dengan jumlah.

Oleh karena itu, untuk mendapatkan hasil maksimal, pemain TETAPI Anda harus memilih salah satu strategi yang nomornya maksimum.

Masalah pengambilan keputusan, dipertimbangkan dalam kerangka pendekatan sistem, berisi tiga komponen utama: sistem, subsistem kontrol dan lingkungan diidentifikasi di dalamnya. Sekarang kita beralih ke studi masalah pengambilan keputusan, di mana sistem tidak hanya dipengaruhi oleh satu, tetapi beberapa subsistem kontrol, yang masing-masing memiliki tujuan dan kemungkinan tindakannya sendiri. Pendekatan untuk pengambilan keputusan ini disebut teori permainan, dan model matematis dari interaksi yang sesuai disebut permainan. Karena perbedaan tujuan dari subsistem kontrol, serta pembatasan tertentu pada kemungkinan pertukaran informasi di antara mereka, interaksi ini bersifat konflik. Oleh karena itu, permainan apa pun adalah model matematika dari konflik. Kami membatasi diri pada kasus ketika ada dua subsistem kontrol. Jika tujuan sistem berlawanan, konflik disebut antagonis, dan model matematis dari konflik semacam itu disebut permainan antagonis..

Dalam terminologi teori permainan, subsistem kontrol pertama disebut pemain 1, subsistem kontrol ke-2 - pemain 2, set

tindakan alternatif mereka disebut set strategi para pemain ini. Membiarkan X- set strategi pemain 1, kamu- banyak strategi

pemain 2. Keadaan sistem secara unik ditentukan oleh pilihan tindakan kontrol oleh subsistem 1 dan 2, yaitu pilihan strategi

xX dan kamukamu. Membiarkan F(x,kamu) - perkiraan utilitas untuk pemain 1 dari negara bagian itu

sistem yang dilaluinya saat pemain 1 memilih strategi X dan

strategi pemain 2 pada. Nomor F(x,kamu) disebut kemenangan pemain 1 dalam situasi ( x,kamu), dan fungsi F- fungsi pembayaran pemain 1. Pemain menang

1 juga kehilangan pemain 2, yaitu nilai yang ingin ditingkatkan oleh pemain pertama, dan yang kedua - untuk dikurangi. Itulah apa itu

manifestasi dari sifat antagonistik dari konflik: kepentingan para pemain benar-benar berlawanan (yang satu menang, yang lain kalah).

Game antagonis secara alami diatur oleh sistem G=(X, Y, F).

Perhatikan bahwa secara formal permainan antagonis sebenarnya diatur dengan cara yang sama seperti masalah pengambilan keputusan dalam kondisi ketidakpastian - jika

mengidentifikasi subsistem kontrol 2 dengan lingkungan. Perbedaan substantif antara subsistem kontrol dan lingkungan adalah bahwa

perilaku yang pertama bertujuan. Jika, ketika menyusun model matematika dari konflik nyata, kami memiliki alasan (atau niat) untuk menganggap lingkungan sebagai musuh, yang tujuannya adalah untuk membawa

kita bahaya maksimal, maka situasi seperti itu dapat direpresentasikan sebagai permainan antagonis. Dengan kata lain, permainan antagonis dapat diartikan sebagai kasus ekstrim ZPR dalam kondisi ketidakpastian,


dicirikan oleh fakta bahwa lingkungan dipandang sebagai musuh dengan tujuan. Pada saat yang sama, kita harus membatasi jenis hipotesis tentang perilaku lingkungan.


Yang paling dibuktikan di sini adalah hipotesis kehati-hatian yang ekstrem, ketika, ketika membuat keputusan, kita mengandalkan skenario terburuk yang mungkin bagi kita untuk bertindak di lingkungan.

Definisi. Jika sebuah X dan kamu berhingga, maka permainan antagonis disebut matriks. Dalam permainan matriks, kita dapat mengasumsikan bahwa X={1,…,n},

kamu={1,…,m) dan menempatkan aij=F(aku j). Dengan demikian, permainan matriks sepenuhnya ditentukan oleh matriks A =(aij), saya=1,…,n, j=1,…,m.

Contoh 3.1. Permainan dengan dua jari.

Dua orang sekaligus menunjukkan satu atau dua jari dan memanggil nomor 1 atau 2, yang menurut penutur berarti nomor

jari yang ditunjukkan kepada orang lain. Setelah jari-jari ditunjukkan dan angka-angka disebutkan, kemenangan didistribusikan sesuai dengan aturan berikut:

jika keduanya menebak atau keduanya tidak menebak berapa banyak jari yang ditunjukkan lawan mereka, hasil masing-masing sama dengan nol; jika hanya satu yang menebak dengan benar, maka lawan membayar sang tebakan sejumlah uang sebanding dengan jumlah total yang ditampilkan

Ini adalah permainan matriks antagonis. Setiap pemain memiliki empat strategi: 1- tunjukkan 1 jari dan katakan 1, 2- tunjukkan 1 jari dan katakan 2, 3-

tunjukkan 2 jari dan katakan 1, 4 - tunjukkan 2 jari dan katakan 2. Kemudian matriks hasil A=(aij), i= 1,…, 4, j= 1,…, 4 didefinisikan sebagai berikut:

a12= 2, a21 = – 2, a13=a42=–3, a24=a31= 3, a34 = – 4, a43= 4, aij = 0 sebaliknya.

Contoh 3.2. Game tipe duel diskrit.

Tugas tipe duel menggambarkan, misalnya, perjuangan dua pemain,

masing-masing ingin melakukan beberapa tindakan satu kali (pelepasan kiriman barang di pasar, aplikasi untuk pembelian di lelang) dan memilih waktu untuk ini. Biarkan para pemain bergerak ke arah satu sama lain n Langkah. Setelah setiap langkah diambil, pemain boleh atau tidak boleh menembak lawan. Setiap orang hanya dapat memiliki satu tembakan. Diyakini bahwa kemungkinan mengenai musuh jika kamu maju dengan k n = 5 memiliki bentuk




 
Artikel pada tema:
Semua yang perlu Anda ketahui tentang kartu memori SD agar Anda tidak bingung saat membeli Connect sd
(4 peringkat) Jika Anda tidak memiliki cukup penyimpanan internal pada perangkat Anda, Anda dapat menggunakan kartu SD sebagai penyimpanan internal untuk ponsel Android Anda. Fitur ini, yang disebut Adoptable Storage, memungkinkan OS Android untuk memformat media eksternal
Cara memutar roda di GTA Online dan lainnya di FAQ GTA Online
Mengapa gta online tidak konek? Sederhana saja, server mati sementara/tidak aktif atau tidak bekerja. Pergi ke yang lain Cara menonaktifkan game online di browser. Bagaimana cara menonaktifkan peluncuran aplikasi Online Update Clinet di manajer Connect? ... di skkoko aku tahu kapan kamu keberatan
Ace of Spades dalam kombinasi dengan kartu lain
Interpretasi kartu yang paling umum adalah: janji kenalan yang menyenangkan, kegembiraan yang tak terduga, emosi dan sensasi yang sebelumnya tidak pernah dialami, menerima hadiah, kunjungan ke pasangan yang sudah menikah. As hati, arti kartu saat mencirikan orang tertentu Anda
Cara membuat horoskop relokasi dengan benar Buat peta berdasarkan tanggal lahir dengan decoding
Bagan kelahiran berbicara tentang kualitas dan kemampuan bawaan pemiliknya, bagan lokal berbicara tentang keadaan lokal yang diprakarsai oleh tempat tindakan. Mereka sama pentingnya, karena kehidupan banyak orang meninggal dunia dari tempat kelahirannya. Ikuti peta lokal