เกมที่เป็นปฏิปักษ์ การแก้เกมที่เป็นปฏิปักษ์ของเมทริกซ์ หลักการในการแก้เกมที่เป็นปฏิปักษ์ของเมทริกซ์
ทฤษฎีเกมเป็นทฤษฎีของแบบจำลองทางคณิตศาสตร์ของการตัดสินใจภายใต้เงื่อนไขของความขัดแย้งหรือความไม่แน่นอน สันนิษฐานว่าการกระทำของฝ่ายต่าง ๆ ในเกมมีลักษณะเฉพาะด้วยกลยุทธ์บางอย่าง - ชุดของกฎการดำเนินการ หากการได้มาของฝ่ายใดฝ่ายหนึ่งนำไปสู่การสูญเสียอีกฝ่ายอย่างหลีกเลี่ยงไม่ได้ พวกเขาจะพูดถึงเกมที่เป็นปรปักษ์กัน หากชุดของกลยุทธ์มีจำกัด เกมจะเรียกว่าเกมเมทริกซ์และวิธีแก้ปัญหานั้นง่ายมาก วิธีแก้ปัญหาที่ได้รับโดยใช้ทฤษฎีเกมมีประโยชน์ในการจัดทำแผนเมื่อเผชิญกับการต่อต้านจากคู่แข่งหรือความไม่แน่นอนในสภาพแวดล้อมภายนอก
หากเกม bimatrix เป็นปฏิปักษ์ เมทริกซ์ผลตอบแทนของผู้เล่น 2 จะถูกกำหนดโดยเมทริกซ์ผลตอบแทนของผู้เล่น 1 อย่างสมบูรณ์ (องค์ประกอบที่สอดคล้องกันของเมทริกซ์ทั้งสองนี้ต่างกันในสัญญาณเท่านั้น) ดังนั้นเกมที่เป็นปฏิปักษ์ของ bimatrix จึงถูกอธิบายโดยเมทริกซ์เดียว (เมทริกซ์ผลตอบแทนของผู้เล่น 1) และด้วยเหตุนี้จึงเรียกว่าเกมเมทริกซ์
เกมนี้เป็นปฏิปักษ์ ในนั้น j \u003d x2 - O, P และ R (O, O] \u003d H (P, P) \u003d -I และ R (O, P) \u003d R (P, O) \u003d 1 หรือ ในรูปแบบเมทริกซ์ o p
ให้บางคลาสของเกม Г เป็น "ปิดกระจก" เช่น ร่วมกับเกมแต่ละเกมมีเกมมิเรอร์ไอโซมอร์ฟิก (เนื่องจากเกมทั้งหมดที่มิเรอร์ไอโซมอร์ฟิกไปยังเกมที่กำหนดเป็นไอโซมอร์ฟิกซึ่งกันและกัน เราจึงสามารถพูดถึงเกมไอโซมอร์ฟิกมิเรอร์เกมหนึ่งได้ตามที่กล่าวไว้) คลาสดังกล่าวคือคลาสของเกมที่เป็นปฏิปักษ์ทั้งหมดหรือคลาสของเกมเมทริกซ์ทั้งหมด
เมื่อนึกถึงคำจำกัดความของสถานการณ์ที่ยอมรับได้ในเกมที่เป็นปฏิปักษ์ เราได้รับว่าสถานการณ์ (X, Y) ในส่วนขยายแบบผสมของเกมเมทริกซ์นั้นเป็นที่ยอมรับสำหรับผู้เล่น 1 หากและเฉพาะในกรณีที่สำหรับ x G x ความไม่เท่าเทียมกัน
กระบวนการแปลงเกมให้เป็นเกมสมมาตรเรียกว่าสมมาตร เราอธิบายวิธีการสมมาตรวิธีหนึ่งที่นี่ อีกรูปแบบหนึ่งที่แตกต่างกันโดยพื้นฐานจะได้รับในหัวข้อ 26.7 สมการสมมาตรทั้งสองแบบนี้ใช้ได้กับเกมที่เป็นปรปักษ์กันโดยพลการ แต่จะถูกกำหนดและพิสูจน์เฉพาะสำหรับเกมเมทริกซ์เท่านั้น
ดังนั้นข้อกำหนดเบื้องต้นและการกำหนดทฤษฎีของเกมที่เป็นปฏิปักษ์ทั่วไปจึงสอดคล้องกับข้อกำหนดและการกำหนดที่สอดคล้องกันของทฤษฎีเกมเมทริกซ์
สำหรับเกมที่เป็นปรปักษ์กัน (เมทริกซ์) ที่มีขอบเขตจำกัด การมีอยู่ของ extrema เหล่านี้ได้รับการพิสูจน์โดยเราในบทที่ 10 1 และประเด็นทั้งหมดคือการสร้างความเท่าเทียมกัน หรืออย่างน้อยก็เพื่อหาทางเอาชนะความไม่เท่าเทียมกัน
การพิจารณาเกมเมทริกซ์แสดงให้เห็นแล้วว่า มีเกมที่เป็นปฏิปักษ์โดยไม่มีสถานการณ์สมดุล (และถึงแม้จะไม่มีสถานการณ์สมดุลอิเล็กทรอนิกส์สำหรับ e > 0) ที่มีขนาดเล็กเพียงพอในกลยุทธ์ที่กำหนดในขั้นต้นของผู้เล่น
แต่เกมไฟไนต์ (เมทริกซ์) แต่ละเกมสามารถขยายไปสู่เกมที่ไม่มีที่สิ้นสุดได้ ตัวอย่างเช่น โดยให้ผู้เล่นแต่ละคนมีกลยุทธ์ที่โดดเด่นจำนวนเท่าใดก็ได้ (ดู 22 Ch. 1) เห็นได้ชัดว่าการขยายชุดกลยุทธ์ของผู้เล่นดังกล่าวไม่ได้หมายถึงการขยายความเป็นไปได้ของเขาจริงๆ และพฤติกรรมที่แท้จริงของเขาในเกมแบบขยายไม่ควรแตกต่างจากพฤติกรรมของเขาในเกมดั้งเดิม ดังนั้นเราจึงได้รับตัวอย่างจำนวนเพียงพอของเกมที่เป็นปฏิปักษ์ที่ไม่สิ้นสุดซึ่งไม่มีคะแนนอานม้า นอกจากนี้ยังมีตัวอย่างประเภทนี้
ดังนั้น เพื่อที่จะนำหลักการ maximin ไปใช้ในเกมที่เป็นปรปักษ์กันอย่างไม่มีที่สิ้นสุด มันเป็นสิ่งจำเป็น เช่นเดียวกับในกรณีของเกมจำกัด (เมทริกซ์) การขยายขีดความสามารถเชิงกลยุทธ์ของผู้เล่นบางส่วน สำหรับ96
ในกรณีของเกมเมทริกซ์ (ดูบทที่ 1, 17) สำหรับเกมที่เป็นปรปักษ์กันทั่วไป แนวคิดเรื่องกลยุทธ์แบบผสมมีบทบาทสำคัญ ซึ่งอย่างไรก็ตาม ในที่นี้ จะต้องให้คำจำกัดความที่กว้างกว่า
สุดท้ายนี้ โปรดทราบว่าชุดของกลยุทธ์แบบผสมทั้งหมดของผู้เล่น 1 ในเกมที่เป็นปฏิปักษ์โดยพลการนั้นเหมือนกับในเมทริกซ์
แม้แต่การพิจารณาเกมที่เป็นปฏิปักษ์ก็แสดงให้เห็นว่าเกมดังกล่าวจำนวนมาก รวมถึงเกมที่มีขอบเขตจำกัด เกมเมทริกซ์มีสถานการณ์สมดุลที่ไม่ได้อยู่ในกลยุทธ์ดั้งเดิมและบริสุทธิ์ แต่เฉพาะในกลยุทธ์ทั่วไปและผสมผสานเท่านั้น ดังนั้น สำหรับเกมทั่วไปที่ไม่เป็นปฏิปักษ์และไม่ร่วมมือกัน เป็นเรื่องปกติที่จะมองหาสถานการณ์สมดุลอย่างแม่นยำในกลยุทธ์แบบผสม
ตัวอย่างเช่น (ดูรูปที่ 3.1) เราสังเกตเห็นแล้วว่า "ผู้รับเหมา" แทบไม่เคยต้องรับมือกับความไม่แน่นอนของพฤติกรรมเลย แต่ถ้าเราใช้ระดับแนวคิดของประเภท "ผู้ดูแลระบบ" แล้วทุกอย่างก็ตรงกันข้าม ตามกฎแล้ว ความไม่แน่นอนประเภทหลักที่ "ผู้ตัดสินใจของเรา" ต้องเผชิญคือ "ความขัดแย้ง" ตอนนี้เราสามารถชี้แจงได้ว่านี่เป็นการแข่งขันที่ไม่เข้มงวด บ่อยครั้งที่ "ผู้ดูแลระบบ" ตัดสินใจภายใต้เงื่อนไขของ "ความไม่แน่นอนตามธรรมชาติ" และแทบจะไม่เคยพบกับความขัดแย้งที่เข้มงวดและเป็นปฏิปักษ์ นอกจากนี้ การขัดแย้งกันของผลประโยชน์เมื่อตัดสินใจโดย "ผู้ดูแลระบบ" เกิดขึ้น พูดได้ว่า "ครั้งเดียว" นั่นคือ ในการจัดหมวดหมู่ของเรา เขามักจะเล่นเกมของเกมเพียงเกมเดียว (บางครั้งมีจำนวนน้อยมาก) เครื่องชั่งสำหรับประเมินผลที่ตามมามักจะมีคุณภาพมากกว่าเชิงปริมาณ ความเป็นอิสระเชิงกลยุทธ์ของ "ผู้บริหาร" ค่อนข้างจำกัด เมื่อพิจารณาจากข้างต้นแล้ว เป็นที่ถกเถียงกันอยู่ว่าสถานการณ์ปัญหาของขนาดนี้ส่วนใหญ่มักจะต้องได้รับการวิเคราะห์โดยใช้เกมไบเมทริกซ์ที่ไม่ร่วมมือกันและไม่เป็นปฏิปักษ์ นอกจากนี้ ในกลยุทธ์ล้วนๆ
หลักการแก้เกมเมทริกซ์ที่เป็นปฏิปักษ์
ด้วยเหตุนี้ จึงมีเหตุผลที่จะคาดหวังว่าในเกมที่อธิบายไว้ข้างต้น ฝ่ายตรงข้ามจะปฏิบัติตามกลยุทธ์ที่เลือกไว้ เกมที่เป็นปฏิปักษ์กับเมทริกซ์ซึ่ง max min fiv = min max Aiy>
อย่างไรก็ตาม ไม่ใช่ทุกเกมที่เป็นปฏิปักษ์ของเมทริกซ์จะค่อนข้างชัดเจน และในกรณีทั่วไป
ดังนั้น ในกรณีทั่วไป ในการแก้ปัญหาเมทริกซ์ที่เป็นปฏิปักษ์กันของมิติ /uxl จำเป็นต้องแก้ปัญหาการเขียนโปรแกรมเชิงเส้นคู่ ส่งผลให้เกิดชุดกลยุทธ์ที่เหมาะสมที่สุด / และต้นทุนของเกม v
เกมเมทริกซ์ที่เป็นปฏิปักษ์กันของคนสองคนถูกกำหนดอย่างไร?
อะไรคือวิธีการในการทำให้เข้าใจง่ายและแก้ปัญหาเมทริกซ์ที่เป็นปฏิปักษ์กัน
ในกรณีของเกมสองคน เป็นเรื่องปกติที่จะถือว่าความสนใจของพวกเขาเป็นสิ่งที่ตรงกันข้าม - เกมนั้นเป็นปฏิปักษ์ ดังนั้น ผลตอบแทนของผู้เล่นคนหนึ่งจึงเท่ากับการสูญเสียของอีกคนหนึ่ง (ผลรวมของผลตอบแทนของผู้เล่นทั้งสองเป็นศูนย์ ดังนั้นชื่อเกมผลรวมศูนย์) เราจะพิจารณาเกมที่ผู้เล่นแต่ละคนมีทางเลือกจำนวนจำกัด ฟังก์ชันการจ่ายเงินสำหรับเกมสองคนที่มียอดรวมเป็นศูนย์สามารถให้ในรูปแบบเมทริกซ์ (ในรูปแบบของเมทริกซ์ผลตอบแทน)
ตามที่ระบุไว้แล้วเกมที่เป็นปฏิปักษ์สุดท้ายเรียกว่าเมทริกซ์
MATRIX GAMES - คลาสของเกมที่เป็นปฏิปักษ์ซึ่งมีผู้เล่นสองคนเข้าร่วม และผู้เล่นแต่ละคนมีกลยุทธ์จำนวนจำกัด หากผู้เล่นคนหนึ่งมีกลยุทธ์ m และผู้เล่นอีกคนมี n กลยุทธ์ เราก็สามารถสร้างเมทริกซ์เกมของมิติ txn ได้ มิ.ย. อาจมีหรือไม่มีจุดอาน ในกรณีหลัง
สถาบันวิศวกรรมไฟฟ้ามอสโก
(มหาวิทยาลัยเทคนิค)
รายงานห้องปฏิบัติการ
ในทฤษฎีเกม
"โปรแกรมค้นหากลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมที่เป็นปรปักษ์กันในรูปแบบเมทริกซ์"
เสร็จสิ้นโดยนักเรียน
กลุ่ม A5-01
Ashrapov Daler
Ashrapova Olga
แนวคิดพื้นฐานของทฤษฎีเกม
ทฤษฎีเกมออกแบบมาเพื่อแก้ไข สถานการณ์ความขัดแย้ง , เช่น. สถานการณ์ที่ผลประโยชน์ของสองฝ่ายขึ้นไปตามเป้าหมายที่ต่างกันขัดแย้งกัน
ถ้าเป้าหมายของคู่กรณีตรงข้ามกันก็พูดถึง ความขัดแย้งที่เป็นปฏิปักษ์ .
เกม เรียกว่าแบบจำลองสถานการณ์ความขัดแย้งที่เป็นทางการอย่างง่าย
เล่นเกมครั้งเดียวตั้งแต่ต้นจนจบเรียกว่า งานสังสรรค์ . ผลของงานเลี้ยงคือ การชำระเงิน (หรือ ชนะ ).
ปาร์ตี้ประกอบด้วย เคลื่อนไหว , เช่น. การเลือกผู้เล่นจากชุดทางเลือกที่เป็นไปได้
เคลื่อนไหวได้ ส่วนตัวและ สุ่ม.การเคลื่อนไหวส่วนบุคคล ไม่เหมือน สุ่ม , หมายถึงการเลือกอย่างมีสติโดยผู้เล่นของตัวเลือกบางอย่าง
เกมที่มีการเคลื่อนไหวส่วนบุคคลอย่างน้อยหนึ่งครั้งเรียกว่า ยุทธศาสตร์ .
เกมที่การเคลื่อนไหวทั้งหมดถูกเรียกแบบสุ่ม การพนัน .
เมื่อทำการเคลื่อนไหวส่วนตัวพวกเขายังพูดถึง กลยุทธ์ ผู้เล่นเช่น เกี่ยวกับกฎหรือชุดของกฎที่กำหนดทางเลือกของผู้เล่น ในขณะเดียวกัน กลยุทธ์ก็ควรมีความครอบคลุม กล่าวคือ ต้องกำหนดทางเลือกสำหรับสถานการณ์ที่เป็นไปได้ในระหว่างเกม
ความท้าทายทฤษฎีเกม– ค้นหากลยุทธ์ที่เหมาะสมของผู้เล่น เช่น กลยุทธ์ที่ให้ผลกำไรสูงสุดหรือขาดทุนขั้นต่ำ
การจำแนกแบบจำลองทฤษฎีเกม
เกม นบุคคลมักจะถูกเรียกว่า โดยที่
เป็นชุดกลยุทธ์ของผู้เล่นที่ i-th
- การชำระเงินเกม
ตามการกำหนดนี้ การจัดประเภทแบบจำลองทฤษฎีเกมต่อไปนี้สามารถเสนอได้:
ไม่ต่อเนื่อง (ชุดของกลยุทธ์ ไม่ต่อเนื่อง)
สุดท้าย
ไม่มีที่สิ้นสุด
ต่อเนื่อง (ชุดของกลยุทธ์ ต่อเนื่อง)
ไม่มีที่สิ้นสุด
นบุคคล (
)
แนวร่วม (สหกรณ์)
ไม่ใช่สหกรณ์ (ไม่ใช่สหกรณ์)
2 คน (คู่)
ศัตรู (เกมผลรวมศูนย์)
(ผลประโยชน์ของคู่กรณีตรงกันข้าม กล่าวคือ เสียผู้เล่นคนหนึ่งเท่ากับได้กำไรของอีกฝ่ายหนึ่ง)
ไม่เป็นปฏิปักษ์
พร้อมข้อมูลที่สมบูรณ์ (หากผู้เล่นทำการเคลื่อนไหวส่วนตัวรู้ประวัติทั้งหมดของเกม เช่น การเคลื่อนไหวทั้งหมดของคู่ต่อสู้)
ที่มีข้อมูลไม่ครบถ้วน
ด้วยยอดเงินเป็นศูนย์ (ยอดชำระทั้งหมดเป็นศูนย์)
ด้วยผลรวมที่ไม่ใช่ศูนย์
ทางเดียว (ลอตเตอรี่)
หลายทาง
การแสดงเมทริกซ์ของเกมที่เป็นปรปักษ์กัน
ในบทช่วยสอนนี้ เราจะพิจารณา เกมที่เป็นปฏิปักษ์ของคนสองคน
ให้ในรูปแบบเมทริกซ์ ซึ่งหมายความว่าเรารู้ชุดกลยุทธ์ของผู้เล่นคนแรก (ผู้เล่น อา){
อา ผม },
ผม = 1,…,
มและชุดกลยุทธ์ของผู้เล่นคนที่สอง (player บี){
บี เจ },
เจ = 1,...,
นและเมทริกซ์ อา
= ||
เอ อิจ ||
ผลตอบแทนของผู้เล่นคนแรก เนื่องจากเรากำลังพูดถึงเกมที่เป็นปฏิปักษ์ จึงถือว่าการได้ของผู้เล่นคนแรกเท่ากับการสูญเสียในเกมที่สอง เราพิจารณาว่าองค์ประกอบเมทริกซ์ เอ อิจคือผลตอบแทนของผู้เล่นคนแรกเมื่อเขาเลือกกลยุทธ์ อา ผมและคำตอบของผู้เล่นคนที่สองกับกลยุทธ์ บี เจ. เราจะอ้างถึงเกมเช่น
, ที่ไหน ม
- จำนวนกลยุทธ์ของผู้เล่น แต่,น
- จำนวนกลยุทธ์ของผู้เล่น ที่.โดยทั่วไปสามารถแสดงด้วยตารางต่อไปนี้:
บี 1 |
บี เจ |
บี น |
|||
อา 1 | |||||
อา ผม | |||||
อา ม |
ตัวอย่าง 1
ยกตัวอย่างง่ายๆ ให้พิจารณาเกมที่เกมประกอบด้วยสองท่า
ก้าวแรก: ผู้เล่น แต่เลือกหนึ่งในตัวเลข (1 หรือ 2) โดยไม่บอกฝ่ายตรงข้ามเกี่ยวกับตัวเลือกของเขา
ก้าวที่ 2: ผู้เล่น ที่เลือกหนึ่งในตัวเลข (3 หรือ 4)
ผล: การเลือกผู้เล่น แต่และ ที่เพิ่มขึ้น. ถ้าผลรวมเป็นคู่ ดังนั้น ที่จ่ายมูลค่าให้กับผู้เล่น แต่, ถ้าคี่ - ในทางกลับกัน แต่จ่ายผู้เล่น ที่.
เกมนี้สามารถแสดงเป็น
ด้วยวิธีต่อไปนี้:
(ตัวเลือก 3) |
(ตัวเลือก 4) |
|
(ตัวเลือก 1) | ||
(ตัวเลือก 2) |
ง่ายที่จะเห็นว่า เกมส์นี้เป็นปฏิปักษ์ นอกจากนี้ เป็นเกมที่มีข้อมูลไม่ครบถ้วนตั้งแต่ ผู้เล่น ที่,การเคลื่อนไหวส่วนตัวไม่รู้ว่าผู้เล่นเลือกอะไร แต่.
ดังที่กล่าวไว้ข้างต้น ภารกิจของทฤษฎีเกมคือการค้นหากลยุทธ์ที่เหมาะสมที่สุดของผู้เล่น กล่าวคือ กลยุทธ์ที่ให้ผลกำไรสูงสุดหรือขาดทุนขั้นต่ำ กระบวนการนี้เรียกว่า การตัดสินใจของเกม .
เมื่อแก้เกมในรูปแบบเมทริกซ์ เราควรตรวจสอบการมีอยู่ของเกม จุดอาน . สำหรับสิ่งนี้มีการแนะนำสองค่า:
คือขอบเขตล่างของราคาเกมและ
เป็นการประมาณราคาสูงสุดของเกม
ผู้เล่นคนแรกมักจะเลือกกลยุทธ์ที่เขาจะได้รับผลตอบแทนสูงสุดจากคำตอบที่เป็นไปได้ทั้งหมดของผู้เล่นคนที่สอง และคนที่สองจะเลือกกลยุทธ์ที่ลดการสูญเสียของตัวเองให้น้อยที่สุด กล่าวคือ เป็นไปได้ที่จะชนะครั้งแรก
สามารถพิสูจน์ได้ว่า α ≤ วี ≤ β , ที่ไหน วี–ราคาเกม นั่นคือผลตอบแทนที่เป็นไปได้ของผู้เล่นคนแรก
ถ้าความสัมพันธ์ α
=
β
=
วีแล้วพวกเขากล่าวว่า เกมมีจุดอาน
, และ แก้ไขด้วยกลยุทธ์ที่บริสุทธิ์
. กล่าวอีกนัยหนึ่งมีสองสามกลยุทธ์
,ให้ผู้เล่น แต่วี.
ตัวอย่าง 2
กลับไปที่เกมที่เราพิจารณาในตัวอย่างที่ 1 และตรวจสอบว่ามีจุดอานหรือไม่
(ตัวเลือก 3) |
(ตัวเลือก 4) | ||
(ตัวเลือก 1) | |||
(ตัวเลือก 2) | |||
สำหรับเกมนี้
=
-5,
=
4,
ดังนั้นจึงไม่มีจุดอาน
ย้ำอีกครั้งว่าเกมนี้เป็นเกมข้อมูลที่ไม่ครบถ้วน ในกรณีนี้ คุณสามารถแนะนำผู้เล่นได้เท่านั้น แต่เลือกกลยุทธ์ , เพราะ ในกรณีนี้เขาสามารถได้รับผลตอบแทนสูงสุดอย่างไรก็ตามโดยที่ผู้เล่นเลือก ที่กลยุทธ์ .
ตัวอย่างที่ 3
มาทำการเปลี่ยนแปลงกฎของเกมจากตัวอย่างที่ 1 กัน ให้ผู้เล่น ที่ข้อมูลการเลือกผู้เล่น แต่.แล้ว ที่มีสองกลยุทธ์เพิ่มเติม:
- กลยุทธ์ที่เป็นประโยชน์ต่อ แต่.ถ้าเลือกได้ เอ - 1,แล้ว ที่เลือก 3 ถ้าเลือก เอ - 2,แล้ว ที่เลือก 4;
- กลยุทธ์ที่ไม่เป็นประโยชน์สำหรับ แต่.ถ้าเลือกได้ เอ - 1,แล้ว ที่เลือก 4 ถ้าเลือก เอ - 2,แล้ว ที่เลือก 3
(ตัวเลือก 3) |
(ตัวเลือก 4) | ||||
(ตัวเลือก 1) | |||||
(ตัวเลือก 2) | |||||
เกมนี้เต็มไปด้วยข้อมูล
ในกรณีนี้
=
-5,
=
-5,
ดังนั้นเกมจึงมีจุดอาน
. จุดอานนี้สอดคล้องกับกลยุทธ์ที่เหมาะสมที่สุดสองคู่:
และ
. ราคาเกม วี= -5.
เป็นที่ชัดเจนว่าสำหรับ แต่เกมนี้ไร้ประโยชน์
ตัวอย่างที่ 2 และ 3 เป็นตัวอย่างที่ดีของทฤษฎีบทต่อไปนี้ ซึ่งได้รับการพิสูจน์แล้วในทฤษฎีเกม:
ทฤษฎีบท 1
เกมที่เป็นปรปักษ์กันทุกคู่พร้อมข้อมูลที่สมบูรณ์แบบได้รับการแก้ไขในกลยุทธ์ที่บริสุทธิ์
ที่. ทฤษฎีบทที่ 1 กล่าวว่าเกมสองคนใด ๆ ที่มีข้อมูลที่สมบูรณ์แบบมีจุดอานและมีคู่ของกลยุทธ์ที่บริสุทธิ์
,ให้ผู้เล่น แต่กำไรอย่างยั่งยืนเท่ากับราคาเกม วี.
ในกรณีที่ไม่มีจุดอานเรียกว่า กลยุทธ์ผสม
:, ที่ไหน พี ผม และq เจคือความน่าจะเป็นของการเลือกกลยุทธ์ อา ผม
และ
บี เจผู้เล่นคนแรกและคนที่สองตามลำดับ วิธีแก้ปัญหาของเกมในกรณีนี้คือคู่ของกลยุทธ์แบบผสม
เพิ่มความคาดหวังทางคณิตศาสตร์ของราคาของเกม
ลักษณะทั่วไปของทฤษฎีบท 1 ในกรณีของเกมที่มีข้อมูลไม่ครบถ้วนเป็นทฤษฎีบทต่อไปนี้:
ทฤษฎีบท 2
เกมที่เป็นปรปักษ์กันทุกเกมมีทางออกที่ดีที่สุดอย่างน้อยหนึ่งวิธี นั่นคือ กลยุทธ์แบบผสมคู่หนึ่งในกรณีทั่วไป
,ให้ผู้เล่น แต่กำไรอย่างยั่งยืนเท่ากับราคาเกม วี, นอกจากนี้ α ≤
วี ≤
β
.
ในกรณีพิเศษ สำหรับเกมที่มีจุดอาน การแก้ปัญหาในกลยุทธ์แบบผสมจะดูเหมือนเวกเตอร์คู่หนึ่ง โดยองค์ประกอบหนึ่งมีค่าเท่ากับหนึ่ง และส่วนที่เหลือจะเท่ากับศูนย์
กรณีที่ง่ายที่สุด ซึ่งอธิบายรายละเอียดอย่างละเอียดในทฤษฎีเกม เป็นเกมคู่ไฟนอลผลรวมศูนย์ (เกมที่เป็นปฏิปักษ์กับคนสองคนหรือสองกลุ่มพันธมิตร) พิจารณาเกมนี้ G, ซึ่งผู้เล่นสองคน แต่และ ที่,มีผลประโยชน์ตรงกันข้าม: ได้ของหนึ่งเท่ากับการสูญเสียของอีก. ตั้งแต่ผลตอบแทนของผู้เล่น แต่เท่ากับผลตอบแทนของผู้เล่น อยู่กับตรงข้ามเราสนใจแต่ผลตอบแทน เอผู้เล่น แต่.โดยธรรมชาติแล้ว แต่ต้องการเพิ่มสูงสุดและ ที่ -ลดขนาด ก.เพื่อความง่าย ให้ระบุตัวตนของเรากับผู้เล่นคนหนึ่ง (ปล่อยให้มันเป็น แต่)และเราจะเรียกเขาว่า "เรา" และผู้เล่น ที่ -"ฝ่ายตรงข้าม" (แน่นอนไม่มีข้อได้เปรียบที่แท้จริงสำหรับ แต่ไม่เป็นไปตามนี้) ให้เรามี tกลยุทธ์ที่เป็นไปได้ แต่ 1 , อา 2 , ..., แต่ มและศัตรู นกลยุทธ์ที่เป็นไปได้ ที่ 1 , ที่ 2 , ..; ที่ น(เกมดังกล่าวเรียกว่าเกม t × น). หมายถึง เอ อิจผลตอบแทนของเราถ้าเราใช้กลยุทธ์ อา ผม , และศัตรูคือกลยุทธ์ บี เจ .
ตาราง 26.1
อา ผม บี เจ |
บี 1 |
บี 2 |
บี น |
|
อา 1 อา 2 อา ม |
เอ 11 เอ 21 เอ m1 |
เอ 21 เอ ม |
เอ 1 น เอ 2 น เอ m |
สมมติว่าสำหรับกลยุทธ์แต่ละคู่ A<, ที่,ชนะ (หรือชนะโดยเฉลี่ย) เอ, เจพวกเรารู้. ตามหลักการแล้ว เป็นไปได้ที่จะรวบรวมตารางสี่เหลี่ยม (เมทริกซ์) ซึ่งแสดงรายการกลยุทธ์ของผู้เล่นและผลตอบแทนที่เกี่ยวข้อง (ดูตารางที่ 26.1)
ถ้าตารางดังกล่าวถูกรวบรวมแล้วเราบอกว่าเกม Gลดลงเป็นรูปแบบเมทริกซ์ (โดยตัวมันเอง การนำเกมไปสู่รูปแบบดังกล่าวอาจเป็นงานที่ยากอยู่แล้ว และบางครั้งก็แทบจะเป็นไปไม่ได้เลย เนื่องจากมีกลยุทธ์มากมาย) โปรดทราบว่าหากเกมถูกลดขนาดให้อยู่ในรูปแบบเมทริกซ์ เกมแบบหลายจังหวะก็จะลดลงเหลือเกมแบบเคลื่อนที่เดียว ผู้เล่นจะต้องทำการย้ายเพียงครั้งเดียว: เลือกกลยุทธ์ เราจะระบุเมทริกซ์เกมสั้น ๆ ( เอ อิจ).
ลองพิจารณาเกมตัวอย่าง G(4×5) ในรูปแบบเมทริกซ์ ที่การกำจัดของเรา (ให้เลือก) สี่กลยุทธ์ ศัตรูมีห้ากลยุทธ์ เมทริกซ์เกมมีให้ในตาราง 26.2
ลองคิดดูว่าเราจะใช้กลยุทธ์อะไร (ผู้เล่น แต่)เอาเปรียบ? Matrix 26.2 มีผลตอบแทนที่น่าดึงดูด "10"; เราถูกดึงดูดให้เลือกกลยุทธ์ แต่ 3 , ที่เราจะได้รับ "อาหารอันโอชะ" นี้ แต่เดี๋ยวก่อน ศัตรูก็ไม่โง่เหมือนกัน! หากเราเลือกกลยุทธ์ แต่ 3 , เขาถึงเราจะเลือกกลยุทธ์ ที่ 3 , และเราได้รับผลตอบแทนที่น่าสังเวช "1" ไม่ เลือกกลยุทธ์ แต่ 3 เป็นสิ่งต้องห้าม! จะเป็นอย่างไร? แน่นอน ตามหลักความระมัดระวัง (และเป็นหลักการหลักของทฤษฎีเกม) เราต้องเลือก
ตาราง 26.2
บี เจ อา ผม |
บี 1 |
บี 2 |
บี 3 |
บี 4 |
บี 5 |
อา 1 อา 2 อา 3 อา 4 |
กลยุทธ์ที่ กำไรขั้นต่ำของเราคือสูงสุดนี่คือสิ่งที่เรียกว่า "หลักการมินิแมกซ์": ดำเนินการในลักษณะที่คุณจะได้รับผลประโยชน์สูงสุดด้วยพฤติกรรมที่เลวร้ายที่สุดของศัตรูสำหรับคุณ
เราเขียนตาราง 26.2 ใหม่และในคอลัมน์เพิ่มเติมด้านขวา เราเขียนมูลค่าขั้นต่ำของการจ่ายเงินในแต่ละบรรทัด (ขั้นต่ำของบรรทัด) มากำหนดกันสำหรับ ผม- แถวที่ α ผม(ดูตาราง 26.3)
ตาราง 26.3
บี เจ อา ผม |
บี 1 |
บี 2 |
บี 3 |
บี 4 |
บี 5 | |
อา 1 อา 2 อา 3 อา 4 | ||||||
β เจ |
ของค่าทั้งหมด α ผม(คอลัมน์ขวา) ที่ใหญ่ที่สุด (3) ถูกเน้น ตรงกับกลยุทธ์ อาสี่. เมื่อเลือกกลยุทธ์นี้แล้ว ไม่ว่ากรณีใดๆ เราสามารถมั่นใจได้ว่า (สำหรับพฤติกรรมใดๆ ของศัตรู) เราจะได้รับไม่น้อยกว่า 3 ค่านี้เป็นกำไรที่รับประกันของเรา ระวังจะโดนน้อยกว่านี้ไม่ได้นะ (อาจจะได้มากกว่านี้) ผลตอบแทนนี้เรียกว่าราคาที่ต่ำกว่าของเกม (หรือ "สูงสุด" - สูงสุดของการจ่ายเงินขั้นต่ำ) เราจะแสดงว่า ก.ในกรณีของเรา α = 3.
ตอนนี้ให้เราใช้มุมมองของศัตรูและโต้เถียงกับเขา เขาไม่ใช่เบี้ยแต่ก็สมเหตุสมผลด้วย! เลือกกลยุทธเขาอยากจะให้น้อยลงแต่เขาต้องพึ่งพาพฤติกรรมของเราซึ่งแย่ที่สุดสำหรับเขา ถ้าเขาเลือกกลยุทธ์ ที่ 1 , เราจะตอบเขา แต่ 3 , และเขาจะให้ 10; ถ้าเขาเลือก บี 2 - เราจะตอบเขา แต่ 2 , และเขาจะให้ 8 เป็นต้น เราเพิ่มแถวล่างเพิ่มเติมในตาราง 26.3 และเขียนค่าสูงสุดของคอลัมน์ในนั้น เจ. เห็นได้ชัดว่า ปฏิปักษ์ที่ระมัดระวังควรเลือกกลยุทธ์ที่ลดค่านี้ให้เหลือน้อยที่สุด (ค่าที่สอดคล้องกันคือ 5 ถูกเน้นในตารางที่ 26.3) ค่าของ β นี้คือมูลค่าของกำไร มากกว่าที่คู่ต่อสู้ที่สมเหตุสมผลจะไม่ให้เราอย่างแน่นอน เรียกว่าราคาสูงสุดของเกม (หรือ "minimax" - ขั้นต่ำของเงินรางวัลสูงสุด) ในตัวอย่างของเรา β = 5 และทำได้ด้วยกลยุทธ์ของคู่ต่อสู้ บี 3 .
ดังนั้นตามหลักความระมัดระวัง (กฎการประกันภัยต่อ "มักจะนับสิ่งที่แย่ที่สุด!") เราต้องเลือกกลยุทธ์ แต่ 4 , และศัตรู - กลยุทธ์ ที่ 3 . กลยุทธ์ดังกล่าวเรียกว่า "minimax" (ตามหลักการ minimax) ตราบใดที่ทั้งสองฝ่ายในตัวอย่างของเรายึดมั่นในกลยุทธ์ขั้นต่ำ ผลตอบแทนจะเป็น เอ 43 = 3.
ตอนนี้ลองนึกภาพสักครู่ว่าเราได้เรียนรู้ว่าศัตรูกำลังไล่ตามกลยุทธ์ ที่ 3 . มาเลย มาลงโทษเขาและเลือกกลยุทธ์กันเถอะ แต่ 1 - เราจะได้ 5 ซึ่งก็ไม่ได้แย่ขนาดนั้น แต่ท้ายที่สุดแล้ว ศัตรูก็ไม่พลาดเช่นกัน ให้เขารู้ว่ากลยุทธ์ของเรา แต่ 1 ; เขายังเลือกได้อย่างรวดเร็ว ที่ 4 , ลดผลตอบแทนของเราเป็น 2 ฯลฯ (พันธมิตร "รีบเร่งเกี่ยวกับกลยุทธ์") พูดง่ายๆ ก็คือ กลยุทธ์ minimax ในตัวอย่างของเรา ไม่เสถียรในความสัมพันธ์กับถึง ข้อมูลเกี่ยวกับพฤติกรรมของอีกฝ่ายหนึ่งกลยุทธ์เหล่านี้ไม่มีคุณสมบัติสมดุล
มันเป็นแบบนี้เสมอ? ไม่เสมอไป พิจารณาตัวอย่างด้วยเมทริกซ์ที่ให้ไว้ในตารางที่ 26.4
ในตัวอย่างนี้ ราคาเกมที่ต่ำกว่าจะเท่ากับราคาบน: α = β = 6. อะไรต่อจากนี้? กลยุทธ์ผู้เล่น Minimax แต่และ ที่จะยั่งยืน ตราบใดที่ผู้เล่นทั้งสองยังยึดติดกับพวกเขา ผลตอบแทนคือ 6. มาดูกันว่าจะเกิดอะไรขึ้นถ้าเรา (แต่)รู้ว่าศัตรู (ที่)
ตาราง 26.4
บีเจ อา ผม |
บี 1 |
บี 2 |
บี 3 |
บี 4 | |
อา 1 อา 2 อา 3 | |||||
β เจ |
ยึดมั่นในกลยุทธ์ บี 2 ? และไม่มีอะไรจะเปลี่ยนแปลงอย่างแน่นอน เพราะการเบี่ยงเบนจากกลยุทธใดๆ แต่ 2 สามารถทำให้สถานการณ์ของเราแย่ลงได้ ในทำนองเดียวกัน ข้อมูลที่ศัตรูได้รับจะไม่ทำให้เขาถอยห่างจากกลยุทธ์ของเขา ที่ 2 . คู่กลยุทธ์ แต่ 2 , บี 2 มีคุณสมบัติของความสมดุล (คู่กลยุทธ์ที่สมดุล) และผลตอบแทน (ในกรณีของเรา 6) ที่ทำได้ด้วยกลยุทธ์คู่นี้เรียกว่า "จุดอานของเมทริกซ์" 1) สัญญาณของการมีอยู่ของจุดอานและคู่ของกลยุทธ์ที่สมดุลคือความเท่าเทียมกันของราคาที่ต่ำกว่าและบนของเกม ค่าทั่วไปของ α และ β เรียกว่าราคาของเกม เราจะติดป้ายว่า วี:
α = β = วี
กลยุทธ์ อา ผม , บี เจ(ในกรณีนี้ แต่ 2 , ที่ 2 ), ซึ่งผลตอบแทนที่ได้รับนี้เรียกว่ากลยุทธ์บริสุทธิ์ที่เหมาะสมที่สุด และจำนวนรวมทั้งหมดนั้นเรียกว่าวิธีแก้ปัญหาของเกม ในกรณีนี้ ตัวเกมเองได้รับการกล่าวขานว่าต้องแก้ด้วยกลยุทธ์ล้วนๆ ทั้งสองด้าน แต่และ ที่เราสามารถระบุกลยุทธ์ที่เหมาะสมที่สุดภายใต้ตำแหน่งของพวกเขาได้ดีที่สุด ผู้เล่นคืออะไร แต่ในกรณีนี้ชนะ 6 ครั้งและผู้เล่น ที่ -แพ้ 6, - นี่คือเงื่อนไขของเกม: มันมีประโยชน์สำหรับ แต่และเสียเปรียบสำหรับ ที่
1) คำว่า "จุดอาน" นำมาจากเรขาคณิต - นี่คือชื่อของจุดบนพื้นผิวที่ถึงจุดต่ำสุดตามพิกัดหนึ่งและสูงสุดพร้อมกัน
ผู้อ่านอาจมีคำถาม: เหตุใดกลยุทธ์ที่เหมาะสมจึงเรียกว่า "บริสุทธิ์" เมื่อมองไปข้างหน้า เรามาตอบคำถามนี้กัน: มีกลยุทธ์ "ผสม" ซึ่งประกอบด้วยความจริงที่ว่าผู้เล่นไม่ได้ใช้กลยุทธ์เดียว แต่ใช้หลายกลยุทธ์สลับกันแบบสุ่ม ดังนั้น หากเรายอมให้นอกจากกลยุทธ์ที่บริสุทธิ์แล้ว ยังใช้กลยุทธ์แบบผสมใดๆ อีกด้วย จบเกมมีทางออก - จุดสมดุล แต่เรายังคงพูดถึงอะตอม
การมีจุดอานในเกมอยู่ไกลจากกฎ ค่อนข้างจะเป็นข้อยกเว้น เกมส่วนใหญ่ไม่มีจุดอาน อย่างไรก็ตาม มีเกมหลากหลายประเภทที่มีจุดอานเสมอ ดังนั้นจึงแก้ไขได้ด้วยกลยุทธ์ล้วนๆ เหล่านี้คือสิ่งที่เรียกว่า "เกมที่มีข้อมูลครบถ้วน" เกมที่มีชั้นข้อมูลเป็นเกมที่ผู้เล่นแต่ละคนรู้ประวัติทั้งหมดของการพัฒนา นั่นคือผลของการเคลื่อนไหวก่อนหน้าทั้งหมด ทั้งส่วนบุคคลและแบบสุ่ม ในการเคลื่อนไหวส่วนบุคคลแต่ละครั้ง ตัวอย่างเกมที่มีข้อมูลครบถ้วน เช่น หมากฮอส, หมากรุก, tic-tac-toe เป็นต้น
ตามทฤษฎีเกมพิสูจน์แล้วว่า ทุกเกมที่มีข้อมูลครบถ้วนมีจุดอานและด้วยเหตุนี้จึงสามารถแก้ไขได้ด้วยกลยุทธ์ล้วนๆ ในทุกเกมที่มีข้อมูลที่สมบูรณ์แบบ มีกลยุทธ์ที่เหมาะสมที่สุดคู่หนึ่งที่ให้ผลตอบแทนที่มั่นคงเท่ากับห่วงโซ่ของเกม วี. หากเกมดังกล่าวประกอบด้วยการเคลื่อนไหวส่วนบุคคลเท่านั้น เมื่อผู้เล่นแต่ละคนใช้กลยุทธ์ที่เหมาะสมที่สุดของตนเอง เกมนั้นจะต้องจบลงด้วยวิธีที่ชัดเจน โดยให้ผลตอบแทนเท่ากับราคาเกม ดังนั้น หากรู้วิธีแก้ปัญหาของเกม ตัวเกมเองก็สูญเสียความหมายไป!
ลองมาดูตัวอย่างเบื้องต้นของเกมที่มีข้อมูลครบถ้วน: ผู้เล่นสองคนสลับกันวางนิกเกิลบนโต๊ะกลม โดยเลือกตำแหน่งของจุดศูนย์กลางของเหรียญตามอำเภอใจ (ไม่อนุญาตให้มีการทับซ้อนกันของเหรียญ) ผู้ชนะคือผู้ที่วางเพนนีสุดท้าย (เมื่อไม่มีที่ว่างสำหรับผู้อื่น) มันง่ายที่จะเห็นว่าผลลัพธ์ของเกมนี้เป็นข้อสรุปมาก่อน มีกลยุทธ์บางอย่างที่ทำให้แน่ใจว่าผู้เล่นที่วางเหรียญก่อนเป็นผู้ชนะ กล่าวคือ เขาต้องวางนิกเกิลไว้ตรงกลางโต๊ะก่อน จากนั้นจึงตอบสนองต่อการเคลื่อนไหวแต่ละครั้งของคู่ต่อสู้ด้วยการเคลื่อนไหวแบบสมมาตร เห็นได้ชัดว่าไม่ว่าฝ่ายตรงข้ามจะมีพฤติกรรมอย่างไร เขาไม่สามารถหลีกเลี่ยงการสูญเสียได้ สถานการณ์เหมือนกันทุกประการกับหมากรุกและเกมที่มีข้อมูลทั้งหมดโดยทั่วไป: ใด ๆ ของพวกเขาที่เขียนในรูปแบบเมทริกซ์มีจุดอานและด้วยเหตุนี้การแก้ปัญหาอยู่ในกลยุทธ์ที่บริสุทธิ์และดังนั้นจึงสมเหตุสมผลตราบใดที่สิ่งนี้ ไม่พบวิธีแก้ปัญหา สมมุติว่าเกมหมากรุกก็เช่นกัน เสมอลงท้ายด้วย ขาว ชนะ หรือ เสมอ -ชัยชนะสีดำหรือ เสมอ -เสมอโดยสิ่งที่แน่นอน - เรายังไม่ทราบ (โชคดีสำหรับคนรักหมากรุก) มาเพิ่มอีกเรื่องเถอะ เราแทบจะไม่รู้เลยในอนาคตอันใกล้นี้ เพราะกลยุทธ์มีมากมายจนยากมาก (ถ้าไม่เป็นไปไม่ได้) ที่จะลดเกมให้อยู่ในรูปแบบเมทริกซ์และหาจุดอานในนั้น
ทีนี้ลองถามตัวเองว่าจะทำอย่างไรถ้าเกมไม่มีจุดอาน: α ≠ β ? ถ้าผู้เล่นแต่ละคนถูกบังคับให้เลือกอย่างใดอย่างหนึ่ง - กลยุทธ์ที่บริสุทธิ์เพียงอย่างเดียวก็ไม่มีอะไรต้องทำ: ต้องได้รับคำแนะนำจากหลักการมินิแม็กซ์ อีกสิ่งหนึ่งคือถ้าเป็นไปได้ที่จะ "ผสม" ชุดกลยุทธ์ สลับแบบสุ่มด้วยความน่าจะเป็นบางอย่าง การใช้กลยุทธ์แบบผสมเกิดขึ้นในลักษณะนี้: เกมซ้ำหลายครั้ง; ก่อนแต่ละเกมของเกมเมื่อผู้เล่นได้รับการเคลื่อนไหวส่วนตัวเขา "มอบหมาย" ให้มีโอกาส "โยนล็อต" และใช้กลยุทธ์ที่หลุดออกมา (เรารู้วิธีจัดล็อตจากบทที่แล้วแล้ว ).
กลยุทธ์แบบผสมในทฤษฎีเกมเป็นรูปแบบของยุทธวิธีที่ปรับเปลี่ยนได้และยืดหยุ่น เมื่อไม่มีผู้เล่นคนใดรู้ว่าฝ่ายตรงข้ามจะมีพฤติกรรมอย่างไรในเกมที่กำหนด ชั้นเชิงนี้ (แม้ว่าจะไม่มีเหตุผลทางคณิตศาสตร์ก็ตาม) มักใช้ในเกมไพ่ ให้เราทราบในขณะเดียวกันว่าวิธีที่ดีที่สุดในการซ่อนพฤติกรรมของคุณจากศัตรูคือการสุ่มให้ตัวละครนั้นและดังนั้นอย่ารู้ล่วงหน้าว่าคุณจะทำอะไร
มาพูดถึงกลยุทธ์แบบผสมกัน เราจะแสดงถึงกลยุทธ์ที่หลากหลายของผู้เล่น แต่และ ที่ตามลำดับ สเอ = ( พี 1 , R 2 , ..., พี ม), ส บี = (q 1 , q 2 , …, q น), ที่ไหน พี 1 , พี 2 , …, พี ม(รวมกันเป็นหนึ่ง) - ความน่าจะเป็นของผู้เล่นที่ใช้ แต่กลยุทธ์ แต่ 1 , อา 2 ,… , อา ม ; q 1 , q 2 , …, q น- ความน่าจะเป็นในการใช้งานโดยผู้เล่น ที่กลยุทธ์ ที่ 1 , ที่ 2 , ..., ที่ น . ในกรณีพิเศษ เมื่อความน่าจะเป็นทั้งหมด ยกเว้นหนึ่ง เท่ากับศูนย์ และอันนี้เท่ากับหนึ่ง กลยุทธ์แบบผสมจะกลายเป็นหนึ่งบริสุทธิ์
มีทฤษฎีบทพื้นฐานของทฤษฎีเกม: เกมที่มีผลรวมเป็นศูนย์สำหรับสองคนใด ๆ ที่มีอย่างน้อยหนึ่งวิธี -คู่ของกลยุทธ์ที่เหมาะสม ผสมกันโดยทั่วไป
และราคาที่สอดคล้องกัน วี.
คู่ของกลยุทธ์ที่เหมาะสมที่สุด
การสร้างโซลูชันของเกมมีคุณสมบัติดังต่อไปนี้: หากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ที่เหมาะสมที่สุดของเขา จะไม่สามารถทำกำไรให้อีกฝ่ายหนึ่งเบี่ยงเบนไปจากเขาเองได้กลยุทธ์คู่นี้สร้างสมดุลในเกม ผู้เล่นคนหนึ่งต้องการเปลี่ยนกำไรให้สูงสุด อีกกลยุทธ์หนึ่งให้เหลือน้อยที่สุด แต่ละคนดึงไปในทิศทางของตัวเอง และด้วยพฤติกรรมที่สมเหตุสมผลของทั้งสองอย่าง สมดุลและความมั่นคง กำไรจะถูกจัดตั้งขึ้น วีถ้า วี > 0 แล้วเกมจะทำกำไรให้เราถ้า วี<
0
-
สำหรับศัตรู; ที่ วี= 0 เกมนั้น “ยุติธรรม” ซึ่งเป็นประโยชน์สำหรับผู้เข้าร่วมทั้งสองอย่างเท่าเทียมกัน
ลองพิจารณาตัวอย่างเกมที่ไม่มีจุดอานและให้คำตอบ (โดยไม่มีข้อพิสูจน์) เกมมีดังนี้: ผู้เล่นสองคน แต่และ ที่พร้อมกันโดยไม่พูดอะไร ให้แสดงหนึ่ง สอง หรือสามนิ้ว การชนะตัดสินด้วยจำนวนนิ้วทั้งหมด: หากเป็นคู่ ชนะ แต่และรับจาก ที่จำนวนเท่ากับจำนวนนี้ ถ้าแปลกก็กลับกัน แต่จ่าย ที่จำนวนเท่ากับจำนวนนั้น ผู้เล่นควรทำอย่างไร?
มาสร้างเมทริกซ์เกมกันเถอะ ในหนึ่งเกม ผู้เล่นแต่ละคนมีสามกลยุทธ์: แสดงหนึ่ง สอง หรือสามนิ้ว เมทริกซ์ 3×3 ให้ไว้ในตารางที่ 26.5; คอลัมน์ขวาพิเศษแสดงค่าสูงสุดของแถว และแถวล่างพิเศษแสดงค่าสูงสุดของคอลัมน์
ราคาที่ต่ำกว่าของเกม α = - 3 และสอดคล้องกับกลยุทธ์ อา 1 . ซึ่งหมายความว่าด้วยพฤติกรรมที่สมเหตุสมผลและระมัดระวัง เรารับประกันว่าเราจะไม่สูญเสียมากกว่า 3 การปลอบใจเล็กน้อย แต่ก็ยังดีกว่าการชนะ 5 ครั้งซึ่งเกิดขึ้นในบางเซลล์ของเมทริกซ์ ไม่ดีสำหรับเราผู้เล่น แต่...แต่มาปลอบใจตัวเอง:
ตำแหน่งของฝ่ายตรงข้ามดูเหมือนจะแย่ลงไปอีก: ต้นทุนที่ต่ำกว่าของเกมคือ β = 4 นั่นคือด้วยพฤติกรรมที่สมเหตุสมผลเขาจะให้เราอย่างน้อย 4 โดยทั่วไปตำแหน่งนั้นไม่ค่อยดี - ไม่ว่าสำหรับใครก็ตาม ด้านอื่น ๆ. แต่มาดูกันว่าจะปรับปรุงได้หรือไม่? ปรากฎว่าคุณทำได้ หากแต่ละฝ่ายไม่ใช้กลยุทธ์เดียว แต่ใช้กลยุทธ์แบบผสมซึ่ง
ตาราง 26.5
บีเจ อา ผม |
บี 1 |
บี 2 |
บี 3 | |
อา 1 อา 2 อา 3 | ||||
β เจ |
การเข้าครั้งแรกและครั้งที่สามด้วยความน่าจะเป็น 1/4 และครั้งที่สอง - ด้วยความน่าจะเป็น 1/2 นั่นคือ
จากนั้นผลตอบแทนเฉลี่ยจะเท่ากับศูนย์อย่างต่อเนื่อง (ซึ่งหมายความว่าเกม "ยุติธรรม" และเป็นประโยชน์ต่อทั้งสองฝ่ายเท่าเทียมกัน) กลยุทธ์
สร้างวิธีแก้ปัญหาให้กับเกมและราคา วี= 0. เราพบวิธีแก้ปัญหานี้ได้อย่างไร? นี่เป็นคำถามที่แตกต่างออกไป ในส่วนถัดไป เราจะแสดงให้เห็นว่าโดยทั่วไปแล้วเกมที่มีขอบเขตจำกัดจะได้รับการแก้ไขอย่างไร
พิจารณาเกมคู่ผลรวมศูนย์ที่มีขอบเขตจำกัด แสดงโดย เอผลตอบแทนของผู้เล่น อาและผ่าน ข- ผู้เล่นชนะ บี. เพราะ เอ = –ขเมื่อวิเคราะห์เกมดังกล่าว ไม่จำเป็นต้องพิจารณาตัวเลขทั้งสองนี้ - การพิจารณาผลตอบแทนของผู้เล่นคนใดคนหนึ่งก็เพียงพอแล้ว ให้เป็นเช่นนั้น ตัวอย่างเช่น อา. ต่อไปนี้ เพื่อความสะดวกในการนำเสนอ ด้านข้าง อาเราจะตั้งชื่อตามเงื่อนไข " เรา"และด้านข้าง บี – "ศัตรู".
ให้เรามี มกลยุทธ์ที่เป็นไปได้ อา 1 , อา 2 , …, เป็นและศัตรู นกลยุทธ์ที่เป็นไปได้ บี 1 , บี 2 , …, บีน(เกมดังกล่าวเรียกว่าเกม ม×น). สมมติว่าแต่ละฝ่ายเลือกกลยุทธ์บางอย่าง: เราเลือกแล้ว AI, ปฏิปักษ์ บีเจ. หากเกมประกอบด้วยการเคลื่อนไหวส่วนบุคคลเท่านั้น ทางเลือกของกลยุทธ์ AIและ บีเจกำหนดผลลัพธ์ของเกมโดยเฉพาะ - ผลตอบแทนของเรา (บวกหรือลบ) มาแสดงกำไรนี้เป็น ไอจ(ชนะเมื่อเราเลือกกลยุทธ์ AIและศัตรู - กลยุทธ์ บีเจ).
หากเกมมีนอกเหนือจากการเคลื่อนไหวแบบสุ่มส่วนบุคคลแล้ว ผลตอบแทนสำหรับคู่ของกลยุทธ์ AI, บีเจเป็นตัวแปรสุ่มที่ขึ้นอยู่กับผลลัพธ์ของการเคลื่อนไหวแบบสุ่มทั้งหมด ในกรณีนี้ การประมาณการตามธรรมชาติของผลตอบแทนที่คาดหวังคือ การคาดการณ์ทางคณิตศาสตร์ของการชนะแบบสุ่ม. เพื่อความสะดวกเราจะแสดงโดย ไอจทั้งผลตอบแทน (ในเกมที่ไม่มีการเคลื่อนไหวแบบสุ่ม) และความคาดหวังทางคณิตศาสตร์ (ในเกมที่มีการเคลื่อนไหวแบบสุ่ม)
สมมุติว่าเรารู้ค่า ไอจสำหรับกลยุทธ์แต่ละคู่ ค่าเหล่านี้สามารถเขียนเป็นเมทริกซ์ที่มีแถวสอดคล้องกับกลยุทธ์ของเรา ( AI) และคอลัมน์แสดงกลยุทธ์ของคู่ต่อสู้ ( บีเจ):
บี เจ เอ ไอ | บี 1 | บี 2 | … | บีน |
อา 1 | เอ 11 | เอ 12 | … | เอ 1น |
อา 2 | เอ 21 | เอ 22 | … | เอ 2น |
… | … | … | … | … |
เป็น | เป็น 1 | เป็น 2 | … | amn |
เมทริกซ์ดังกล่าวเรียกว่า เมทริกซ์ผลตอบแทนของเกมหรือง่ายๆ เกมเมทริกซ์.
โปรดทราบว่าการสร้างเมทริกซ์ผลตอบแทนสำหรับเกมที่มีกลยุทธ์จำนวนมากอาจเป็นงานที่ยาก ตัวอย่างเช่น สำหรับ เกมหมากรุกจำนวนของกลยุทธ์ที่เป็นไปได้มีมากจนการสร้างเมทริกซ์ผลตอบแทนนั้นเป็นไปไม่ได้ในทางปฏิบัติ อย่างไรก็ตาม โดยหลักการแล้วเกมใด ๆ ที่มีขอบเขตจำกัดสามารถถูกย่อให้อยู่ในรูปแบบเมทริกซ์ได้
พิจารณา ตัวอย่าง 1เกมที่เป็นปรปักษ์กัน 4×5 เรามี 4 กลยุทธ์ ศัตรูมี 5 กลยุทธ์ เมทริกซ์ของเกมมีดังนี้:
บี เจ เอ ไอ | บี 1 | บี 2 | บี 3 | บี 4 | บี 5 |
อา 1 | |||||
อา 2 | |||||
อา 3 | |||||
อา 4 |
เราควรใช้กลยุทธ์อะไร (เช่น ผู้เล่น อา) ใช้? ไม่ว่าเราจะเลือกกลยุทธ์ใด ปฏิปักษ์ที่มีเหตุผลจะตอบสนองด้วยกลยุทธ์ที่ผลตอบแทนของเราให้น้อยที่สุด เช่น ถ้าเราเลือกกลยุทธ์ อา 3 (ลุ้นชนะ 10) คู่ต่อสู้จะเลือกกลยุทธในการตอบโต้ บี 1 และผลตอบแทนของเราจะอยู่ที่ 1 เท่านั้น แน่นอน ตามหลักความระมัดระวัง (และเป็นหลักการหลักของทฤษฎีเกม) เราต้องเลือกกลยุทธ์ที่ กำไรขั้นต่ำของเราคือสูงสุด.
แสดงโดย ฉันมูลค่าผลตอบแทนขั้นต่ำสำหรับกลยุทธ์ AI:
และเพิ่มคอลัมน์ที่มีค่าเหล่านี้ลงในเมทริกซ์เกม:
บี เจ เอ ไอ | บี 1 | บี 2 | บี 3 | บี 4 | บี 5 | ขั้นต่ำในแถว ฉัน | |
อา 1 | |||||||
อา 2 | |||||||
อา 3 | |||||||
อา 4 | maximin |
ในการเลือกกลยุทธ เราต้องเลือกกลยุทธที่คุ้มค่า ฉันขีดสุด. มาแทนค่าสูงสุดนี้โดย α :
ค่า α เรียกว่า ราคาเกมที่ต่ำกว่าหรือ maximin(ชนะขั้นต่ำสูงสุด). กลยุทธ์ผู้เล่น อาสอดคล้องกับ maximin α , ถูกเรียก กลยุทธ์สูงสุด.
ในตัวอย่างนี้ ค่าสูงสุด α เท่ากับ 3 (เซลล์ที่เกี่ยวข้องในตารางถูกเน้นเป็นสีเทา) และกลยุทธ์สูงสุดคือ อาสี่. เมื่อเลือกกลยุทธ์นี้แล้วเราสามารถมั่นใจได้ว่าพฤติกรรมของศัตรูเราจะชนะไม่น้อยกว่า 3 (และอาจจะมากกว่าด้วยพฤติกรรมที่ "ไม่สมเหตุสมผล" ของศัตรู) ค่านี้เป็นค่าต่ำสุดที่รับประกันได้ซึ่งเราสามารถรับรองได้ ตัวเราเองโดยยึดมั่นในกลยุทธ์ ("การประกันภัยต่อ") ที่ระมัดระวังที่สุด
ตอนนี้เราจะดำเนินการให้เหตุผลที่คล้ายกันสำหรับศัตรู บี บี อา บี 2 - เราจะตอบเขา อา .
แสดงโดย βj อา บี) สำหรับกลยุทธ์ AI:
βj β :
7. เกมที่มีมูลค่าสูงสุดคืออะไร ตอนนี้เราจะดำเนินการให้เหตุผลที่คล้ายกันสำหรับคู่ต่อสู้ บี. เขาสนใจที่จะลดกำไรของเรา นั่นคือ ให้เราน้อยลง แต่เขาต้องพึ่งพาพฤติกรรมของเรา ซึ่งแย่ที่สุดสำหรับเขา เช่น ถ้าเขาเลือกกลยุทธ์ บี 1 แล้วเราจะตอบเขาด้วยกลยุทธ์ อา 3 และเขาจะให้เรา 10. ถ้าเขาเลือก บี 2 - เราจะตอบเขา อา 2 และเขาจะให้ 8 เป็นต้น เห็นได้ชัดว่าคู่ต่อสู้ที่ระมัดระวังต้องเลือกกลยุทธ์ที่ กำไรสูงสุดของเราจะน้อยที่สุด.
แสดงโดย βjค่าสูงสุดในคอลัมน์ของเมทริกซ์ผลตอบแทน (ผลตอบแทนสูงสุดของผู้เล่น อาหรือที่เหมือนกันคือการสูญเสียสูงสุดของผู้เล่น บี) สำหรับกลยุทธ์ AI:
และเพิ่มแถวที่มีค่าเหล่านี้ลงในเมทริกซ์เกม:
เลือกกลยุทธ์ศัตรูจะชอบกลยุทธ์ที่คุ้มค่า βjขั้นต่ำ มาแทนด้วย β :
ค่า β เรียกว่า ราคาเกมชั้นนำหรือ มินิแม็กซ์(ชนะขั้นต่ำสูงสุดขั้นต่ำ). กลยุทธ์ของฝ่ายตรงข้าม (ผู้เล่น) ที่สอดคล้องกับ minimax บี), ถูกเรียก กลยุทธ์ขั้นต่ำ.
ขั้นต่ำคือมูลค่าของกำไร มากกว่าที่คู่ต่อสู้ที่สมเหตุสมผลจะไม่ให้เราอย่างแน่นอน (กล่าวอีกนัยหนึ่ง คู่ต่อสู้ที่สมเหตุสมผลจะสูญเสียไม่เกิน β ). ในตัวอย่างนี้ minimax β เท่ากับ 5 (เซลล์ที่สอดคล้องกันในตารางถูกเน้นด้วยสีเทา) และทำได้ด้วยกลยุทธ์ของฝ่ายตรงข้าม บี 3 .
ดังนั้น ตามหลักความระมัดระวัง ("คาดหวังสิ่งที่เลวร้ายที่สุดเสมอ!") เราต้องเลือกกลยุทธ์ อา 4 และศัตรู - กลยุทธ์ บี 3 . หลักการของความระมัดระวังเป็นพื้นฐานในทฤษฎีเกมและเรียกว่า หลักการมินิแม็กซ์.
พิจารณา ตัวอย่าง2. ให้ผู้เล่น อาและ ที่หนึ่งในสามตัวเลขเขียนพร้อมกันและเป็นอิสระจากกัน: "1" หรือ "2" หรือ "3" หากผลรวมของตัวเลขที่เขียนเป็นคู่ ผู้เล่น บีจ่ายผู้เล่น อาจำนวนนี้ หากจำนวนเงินเป็นเลขคี่ ผู้เล่นจะจ่ายเงินจำนวนนี้ อาผู้เล่น ที่.
ลองเขียนเมทริกซ์ผลตอบแทนของเกมและค้นหาราคาที่ต่ำกว่าและด้านบนของเกม (หมายเลขกลยุทธ์สอดคล้องกับตัวเลขที่เขียน):
ผู้เล่น อาต้องยึดตามกลยุทธิ์สูงสุด อา 1 ชนะอย่างน้อย -3 (นั่นคือ แพ้มากสุด 3) กลยุทธ์ผู้เล่นขั้นต่ำ บีกลยุทธ์ใด ๆ บี 1 และ บี 2 ซึ่งรับรองว่าเขาจะให้ไม่เกิน 4
เราจะได้ผลลัพธ์เช่นเดียวกันหากเราเขียนเมทริกซ์ผลตอบแทนจากมุมมองของผู้เล่น ที่. อันที่จริงเมทริกซ์นี้ได้มาจากการย้ายเมทริกซ์ที่สร้างจากมุมมองของผู้เล่น อาและเปลี่ยนสัญญาณของธาตุให้ตรงกันข้าม (เนื่องจากผลตอบแทนของผู้เล่น อาคือการสูญเสียผู้เล่น ที่):
ตามเมทริกซ์นี้ มันเป็นไปตามที่ผู้เล่น บีต้องปฏิบัติตามกลยุทธ์ใด ๆ บี 1 และ บี 2 (แล้วเขาจะเสียไม่เกิน 4) และผู้เล่น อา– กลยุทธ์ อา 1 (แล้วเขาจะเสียไม่เกิน 3) อย่างที่คุณเห็น ผลลัพธ์จะเหมือนกับที่ได้รับข้างต้น ดังนั้นการวิเคราะห์จึงไม่สำคัญจากมุมมองของผู้เล่นที่เราดำเนินการ
8 เกมที่มีค่าคืออะไร
9. หลักการ MINIMAX ประกอบด้วยอะไร 2. ราคาที่ต่ำกว่าและด้านบนของเกม หลักการมินิแมกซ์
พิจารณาเกมเมทริกซ์ประเภทที่มีเมทริกซ์ผลตอบแทน
ถ้าผู้เล่น แต่จะเลือกกลยุทธ ฉันจากนั้นผลตอบแทนที่เป็นไปได้ทั้งหมดจะเป็นองค์ประกอบ ผม- แถวที่หนึ่งของเมทริกซ์ จาก. แย่ที่สุดสำหรับผู้เล่น แต่กรณีที่ผู้เล่น ที่ใช้กลยุทธ์ที่เหมาะสมกับ ขั้นต่ำองค์ประกอบของเส้นนี้ ผลตอบแทนของผู้เล่น แต่จะเท่ากับจำนวน
ดังนั้น เพื่อให้ได้ผลตอบแทนสูงสุด ผู้เล่น แต่คุณต้องเลือกหนึ่งในกลยุทธ์ที่ตัวเลข ขีดสุด.
ปัญหาการตัดสินใจที่พิจารณาในกรอบของแนวทางระบบ ประกอบด้วยองค์ประกอบหลักสามส่วน: ระบบ ระบบย่อยการควบคุม และสภาพแวดล้อมมีความโดดเด่น ตอนนี้เราหันไปศึกษาปัญหาการตัดสินใจ ซึ่งระบบไม่ได้รับผลกระทบจากระบบย่อยการควบคุมเพียงระบบเดียว แต่ระบบย่อยการควบคุมหลายระบบ ซึ่งแต่ละระบบมีเป้าหมายและความเป็นไปได้ในการดำเนินการของตนเอง แนวทางในการตัดสินใจนี้เรียกว่า ทฤษฎีเกม และเรียกแบบจำลองทางคณิตศาสตร์ของการโต้ตอบที่สอดคล้องกัน เกม. เนื่องจากความแตกต่างในเป้าหมายของระบบย่อยการควบคุม เช่นเดียวกับข้อจำกัดบางประการเกี่ยวกับความเป็นไปได้ในการแลกเปลี่ยนข้อมูลระหว่างกัน การโต้ตอบเหล่านี้จึงมีลักษณะความขัดแย้ง ดังนั้นเกมใด ๆ จึงเป็นแบบจำลองทางคณิตศาสตร์ของความขัดแย้ง เราจำกัดตัวเองไว้เฉพาะกรณีเมื่อมีระบบควบคุมย่อยสองระบบ หากเป้าหมายของระบบตรงกันข้าม ความขัดแย้งจะเรียกว่าเป็นปรปักษ์ และเรียกแบบจำลองทางคณิตศาสตร์ของความขัดแย้งดังกล่าว เกมที่เป็นปฏิปักษ์..
ในศัพท์ตามทฤษฎีเกม เรียกระบบย่อยการควบคุมที่ 1 ว่า ผู้เล่น 1, ระบบย่อยการควบคุมที่ 2 - ผู้เล่น2, ชุด
การกระทำทางเลือกของพวกเขาเรียกว่า ชุดกลยุทธ์ผู้เล่นเหล่านี้ อนุญาต X- ชุดผู้เล่น 1 กลยุทธ์ Y- กลยุทธ์มากมาย
ผู้เล่น 2. สถานะของระบบจะถูกกำหนดโดยการเลือกการดำเนินการควบคุมโดยระบบย่อย 1 และ 2 นั่นคือการเลือกกลยุทธ์
x∈Xและ y∈Y. อนุญาต F(x,y) - ค่ายูทิลิตี้โดยประมาณสำหรับผู้เล่น 1 ในสถานะนั้น
ระบบที่จะผ่านเมื่อผู้เล่น 1 เลือกกลยุทธ์ Xและ
ผู้เล่น 2 กลยุทธ์ ที่. ตัวเลข F(x,y) ถูกเรียก ชนะผู้เล่นที่ 1 ในสถานการณ์ ( x,y) และฟังก์ชัน F- ผู้เล่น 1 ฟังก์ชั่นการจ่ายเงิน. ผู้เล่นชนะ
1 ยังเป็นการสูญเสียผู้เล่น 2 นั่นคือมูลค่าที่ผู้เล่นคนแรกพยายามเพิ่มและครั้งที่สอง - เพื่อลด นั่นแหละค่ะ
การแสดงออกถึงลักษณะที่เป็นปฏิปักษ์ของความขัดแย้ง: ผลประโยชน์ของผู้เล่นนั้นตรงกันข้ามอย่างสิ้นเชิง (สิ่งที่หนึ่งชนะอีกฝ่ายเสีย)
เกมที่เป็นปฏิปักษ์ถูกกำหนดโดยระบบโดยธรรมชาติ ก=(X, Y, F).
โปรดทราบว่าเกมที่เป็นปรปักษ์กันอย่างเป็นทางการมีการตั้งค่าในลักษณะเดียวกับปัญหาในการตัดสินใจภายใต้เงื่อนไขของความไม่แน่นอน - ถ้า
ระบุระบบควบคุมย่อย 2 กับสภาพแวดล้อม ความแตกต่างที่สำคัญระหว่างระบบย่อยการควบคุมและสิ่งแวดล้อมคือ
พฤติกรรมของคนแรกมีจุดมุ่งหมาย หากเมื่อรวบรวมแบบจำลองทางคณิตศาสตร์ของความขัดแย้งที่แท้จริงแล้ว เรามีเหตุผล (หรือเจตนา) ให้ถือว่าสิ่งแวดล้อมเป็นปฏิปักษ์ โดยมีจุดประสงค์เพื่อนำมา
เราเป็นอันตรายสูงสุดแล้วสถานการณ์ดังกล่าวสามารถแสดงเป็นเกมที่เป็นปฏิปักษ์ได้ กล่าวอีกนัยหนึ่งเกมที่เป็นปฏิปักษ์สามารถตีความได้ว่าเป็นกรณีที่รุนแรงของ ZPR ภายใต้เงื่อนไขของความไม่แน่นอน
โดดเด่นด้วยความจริงที่ว่าสภาพแวดล้อมถูกมองว่าเป็นปฏิปักษ์ที่มีเป้าหมาย ในขณะเดียวกัน เราต้องจำกัดประเภทของสมมติฐานเกี่ยวกับพฤติกรรมของสิ่งแวดล้อม
หลักฐานที่ชัดเจนที่สุดคือสมมติฐานของความระมัดระวังอย่างยิ่งเมื่อต้องตัดสินใจ เราอาศัยสถานการณ์ที่เลวร้ายที่สุดที่เป็นไปได้สำหรับเราในการดำเนินการในสภาพแวดล้อม
คำนิยาม.ถ้า Xและ Yมีขอบเขตแล้วเกมที่เป็นปฏิปักษ์เรียกว่าเมทริกซ์ ในเกมเมทริกซ์ เราสามารถสรุปได้ว่า X={1,…,น},
Y={1,…,ม) และใส่ aij=F(ฉัน j). ดังนั้น เกมเมทริกซ์จึงถูกกำหนดโดยเมทริกซ์อย่างสมบูรณ์ ก=(ไอจ), ผม=1,…,น เจ=1,…,ม.
ตัวอย่างที่ 3.1 เกมที่มีสองนิ้ว
คนสองคนพร้อมกันแสดงหนึ่งหรือสองนิ้วแล้วเรียกหมายเลข 1 หรือ 2 ซึ่งตามที่ผู้พูดหมายถึงหมายเลข
นิ้วชี้ให้คนอื่นเห็น หลังจากแสดงนิ้วและตั้งชื่อหมายเลขแล้ว เงินรางวัลจะถูกแจกจ่ายตามกฎต่อไปนี้:
ถ้าทั้งคู่เดาหรือทั้งคู่ไม่ได้เดาว่าฝ่ายตรงข้ามแสดงกี่นิ้ว ผลตอบแทนของแต่ละฝ่ายจะเท่ากับศูนย์ ถ้าเดาถูกเพียงคนเดียวฝ่ายตรงข้ามจะจ่ายเงินให้ผู้เดาตามสัดส่วนของจำนวนที่แสดง
นี่คือเกมเมทริกซ์ที่เป็นปฏิปักษ์ ผู้เล่นแต่ละคนมีสี่กลยุทธ์: 1- แสดง 1 นิ้วและพูดว่า 1, 2- แสดง 1 นิ้วและพูดว่า 2, 3-
แสดง 2 นิ้วแล้วพูดว่า 1, 4 - แสดง 2 นิ้วแล้วพูดว่า 2 จากนั้นเมทริกซ์ผลตอบแทน A=(ไอจ), ผม= 1,…, 4, เจ= 1,…, 4 ถูกกำหนดไว้ดังนี้:
a12= 2, a21 = – 2, a13=a42=–3, a24=a31= 3, a34 = – 4, a43= 4,aij= 0 อย่างอื่น
ตัวอย่างที่ 3.2 เกมประเภทดวลแบบแยกส่วน
งานประเภทดวลอธิบาย ตัวอย่างเช่น การต่อสู้ของผู้เล่นสองคน
แต่ละรายการต้องการดำเนินการเพียงครั้งเดียว (การปล่อยสินค้าออกสู่ตลาด การสมัครเพื่อซื้อในการประมูล) และเลือกเวลาสำหรับสิ่งนี้ ให้ผู้เล่นเคลื่อนเข้าหากันบน นขั้นตอน หลังจากแต่ละขั้นตอนผู้เล่นอาจยิงใส่ฝ่ายตรงข้ามหรือไม่ก็ได้ แต่ละคนสามารถมีได้เพียงครั้งเดียว เชื่อกันว่าความน่าจะเป็นที่จะตีศัตรูถ้าคุณรุกโดย k n =5 มีรูปแบบ