โป๊กเกอร์เป็นเกมที่ต้องใช้ทั้งทักษะ กลยุทธ์ รวมถึงโชค ด้วยองค์ประกอบเหล่านี้จึงทำให้โป๊กเกอร์สามารถครองใจผู้เล่นทั่วโลกมาได้อย่างยาวนาน ถึงแม้ในไทยคนส่วนใหญ่และสังคมจะยังไม่เข้าใจ และเหมารวมถึงเกมที่ใช้ไพ่ในการเล่นไปในทางลบก็ตาม (เราจะมีบทความเรื่อง โป๊กเกอร์ในบริบทของสังคมไทย ออกมาอีกที)
ด้วยตัวเกมที่สามารถเอาชนะได้ในระยะยาว แตกต่างจากเกมการพนันในกาสิโนชนิดอื่น ๆ เพราะในระยะยาวโชคจะยิ่งส่งผลน้อยลง กลยุทธ์และทักษะจะแสดงออกมาทางผลลัพธ์อย่างชัดเจน ทำให้มีผู้เล่นที่จริงจังในการเล่นไปจนถึงผู้ที่ยึดเกมโป๊กเกอร์เป็นอาชีพหลัก สำหรับผู้เล่นเหล่านี้การศึกษาเกมเพื่อพัฒนาทักษะและกลยุทธ์ของตัวเองจึงเป็นสิ่งที่สำคัญมาก
การศึกษาโป๊กเกอร์จึงถูกพัฒนามามากมาย ผ่านยุคสมัยต่าง ๆ จนมาถึงยุคปัจจุบันที่มีการนำแนวคิดของทฤษฏีเกมและหลักการทางคณิตศาสตร์มาใช้อย่างเป็นที่ประจักษ์ ด้วยแนวคิดและหลักการเหล่านี้ ทำให้วิธีการในการเล่นโป๊กเกอร์ของผู้เล่นทั่วโลกไปอย่างสิ้นเชิง
ไม่กี่ปีที่ผ่านมานี้ ได้มีเครื่องมือที่สามารถพาทุกคนดำดิ่งลงไปในเกม ช่วยให้ผู้ที่สนใจสามารถศึกษาเกมโป๊กเกอร์ได้อย่างลึกซึ้ง โดยเครื่องมือนี้สามารถมอบข้อมูลเชิงลึกให้แก่ผู้เล่นเพื่อนำไปสู่การตัดสินใจที่ดีที่สุด เครื่องมือนั่นถูกเรียกในหมู่ผู้ศึกษาโป๊กเกอร์ว่า “solver” นั่นเอง
หลังจากที่ได้เกริ่นมาถึงตรงนี้ ดูเหมือน solver จะเป็นเครื่องมือที่ทรงพลังอย่างมาก สามารถช่วยให้เราเลือกการตัดสินใจที่ดีที่สุดในเกมได้ แต่ว่า solver มันเป็นมายังไง มันทำงานได้อย่างไร? แล้วเราสามารถนำ solver มาช่วยพัฒนากลยุทธ์ของเราได้ยังไงบ้าง? ในบทความนี้ เราจะพาทุกคนเจาะลึกไปยังโลกของ โป๊กเกอร์ ทฤษฎีเกม และ solver พร้อมทั้งช่วยให้ทุกคนกระจ่างว่า องค์ประกอบต่าง ๆ เหล่านี้ จะช่วยยกระดับกลยุทธ์เกมโป๊กเกอร์ของทุกคนไปอีกขั้นได้อย่างไร
ทฤษฎีเกมคือศาสตร์แขนงหนึ่งของคณิตศาสตร์ที่ว่าด้วยการศึกษากลยุทธ์ของผู้เล่น (การตัดสินใจ) ที่จะส่งผลต่อผลลัพธ์ คำว่า “เกม” ในทฤษฏีเกมอาจทำให้ศาสตร์นี้ดูเหมือนของเด็กเล่น แต่ไม่ใช่เลย คำว่าเกมจริง ๆ แล้ว หมายความถึงได้ทั้ง การลงทุน การทหาร หรือแม้กระทั่ง การทูต ซึ่งโป๊กเกอร์เอง ก็เป็นตัวอย่างสุดคลาสสิคในอดีตที่มักถูกหยิบยกมากล่าวถึงเมื่อพูดถึงทฤษฏีเกม โดยการนำหลักการของทฤษฏีเกมมาประยุกต์ใช้ ทำให้ผู้เล่นสามารถสร้างกลยุทธ์ที่แข็งแกร่งขึ้นมาได้
แนวคิดของ “equilibrium” จากทฤษฏีเกมเป็น concept สำคัญที่ถูกนำมาใช้ ในบริบทของโป๊กเกอร์ equilibrium strategy (optimal strategy) นั้นไม่สามารถถูก exploit ได้โดยผู้เล่นคนอื่น ๆ (โจมตีจุดอ่อนในกลยุทธ์ หรือกล่าวคือ optimal strategy นั้นไม่มีจุดอ่อน) ไม่ว่าผู้เล่นคนนั้นจะทำยังไงก็ตาม จะเก่งแค่ไหน เล่นด้วยกลยุทธ์แบบใด หรือแม้กระทั้งรู้กลยุทธ์ของเรา (แต่ไม่รู้ไพ่บนมือที่เราถืออยู่)
แล้วกลยุทธ์ที่ไม่มีจุดอ่อน หรือ optimal strategy มันมีจริง ๆ หรอ? หน้าตามันเป็นอย่างไร? เราจะอธิบายให้ทุกคนเข้าใจผ่าน เกม “ค้อน กรรไกร กระดาษ” หรือที่ทุกคนรู้จักในชื่อ “เป่ายิ้งฉุบ”
สำหรับเกมเป่ายิ้งฉุบเกมนี้ เรากำหนดให้เกมประกอบด้วยผู้เล่น 2 คน ได้แก่ player 1 และ player 2 ผู้เล่นที่ชนะในแต่ละรอบจะได้ผลตอบแทน 1 บาท ส่วนผู้แพ้ก็จะเสีย 1 บาท และถ้าหากผู้เล่นทั้ง 2 คนเสมอกัน จะไม่มีใครได้หรือเสียผลตอบแทน
ดังนั้นในเกมนี้เราจึงสนใจผลตอบแทนของเกมนี้ ในรูปของ Expected Value (EV) หรือก็คือผลตอบแทนระยะยาวของเกมนี้เมื่อเล่นกันไปเป็นอนันต์ครั้ง
เมื่อเริ่มเล่นไปซักพัก player 1 อาจสังเกตเห็นว่า player 2 ออกค้อนบ่อยมากกว่า กรรไกร และกระดาษ player 1 จึงเริ่มปรับเปลี่ยนกลยุทธ์โดยการออกกระดาษมากขึ้น เพื่อ exploit กลยุทธ์ของ player 2 ในทางกลับกันหลังจากที่ player 1 เริ่มปรับเปลี่ยนกลยุทธ์ player 2 เองก็เริ่มสังเกตเห็นเหมือนกันว่า player 1 ออกกระดาษบ่อยขึ้น player 2 จึงเริ่มปรับกลยุทธ์โดยการออกกรรไกรบ่อยขึ้นเพื่อ exploit player 1
แต่เมื่อคนใดคนนึงเล่นด้วย optimal strategy ซึ่งก็คือกลยุทธ์ที่ออกทั้ง ค้อน กรรไกร และกระดาษ ด้วยความถี่เท่า ๆ กัน ที่อย่างละ ⅓ (~33.33%) ไม่ว่าอีกคนจะเล่นด้วยกลยุทธ์อะไร ก็จะทำให้ได้รับ EV เท่าเดิม
ใน [รูปที่ 1] หาก player 1 ยังคงใช้ optimal strategy เหมือนเดิมอยู่ ส่วน player 2 พยายามที่จะปรับเปลี่ยนกลยุทธ์ของตัวเองเพื่อให้ได้ผลตอบแทนที่ดีขึ้น (ชนะบ่อยขึ้น) โดยลองออกค้อนทุกครั้ง โดยทดลองเล่นกันทั้งหมด 9 ครั้ง จะได้ว่า player 1 จะออกค้อน กรรไกร และกระดาษ เท่ากัน อย่างละ 3 ครั้ง ส่วน player 2 จะออกค้อนทุกครั้ง ผลลัพธ์ที่ได้คือทุกครั้งที่ player 1 ออกค้อนจะเสมอ เมื่อออกกรรไกรจะแพ้ และเมื่อออกกระดาษก็จะชนะ สรุปได้ว่าจากการเล่นทั้งหมด 9 ครั้ง ของ player 1 แบ่งเป็น ชนะ เสมอ และแพ้ อย่างละ 3 ครั้ง เท่ากัน และมี EV = 0 เช่นเดียวกันกับ player 2
[รูปที่ 1: EV ของเกมค้อนกรรไกรกระดาษ optimal vs pure]
ใน [รูปที่ 2] หลังจากที่ player 2 ลองใช้กลยุทธ์ออกค้อนทุกครั้งแล้วพบว่าไม่สามารถเพิ่มผลตอบแทนได้ จึงลองเปลี่ยนมาใช้ optimal strategy เหมือนกับ player 1 โดยทดลองเล่นกันทั้งหมด 9 ครั้งเหมือนเดิม จะได้ว่า player 1 จะออกค้อน กรรไกร และกระดาษ เท่ากัน อย่างละ 3 ครั้ง ส่วน player 2 ก็จะออกค้อน กรรไกร และกระดาษ เท่ากัน อย่างละ 3 ครั้ง เช่นเดียวกัน จะได้ว่าใน 3 ครั้งที่ player 1 ออกค้อน ก็จะเจอกับ player 2 ที่ออกค้อน กรรไกร กระดาษ อย่างละครั้ง และเป็นแบบนี้เช่นเดียวกันกับครั้งที่ player 1 ออกกรรไกร และกระดาษ ผลลัพธ์ที่ได้จะเป็นดังรูป สามารถสรุปได้ว่าจากการเล่นทั้งหมด 9 ครั้ง player 1 จะชนะ เสมอ และแพ้ อย่างละ 3 ครั้ง เท่ากัน และมี EV = 0 เช่นเดียวกันกับ player 2 เหมือนกันกับผลการทดลองใน [รูปที่ 1]
[รูปที่ 2: EV ของเกมค้อนกรรไกรกระดาษ optimal vs optimal]
จากผลการทดลองทั้งใน [รูปที่ 1] และ [รูปที่ 2] จะเห็นได้ว่าเมื่อ player 1 ใช้ optimal strategy เจอกับ player 2 ที่ไม่ว่าจะใช้กลยุทธ์อะไรก็ตาม player 2 จะไม่มีทางได้ผลตอบแทนที่เพิ่มขึ้นได้ หรือกล่าวคือ player 2 จะไม่สามารถ exploit กลยุทธ์ของ player 1 ได้นั่นเอง หาก player 1 ยังคงเล่นตาม optimal strategy แต่ในทางกลับกัน player 1 สามารถออกจาก optimal โดยการออกกระดาษให้มากขึ้นเพื่อ exploit จุดอ่อนในกลยุทธ์ของ player 2 ที่เลือกออกค้อนทุกครั้ง เพื่อให้ได้รับผลตอบแทนที่มากขึ้นในระยะยาว ทั้งนี้ทั้งนั้นในเกมโป๊กเกอร์จริง ๆ นั้น มีความซับซ้อนมากกว่าเกมเป่ายิ้งฉุบมาก แต่การเข้าใจหลักการพื้นฐานด้วยเกมที่ถูกตัดความซับซ้อนออก ก็เป็นส่วนสำคัญที่จะช่วยให้เข้าใจธรรมชาติของเกมที่ซับซ้อนกว่า
ตอนนี้ทุกคนคงได้เห็นแนวคิดของ equilibrium ด้วยตัวอย่างจากเกมเป้ายิ้งฉุบกันแล้วนะครับ equilibrium หรือ optimal strategy ของเกมโป๊กเกอร์นั้นมีความซับซ้อนกว่านี้มาก ๆ ด้วยความที่เกมมีจุดที่ต้องตัดสินใจเป็นจำนวนมาก (สำหรับ NLH Heads Up เกมอาจมีมากถึง 10¹⁶⁰) ซึ่งเราจะปล่อยให้เป็นหน้าที่ของโปรแกรม solver ในการหากลยุทธ์นี้ออกมา
solver เป็นโปรแกรมที่ใช้หากลยุทธ์ในสถานการณ์ต่าง ๆ ในเกมโป๊กเกอร์ โดย solver เหล่านี้มีอัลกอริทึมที่สามารถหา optimal strategy ออกมาบนเงื่อนไขของเกมที่กำหนดลงไป
หนึ่งในเครื่องมือที่เป็นผลลัพธ์จาก solver ที่เป็นที่รู้จักและใช้งานกันอย่างกว้างขวางมากที่สุด ณ ตอนนี้ คือ “GTO Wizard” ซึ่งสามารถให้ผู้เล่นอย่างพวกเราเลือกดูผลจำลองหรือกลยุทธ์ที่ได้จากการ run simulation ของสถานการณ์ในเกมต่าง ๆ ด้วย solver ออกมาได้
ใน [รูปที่ 3] คือหน้า UI คร่าว ๆ ของ GTO Wizard หลังจากที่ดูแล้ว หลาย ๆ คนคงเกิดคำถามใช่ไหมครับว่า เจ้าตารางที่หน้าตาดูเหมือน preflop range ที่หลาย ๆ คนเคยเห็นนี้ มันมีแถบสีเต็มไปหมดเลย มันหมายถึงอะไรกัน ตอนนี้ทุกคนยังไม่ต้องกังวลไปครับ เพราะในบทความนี้เราจะพูดถึงทฤษฎีที่อยู่เบื้องหลังและการใช้ประโยชน์ของ solver เป็นหลัก รูปนี้พวกเราแค่อยากให้ทุกคนได้ลองเห็นหน้าตาคร่าว ๆ ของ solver เสียก่อน ส่วนรายละเอียดการใช้ GTO Wizard ตั้งแต่ระดับ basic มีสอนในคอร์สฟรีของเราผ่านทาง Youtube
[รูปที่ 3: GTO Wizard]
ใน [รูปที่ 4] เป็นหน้าต่างในการตั้งค่าผล sim ซึ่งจะสังเกตเห็นได้ว่าสามารถปรับเลือกได้ทั้งประเภทเกม จำนวนผู้เล่น stack size รวมถึง rake ซึ่งทุก ๆ ตัวเลือกนั้นส่งผลต่อผล sim หมด ไม่มากก็น้อย
[รูปที่ 4: หน้าต่างการตั้งค่าผล sim ของ GTO Wizard]
ใน [รูปที่ 5] เป็นหน้าต่างที่สามารถให้ผู้ใช้เลือก edit board texture ได้อย่างอิสระ เพื่อดูผล sim ในสถานการณ์ที่แตกต่างกันไปในแต่ละ board โดยสามารถเลือก edit ได้ตั้งแต่ flop (เปิดไพ่กองกลาง 3 ใบ) ไปจนถึง river (เปิดไพ่กองกลางครบ 5 ใบ)
[รูปที่ 5: หน้าต่างในการเลือก board texture]
ทีนี้ก็มาถึงส่วนสำคัญที่สุดของบทความนี้แล้วครับ และพวกเราก็เชื่อว่าหลาย ๆ คน ที่เข้ามาอ่านบทความนี้เองก็ อยากทราบใช่ไหมครับว่า แล้วเราจะนำ solver ไปช่วยพัฒนากลยุทธ์ในเกมจริง ๆ ของเราได้อย่างไรกันล่ะ ?
solver ได้เข้ามาเปลี่ยนวิธีการที่ผู้เล่นอย่างเราใช้ในการสร้างกลยุทธ์ โดยใช้แนวคิดของทฤษฏีเกมที่ตั้งอยู่บนหลักคณิตศาสตร์และความน่าจะเป็น สิ่งที่ solver มอบให้คือ optimal strategy โดยเราสามารถมอง solver ว่าเป็นเครื่องมือหนึ่งที่จะนำมาพัฒนาการเล่น และที่พวกเราจะกล่าวต่อไปนี้คือวิธีการต่าง ๆ ที่ทุกคนสามารถนำ solver ไปช่วยเพิ่มศักยภาพในเกมการเล่นของทุกคนได้
อย่างแรกเลยคือการศึกษากลยุทธ์จาก solver และนำมาใช้เป็น baseline ในกรณีที่เรายังไม่มีข้อมูลคู่ต่อสู้มากพอ เช่น สถานการณ์ที่พึ่งเข้ามาเล่นในโต๊ะได้ไม่นาน ทำให้ยังเก็บข้อมูลไม่ได้มากเพียงพอที่จะสามารถหาและโจมตีจุดอ่อนของคู่ต่อสู้ได้
ถึงแม้การนำกลยุทธ์จาก solver มาใช้เป็น baseline จะไม่ได้ช่วยให้ทำกำไรได้อย่างมหาศาลได้เท่ากับการที่เราพยายามจะ exploit จากจุดอ่อนของคู่ต่อสู้ แต่ก็ทำให้การเล่นของเรานั้นไม่ blunder (ข้อผิดพลาดใหญ่ ๆ ที่ทำให้เสียผลตอบแทนเยอะ) อีกทั้งยังสามารถเล่นได้ง่าย
และอย่างที่สองก็คือการศึกษากลยุทธ์จาก solver สามารถช่วยหาจุดอ่อนของคู่ต่อสู้ได้ ซึ่งในข้อที่สองนี้จะล้อมากับข้อแรก การที่เรารู้จุดตรงกลางหรือ optimal จะช่วยให้เราสามารถรู้ได้ว่าเมื่อไหร่ที่ผู้เล่นออกไปจากตรงกลางหรือออกไปยังจุดที่สามารถ exploit ได้ เช่น ในจุดไหนที่คู่ต่อสู้บลัฟมากเกินไปหรือหมอบมากเกินไป เมื่อรู้อย่างนี้แล้วเราก็จะสามารถปรับกลยุทธ์ของเราเพื่อ exploit คู่ต่อสู้ได้ และสามารถทำกำไรเพิ่มมากขึ้นได้ เมื่อเทียบกับการเล่นโดยยึดจาก baseline เป็นหลัก และไม่พยายามที่จะ exploit คู่ต่อสู้
ถึงแม้ว่า solver จะเป็นเครื่องมือที่ทรงพลังมาก ๆ ที่จะสามารถช่วยให้ทุกคนพัฒนาการสร้างกลยุทธ์ในเกมได้ แต่ solver เองก็ยังมีข้อจำกัดและข้อควรระวังในการใช้อยู่เช่นกัน…
เราอยากให้ทุกคนพึงระลึกไว้เสมอว่ากลยุทธ์ที่ได้มาจาก solver นั้น อยู่บนพื้นฐานของเกมที่ถูกลดความซับซ้อนลง เช่น การลด bet size ลง เช่น การลดลงเหลือแค่ 33%, 50%, 75%, 125% pot หรือ ตัด action การ limp ออกจาก preflop เป็นต้น ซึ่งอาจจะไม่ได้ครอบคลุมถึงความซับซ้อนและรายละเอียดปลีกย่อยอื่น ๆ เมื่อเทียบกับเกมจริง อีกทั้งการพยายามที่จะเล่นตามผล GTO จาก solver เลย อาจทำให้เราไม่ win ได้ด้วยซ้ำ เพราะจากที่พวกเราได้อธิบายไปก่อนหน้านี้ว่าผล sim ที่ได้มาจาก solver นั้นถูกลดความซับซ้อนลง ทำให้ optimal strategy จาก solver นั้นต่างจากในเกมจริง ๆ รวมถึงในจุดที่ลึก ๆ เช่น กลยุทธ์ที่ river (เปิดไพ่บนบอร์ดครบ 5 ใบ) ในบางจุด อาจมี noise (ข้อผิดพลาดจากการคำนวณของ solver) เกิดขึ้น
อ่านมาถึงตรงนี้ หลาย ๆ คนก็คงจะเริ่มตั้งคำถามว่าแล้วอย่างนี้เรายังสามารถศึกษากลยุทธ์จาก solver ได้หรือไม่? คำตอบคือได้แน่นอนครับ เพราะว่าสิ่งที่เรายังสามารถนำมาศึกษาจาก solver ได้อยู่ก็คือ รูปแบบหรือแนวโน้มต่าง ๆ หรือพูดง่าย ๆ ก็คือปัจจัยที่ solver เลือกตัดสินใจนั่นเอง ทำให้เราพอจะรู้ pattern คร่าว ๆ ที่ solver เลือกออก actionในหลาย ๆ สถานการณ์ในเกมที่เราอาจจะไม่เคยได้ศึกษามาก่อน ก็สามารถนำความรู้ความเข้าใจมาประยุกต์ใช้ได้นั่นเอง
โป๊กเกอร์เป็นเกมที่ต้องใช้ทั้งทักษะความสามารถ จิตวิทยา ไปจนถึงความรู้ความเข้าใจในทฤษฎีเกม ทำให้โป๊กเกอร์ยังคงเป็นเกมที่ดึงดูดให้ผู้คนจากทั่วโลกหลั่งไหลเข้ามาลองสัมผัสประสบการณ์ในเกมนี้ การเข้ามาของ solver จะช่วยยกระดับเกมการเล่นของผู้ที่ได้ศึกษาไปอีกขั้น ปลดล็อคศักยภาพที่ถูกกำจัดเอาไว้อยู่ในเกมโป๊กเกอร์ การตัดสินใจต่าง ๆ จะอยู่บนพื้นฐานของทฤษฏีเกมและคณิตศาสตร์ ถึงแม้ solver จะเป็นเครื่องมือที่ทรงพลังมาก ๆ แต่ก็มีข้อจำกัดเช่นกัน หากต้องการที่จะดึงศักยภาพของ solver ออกมาใช้ได้อย่างเต็มที่ ผู้ใช้เองก็ต้องมีความรู้ความเข้าใจการใช้งาน solver อย่างถูกต้องอยู่บนหลักการที่สมเหตุสมผลถึงจะสร้างกลยุทธ์ที่ดีให้กับเกมของตนเองได้