Introduce Sách Poker GTO - Modern poker theory

hocpoker2021

Senior
Joined
Nov 6, 2021
Messages
447
Reactions
148
MR
0.298
Mình ko hiểu gì cả. Sách này nó giới thiệu, chỉ ra cách tính cho ai muốn nghiên cứu thôi. Mình cũng chỉ đọc lướt cho biết, giờ có software nó tính dùm hết rồi.
Em nghe qc Piosolver j đó xài tốt lắm, mà e download về bản dùng thử, không hiểu xài sao luôn.
Chắc do trình e còn gà, e thấy mỗi thằng Snowie dễ hiểu dễ xài.
 
The Elements of Game Theory

sasura

Expert
Joined
May 11, 2013
Messages
1,030
Reactions
1,297
MR
16.151
$75.00
NHỮNG YẾU TỐ LÝ THUYẾT CỦA TRÒ CHƠI

Những khái niệm dưới đây đặc biệt quan trọng và bạn phải nắm vững vì chúng sẽ xuất hiện nhiều lần trong cuốn sách này khi nói về lý thuyết trò chơi.

Lý Thuyết Trò Chơi - Game Theory: Toàn bộ những kiến thức, nghiên cứu về toán và khoa học để có thể đưa ra những quyết định tối ưu và hợp lý nhất. Lý thuyết này thậm chí còn có thể ứng dụng trong kinh tế, chiến thuật quân sự, chính trị, tâm lý học, sinh học, khoa học máy tính và các trò chơi khác như poker.

Trò Chơi - Game: Gồm bất kỳ sự tương tác nào giữa nhiều người chơi, trong đó tiền thưởng của mỗi người sẽ bị ảnh hưởng bởi những quyết định của người chơi khác.

Tính Hữu Dụng - Utility: Thang đo tổng quan về mức độ hài lòng của một người chơi khi có được những kết quả cụ thể. Khi hành động có tính hữu dụng càng cao, thì nó sẽ được ưu tiên hơn những hành động khác.

Trò Chơi Tổng Bằng 0 - Zero-Sum Game: Đây là một sự diễn tả về mặt toán học trong trường hợp mà khoản lãi/lỗ của người này chính là khoảng lỗ/lãi của người khác. Nếu như ta lấy tổng khoản lãi của tất cả người chơi trừ đi tổng số tiền mà những người chơi còn lại lỗ, ta sẽ có tổng bằng 0. (Poker cũng là trò chơi có tổng bằng không nếu như chúng ta không tính tới rake hay ICM [Independent Chip Model] sử dụng ở bàn final MTT và SNGs; điều này sẽ được tìm hiểu kỹ hơn ở phần sau cuốn sách.)

Chiến Thuật - Strategy: Bao gồm tất cả những hành vi chi tiết của người chơi, mô tả từng hành động mà người chơi sẽ thực hiện tại mọi thời điểm quyết định có thể trong suốt trò chơi.

Chiến Thuật Thuần - Pure Strategy: Một chiến thuật mà những hành động giống nhau sẽ luôn luôn được hành động ở những thời điểm giống nhau.

Chiến Thuật Hỗn Hợp - Mixed Strategy: Một chiến thuật bao gồm nhiều chiến thuật thuần với tần suất khác nhau ở cùng những thời điểm giống nhau.

Chiến Thuật Vượt Trội - Dominant Strategy: Khi một chiến thuật mang lại lợi nhuận cao hơn một số chiến thuật khác, bất kể những người chơi khác chơi như thế nào. Ngược lại, một chiến thuật được gọi là yếu thế, nếu như bất kể đối phương có làm gì, chiến thuật đó sẽ kiếm được ít lợi nhuận hơn một số chiến thuật khác.

Ví dụ cho hai chiến thuật khác nhau là A và B:

◆ B vượt trội hoàn toàn so với A nếu như lựa chọn chiến thuật B sẽ luôn luôn có kết quả tốt hơn lựa chọn chiến thuật A, không quan tâm tới những người chơi khác như thế nào.

◆ B vượt trội một phần so với A nếu như tồn tại ít nhất một chuỗi hành động của đối thủ khiến cho B có lợi nhuận vượt trội so với A. Và những hành động còn lại của đối thủ sẽ khiến cho kết quả của hai chiến thuật A và B như nhau.

◆ B yếu thế hoàn toàn so với A nếu như lựa chọn chiến thuật B sẽ luôn luôn có kết quả tệ hơn so với lựa chọn chiến thuật A, bất luận đối phương hành động như thế nào.

◆ B yếu thế một phần so với A nếu như tồn tại ít nhất một chuỗi hành động của đối thủ khiến chiến thuật B có kết quả tệ hơn chiến thuật A, trong khi những hành động còn lại của đối thủ sẽ khiến kết quả của hai chiến thuật như nhau.

◆ B và A không liên quan tới nhau nếu như chiến thuật B không vượt trội hơn và cũng không bị yếu thế hơn so với chiến thuật A thì khi đó phải dựa vào hành động của đối thủ để có thể đưa ra chiến thuật hợp lý nhất.
Chiến thuật khai thác đối thủ tối đa (Maximally Exploitative Strategy – MES) là một trong những chiến thuật mang lại lợi nhuận nhiều nhất dựa trên chuỗi hành động của đối thủ. Để tính toán MES bạn cần phải thấu hiểu hoàn toàn chiến thuật của đối thủ. Bạn có thể tìm được MES bằng việc thử những cách có lợi nhất để chơi ở từng hand bài cụ thể. Một khi đã tìm hiểu được, tổng giá trị của trò chơi sẽ là tổng của từng EV cho những hand bài cụ thể.

Nếu bạn có thể tìm ra được những cách chơi lợi nhuận cao nhất với mỗi 1,326 hand Hold’em khác nhau, bạn sẽ tìm được MES. Bởi mỗi hand sẽ luôn luôn được chơi theo những cách tối đa lợi nhuận nhất, nếu có những hand có thể chơi bằng nhiều cách khác nhau (như trong chiến thuật hỗn hợp) thì EV của mỗi hành đông phải được đảm bảo là như nhau. Hãy cùng quan sát về một tình huống cơ bản sau đây.

Ví dụ
Game: Heads-Up Sit N’ Go (Players can only push or fold)
BN Stack: 100 chips
BB Stack: 100 chips
Blinds: (5/10)

Pre-flop: BN sẽ chơi với chiến thuật all-in với tất cả các hand. Vậy thì để đối đầu với nhà BN, MES của BB sẽ là gì?

Đầu tiên, chúng ta tính toán pot odds:
1640489156347.png

BB có thể thực hiện lệnh call với tất cả các hand có ít nhất 45% equity so với range của đối thủ, vì vậy MES của nhà BB sẽ là call với 66.21% hand và fold đi 33.79% hand còn lại
(Hand Range 18).
1640489184715.png

Hand Range 18: Call Range với ít nhất 45% Equity

Tính toán EV cho từng hand được thực hiện một cách độc lập, vì thế tất cả những hand có EV dương nên thực hiện lệnh call còn các hand có EV âm thì nên thực hiện lệnh fold. Về đường dài sẽ không có trường hợp nào là “đỏ ăn tất” khi chơi một hand với ít khả năng tạo ra lợi nhuận nó có thể mang lại lợi nhuận như là chơi theo đúng chiến thuật. Mỗi hand đều sẽ có lợi nhuận, hoặc không và nên được chơi theo cách phù hợp nhất có thể.

Tổng EV của MES của nhà BB (MES của nhà BB là call với tất cả các hand có +EV và fold tất cả các hand có -EV) sẽ có trọng số cho tần suất của mỗi sự kết hợp hand bài 13.77 chips từ pot 15 chips, chiếm tới 92% của pot (Hand Range 19).
1640489260287.png

Hand Range 19: Rang bài MES của BB

Tổng EV của nhà BN (all-in với 100% hand) khi bị khai thác là: 1.2228 chips từ pot 15 chip, chỉ chiếm 8% pot (Hand Range 20).
1640489315327.png

Hand Range 20: Tổng EV của nhà BN khi bị khai thác

Cách Khắc Chế Khi Bị Khai Thác
MES được tính toán khi phải đối đầu với một đối thủ có một chiến thuật cụ thể và không thay đổi, tuy nhiên đối thủ có thể sẽ sửa đổi lại chiến thuật của họ để có được chiến thuật mới nhằm khai thác lại tối đa MES của chính bạn và để cải thiện được kết quả của họ.

Ví dụ
Hãy chú ý lại ví dụ trước, khi nhà BN đã chơi chiến thuật đơn giản là all-in hết với tất các các hand với 10bb. Nhà BB đã tìm ra MES để đối đầu lại là call với 66.21% hand và fold đi 33.79% hand còn lại. Nếu như nhà BN biết được chiến thuật của nhà BB, họ có thể tận dụng ngược lại nó để có thể khai thác tối đa lại nhà BB.

Chúng ta có thể tìm được những hand nào nhà BN có +EV khi all-in bằng cách áp dụng công thức tính EV:
1640489396668.png

Tính toán EV của tất cả các hand là một việc cực tốn thời gian, vì vật chúng ta có thể sử dụng những ứng dụng có thể tính toán trong những game như all-in or fold như Hold’em Resources Calculator (HRC) (holdemresources.net).

Lần khai thác thứ hai: Sau khi bị nhà BB khai thác, nhà BN có thể khai thác ngược lại bằng cách shove 46.61% hand và fold đi 53.39% hand (Hand Range 21).
1640489477452.png

Hand Range 21: Range nhà BN khai thác ngược nhà BB

Sau đó, nhà BB sẽ bị khai thác, và nhà BB hoàn toàn có thể điều chỉnh lại chiến thuật của mình để khai thác ngược lại nhà BN.

Lần khai thác thứ ba: Lúc này, nhà BB sẽ call với 30.3% hand và fold đi 69.7% hand còn lại (Hand Range 22).
1640489548022.png

Hand Range 22: Range nhà BB khai thác BN sau khi bị BN khai thác

Nếu như chuỗi quá trình này của hai người chơi được tiếp diễn với số lượng lớn các hand bài, cuối cùng nó sẽ dẫn tới các điểm cân bằng mà khi đó cả hai đều không thể điều chỉnh được chiến thuật nữa. Ở thời điểm này, có thể nói rằng, cả hai người đều đang khai thác nhau một cách tối đa. Đây còn được gọi là điểm cân bằng Nash (Nash Equilibrium).
 
NHỮNG YẾU TỐ LÝ THUYẾT CỦA TRÒ CHƠI

Những khái niệm dưới đây đặc biệt quan trọng và bạn phải nắm vững vì chúng sẽ xuất hiện nhiều lần trong cuốn sách này khi nói về lý thuyết trò chơi.

Lý Thuyết Trò Chơi - Game Theory: Toàn bộ những kiến thức, nghiên cứu về toán và khoa học để có thể đưa ra những quyết định tối ưu và hợp lý nhất. Lý thuyết này thậm chí còn có thể ứng dụng trong kinh tế, chiến thuật quân sự, chính trị, tâm lý học, sinh học, khoa học máy tính và các trò chơi khác như poker.

Trò Chơi - Game: Gồm bất kỳ sự tương tác nào giữa nhiều người chơi, trong đó tiền thưởng của mỗi người sẽ bị ảnh hưởng bởi những quyết định của người chơi khác.

Tính Hữu Dụng - Utility: Thang đo tổng quan về mức độ hài lòng của một người chơi khi có được những kết quả cụ thể. Khi hành động có tính hữu dụng càng cao, thì nó sẽ được ưu tiên hơn những hành động khác.

Trò Chơi Tổng Bằng 0 - Zero-Sum Game: Đây là một sự diễn tả về mặt toán học trong trường hợp mà khoản lãi/lỗ của người này chính là khoảng lỗ/lãi của người khác. Nếu như ta lấy tổng khoản lãi của tất cả người chơi trừ đi tổng số tiền mà những người chơi còn lại lỗ, ta sẽ có tổng bằng 0. (Poker cũng là trò chơi có tổng bằng không nếu như chúng ta không tính tới rake hay ICM [Independent Chip Model] sử dụng ở bàn final MTT và SNGs; điều này sẽ được tìm hiểu kỹ hơn ở phần sau cuốn sách.)

Chiến Thuật - Strategy: Bao gồm tất cả những hành vi chi tiết của người chơi, mô tả từng hành động mà người chơi sẽ thực hiện tại mọi thời điểm quyết định có thể trong suốt trò chơi.

Chiến Thuật Thuần - Pure Strategy: Một chiến thuật mà những hành động giống nhau sẽ luôn luôn được hành động ở những thời điểm giống nhau.

Chiến Thuật Hỗn Hợp - Mixed Strategy: Một chiến thuật bao gồm nhiều chiến thuật thuần với tần suất khác nhau ở cùng những thời điểm giống nhau.

Chiến Thuật Vượt Trội - Dominant Strategy: Khi một chiến thuật mang lại lợi nhuận cao hơn một số chiến thuật khác, bất kể những người chơi khác chơi như thế nào. Ngược lại, một chiến thuật được gọi là yếu thế, nếu như bất kể đối phương có làm gì, chiến thuật đó sẽ kiếm được ít lợi nhuận hơn một số chiến thuật khác.

Ví dụ cho hai chiến thuật khác nhau là A và B:

◆ B vượt trội hoàn toàn so với A nếu như lựa chọn chiến thuật B sẽ luôn luôn có kết quả tốt hơn lựa chọn chiến thuật A, không quan tâm tới những người chơi khác như thế nào.

◆ B vượt trội một phần so với A nếu như tồn tại ít nhất một chuỗi hành động của đối thủ khiến cho B có lợi nhuận vượt trội so với A. Và những hành động còn lại của đối thủ sẽ khiến cho kết quả của hai chiến thuật A và B như nhau.

◆ B yếu thế hoàn toàn so với A nếu như lựa chọn chiến thuật B sẽ luôn luôn có kết quả tệ hơn so với lựa chọn chiến thuật A, bất luận đối phương hành động như thế nào.

◆ B yếu thế một phần so với A nếu như tồn tại ít nhất một chuỗi hành động của đối thủ khiến chiến thuật B có kết quả tệ hơn chiến thuật A, trong khi những hành động còn lại của đối thủ sẽ khiến kết quả của hai chiến thuật như nhau.

◆ B và A không liên quan tới nhau nếu như chiến thuật B không vượt trội hơn và cũng không bị yếu thế hơn so với chiến thuật A thì khi đó phải dựa vào hành động của đối thủ để có thể đưa ra chiến thuật hợp lý nhất.
Chiến thuật khai thác đối thủ tối đa (Maximally Exploitative Strategy – MES) là một trong những chiến thuật mang lại lợi nhuận nhiều nhất dựa trên chuỗi hành động của đối thủ. Để tính toán MES bạn cần phải thấu hiểu hoàn toàn chiến thuật của đối thủ. Bạn có thể tìm được MES bằng việc thử những cách có lợi nhất để chơi ở từng hand bài cụ thể. Một khi đã tìm hiểu được, tổng giá trị của trò chơi sẽ là tổng của từng EV cho những hand bài cụ thể.

Nếu bạn có thể tìm ra được những cách chơi lợi nhuận cao nhất với mỗi 1,326 hand Hold’em khác nhau, bạn sẽ tìm được MES. Bởi mỗi hand sẽ luôn luôn được chơi theo những cách tối đa lợi nhuận nhất, nếu có những hand có thể chơi bằng nhiều cách khác nhau (như trong chiến thuật hỗn hợp) thì EV của mỗi hành đông phải được đảm bảo là như nhau. Hãy cùng quan sát về một tình huống cơ bản sau đây.

Ví dụ
Game: Heads-Up Sit N’ Go (Players can only push or fold)
BN Stack: 100 chips
BB Stack: 100 chips
Blinds: (5/10)

Pre-flop: BN sẽ chơi với chiến thuật all-in với tất cả các hand. Vậy thì để đối đầu với nhà BN, MES của BB sẽ là gì?

Đầu tiên, chúng ta tính toán pot odds:
View attachment 191840
BB có thể thực hiện lệnh call với tất cả các hand có ít nhất 45% equity so với range của đối thủ, vì vậy MES của nhà BB sẽ là call với 66.21% hand và fold đi 33.79% hand còn lại
(Hand Range 18).
View attachment 191841
Hand Range 18: Call Range với ít nhất 45% Equity

Tính toán EV cho từng hand được thực hiện một cách độc lập, vì thế tất cả những hand có EV dương nên thực hiện lệnh call còn các hand có EV âm thì nên thực hiện lệnh fold. Về đường dài sẽ không có trường hợp nào là “đỏ ăn tất” khi chơi một hand với ít khả năng tạo ra lợi nhuận nó có thể mang lại lợi nhuận như là chơi theo đúng chiến thuật. Mỗi hand đều sẽ có lợi nhuận, hoặc không và nên được chơi theo cách phù hợp nhất có thể.

Tổng EV của MES của nhà BB (MES của nhà BB là call với tất cả các hand có +EV và fold tất cả các hand có -EV) sẽ có trọng số cho tần suất của mỗi sự kết hợp hand bài 13.77 chips từ pot 15 chips, chiếm tới 92% của pot (Hand Range 19).
View attachment 191842
Hand Range 19: Rang bài MES của BB

Tổng EV của nhà BN (all-in với 100% hand) khi bị khai thác là: 1.2228 chips từ pot 15 chip, chỉ chiếm 8% pot (Hand Range 20).
View attachment 191843
Hand Range 20: Tổng EV của nhà BN khi bị khai thác

Cách Khắc Chế Khi Bị Khai Thác
MES được tính toán khi phải đối đầu với một đối thủ có một chiến thuật cụ thể và không thay đổi, tuy nhiên đối thủ có thể sẽ sửa đổi lại chiến thuật của họ để có được chiến thuật mới nhằm khai thác lại tối đa MES của chính bạn và để cải thiện được kết quả của họ.

Ví dụ
Hãy chú ý lại ví dụ trước, khi nhà BN đã chơi chiến thuật đơn giản là all-in hết với tất các các hand với 10bb. Nhà BB đã tìm ra MES để đối đầu lại là call với 66.21% hand và fold đi 33.79% hand còn lại. Nếu như nhà BN biết được chiến thuật của nhà BB, họ có thể tận dụng ngược lại nó để có thể khai thác tối đa lại nhà BB.

Chúng ta có thể tìm được những hand nào nhà BN có +EV khi all-in bằng cách áp dụng công thức tính EV:
View attachment 191844
Tính toán EV của tất cả các hand là một việc cực tốn thời gian, vì vật chúng ta có thể sử dụng những ứng dụng có thể tính toán trong những game như all-in or fold như Hold’em Resources Calculator (HRC) (holdemresources.net).

Lần khai thác thứ hai: Sau khi bị nhà BB khai thác, nhà BN có thể khai thác ngược lại bằng cách shove 46.61% hand và fold đi 53.39% hand (Hand Range 21).
View attachment 191845
Hand Range 21: Range nhà BN khai thác ngược nhà BB

Sau đó, nhà BB sẽ bị khai thác, và nhà BB hoàn toàn có thể điều chỉnh lại chiến thuật của mình để khai thác ngược lại nhà BN.

Lần khai thác thứ ba: Lúc này, nhà BB sẽ call với 30.3% hand và fold đi 69.7% hand còn lại (Hand Range 22).
View attachment 191846
Hand Range 22: Range nhà BB khai thác BN sau khi bị BN khai thác

Nếu như chuỗi quá trình này của hai người chơi được tiếp diễn với số lượng lớn các hand bài, cuối cùng nó sẽ dẫn tới các điểm cân bằng mà khi đó cả hai đều không thể điều chỉnh được chiến thuật nữa. Ở thời điểm này, có thể nói rằng, cả hai người đều đang khai thác nhau một cách tối đa. Đây còn được gọi là điểm cân bằng Nash (Nash Equilibrium).
Em đang học đánh theo kiểu cân bằng Nash này, giả định là đối thủ chơi hợp lý, mà tụi NL2 đánh kinh quá, 95 73 call 3-*** luôn, không đoán nổi range tụi nó có gì luôn.
 
The Elements of Game Theory
Trong poker, GTO (lý thuyết trò chơi) thường được sử dụng như một cách gọi khác của điểm cân bằng Nash.
Điểm cân bằng Nash là một chuỗi các chiến thuật trong đó:

◆ Những người chơi đều rất tinh tế: mỗi người đều có thể biết rõ chiến thuật của đối phương.

◆ Tất cả người chơi đều đang khai thác đối ta lẫn nhau một cách đồng thời.

◆ Không có người chơi nào có thể tự thay đổi chiến thuật của họ để cải thiện kết quả.

Những chiến thuật cân bằng được khai thác tối đa khi đấu với một đối thủ không dễ khuất phục, vì vậy chúng kế thừa tất cả các đặc tính của MES, đó là:

◆ Những hand bài riêng kẻ luôn được chơi theo cách có lợi nhất có thể, vì vậy, GTO không bao giờ liên quan đến việc chơi một hand bài có ít khả năng hơn so với bình thường chỉ vì để cân bằng.

◆ Những chiến thuật yếu thế hoàn toàn không thể là một phần của cân bằng Nash, vì bất kỳ người chơi nào sử dụng chúng đều không hợp lý.

◆ Cách duy nhất một hand có thể chơi nhiều hơn một cách ở trạng thái cân bằng (chiến thuật hỗn hợp) là khi nhiều chiến thuật đó mang lại cùng một mức EV.

Sau đây là những lời giải của Cân bằng Nash (nguồn HRC) cho ví dụ trước đó khi chơi heads-up với stack 10bb ở trò chơi allin or fold (Hand Ranges 23 và 24).
1640566585263.png

Hand Range 23: Cân Bằng Nash của BN
1640566611859.png

Hand Range 24: Cân Bằng Nash của BB


Giá trị của trò chơi allin or fold cho hai người chơi sau khi đã trải qua rất nhiều lần điều chỉnh chiến thuật để khắc chế đối phương (Table 9).
1640569190390.png

Table 9: EV của những lần khắc chế chiến thuật trong Allin or Fold

Ở ví dụ này, nếu nhà BB biết rằng nhà BN đang ở vòng khắc chế đầu tiên (khi họ đang thực hiện all-in 100% hand bài), nhà BB có thể cả thiện EV của mình lên tới 13.77 bằng cách áp dụng MES và call với 66.21% hand bài. Nhưng nếu nhà BB phán đoán sai về cách mà BN đang chơi, EV của nhà BB có thể giảm xuống 8.48. Nếu như nhà BB chơi theo chiến thuật GTO và call với 37.4% hand khi đối mặt với lệnh all-in, EV của họ sẽ được đảm bảo ở mức 10.45 mà không cần quan tâm tới nhà BN như thế nào.

Một trong những lý do chính của Cân bằng Nash hay chiến thuật GTO nằm ở sức mạnh chúng có thể cho bạn một mức EV nhất định. Bởi cách chúng được xác định, đã bao gồm việc đối thủ đã biết được chiến thuật của bạn và chiến thuật của họ sẽ là phản ứng tốt nhất cho những hành động của bạn. Đây là ý do tại sao các chiến thuật GTO được coi là không thể khai thác. Về mặt toán học, không thể có đối thủ nào giành được lợi thế trước bạn, nghĩa là bạn sẽ hòa vốn hoặc có lãi.

Một lợi thế khác của việc chơi theo những chiến thuật cân bằng đó là bạn không cần quá cố gắng để đánh lừa hay chọc giận đối thủ. Chiến thuật GTO không phải về việc thực hiện hand cụ thể đối đầu với các loại đối thủ cụ thể. Chiến thuật này cho rằng đối thủ của bạn sẽ điều chỉnh chính xác bất cứ điều gì bạn làm và do đó họ tập trung nhiều hơn vào việc chơi poker một cách vững chắc hơn là liên tục cố gắng xâm nhập vào đầu đối thủ của bạn.

Nếu bạn chơi theo GTO với bất kỳ đối thủ nào không hoàn toàn chống lại chiến thuật của bạn (họ có thể cũng chơi theo GTO), kỳ vọng của bạn sẽ lớn hơn mức cân bằng và sẽ tăng lên khi chiến thuật của đối thủ trở nên tồi tệ hơn. Tuy nhiên, chiến thuật cân bằng sẽ không giúp bạn kiếm được nhiều EV như một chiến thuật được thiết kế hoàn hảo để chống lại những sai lầm cụ thể của đối thủ. Những người chơi hàng đầu phát triển chiến thuật GTO cơ bản và hợp lý để họ vẫn không bị khuất phục trước những đối thủ khó hoặc chưa biết nhiều thông tin, nhưng họ cũng có khả năng tận dụng sự rò rỉ của đối thủ bằng cách thực hiện các điều chỉnh khai thác khi họ đã có một sự tìm hiểu về cách chơi của đối thủ.
Nguyên tắc bàng quan (indifference principle) được phát biểu một cách chính xác nhất bởi Will Tipton trong cuống sách “Expert Heads Up No Limit Hold’em, Volume 1: Optimal and Exploitative Strategies” (D&B Publishing):

“Chiến lược cân bằng là chiến lược khai thác tối đa khi đối mặt với một đối thủ đang chơi chiến lược GTO của theo cách của họ - trong trường hợp này, mọi hand bài đều được chơi theo hướng có lợi nhất có thể. Vì vậy, cách duy nhất một hand bài có thể được chơi theo hai cách khác nhau tại điểm cân bằng là nếu cả hai hành động đó có cùng EV; nghĩa là, nếu người chơi thờ ơ với lựa chọn hành động của mình. Điều này được gọi là Nguyên tắc bàng quan: nếu một người chơi chiến thuật hỗn hợp với một hand ở điểm cân bằng, thì tất cả hành động mà anh ta thực hiện với tần số khác không sẽ có cùng EV. Đây là một mệnh đề mạnh mẽ, bởi vì nó cho chúng ta biết điều gì đó về chiến thuật GTO của đối thủ. Nếu một người chơi thờ ơ giữa hai lựa chọn, thì hẳn là đối thủ của anh ta đang chơi theo cách để khiến anh ta như vậy"

Nguyên tắc này được kết nối mật thiết với ý tưởng về sự cân bằng. Hãy nhớ lại ví dụ trước khi mà chúng ta biết rằng range của nhà BN chơi theo GTO là 58.3% hand. Lý do khiến họ không thể all-in với range bài rộng hơn bởi vì nhà BB sẽ chỉ call khi cảm thấy BN không thể kiếm được tiền với những hand ở cuối range (ví dụ như hand 43s). Nếu họ có thể all-in và có được lợi nhuận với những hand ở cuối range, nhà BN sẽ tiếp tục làm thế. Còn nếu nhà BN mất tiền với những hand kiểu như 43s, họ sẽ chọn rằng không chơi những hand kiểu như thế nữa, và khi đó sẽ có những hand cuối ở range mới. Vì vậy, nhà BB phải thực hiện lệnh call chính xác những hand bài tệ nhất trong range của nhà BN. Bởi 43s là một hand khá lỡ cỡ, nên nó có thể được chơi như một chiến thuật hỗn hợp: 74% allin, 26% fold. Nếu như nhà BN all in 43s nhiều hơn 74%, nhà BB có thể khai thác bằng cách thực hiện lệnh call nhiều hơn để khiến cho hand 43s có EV âm.

Cùng lúc đó, tại điểm cân bằng, nhà BB chỉ có thể thực hiện lệnh call với 37.4% hand. Những hand cuối ở range call của họ, ví dụ như Q6s, cũng có thể chơi với một chiến thuật hỗn hợp call 61%, fold 39%. Nếu như nhà BB call với Q6s nhiều hơn 61%, nhà BN có thể tận dụng và khai thác điều đó để có thể khiến cho hand Q6s có EV âm.
Một phần nói nhãm về việc bluff/check 50% vs fold/call 50% tỷ lệ là 50/50 như trò tung đồng xu (head and tail) mà thằng tác giả nó ví dụ ra phức tạp hóa vấn đề bao gồm hơn 40 phép tính nhìn vô không hiểu mother gì hết nên mình skip luôn do attach files bị giới hạn.
MDF được tính thông qua chỉ số alpha:
1640668169646.png

b = ***
p = pot

Chỉ số Alpha rất quan trọng khi thực hiện bluff bới nó sẽ cho chúng ta biết rằng tần suất nên bluff với 0% equity như thế nào thì sẽ mang lại lợi nhuận.

Ví dụ
Game: Live Multi-table Tournament
Stacks: SB=50bb, BB=20bb
Players: 9 (12.5% ante)

Pre-flop: (2.625bb) Hero ở SB với 72o và action fold đến Hero, BB là một người chơi rất chắc cú và thường sẽ không chơi quá hung hăng với những pot nhỏ.

72o là một hand mà thông thường chúng ta sẽ fold ở vị trí SB khi đối đầu với đối thủ, nhưng ở đây Hero nghĩ rằng BB chỉ có thể defend khoảng ~50.8% hands khi đối đầu với lệnh cướp từ SB (Hand Range 25). Bạn phải quyết tâm để cướp blind dù cho hand bạn đang cầm tương đối yếu.

1640668254729.png

Hand Range 25: Range defend chắc cú từ nhà BB

Chúng ta có thể sử dụng công thức Alpha để tìm ra tần suất mà lệnh *** sẽ mang về lợi nhuận nếu chúng ta raise 2.5bb từ SB:
1640668308917.png

Nếu lệnh *** có tác dụng nhiều hơn 43% thời gian nó sẽ ngay lập thức có lợi nhuận, và trường hợp này là BB sẽ fold đi 49.17% hand bài.

Bạn sẽ luôn luôn fold 72o khi gặp 3-***, hãy giả định rằng bạn sẽ luôn thua pot nếu như BB call, mặc dù điều này không đúng vì nếu BB call, bạn vẫn còn một chút equity so với range call của BB (nhưng chúng ta ở đây là đang nhìn vào tình huống xấu nhất bởi nếu bạn có thể kiếm tiền, bạn sẽ luôn luôn kiếm được tiền).
1640668364061.png

Lệnh cướp với 72o có lợi nhuận là 27.4bb/100. Lệnh raise này gần như là luôn có lợi bởi đối thủ defend ở BB quá chặt, tạo điều kiện cho bạn có thể cướp blind với bất kì quân bài nào (any two cards – ATC).

Từ góc nhìn của BB, tần suất phòng thủ phải ở tần suất:
1640668393876.png

Nhà BB có MDF là 57% hands, nhưng theo giải pháp GTO cho BB ở trường hợp này là defend với 82.1% hands (Hand Range 26) điều mà với một số người chơi nó sẽ bị coi là điên rồ. Phần sau của cuốn sách chúng ta sẽ nghiên cứu về chiến thuật defend ở BB sâu hơn để hiểu rằng nó không hề vô lý chút nào.

1640668427566.png

Hand Range 26: BB vs SB (2.5x Raise) 20bb GTO Defense
• 3-*** all-in: 17.9% / • Call: 54.3% / • Fold: 17.9%


Multiway (Pot nhiều nhà)
Chỉ số Alpha nói cho bạn rằng tần suất bạn *** với 0% equity như thế nào sẽ mang về lợi nhuận cho bạn. Tuy nhiên, nếu như có một vài đối thủ ngồi phía sau bạn thì sao, bạn cần phải thay đổi một chút công thức để tìm ra được mức tần suất hợp lý hơn để khiến đối phương fold khi bạn ***.
Hãy thay đổi như sau.
1640668578039.png

Trong đó opponents ám chỉ số đối thủ sẽ hành động sau bạn.

Ví dụ
Game: Online Cash Game
Stacks: BB=99bb, SB=220bb, BN=114bb
Blinds: $1/$2
Players: 6 (không ante)

Pre-flop: (1.5bb) Mọi người fold hết đến Hero ở BN. Tần suất mà 2 nhà blind còn lại fold trước lệnh raise 2.5bb của Hero để Hero có lệnh open lợi nhuận với 2 lá bất kỳ là bao nhiêu?

Chúng ta sẽ bắt đầu bằng việc tính Alpha:
1640668618910.png

Nhìn chung, Hero cần lệnh raise hiệu quả 62.5% thời gian để có lợi nhuận. Để tìm ra được tần suất fold bài của mỗi đối thủ, chúng ta chỉ cần lấy căn bậc hai của Alpha:
1640668637502.png

Vì vậy, nếu như đối thủ fold nhiều hơn 79% thời gian khi đối mặt với lệnh cướp từ BN, Hero sẽ có lợi nhuận từ việc raise với 2 lá bất kỳ.

Chỉ số Alpha khi đối mặt với một người chơi chính là
1640668660506.png

Còn với ba người chơi:
1640668674502.png

Với bốn người chơi:
1640668683403.png

Khi đó, mỗi người chơi sẽ có tần suất defend tối thiểu được tính bằng:
1640668699451.png

Ở ví dụ này, mỗi người chơi nên defend ít nhất (1 – 0.79) = 21% thời gian để có thể dừng việc Hero liên tục kiếm tiền bằng việc raise với 2 lá bất kỳ.
Hãy cùng xem xét một điều chỉnh nhỏ đối với ví dụ này. Giả sử Hero nhìn vào HUD và số liệu thống kê về đối thủ là:
1640668722986.png

Liệu Hero có thể có lợi nhuận trước 2 đối thủ bằng lệnh raise?

Trong trường hợp này, bạn đã biết rằng tần suất fold của đối thủ khi đối mặt với tần suất cướp blind từ nhà BN. Nếu người chơi fold đi ít nhất 79% thời gian, việc giải quyết ví dụ này sẽ trở nên đơn giản bởi khi đó tần suất fold của họ sẽ đủ với lệnh cướp blind của chúng ta.

Làm thế nào để bạn biết rằng khi nào bạn có thể thực hiện lệnh raise với hai hand bất kỳ ở vị trí BN với 2 đối thủ còn lại? Bạn có thể giải quyết bằng cách tìm tần suất fold kết hợp của 2 đối thủ trên:
1640668770887.png

Kết hợp lại, hai người chơi này đang fold đi 60% thời gian và Alpha là 62,5%, vì vậy mặc dù cả hai người chơi fold khi nhà BN cướp blind là rất cao, nhưng Hero không có lợi nhuận BN khi cướp blind với 2 lá bất kỳ (giả sử Hero có 0% equity khi bị call).

Nếu bạn biết tần suất fold cá nhân của từng người chơi, bạn có thể tính toán tần suất fold kết hợp của họ bằng cách nhân chúng với nhau.

Giả sử việc bluff của bạn không có equity, công thức này vẫn phù hợp với bất kỳ số lượng đối thủ nào và ngay cả đối với các tình huống post-flop có thể xảy ra khi chúng ta có thể c-***.
 
Last edited:
Không biết nên nói tác giả viết quyển sách này là người ngu hay người thông minh.

Người ngu phức tạp hóa vấn đề làm cho những chuyện đơn giản trở nên rắc rối, khó hiểu. Người thông minh sẽ có cách nói những vấn đề phức tạp, khó hiểu một cách dễ hiểu.

Just kidding :popo_big_smile:, mình biết mấy cái công thức đó không có ai thèm quan tâm nhưng tác giả cố giải thích chỉ ra cách tính để cho chúng ta gọi là hiểu đại khái cách mà mọi thứ được tính toán. Các phần sau sẽ nói thêm về những phần mềm giúp chúng ta tính toán mà không cần nhức đầu như những bài giải thích của tác giả.
 
Không biết nên nói tác giả viết quyển sách này là người ngu hay người thông minh.

Người ngu phức tạp hóa vấn đề làm cho những chuyện đơn giản trở nên rắc rối, khó hiểu. Người thông minh sẽ có cách nói những vấn đề phức tạp, khó hiểu một cách dễ hiểu.

Just kidding :popo_big_smile:, mình biết mấy cái công thức đó không có ai thèm quan tâm nhưng tác giả cố giải thích chỉ ra cách tính để cho chúng ta gọi là hiểu đại khái cách mà mọi thứ được tính toán. Các phần sau sẽ nói thêm về những phần mềm giúp chúng ta tính toán mà không cần nhức đầu như những bài giải thích của tác giả.
Tác giả quyển đó học khoa toán, hình như đang tiếp tục học lên thạc sĩ tiến sĩ toán gì đó, ông đó chủ yếu là nghiên cứu lý thuyết toán, đã nghỉ đánh poker thực tế lâu rồi, giờ chỉ thuần phân tích theo góc độ số học và viết sách thôi.
Về việc giải thích rõ em nghĩ 1 phần là vì bán sách, nếu bỏ hết phần giải thích, chỉ ghi kết quả thì sách còn 5-10 trang bán ai mua.
 

Titun

Newbie
Joined
Nov 22, 2021
Messages
17
Reactions
6
MR
0.093
mình đọc thấy khó hiểu quá toàn công thức , trọng tâm nó ngiêng về toán học khá nhiều , tác giả chắc là người hỗ trợ công thức viết phần mềm GTO nên họ giải thích phần mềm hoạt động ra làm sao công thức như thế nào theo mình là như thế . đọc hiểu thì ... thua
 
mình đọc thấy khó hiểu quá toàn công thức , trọng tâm nó ngiêng về toán học khá nhiều , tác giả chắc là người hỗ trợ công thức viết phần mềm GTO nên họ giải thích phần mềm hoạt động ra làm sao công thức như thế nào theo mình là như thế . đọc hiểu thì ... thua
Tác giả lúc viết cuốn này là sinh viên khoa toán, hiện giờ đang học tiếp thác sĩ tiến sĩ toán gì đó, nghỉ đánh poker rồi, ông này chuyên về toán poker thôi không chuyên về đánh real, đầu sách có giới thiệu về ổng đó.
 

Mmo01

Hero
Joined
May 28, 2011
Messages
1,173
Solutions
10
Reactions
1,548
MR
21.321
post nguyên link sách hơn 800 trang

Sorry các bạn. Mình đi chơi xa giờ mới về nên lâu rồi ko update, từ mai lại tiếp tục cùng nghiên cứu. :popo_smile:
Post luôn 1 lần nguyên link để nhiều bạn như mình tự đọc tự nghiên cứu đi bạn hiền.
 
Thanks bro @sasura đã chia sẻ một tài liệu rất hay, em xin góp ý là, nếu bro chia sẻ theo kiểu, cắt từng chương ra từng file pdf up lên, mn tự xem nội dung file pdf, bro chỉ đưa ra nhận xét cá nhân về nội dung chương, như vậy thì sẽ hay hơn rất nhiều, vì mn đa phần là còn dở, đọc cũng không hiểu lắm, các ý kiến nhận xét của reg cứng như bro mới là điều quý nhất người mới cần.
 
Modern Poker Software
Do các ví dụ và các công thức tính toán quá nhiều nên mình nhảy cóc một số phần nhức đầu, bạn nào có nhu cầu xem mấy phần đó thì download file pdf ở post #55.

PHẦN MỀM POKER HIỆN ĐẠI - Modern Poker Software
Các chương trình máy tính và ứng dụng đã chiếm lĩnh xã hội hiện đại. Giờ đây, bạn có thể tìm thấy các ứng dụng làm được nhiều thứ, bao gồm chơi game, mạng xã hội, giao tiếp, fitness, sức khỏe, yoga, thiền, nấu ăn, học ngôn ngữ mới, chơi nhạc và video và thậm chí cả hẹn hò! Bất kể nhu cầu của bạn là gì, vẫn có cơ hội tốt để bạn có thể tìm thấy một ứng dụng có thể đáp ứng được điều đó và nếu không thể, bạn có thể chắc chắn rằng có ai đó ở đâu đó trên thế giới đang phát triển nó ngay bây giờ.

Thế giới chúng ta đang sống đã thay đổi, và cùng với đó là poker như chúng ta đã biết. Khi công nghệ ngày càng phát triển, các công cụ được người chơi poker sử dụng để phân tích và nghiên cứu trò chơi ngày càng trở nên tinh vi hơn. Trong chương này, chúng tôi sẽ phân tích một số chương trình và ứng dụng quan trọng nhất được người chơi poker sử dụng để cải thiện chiến lược của họ, theo kịp sự phát triển hiện đại và đánh bại đối thủ của họ.

Công cụ tính equity trong poker đã tồn tại mãi mãi và chúng chắc chắn là công cụ thiết yếu nhất trong kho vũ khí của bất kỳ người chơi nghiêm túc nào. Hiểu được cách equity thay đổi giữa hand với hand, hand với range và range với range là bước đầu tiên hướng tới sự nghiệp poker thành công.

Công cụ tính equity đã có chặng đường phát triển dài kể từ năm 2008 khi lần đầu tiên PokerStove được phát hành. Hồi đó, máy tính chưa được đánh bóng và cung cấp chức năng cực kỳ hạn chế.
Giờ đây, các công cụ tính toán equity như Power Equilab (power-equilab.com) cung cấp nhiều tính năng vượt xa các phép equity đơn giản, bao gồm đồ thị equity, heatmaps, phân tích range và hơn thế nữa.

Ưu điểm
◆ Quá trình nhập các range và tính toán equity thì trực quan và dễ sử dụng
◆ Các phép tính equity đa dạng
◆ Khả năng tạo ra hồ sơ khả năng chơi tuỳ chỉnh
◆ Tính toán equity nhanh

Nhược điểm
◆ Các phép tính hạn chế cho equity và những tính toán đơn giản
◆ Không đưa ra EV hay lời khuyên về chiến thuật nào
◆ Phân tích về range ở sau flop còn hạn chế
Với một công cụ phân tích range như Flopzilla (flopzilla.com) người chơi có thể nhập vào những range của hand và tìm ra được range thay đổi như nào với từng flop xảy ra, chia chúng thành các loại hand như top pair, sets, straights, flush draws, backdoor straight draws, và hơn thế nữa.

Ưu điểm
◆ Đưa ra equity theo từng hand combos
◆ Có thể sử dụng để phân tích hiệu ứng loại bỏ lá bài
◆ Lọc các hand bài ở sau flop theo các mục turns và rivers
◆ Tính toán nhanh
◆ Dễ sử dụng

Nhược điểm
◆ Không đưa ra EV hay bất kỳ lời khuyên về chiến thuật nào
◆ Không thể sử dụng để tạo ra sơ đồ quyết định phức tạp
◆ Hầu như chỉ hiệu quả khi phân tích các trận đối đầu
◆ Sự hiệu quả ở pre-flop còn hạn chế
Với một công cụ sơ đồ quyết định EV như Card Runners EV (cardrunnersev.com) bạn có thể tạo ra sơ đồ quyết định cho thấy những hành động của người chơi và tính EV tại mỗi thời điểm quyết định.

Ưu điểm
◆ Đưa ra EQ và EV cho những hành động khác nhau
◆ Tính toán ICM hiệu quả cho SNG và MTT final tables
◆ Khả năng tạo ra sơ đồ quyết định (sử dụng ngôn ngữ lập trình để tự động hóa các tác vụ)
◆ Tính toán đa dạng
◆ Hiệu quả khi phân tích range ở pre-flop và post-flop
◆ Công cụ lọc range toàn diện
◆ Tính toán MES
◆ Có thể kết hợp bounties và rake vào tính toán
◆ Hỗ trợ loại bỏ lá bài và hiệu ứng bunching

Nhược điểm
◆ Yêu cầu mức độ nhập thông tin đầu vào của người dùng lớn, bao gồm range của người chơi ở mọi điểm quyết định, pot size, ***-sizes, raise sizes, và stack depths
◆ Tạo sơ đồ và phân tích chiến thuật có thể rất tốn thời gian
◆ Yêu cầu hiểu biết về toàn bộ chiến thuật của đối thủ hoặc cách sử dụng một vài giả định để tính EV
◆ Yêu cầu người sử dụng phải trau dồi kiến thức liên tục
Trước khi có bộ giải GTO hiện đại, máy tính Nash như Holdem Resources Calculator (holdemresources.net) là công cụ được người chơi MTT và SNG lựa chọn. Nó rất hiệu quả trong việc ước tính các chiến lược all-in/fold ở pre-flop, đặc biệt là đối với những stacks bé trong các tình huống mà người chơi không có range để call.
Tuy nhiên, nó không hỗ trợ chơi ở post-flop, vì vậy nếu bạn cố gắng tính toán range cho các stacks đủ lớn để có những size *** không phải all-in, bạn sẽ buộc phải áp dụng các hành động tuỳ ý. Bạn có thể loại bỏ hoàn toàn các tùy chọn của người chơi để call những cú raise không phải all- in hoặc cho phép call, nhưng giả sử sẽ không có khoản *** nào sau khi flop được chia, khi cả hai người chơi đều check hand của họ. Cả hai cách tuỳ ý đều tạo ra các chiến lược pre-flop không chính xác. Việc loại bỏ tùy chọn call sẽ gây tổn hại cho những người chơi phòng thủ bằng cách buộc họ chơi các ranges chặt chẽ hơn, vì vậy máy tính đề xuất các ranges để open rộng hơn thay vì tối ưu và thiên về việc có những lá bài chặn tốt, trong khi bỏ qua khả năng chơi ở post-flop.

Việc check ở post-flop có lợi cho người chơi call vì tất cả các ván bài biên của họ sẽ ghi nhận 100% equity của họ, điều này dẫn đến ranges để call rộng hơn thay vì tối ưu. Cả hai tùy chọn đều hạn chế các ứng dụng của máy tính Nash đối với những stack lớn trong poker và làm cho chúng chỉ phù hợp với các tình huống all-in/fold.

Ưu điểm
◆ Rất hiệu quả khi tính toán những cú shoves không thể khai thác được
◆ Tính toán nhanh
◆ Tính toán được MES ở Pre-flop
◆ Đưa ra các chiến thuật ở pre-flop và EV
◆ Hỗ trợ tính toán cho tour bounty
◆ Mô hình Chip (ICM) độc lập và Mô phỏng Trò chơi Tương lai (FGS) cho SNGs và MTTs
◆ Thực hiện tính toán ở final table

Nhược điểm
◆ Không hỗ trợ cách chơi ở post-flop
◆ Không hỗ trợ loại bỏ lá bài và hiệu ứng chặt chẽ
Trở lại năm 1997, kỳ thủ cờ vua giỏi nhất thế giới lúc bấy giờ, Garry Kasparov, đã thất bại trước siêu máy tính của IBM, Deep Blue. Thất bại của ông được coi là một dấu hiệu cho thấy một ngày nào đó trí thông minh nhân tạo sẽ bắt kịp trí thông minh của con người.

Kể từ chiến thắng của Deep Blue, AI đã có những bước tiến lớn để hướng tới thất bại cuối cùng của nhân loại. Vào năm 2015, AlphaGo, một AI được phát triển bởi Deep Mind, công ty hàng đầu thế giới về nghiên cứu trí tuệ nhân tạo, đã trở thành chương trình cờ vây máy tính đầu tiên đánh bại một kỳ thủ cờ vây chuyên nghiệp của con người trên bàn cờ kích thước đầy đủ 19X19. Vào tháng 5 năm 2017, AlphaGo đánh bại Ke Jie, kỳ thủ xếp hạng số 1 thế giới vào thời điểm đó. Trò chơi cờ vây có thứ tự cường độ là 10170. Cùng năm đó, Deep Mind cũng phát hành AlphaZero, một trò chơi cờ vua và shogi AI đã làm điên đảo thế giới, đạt được trình độ chơi siêu phàm trong vòng 24 giờ sau khi phát hành và đánh bại các chương trình vô địch thế giới Stockfish và Elmo.

Trò chơi cờ vua có thứ tự cường độ là 1047 và shogi có thứ tự cường độ là 1071. Tuy nhiên, đánh bại những kỳ thủ giỏi nhất của con người không giống như giải quyết trò chơi. Một AI có thể đủ tốt để đánh bại những con người giỏi nhất, nhưng sau đó một AI khác có thể phát triển một chiến lược thậm chí còn tốt hơn và đánh bại AI trước đó. Chu kỳ này có thể tiếp tục mãi mãi. Giải một trò chơi bao gồm việc tính toán một giải pháp tối ưu về lý thuyết trò chơi (GTO) không thể thua bất kỳ đối thủ nào trong một trò chơi công bằng.

Cho đến nay, mọi trò chơi được chơi cạnh tranh bởi con người đã được giải là một trò chơi có thông tin đầy đủ. Trong các trò chơi thông tin đầy đủ như cờ vua hoặc cờ caro, mỗi người chơi có thể nhìn thấy tất cả các quân cờ của bàn cờ mọi lúc. Trong các trò chơi thông tin không đầy đủ như poker, lá bài của người chơi bị ẩn khỏi những người chơi khác. Giải các trò chơi này yêu cầu mức độ khó cao hơn.

Trò chơi cờ caro có 5 X 1020 nước đi và được giải hoàn toàn vào năm 2007 bởi Giáo sư Jonathan Schaeffer. Heads-Up Limit Hold’em (HULHE) là biến thể nhỏ nhất của poker được chơi cạnh tranh bởi con người. HULHE có 3.19 X 1014 điểm quyết định. Mặc dù ít hơn cờ caro, nhưng bản chất thông tin không đầy đủ của HULHE khiến nó trở thành một trò chơi khó hơn rất nhiều đối với máy tính để chơi và giải.

Trò chơi poker quy mô đầy đủ đầu tiên được giải là HULHE, được giải bởi Dự án Poker của Đại học Alberta Cepheus (2015). Việc áp dụng thuật toán CFR + (giảm thiểu sự hối tiếc phản thực tế) của họ được thực thi trên một cụm 200 nút tính toán, mỗi nút có 24 lõi AMD 2,1-GHz, 32 GB RAM (6400 GB RAM) và một đĩa cục bộ 1 TB (Đĩa có dung lượng 200 TB).
Thông tin đầy đủ hơn về Cepheus tại poker.srv.ualberta.ca.

Vào ngày 30 tháng 1 năm 2017, AI Libratus do Carnegie Mellon phát triển đã đánh bại các chuyên gia Head-Up No-Limit Hold’em (HUNLHE) hàng đầu của con người trong một thử thách 120.000 ván bài.

HUNLHE bao gồm 10160 tình huống, nhiều hơn số nguyên tử trong vũ trụ (1082). AI yêu cầu một cụm siêu máy tính bao gồm 600 nút, mỗi nút có 28 lõi sức mạnh xử lý và tổng cộng 2,7 petabyte dữ liệu, để hoàn thành nhiệm vụ và đánh bại người chơi là con người.

Thông tin đầy đủ hơn về Libratus tại:
cmu.edu/news/stories/archives/2017/january/AI-beats-poker-pros.html

Các bots poker ngày càng thông minh hơn mỗi ngày, nhưng với sức mạnh tính toán hiện tại vẫn còn một số hạn chế đối với những gì chúng có thể làm, đặc biệt là trong các tình huống nhiều người chơi với size *** vô hạn và nhiều stack lớn trong các trò chơi *** lớn như NLH và PLO.

Trong khi HULHE đã được giải hoàn toàn và Libratus đã đủ tốt để đánh bại những người chơi hàng đầu của con người trong HUNLHE, các biến thể poker khác bao gồm các giải đấu, cash game bàn 6 người và 9 người vẫn chưa được giải quyết hoàn toàn.
Mặc dù vẫn chưa tìm ra giải pháp đầy đủ cho các trò chơi hold’em với nhiều hơn hai người chơi, nhưng các trò chơi phức tạp có thể được chia thành các phần nhỏ hơn, dễ giải quyết hơn. Với việc sử dụng các bộ giải hiện đại, siêu máy tính, size *** giới hạn và áp dụng chính xác các chiến lược tuỳ ý, có thể tính toán các giá trị gần đúng cho cách chơi No-Limit hold’em GTO.
Phần mềm dựa trên trí tuệ nhân tạo cho NLH, chẳng hạn như Poker Snowie (pokersnowie.com), là những công cụ đã học được trò chơi bằng cách chơi hàng nghìn tỷ ván bài chống lại chính họ.
Họ bắt đầu với các chiến lược hoàn toàn ngẫu nhiên và sau mỗi ván bài được chơi, các hướng chơi thành công được củng cố và các hướng không thành công bị giảm đi, điều này giúp cho chiến lược của họ được cải thiện theo thời gian.

Ưu điểm
◆ Nhanh và dễ sử dụng
◆ Yêu cầu thông tin đầu vào từ người dùng ít
◆ Không có yêu cầu phần cứng lớn
◆ Cung cấp khả năng nhập lịch sử ván bài từ các trò chơi trực tuyến và đánh giá chúng dựa trên các chiến lược AI
◆ Đưa ra hướng dẫn ở pre-flop và hand range
◆ Người dùng có thể chơi các thử thách, nhận số liệu thống kê và đánh giá lỗi

Nhược điểm
◆ Không thực sự giải quyết được các chiến lược GTO
◆ Size *** bị hạn chế hoặc cố định
◆ AI không thể lý giải tại sao nó làm, cái gì nó làm và kết quả không thể kiểm chứng
◆ Không thể tính toán các chiến thuật để khai thác các người chơi yếu; chương trình chỉ cung cấp chiến thuật cốt lõi
◆ Các chiến thuật thay đổi theo thời gian, khiến cho việc học từ đó trở nên khó khăn
◆ Không thể đảm bảo khả năng không bị khai thác
Bộ giải là máy tính Nash Equilibrium cho cách chơi ở pre-flop và post-flop. Có một số loại có sẵn trên thị trường và chúng cung cấp các đặc điểm khác nhau. Tại thời điểm được tạo ra, hầu hết những bộ giải thương mại có thể tính toán các chiến lược Nash Equilibrium cho các tình huống post-flop của Limit và No- Limit Hold’em với range và size *** tùy ý trong bất kỳ thời điểm đối đầu nào với mức độ chính xác rất cao (khả năng khai thác thấp).

Một số bộ giải có thể tính toán Nash Equilibrium ở pre-flop và post-flop cho các tình huống nhiều người chơi, và một bộ giải thậm chí có thể giải cho các trò chơi lớn hơn như Omaha có pot hạn chế.

Nhận định rằng một chiến lược là GTO hoặc rất gần giống với nó phải được sao lưu bằng cách nào đó. Như đã nói trước đây, giải pháp hoàn chỉnh cho một trò chơi như NLH chưa được tìm thấy, vì vậy nếu một người tuyên bố có giải pháp GTO cho điểm poker nhất định, thì phải có một cách khoa học và toán học để xác minh khẳng định này, nếu không thì bất kỳ ai cũng có thể tuyên bố đã giải được và chơi GTO.

Nash Distance
Ɛ-Nash hoặc Cân bằng Epsilon là một công cụ gần với chiến thuật Nash Equilibrium giúp thoả mãn một cách tương đối những điều kiện của cân bằng Nash. Chiến lược cân bằng Nash tối đa hóa tiện ích Ɛ đôi khi còn được gọi là khoảng cách Nash, vì nó có thể được sử dụng để xác minh mức độ giống của bất kỳ chiến lược nào so với Cân bằng Nash ngay cả khi không biết trạng thái cân bằng thực sự trông như thế nào.

Tính khoảng cách Nash
Khi bạn đã có một đôi chiến lược mà bạn nghĩ là GTO, quá trình tính toán khoảng cách Nash khá đơn giản. Đầu tiên, bạn tính EV của cả hai người chơi, sau đó bạn tính MES của Người chơi 1 so với Người chơi 2, xem EV này tăng lên bao nhiêu và gọi độ tăng EV của P1 là Ɛ1, sau đó bạn làm tương tự cho Người chơi 2. Tính MES của họ so với Người chơi 1, xem EV này tăng lên bao nhiêu và gọi nó là Ɛ2.

Số lớn nhất giữa Ɛ1 và Ɛ2 là Khoảng cách Nash. Nếu con số này là 0, thì bạn đang ở trạng thái Cân bằng Nash chính xác và cặp chiến lược là GTO đúng. Nếu con số này lớn, nghĩa là bạn đang ở rất xa GTO và nếu bạn ở gần GTO thì nó sẽ nhỏ.

Hầu hết các bộ giải GTO hiện đại đưa ra khoảng cách Nash cho lời giải của nó. Ví dụ: PioSOLVER đưa ra Khoảng cách Nash dưới dạng % đối với pot và nó có thể được sử dụng để thiết lập độ chính xác mong muốn để người giải hoàn thành việc thực hiện các phép tính. Thông thường, thời gian chạy bất kỳ giải pháp GTO nào càng nhiều, thì Ɛ nhận được càng thấp. Thật không may, hầu hết các bộ giải GTO sẽ bị trả lại sau khi Ɛ rất nhỏ vì chúng không thể đạt được cách chơi GTO hoàn hảo. Một khi Ɛ là rất nhỏ, sẽ không thực tế nếu mong đợi bất kỳ đối thủ nào có thể khai thác bạn với số tiền đó, vì trước tiên nó sẽ yêu cầu bạn chơi từng combo trên mỗi nút chính xác như bộ giải thực hiện, sau đó cho phép đối thủ biết chính xác chiến lược của bạn tại mọi thời điểm quyết định và tính toán MES so với chiến lược Ɛ-GTO của bạn. Trên hết, đối thủ sẽ cần thực hiện MES của họ một cách hoàn hảo để có thể khai thác tất cả EV có thể từ bạn. Vì vậy, khá an toàn khi cho rằng không ai có thể khai thác bạn vì Ɛ, và bạn không nên lo lắng về điều đó.
Trong thực tế, khi Ɛ còn nhỏ, Ɛ-GTO không khác gì để giúp hoàn thiện GTO cho người chơi.

Cá nhân tôi thích thực hiện các cách giải GTO ở flop của mình với độ chính xác là 0,35% pot.
Khi range ngày càng rộng, SPR tăng và độ phức tạp của sơ đồ quyết định tăng lên, càng khó đạt được khoảng cách Nash thấp và mất nhiều thời gian hơn để thực hiện tính toán. Đối với mô phỏng PioSOLVER ở pre-flop, các range ở pre-flop sẽ được đưa ra nhanh hơn rất nhiều so với post-flop.
Hầu hết khả năng khai thác của bản mô phỏng sẽ đến từ cách chơi lá river, do đó, ngưỡng có thể được hạ xuống và khả năng khai thác có thể được đo bằng bb/100. Ngưỡng mà tôi thích cho mô phỏng PioSOLVER ở pre-flop là 3,5bb/100.

Các ngưỡng này là hoàn toàn tùy ý, nhưng có vẻ như cộng đồng người chơi nhất trí về việc chúng cần phải đủ tốt, vì các chiến lược không thực sự thay đổi quá nhiều ở khoảng cách Nash thấp hơn.

Ở các bộ giải khác như MonkerSolver, hầu hết khả năng khai thác đến từ việc chơi post-flop dưới mức tối ưu do sự tuỳ ý ở post-flop. Không rõ bao nhiêu trong số này ảnh hưởng đến các range ở pre-flop, vì vậy câu hỏi về mức độ khai thác của các range ở pre-flop như thế nào, khi mà cách chơi ở post-flop đã tối ưu, là không thể trả lời. Tôi đã xem xét một số tiêu chuẩn và so sánh cả mô phỏng ở pre và post-flop của Monker, Pio và một bộ giải GTO riêng mà nhóm của tôi đang làm việc và nhận thấy các chiến lược gần giống nhau khi sử dụng các bộ giải có độ đặt tuỳ ý cao. Trước khi PioSOLVER trở thành chủ đạo, tôi cũng đã xem xét rất nhiều tiêu chuẩn và kiểm tra kết quả của nó với các công cụ khác, chẳng hạn như CardRunners EV và Máy tính all-in/fold Nash như HRC, và nhận thấy rằng kết quả phù hợp với kiến thức và lý thuyết trước đó.

Nói chung, ngay cả khi trò chơi poker chưa được giải quyết hoàn toàn, tôi tin tưởng rằng các chiến lược rút ra từ quá trình làm việc với bộ giải GTO là rất chính xác và có thể được sử dụng để nâng cao hiểu biết của chúng tôi về trò chơi poker, giúp chúng tôi đưa ra quyết định tốt hơn tại các bàn chơi mà cuối cùng được chuyển thành EV.
PioSOLVER (piosolver.com) là bộ giải phổ biến nhất trên thị trường. Nó giải được các chiến lược cân bằng HUNLHE với range bắt đầu, size stack và size *** tuỳ ý với độ chính xác mong muốn (khả năng khai thác).

Ưu điểm
◆ Đưa ra equity, EV, EQR và chiến thuật đầy đủ
◆ Kết quả rất chính xác
◆ Có thể tính toán được MES và MinES
◆ Tổng hợp các tính năng báo cáo và phân tích tần suất
◆ Đưa ra giải pháp cho Limit và No-Limit Hold’em
◆ Khả năng tương thích cao với các công cụ poker khác
◆ Chức năng tạo tập lệnh nâng cao
◆ Thực hiện được các phép tính ICm
◆ Bộ giải ở Pre-flop (chỉ dành cho tình huống đối đầu)
◆ Hỗ trợ khách hàng ưu việt

Nhược điểm
◆ Lúc đầu, giao diện người dùng có thể gây choáng ngợp nhưng sau khi hiểu rõ, việc điều hướng trở nên đơn giản
◆ Các phép tính GTO có thể mất nhiều thời gian để hoàn thành, tùy thuộc vào kích thước của sơ đồ quyết định, độ lớn của stack và range đang chơi
◆ Yêu cầu người sử dụng phải trau dồi kiến thức liên tục. Sử dụng nó một cách hiệu quả đòi hỏi một số kiến thức về poker.
◆ Yêu cầu phần cứng cao. Độ phức tạp của các giải pháp bị giới hạn bởi khả năng của máy tính, vì vậy nó có thể yêu cầu nâng cấp hệ thống để chạy mô phỏng những stack lớn với nhiều size ***, đặc biệt nếu sử dụng bộ giải pre-flop.
◆ Chỉ thực hiện giải phù hợp cho các tình huống đối đầu
◆ Lưu mô phỏng đầy đủ yêu cầu nhiều dung lượng lưu trữ dữ liệu, vì vậy để tiết kiệm dung lượng đĩa, các tệp Pio có thể được lưu mà không có chiến lược ở river, sau đó sẽ được tính toán lại trong khi duyệt mô phỏng
◆ Việc thiết lập mô phỏng một cách chính xác có thể khó khăn, đặc biệt là đối với người dùng mới. Tuy nhiên, khi mô phỏng đã bắt đầu, việc duyệt các giải pháp khá dễ dàng và trực quan.
MonkerSolver (monkerware.com) là một trong những bộ giải linh hoạt nhất trên thị trường. Nó có thể giải Hold’em và Omaha từ mỗi vòng chơi, với bất kỳ số lượng người chơi nào sử dụng các kỹ thuật tuỳ ý để giảm kích thước trò chơi.

Ưu điểm
◆ Giải quyết các tình huống NLH và PLO đa chiều phức tạp. Tuy nhiên, khả năng giải quyết các trò chơi lớn hơn và phức tạp hơn đi kèm với một cái giá phải trả. Việc sử dụng các yếu tố tuỳ ý để giảm kích thước trò chơi tạo ra các giải pháp kém chính xác hơn.
◆ Các mô phỏng đã hoàn thiện rất dễ duyệt
◆ Thực hiện tính ICM
◆ Có thể điều chỉnh mô phỏng cho hiệu ứng rake
◆ Có các biểu đồ equity
◆ Khả năng xuất thủ công các range sang các công cụ khác ở các định dạng khác nhau

Nhược điểm
◆ Giao diện sử dụng đồ họa có vẻ thô và người dùng dễ cảm thấy choáng ngợp, đặc biệt nếu không am hiểu về máy tính
◆ Yêu cầu người sử dụng phải trau dồi kiến thức rất thường xuyên
◆ Yêu cầu phần cứng dung lượng cao. Máy tính được sử dụng để chạy mô phỏng Monker càng mạnh thì các cài đặt tuỳ ý có thể được sử dụng càng tốt và do đó các giải pháp chính xác hơn. Điều này buộc người dùng phải xây dựng các siêu máy tính hoặc thuê các máy chủ lớn để chạy các giải pháp có độ chính xác cao.
◆ Qúa trình xây dựng sơ đồ chiến lược có thể tẻ nhạt và tốn thời gian
◆ Xây dựng chiến lược ở pre-flop có thể mất hàng tuần để hoàn thành, phụ thuộc vào kích thước của sơ đồ
◆ Các công cụ phân tích range hạn chế
◆ Thiếu khả năng chạy các báo cáo tổng hợp (tổng hợp dữ liệu qua nhiều lần lặp lại)
Các ứng dụng đào tạo GTO như GTO Poker (gtopoker.io) cung cấp nhiều chiến lược GTO được tính toán trước cho các biến thể poker khác nhau bao gồm cash game bàn 6 người chơi và các trận đối đầu, MTT, HUSNG và SNG Jackpot tối đa 3 người với nhiều stack lớn, và hơn thế nữa. Chúng giúp cho các chiến lược GTO nâng cao có thể truy cập được cho những người dùng muốn tìm hiểu về cách chơi GTO nhưng không nhất thiết phải quan tâm đến việc phải tự thực hiện các phép tính của riêng họ.

Ưu điểm
◆ Không yêu cầu cài đặt hoặc yêu cầu máy tính phức tạp
◆ Cung cấp các chiến lược GTO có độ chính xác cao được xây dựng cẩn thận do các chuyên gia phát triển bằng cách sử dụng các bộ giải GTO tư nhân và thương mại tiên tiến nhất
◆ Dễ sử dụng, với giao diện người dùng đẹp và trực quan
◆ Đưa ra giải pháp theo thời gian thực, vì vậy không cần đợi tính toán hoàn thành
◆ Kho tàng giải pháp lớn phát triển theo thời gian
◆ Các giải pháp Multiway pre-flop và post-flop
◆ Yêu cầu đầu vào của người dùng tối thiểu
◆ Các giải pháp cho những cash game có rake tuỳ chỉnh
◆ Phân tích post-flop nâng cao

Nhược điểm
◆ Size *** bị cố định
◆ Không thể tính toán các chiến lược khai thác chống lại những người chơi yếu kém (chương trình chỉ cung cấp chiến lược cốt lõi của GTO)
◆ Giới hạn đối với các giải pháp GTO được tính toán trước, vì vậy người dùng không thể thực hiện các phép tính tùy chỉnh
 
Last edited:
PRE-FLOP: THEORY AND PRACTICE
LÝ THUYẾT VỀ CÁCH CHƠI TẠI PRE-FLOP

Range pre-flop chính là xương sống của poker. Bất cứ khi nào bạn mắc lỗi trong một ván bài, tức là cách chơi của bạn đang mắc lỗi, nghĩa là lỗi sẽ được tiếp tục và sẽ ảnh hưởng đến quyết định trong tương lai. Một sai lầm ở pre-flop có thể chuyển thành một sai lầm flop, một sai lầm turn và cuối cùng là một sai lầm river. Ngay cả khi bạn nhận ra mình đã mắc sai lầm trên một vòng đặt cược sớm hơn, bạn có thể khó bù đắp cho nó sau này.

Nếu không có blind và antes, người chơi sẽ vui vẻ chờ đợi để được chia AA, hoặc stack đủ nhiều, những ván bài có pot odd/implied odd để đánh bại AA. Blind khuyến khích người chơi tranh giành số tiền trong pot, và do đó, chơi nhiều ván bài hơn. Lý do người chơi chơi các ván bài khác với AA là vì có tiền trong pot để thắng.

Tỉ lệ thắng
Lợi thế về kỹ năng hoặc mức độ thiếu hụt kỹ năng của một người chơi trong một nhóm có thể được đo bằng số lượng người chơi thắng hoặc thua lớn trên 100 ván bài. Người chơi có lợi thế nhiều hơn đối thủ, tỷ lệ thắng của họ càng cao. Nếu tất cả những người chơi trong bàn đều có kỹ năng như nhau, tỷ lệ thắng của họ sẽ bằng 0 và trong các trò chơi có rake, tất cả họ sẽ thua dù nhà cái đặt rake là bao nhiêu.

Tỷ lệ thắng của người chơi phụ thuộc vào cấp độ kỹ năng của đối thủ. Đây là lý do tại sao lựa chọn trò chơi là chìa khóa cho sự thành công hay thất bại trong sự nghiệp của tất cả người chơi poker. Giả sử bạn là một người chơi có kỹ năng và có hai trò chơi khác nhau chạy tại sòng bạc địa phương của bạn: trò chơi khó với $ 10/$ 20 trong đó tỷ lệ thắng của bạn là 2bb/100 và trò chơi mức cược thấp hơn $ 2/$ 5 trong đó tỷ lệ thắng của bạn là 10bb/100. Trong trò chơi khó khăn hơn, bạn kiếm được trung bình 40 đô la cho mỗi 100 ván bài bạn chơi, nhưng trong trò chơi nhỏ hơn, bạn kiếm được trung bình 50 đô la cho mỗi 100 ván bài bạn chơi. Về lâu dài, bạn sẽ kiếm được nhiều tiền hơn khi chơi trò chơi nhỏ hơn trong khi trải qua ít sự chênh lệch hơn rất nhiều bởi vì sự thay đổi thường cao hơn trong các trò chơi lớn hơn mà bạn có lợi thế thấp hơn.

Tại bàn cash 6 người (không có ante), có 1,5 big blind trong pot mỗi ván bài, hoặc 150BB mỗi 100 ván bài (150bb/100). Hãy tưởng tượng một tình huống mà tất cả mọi người đều sợ khi chơi với bạn và bất cứ khi nào bạn raise lên, đối thủ của bạn sẽ fold bài mỗi lần, kể cả AA. Trong trường hợp đó, không có lý do gì để bạn không raise tất cả các ván bài với hai lá bài bất kỳ, đạt được tỷ lệ thắng của toàn bộ tiền cược là 150bb/100. Chúng tôi biết rằng một tình huống như vậy là không thể xảy ra và, bất kể bạn là ai, có một số ván bài sẽ không có người chơi nào chịu fold. Quan trọng hơn, có những ván bài, họ có khả năng sẽ raise lại (điều này sẽ buộc bạn phải fold một số ván bài và mất equity của họ trong pot) và vì vậy chúng tôi có thể kết luận rằng không người chơi nào có thể đạt được tỷ lệ thắng của toàn bộ tiền cược (150bb / 100 ).

Nếu không người chơi nào có thể đạt được tỷ lệ thắng của toàn bộ tiền, làm thế nào bạn có thể tìm ra phần tiền mà bạn có thể có được? Hay nói cách khác, làm thế nào để bạn xác định được tỷ lệ thắng của mình?

Tỷ lệ thắng của người chơi online khá dễ tính bằng cách sử dụng phần mềm theo dõi. Sau khi chơi 100.000 ván bài, người chơi bắt đầu biết tỷ lệ thắng thực tế của họ trông như thế nào, nhưng cần có ít nhất 1.000.000 ván bài mẫu mới có ý nghĩa thống kê. Người chơi cash offline có thể ước tính về tỷ lệ thắng tổng thể của họ trong một khoảng thời gian bằng cách sử dụng công thức sau:
1642501900380.png

Ví dụ, nếu một người chơi khoảng 300 ván bài trong một phiên poker kéo dài 10 giờ và chơi năm ngày mỗi tuần, bốn tuần mỗi tháng, họ sẽ được chia khoảng 6.000 ván bài mỗi tháng hoặc 72.000 ván mỗi năm. Nếu người chơi đó kiếm được 100.000 đô la sau một năm chơi với 5 đô la / 10 đô la blind, tỷ lệ thắng của họ là:
1642501942919.png

Tỷ lệ thắng có xu hướng cao hơn rất nhiều trong trò chơi trực tiếp so với trò chơi trực tuyến vì trò chơi trực tiếp hầu như luôn nhẹ nhàng hơn so với trò chơi trực tuyến. Sòng bạc thu hút tất cả các loại người chơi giải trí muốn đánh bạc, giao lưu và vui chơi. Những người chơi này không có nhiều nền tảng về poker, dẫn đến những người chơi tốt sẽ có tỷ lệ thắng cao hơn.

Người chơi trực tiếp cũng thiếu kinh nghiệm hơn so với người chơi trực tuyến. Nếu một người chơi trực tiếp chơi trung bình 300 ván bài mỗi ngày thì sau một năm, họ sẽ chơi được 72.000 ván bài. Còn các phòng poker trực tuyến cung cấp khả năng chơi nhiều lần, cho phép người chơi chơi hai, bốn, sáu, 10 hoặc thậm chí 20 bàn cùng một lúc. Điều này, kết hợp với tốc độ nhanh hơn của phần mềm chia bài so với tốc độ của người chia bài và quỹ thời gian hạn chế để đưa ra quyết định, dẫn đến số lượng ván bài trực tuyến tăng theo cấp số nhân. Một người chơi trực tuyến thông thường có thể dễ dàng chơi 3.000 ván bài trong một ngày hoặc 720.000 ván bài trong một năm. Trong một năm, một người chơi trực tuyến sẽ chơi nhiều ván bài poker như một người chơi trực tiếp sẽ chơi trong 10 năm! Tất nhiên, có những yếu tố khác xuất hiện và không nhất thiết tất cả người chơi trực tuyến đều tốt hơn người chơi trực tiếp, nhưng chỉ sự khác biệt này là quá đủ để khiến người chơi trực tuyến trung bình trở nên khó khăn hơn nhiều so với người chơi trực tiếp trung bình.

Tỷ lệ thắng tổng thể của bạn là trung bình của tỷ lệ thắng bạn có ở mỗi vị trí của bàn. Ở bàn chơi 6 người, nếu pot được chia đều cho cả sáu vị trí, tỷ lệ thắng ở mỗi vị trí sẽ là 25b / 100, nhưng, như
chúng ta sẽ thấy, có nhiều yếu tố ảnh hưởng đến lợi nhuận của người chơi bao gồm vị trí trên bàn.
Ở một số vị trí, tỷ lệ thắng có thể cao hơn 25bb / 100, và đối với những vị trí khác, nó sẽ thấp hơn
(Table 15).
1642502039713.png

Table 15: Ví dụ cho tỉ lệ thắng Online bàn 6 (bb/100)

Tỷ lệ thắng ở blind luôn luôn âm. BB bắt đầu bài bằng 1bb và SB là 0,5bb, vì vậy tỷ lệ thắng của họ bắt đầu lần lượt là -100bb / 100 và -50bb / 100. Khởi đầu với một bất lợi như vậy, cho dù một người chơi có giỏi đến đâu thì tỷ lệ thắng của họ ở các vị trí đặt cược cũng không bao giờ có thể tốt bằng các vị trí khác. BN có tỷ lệ thắng cao nhất vì vị trí đó được chơi các ván bài có lợi nhất. Tỷ lệ thắng giảm khi vị trí di chuyển khỏi BN.

Hầu hết người chơi đều mất tiền khi chơi poker. Đó là một sự thật. Bạn phải thực sự giỏi mới có thể hòa vốn bởi vì bạn phải phục hồi -150bb / 100 mà bạn thua người mù mỗi vòng, cũng như tiền rake của nhà cái.

Tùy thuộc vào stake mà bạn chơi và trang web chơi, rake thường sẽ là từ 5 đến 10bb mỗi 100 ván bài. Phần mềm theo dõi poker có thể được sử dụng để tìm ra số tiền rake chính xác, cũng như ảnh hưởng của nó đối với tỷ lệ thắng. Thông thường, đặc biệt là trong các micro stake, mức rake cao đến mức ngay cả những người chơi mạnh cũng không thể giành chiến thắng, vì vậy lời khuyên của tôi cho tất cả người chơi là hãy xem xét kỹ cấu trúc rake của từng trang web (cũng như các giao dịch và chương trình VIP) trước khi quyết định chơi ở đâu. Rake cao hơn không bao giờ có lợi cho người chơi bởi vì nó chỉ có nghĩa là nhiều tiền hơn được lấy đi từ các bàn và vào túi của nhà cái. Lưu ý rằng trong trò chơi ante, người chơi cũng cần có khả năng phục hồi ante. Một ante có kích thước 12,5% của BB tương đương với -12,5bb / 100.

Vì vậy, người chơi có thể làm gì để tối đa hóa tỷ lệ thắng của họ và có thể đánh bại người chơi và rake?

Tỷ lệ thắng tổng thể của bạn là tổng số EV của tất cả các ván bài mà bạn đã được chia ở tất cả các vị trí và các hành động bạn đã thực hiện với chúng. Vì vậy, cách để tối đa hóa tỷ lệ thắng tổng thể của bạn đơn giản là luôn thực hiện hành động EV cao nhất với mỗi ván bài mà bạn được chia ở mọi thời điểm quyết định.

EV có thể được biểu thị giống tỷ lệ thắng ở bb / 100 và chúng ta biết rằng EV của fold là 0, vì vậy người chơi chỉ nên chơi ván bài khi các hành động mà họ có thể thực hiện có tỷ lệ thắng không âm.

Ví dụ
9-max MTT (12.5% ante), stack hiệu dụng 20bb. Fold đến SB, người có 4 lựa chọn. All-in với 20bb, raise 2.5bb, limp hay fold. Chúng ta biết rằng EV của việc fold là 0. Hãy cùng xem xem tỉ lệ thắng của cả 4 hành động đó như thế nào (Table 16).

Theo bảng, hành động tốt nhất để thực hiện với AA là nâng lên 2.5bb, AJo nên đẩy 20bb, Q7 nên limp và cho ất cả hành động khi cầm 72o có tỷ lệ thắng âm, nó nên được fold.
Tỷ lệ thắng tổng thể của bạn trong SB khi hành động fold lại cho bạn là 88bb / 100 (Table 17).

Đó chỉ đơn giản là EV tổng hợp của từng hand trong số 1.326 hand có thể có. Các hand có EV âm sẽ được fold và có 0 EV, và tất cả các hand khác sẽ có EV bằng hành động EV cao nhất. Nếu bạn chọn bất kỳ hành động nào khác ngoài EV cao nhất cho mỗi ván bài so với đối thủ GTO, tỷ lệ thắng của bạn tại chỗ chỉ có thể giảm xuống.

1642502317210.png

Table 16: (Giả sử đối phương chơi theo GTO, bảng tổng hợp EV)

Ví dụ, nếu bạn chọn all-in với 72o, trung bình bạn sẽ mất -63bb / 100. Tất cả với AA là + EV, nhưng không phải là cách chơi EV cao nhất. Trên thực tế, all-in với AA là -136bb / 100 tệ hơn raise 2.5bb, vì vậy sai lầm này thậm chí còn tồi tệ hơn so với push 72o. Điều rất quan trọng là bạn không mắc phải sai lầm phổ biến khi nghĩ rằng chỉ vì một lượt chơi + EV thì đó là lượt chơi chính xác.

Mọi hành động luôn phải được so sánh với tất cả các khả năng khác trước khi quyết định chơi.
1642502398899.png

Table 17: Tỉ lệ chiến thắng của Blind khi fold đến họ (BB 40, Stacks 800, i.e.20bb)

Bạn càng chơi có lợi nhuận nhiều ván bài và lợi nhuận trung bình của mỗi ván bài càng cao thì tỷ lệ thắng của bạn càng cao. Mỗi quyết định bạn đưa ra trên mỗi ván bài sẽ làm tăng hoặc giảm tỷ lệ thắng chung của bạn. Trong các cash game, tỷ lệ thắng tỷ lệ thuận với lợi nhuận của người chơi trong các trò chơi (như trong Table 18), nhưng trong các giải đấu không phải lúc nào cũng vậy vì giá trị của chip không tỷ lệ thuận với giá trị đô la của chúng. Chúng ta sẽ thảo luận về các giải đấu sau trong chương Lý thuyết Giải đấu. Điều đó nói rằng, tỷ lệ thắng vẫn có thể khá hữu ích cho những người chơi tham gia giải đấu vì chúng nói lên rất nhiều về kỹ năng của người chơi và có thể được sử dụng để tìm ra các lỗ hổng khi tỷ lệ thắng thấp hơn mong đợi.
1642502477823.png

Table 18: Ví dụ về các trường hợp Cash Games sau 1,000,000 Hand chơi ở các Stakes kháu nhau

Mặc dù sự khác biệt về tỷ lệ thắng có vẻ nhỏ, nhưng chúng nhanh chóng lớn hơn khi stake tăng lên. Nếu tỷ lệ thắng cao hơn dẫn đến tiền thắng cao hơn, mục tiêu của bạn, với tư cách là một người chơi poker, phải tăng tỷ lệ thắng của mình nhiều nhất có thể bằng cách liên tục lấy điểm + EV và tránh điểm -EV. Về lâu dài, những người chơi đưa ra quyết định tốt nhất trung bình sẽ nhận toàn bộ số tiền và những người chơi mắc lỗi nhiều nhất chắc chắn sẽ thua cuộc.
Tại sao người chơi sử dụng các chiến lược phức tạp? Tại sao họ không thực hiện một chiến lược allin/fold đơn giản, chơi được những hand tốt và fold những hand không tốt?

Phần này sẽ so sánh hai trong số các tình huống pre-flop đơn giản nhất để hiểu giá trị của việc có các lựa chọn chiến lược khác nhau và chơi các chiến lược phức tạp.

Trường hợp 1: Hero ở SB chơi OOP với nhà BB
Game: 3-max SNG
Stack depths: 8bb, 10bb, 12bb, 15bb, 17bb, 20bb & 25bb
Blinds: 0.5bb/1bb
Players: 3 (không ante)
Pre-flop: (1.5bb) BN fold và Hero ở SB hành động. Anh ta có thể fold, limp, raise 2bb, 2.5bb, 3bb, hay all-in.

Trường hợp 2: Hero ở BN chơi IP với nhà BB
Game: Heads-up SNG
Stack depths: 8bb, 10bb, 12bb, 15bb, 17bb, 20bb & 25bb
Blinds: 0.5bb/1bb
Players: 2 (không ante)
Pre-flop: (1.5bb) Hero hành động trước ở BN. He có thể fold, limp, raise 2bb, 2.5bb, 3bb, hay all-in.

Hai tình huống được mô tả rất giống nhau. Hero ở SB trong cả hai, nhưng Tình huống 1 là trò chơi 3 người nên Hero là OOP so với BB trong khi Tình huống 2 là đối đầu với BB, nghĩa là Hero ở BN và sẽ có IP. Nếu cả hai người chơi đều chơi chiến thuật chỉ allin/fold mà không chơi post flop, thì các tình huống sẽ tương đương nhau. Tuy nhiên, nếu chúng tôi giải quyết vấn đề bằng cách sử dụng các bộ giải pre-flop hiện đại và cung cấp cho người chơi các tùy chọn chiến lược bổ sung như limp và khả năng sử dụng các cách raise khác nhau ngoài all-in, chúng ta có thể so sánh các tình huống khác nhau và cố gắng có được một số thông tin chi tiết về giá trị của các lựa chọn chiến lược khác nhau và cách chúng bị ảnh hưởng bởi vị trí.
1643013921559.png

Diagram 2: Trung bình EV theo Stack
1643013932590.png

Table 19: Trung bình EV với các chiến thuật khác nhau


Chúng tôi thấy rằng bằng cách chơi một chiến lược phức tạp hơn so với allin/fold, Hero chiếm được một phần tiền pot lớn hơn, thêm 4,62% pot (7b / 100) khi ở ngoài vị trí và 14,6% tiền (22b / 100) khi có vị trí. Với các stack ít, tổn thất EV khi áp dụng chiến lược chỉ allin/fold là rất nhỏ, nhưng khi stack lớn hơn và đặc biệt là khi có vị trí, giá trị của các tùy chọn chiến lược khác sẽ tăng lên. Chơi một chiến lược phức tạp hơn so với allin/fold sẽ mang lại cho Hero phần thưởng cao hơn.
1643014025162.png

Diagram 3: Trung bình tần suất fold của stack lớn
1643014035457.png

Table 20: Trung bình tần suất fold

Tần suất fold của Hero là cao nhất khi chơi allin/fold (Table 20), có nghĩa là chiến lược này giới hạn số lượng ván bài mà Hero có thể chơi có lãi, đặc biệt khi stack lớn hơn. Ngược lại, tần suất fold sẽ thấp hơn khi chơi một chiến lược phức tạp hơn, đặc biệt là khi có vị trí.

Với hơn 17bb, all-in rất hiếm khi được BN sử dụng, nhưng lại trở thành chiến lược thống trị với ít hơn 10bb. Các tần số allin SB cao hơn rất nhiều so với BN bởi vì việc allin làm giảm nhược điểm của OOP.
1643014152837.png

Diagram 4: Tần suất Hero Allin khi stack lớn
1643014175049.png

Table 21

1643014192519.png

Diagram 5: Tần suất Hero Limp khi stack lớn
1643014227451.png

Table 22


Limp được sử dụng thường xuyên hơn 42,51% khi Hero IP so với OOP, trở thành chiến lược thống trị (Table 23). Lưu ý rằng cách limp trở nên quan trọng hơn đối với SB khi stack lớn hơn nhưng vẫn tương đối không đổi đối với BN. Điều này có nghĩa là khi Hero IP, việc limp gần như quan trọng ở tất cả các độ lớn stack, và khi Hero OOP, việc limp trở nên có giá trị hơn khi stack lớn khi Hero mất khả năng đẩy all-in range bài rộng.
1643014277690.png

Table 23: Tần suất ở SB (8-25bb)

Size raise duy nhất mà BN sử dụng là 2bb (tối thiểu). Các size *** khác chỉ được sử dụng khi Hero ở trong SB, vì vậy chúng ta có thể kết luận rằng size lớn hơn có lợi cho Hero khi OOP, nhưng không thêm nhiều giá trị khi chơi với có vị trí
1643014356322.png

Diagram 6: *** size của Small Blind (3-Max)

Minraising là chiến lược chiếm ưu thế ở stack ít hơn (khi OOP), nhưng bắt đầu với stack 15bb, 2,5x trở nên thống trị. 3x bắt đầu được sử dụng ở 20bb và trở nên thống trị ở 25bb (Diagram 6). Vì vậy, chúng ta có thể kết luận rằng khi chơi lệch vị trí, *** size sẽ tăng lên khi các stack nhiều hơn.

Kết luận
Việc có quyền sử dụng nhiều chiến lược hơn làm tăng kỳ vọng của người chơi. Tuy nhiên, một số chiến lược rất hiếm khi được sử dụng và nó tác động đến EV tổng thể rất nhỏ nên chi phí thực hiện có thể vượt qua giá trị mà chúng thêm vào. Trên thực tế, việc thêm quá nhiều tùy chọn chiến lược EV thấp/tần suất thấp vào chiến lược tổng thể của bạn có thể làm tổn hại đến kỳ vọng của bạn. Chiến lược càng phức tạp thì càng khó thực hiện, vì vậy, trên thực tế, bạn nên cố gắng đơn giản hóa các chiến lược của mình càng nhiều càng tốt để giảm thiểu sai lầm mà không làm ảnh hưởng đến kỳ vọng chung của bạn.

Trong ví dụ đầu tiên của chúng tôi, chiến lược đơn giản nhất có thể là allin/fold và nó có thể được áp dụng cho hầu hết các vị trí có stack 10bb và ít hơn. Khi ở không có vị trí, việc allin vẫn quan trọng lên đến 17bb, nhưng BN chỉ all-in 3,88% với 15bb, 1,70% với 17bb, 0,69% với 20bb và 0,06% với 25bb. Vì vậy, chiến lược ở BN có thể được đơn giản hóa để không bao giờ allin với 15bb trở lên và EV tổng thể của BN sẽ không bị ảnh hưởng đáng kể. Tuy nhiên, chiến lược limp đang chiếm ưu thế đối với BN, vì vậy bất kỳ chiến lược nào loại bỏ BN limp trong heads-up (đối đầu) sẽ làm tổn hại đáng kể đến EV tổng thể của nó.

Hệ quả: Nếu chơi với một đối thủ mà chúng ta nghĩ rằng họ có kỹ năng vượt trội, thì việc chơi một chiến thuật phức tạp chỉ có lợi cho người chơi mạnh hơn vì họ sẽ có khả năng tận dụng tất cả các lựa chọn tốt hơn bạn. Do đó, chơi một cách chơi đơn giản hơn sẽ giúp giảm bớt lợi thế của đối thủ này bằng cách giảm thiểu những sai lầm của bạn. Ví dụ: nếu chơi heads-up trong MTT, sẽ không thành vấn đề nếu bạn đấu với người chơi giỏi nhất thế giới nếu bạn allin pre-flop với AJs vs TT. Bạn sẽ thắng ~ 50% thời gian, đó là một kết quả tuyệt vời khi đối mặt với một người chơi có lợi thế hơn hẳn bạn.
 
Last edited:

Announcements

Today's birthdays

Forum statistics

Threads
425,036
Messages
7,150,559
Members
177,589
Latest member
subytb

Most viewed of week

Most discussed of week

Most viewed of week

Most discussed of week

Back
Top Bottom