Vai al contenuto

“Libratus non ha leak, la sua GTO è quasi perfetta. Tra due anni batterà gli umani anche nel 6-max”

La vittoria schiacciante del bot Libratus sul team composto da quattro professionisti ha fatto il giro del mondo, perché l’intelligenza artificiale ha dato l’ennesima dimostrazione non solo del livello a cui è arrivata, ma soprattutto del suo potenziale. Un aspetto che gli stessi creatori di Libratus hanno voluto sottolineare: ciò che abbiamo visto finora, è solo una piccola anteprima di ciò che un bot può fare nel No-Limit Hold’em.

In particolare, è stato lo sviluppatore Noam Brown a rilasciare dichiarazioni molto interessanti riguardo la sfida, il confronto con il predecessore Claudico e i danni che i bot potrebbero causare nel cash game online.

“In realtà siamo rimasti molto stupiti di quanto fatto da Libratus”, ha dichiarato Brown a CardPlayer.com. “Prima di iniziare la sfida avevamo fatto giocare Libratus contro Claudico, e avevamo visto che lo batteva per 10-12 big blind su 100, che era più di quanto gli umani avessero ottenuto nel 2015 contro lo stesso bot. Pertanto, sapevamo di avere un edge sul team human, ma non sapevamo quanto fosse grande”.

La sfida si è conclusa con la vittoria di Libratus per 90 buy-in, quindi si può dire con certezza che l’edge fosse netto. Secondo Brown, ciò che ha fatto la differenza rispetto all’anno precedente è l’impostazione strategica: quest’anno gli sviluppatori hanno puntato forte su un approccio basato sulla GTO, la Teoria dei Giochi Ottimale. Invece di programmare il bot per individuare i leak degli avversari, lo hanno reso quasi impossibile da exploitare.

GTO vs strategia exploitativa: la spiegazione di Daniel Negreanu

“L’edge degli umani su Claudico era dovuto alla loro capacità di exploitarlo. Trovavano delle debolezze nel suo gioco e le sfruttavano per vincergli soldi. Ad esempio, rilanciare sempre sui limp del bot era una strategia molto profittevole. Al contrario, Libratus non ha giocato per exploitare gli avversari. La ragione per cui ha battuto gli umani è semplice: non aveva debolezze che potessero essere exploitate dai quattro professionisti“.

Brown è molto sicuro su questo aspetto: Libratus ha uno stile che rasenta la perfetta GTO. Infatti, più gli umani tentavano di scovare dei leak da exploitare, più perdevano soldi:

“I pro hanno pensato che l’Intelligenza Artificiale dovesse per forza avere dei leak. Per questo motivo un giorno hanno deciso di 3-bettare l’80% delle mani, ma il bot era programmato per affrontare al meglio tutte le situazioni. Il team human sapeva che Libratus era programmato per giocare al massimo contro rilanci 2x, 2.5x e 3.00x, così hanno provato a rilanciare 2.75x, ma il bot rispondeva arrotondando per eccesso, come se fosse un raise 3.00x. Poi, durante la notte, mentre gli umani dormivano, lui “lavorava” per trovare la strategia più profittevole contro i rilanci 2.75x“.

Ciò che più stupisce dell’evoluzione di questo bot è proprio la sua capacità di analizzare i dati e migliorare il suo stile di gioco a sfida in corso. Sotto questo punto di vista, Claudico era molto più arretrato.

CVai alla diretta streaming EPT Montecarlo
Jason Les impegnato a sfidare Libratus
Jason Les impegnato a sfidare Libratus

“Claudico aveva un real-time solver per i river, ma era più debole sotto molti aspetti. Prima di tutto non prendeva in considerazione i blockers: su un board con tre picche, per lui non faceva differenza avere in mano a o a , ma sappiamo tutti che c’è una bella differenza. Libratus, invece, considera i blocker e soprattutto rivaluta tutta la sua strategia quando arriva sul turn e il river. Molti non si sono accorti che le sue decisioni richiedevano più tempo sulle ultime due streets, ma era in quei momenti che si preparava ad affrontare qualsiasi size scelta dagli umani”.

Ai semplici appassionati di poker, Libratus sembra già essere un bot imbattibile. Ma Noam Brown assicura che questo è solo l’inizio:

“Quanto siamo distanti dalla GTO? Nessuno può dirlo. Ci sono dei modi per calcolarlo, ma sono estremamente costosi e non verranno utilizzati prima del prossimo anno. Posso dare la mia opinione: credo che un bot in grado di giocare secondo GTO alla perfezione possa battere Libratus per 15 bb/100. Questa è la mia stima, ma potrebbe essere anche tra i 5 e i 50 big blind su 100″.

Dovendo ricercare l’elemento chiave nella vittoria del bot, Brown parla di una mossa che è stata notata fin dall’inizio da tutti gli osservatori: le over bet enormi che il bot piazzava soprattutto al river.

Scopri tutti i bonus di benvenuto

“Le over bet hanno stupito anche noi. Libratus non era stato addestrato con dati riguardanti il gioco di una persona reale, non aveva mai visto una mano di poker giocata da un umano prima di incontrare i professionisti. Pertanto è arrivato alla sfida con una strategia unica che pensava fosse ottimale, nonostante fosse ben diversa dalla strategia ottimale che avevano in mente gli umani”.

libratus2

“Le grandi over bet sono state una parte fondamentale del suo gioco, così come le donk bet. È stata una grandissima soddisfazione vederlo giocare in un modo che gli umani non avevano mai preso in considerazione prima. Anche Claudico era aggressivo, ma non era molto bilanciato. Libratus ha un’aggressività bilanciata, e questo è stato il fattore determinante per vincere”.

Infine, Brown ha parlato dell’impatto che potrebbe avere un bot del genere sul poker online, non solo in heads-up ma anche nel 6-max.

“Posso assicurare che non abbiamo mai utilizzato Libratus online e non abbiamo in mente di farlo. Ma ovviamente questo non fermerà i malintenzionati dal prendere i dati pubblici sul bot e provare a replicarlo. Non voglio speculare sull’impatto che avrebbe sul poker online. Posso dire che Libratus funzionerebbe molto bene anche in un tavolo con più di tre giocatori. Ci sarebbe un problema, però: pur programmandolo per giocare secondo una GTO perfetta, l’eventuale collusion (volontaria o involontaria) degli altri giocatori lo potrebbe far perdere”.

“Per questo motivo abbiamo scelto di giocare la sfida in modalità heads-up, ma posso anticipare che quest’anno proveremo dei bot in tavoli 6-max. La mia opinione è che, continuando a implementare Libratus, entro un paio di anni sarà in grado di battere gli umani anche nel 6-max. Prima, però, dobbiamo capire se in questo format sia meglio giocare secondo GTO oppure con una strategia exploitativa, perché attualmente gli umani hanno ancora un edge importante quando si tratta di exploitare gli avversari”.

© riproduzione riservata

“gli articoli di attualità, di carattere economico, politico, religioso, pubblicati nelle riviste o giornali, possono essere liberamente riprodotti in altre riviste o giornali anche radiofonici, se la riproduzione non è stata espressamente riservata, purché si indichino la rivista o il giornale da cui sono tratti, la data e il numero di detta rivista o giornale e il nome dell’autore, se l’articolo è firmato” (art. 65 legge n. 633/1941)

MIGLIORA IL TUO POKER CON I NOSTRI CONSIGLI