La inteligencia artificial que supo ridiculizar a dos jugadores pro de StarCraft II

Por en Inteligencia Artificial

El objetivo del experimento era poner a prueba la toma de decisiones del sistema de IA, de tal manera de que este vaya mejorando con el tiempo y pueda adaptarse a contextos complejos como lo es este videojuego.

Lo hizo en el go, lo hizo en el ajedrez y ahora lo acaba de hacer en un videojuego de estrategia en tiempo real, ‘StarCraft II’. El sistema de inteligencia artificial (desde ahora IA) AlphaStar desarrollado por la empresa filial de Google, DeepMind,  jugó en un torneo contra dos jugadores profesionales de este videojuego y ganó casi todas las partidas, excepto una.

Hay que hacer el alcance que AlphaStar jugó en condiciones algo especiales en comparación a los gamers. Por ejemplo, en muchas partidas el mapa para el sistema de IA estaba completamente revelado, no así el de los jugadores humanos. Pese a ello, AlphaStar aplastó por 5 partidas a 0 al jugador alemán Dario “TLO” Wünsch. Posteriormente la IA perdió solo una partida de seis contra el polaco Grzegorz "MaNa" Komincz, ambos jugadores pertenecientes al equipo Team Liquid. 

Las cosas pintan mal para los profesionales de 'StarCraft II', un juego que planteaba un reto importante para los ingenieros de DeepMind y que una vez más se ha logrado superar con la llamada red neuronal de convolución.

Los juegos como StarCraft II son más difíciles para las computadoras de jugar que los juegos de mesa como el go o el ajedrez. En los videojuegos, los programas de IA no pueden ver el movimiento de cada pieza para calcular su próximo movimiento, de esa forma deben reaccionar en tiempo real. 

Esos factores no parecieron mucho impedimento para que el sistema de IA de DeepMind (AlphaStar) derrotara por 10 partidas a 1 a los profesionales. Encuentros que se llevaron a cabo en el cuartel general de DeepMind en Londres.

En estas partidas AlphaStar demostró tener una gestión excepcional de sus unidades, retirándolas cuando estaban dañadas y sustituyéndolas por otras más fuertes al frente de cada batalla. Minimizaba daños propios y maximizaba los daños de los rivales, algo que iba más allá de la relevancia de las acciones por minuto (APM) que se pueden llegar a lograr en este juego, y que de hecho sorprendentemente eran superiores en el caso de los humanos. La toma de decisiones de AlphaStar, simplemente, era mejor.

Los jugadores humanos se enfrentaron a un único sistema de inteligencia artificial, pero en realidad AlphaStar hizo uso de cinco agentes diferentes que habían sido entrenados con distintos objetivos, lo que revela que incluso esa variación del motor específico de IA era superior con esas variaciones. Para entrenarlos los sistemas jugaron anteriormente la llamada "AlphaStar League", una competición en la que los agentes jugaron una y otra vez durante una semana y "absorbieron" el equivalente a 200 años de partidas de StarCraft II entre humanos.

Para MaNa el resultado fue sorprendente: "me impresionó ver cómo AlphaStar hacía movimientos avanzados y estrategias distintas en todas las partidas, usando una forma de jugar muy humana que no me esperaba. Me he dado cuenta de cómo mi forma de jugar depende de forzar al contrincante a cometer errores y ser capaz de sacar partido de las reacciones humanas, así que esto le ha dado una nueva perspectiva al juego para mí", explicó el jugador.

Finalmente, el objetivo final de inventos como estos no es ganarle a los humanos en un videojuego, sino afilar y mejorar los métodos de entrenamiento de los softwares de IA, particularmente con la idea de crear sistemas que puedan operar en contextos virtuales cada vez más complejos, como lo es StarCraft.

Comentarios