Agent usa un método llamado Aprendizaje Profundo, que convierte las instrucciones visuales en conceptos significativos, replicando la forma en que el cerebro humano coge pedazos de información en bruto y los transforma en conocimiento que le enriquezca. Su programación implementa la noción básica de que lograr puntos es bueno, y perderlos es malo. A partir de ahí, y al principio como ver a un niño descubriendo cosas, Agent aprende en progresión geométrica de una manera tal como nunca se había logrado antes.
Para Tim Behrens, profesor de neurociencia cognitiva en el University College de Londres, lo conseguido “es realmente impresionante, no hay duda. Han dado con agentes que aprenden conceptos basados solamente en recompensas y castigos. Nunca nadie ha hecho eso antes”. El programa comenzó a jugar haciendo movimientos torpes, sin sentido. Pero tras 600 partidas de entrenamiento, ya tenía la clave de cómo ganar. Y lo que honestamente más miedo da: Hubo casos en que Agent dio con estrategias de victoria que nadie se había planteado aún, como en Breakout, clásico en que una de sus claves es abrir un agujero en los escudos y disparar con seguridad desde ellos. Agent comprobó que era mejor perforar no el centro, sino uno de los laterales de cada muro.
Uno de sus ‘padres’ por así llamarlo, Vlad Mnih, sonríe sobre esto señalando que “es divertido ver a las computadoras descubrir cosas que tu ni te habías planteado”. Pero aunque suene a ciencia ficción (la ciencia que plantea desafíos aún no comprobados al fin y al cabo), si algo nos ha enseñado cientos de novelas, películas e historias es precisamente sobre el peligro de que una máquina, con su fría lógica, piense por sí misma, lo que hace plantearse dudas que la comunidad científica no suele: ¿Debe la raza humana crear una inteligencia a su imagen y semejanza pero artificial y más perfecta para que la ayude a mejorar su condición de vida? ¿O está el hombre llevando demasiado lejos eso de jugar a ser Dios?