Estratègia apresa amb videojocs

El 'software' AlphaGo ha practicat amb els jocs clàssics d'Atari i en només un any ha aconseguit competir amb humans

jgblanco32824791 barcelona   barcelones    16 02 2016   sociedad  p160219123911

jgblanco32824791 barcelona barcelones 16 02 2016 sociedad p160219123911 / Joan S Puig Pasqual

2
Es llegeix en minuts
CARMEN JANÉ / BARCELONA

AlphaGo, el 'software' que jugarà d'aquí uns dies contra el campió mundial de go, Lee Sedol, en el principal duel home-màquina de la història, fa un any era un programa que amb prou feines aconseguia guanyar al Comecocos. Així ho anunciaven almenys a la revista 'Nature' els seus creadors, que van començar entrenant les habilitats del programa jugant als jocs més clàssics d'Atari. 

Space Invaders, el clàssic d'ordinador en què s'ha d'anar destruint tot el que apareix per la pantalla negra, va ser el seu primer entrenament. Breakout, on s'ha d'aconseguir que una bola destrossi tots els totxos de la pantalla, el segon. I el Comecocos (Pacman), per sortir de laberints. Alguns se li van resistir i el programa no va aconseguir captar quin era l'objectiu del joc, ni què havia de fer amb els botons ni com guanyar. Com molts humans. Demis Hassabis, el seu creador, afirmava aquest dimarts en un congrés que no havien programat específicament la màquina per jugar al go, cosa que sí que va fer amb Deep Blue per guanyar Kaspàrov.

Hassabis és l'ànima d'una petita empresa londinenca, Deep Mind, comprada per Google el 2011 i que ha anat captant talent de la seu de la multinacional a Mountain View (Califòrnia). Un dels últims fitxatges és Oriol Vinyals, un investigador català que fa gairebé vuit anys que treballa a Google i que és un dels autors de Tensor Flow, el software d'intel·ligència artificial que la companyia va alliberar el novembre passatsoftware d'intel·ligència artificial perquè l'usin investigadors de tot el món.

AlphaGo, que utilitza xarxes neuronals i ingents volums de dades, s'usa també per a reconeixement d'imatges i textos, i és entrenat perquè arribi a convertir-se en un assistent virtual. “Això ho veurem ben aviat en els mòbils, programes que faran de secretaris virtuals i resoldran coses que ara fan persones, com preparar un viatge”, explica Vinyals. “Ara es treballa també en l'anàlisi del llenguatge i es podria aplicar per aconseguir tractaments mèdics o optimitzar les xarxes de carreteres. Al CERN l'utilitzen per a problemes de física”, afegeix.

ROBOTS FINS ARA DETECTABLES

Notícies relacionades

Fins ara, la intel·ligència artificial en els videojocs s'havia aplicat per determinar com es movia el jugador en el joc i que aquest reaccionés presentant-li un estímul o un altre. Ara, han canviat les regles i és la màquina la que intenta guanyar el joc i competir amb humans. Molts videojocs tenen 'bots' (robots) que competeixen virtualment contra humans, però qualsevol jugador entrenat els detecta aviat.

AlphaGo és diferent. La seva corba d'aprenentatge ha sigut tan espectacular per la quantitat de dades que ha pogut processar en aquest temps després de tanta partida de videojoc, però també perquè els seus creadors van enfrontar dues màquines amb el mateix 'software' una contra una altra, perquè es retroalimentessin. “La novetat és que hagin aconseguit tan ràpid que una màquina venci un humà en un joc que requereix molta part d'estratègia a curt i a llarg termini. L'estratègia era una característica humana fins ara, no ho feien les màquines, i això ho canvia tot”, explica Hugo Zaragoza, exinvestigador d'aprenentatge mecànic a Yahoo i fundador de l'empresa d'anàlisi Websays.

Temes:

Google