ENTREVISTA

Corinna Cortes (Google): "La veu i les imatges substituiran el text en la comunicació"

Una de les responsables d'Investigació a Google prediu les tendències del futur

getthumbsbyfilename

getthumbsbyfilename

4
Es llegeix en minuts
Josep M. Berengueras
Josep M. Berengueras

Periodista

ver +

Corinna Cortes és la màxima responsable a Nova York de Google Research, la divisió d’investigació del gegant del buscador (la matriu es diu ara Alphabet). Més d’un miler de persones treballen a l’empresa indagant sobre algoritmes, llenguatge natural, processament de dades, seguretat, intel·ligència artificial i machine learning (sistemes que aprenen sols), és a dir, planejant com serà el futur. Moltes de les seves investigacions, després, s’implementen en els productes de Google.

–¿Què és exactament Google Research?

–És la divisió de Google que treballa en projectes d’investigació. Només a Nova York, som més de 100 persones, i hi ha equips a Londres, Califòrnia, Suïssa... Principalment, són equips formats per doctors (PhD), experts en àrees com el 'machine learning', els algoritmes, la visió artificial, el reconeixement de veu, el processament del llenguatge natural... És com si fos un gran departament de Ciències de la Informàtica d’una universitat. Però també treballem amb un equip d’enginyers per implementar les nostres investigacions.

–¿Vostès són els que tenen idees i les investiguen o l’empresa els exposa problemes?

–Treballem molt de prop amb els enginyers. Tot el que fem està relacionat amb les necessitats del producte. Parlem amb els enginyers, veiem quins són els problemes que tenen, proposem solucions, les implementem, després veiem si funcionen, tornem enrere per veure si hi pot haver alguna solució més simple... I després publiquem els'papers'. Tenim una gran quantitat de llibreries de codi obert perquè les universitats se’n puguin beneficiar. Mirem de tornar el màxim possible a la comunitat científica i acadèmica.

–Posi’m alguns exemples de projectes en què han treballat.

–Un dels més actuals és l’algoritme de reconeixement de veu, el que s’utilitza en molts dels productes de Google. Definitivament, cada vegada hi ha i hi haurà més relació amb la veu, el diàleg. Tenim Google Home, Siri [d’Apple], Alexa [d’Amazon]... Estem encara en una etapa molt inicial i veurem molts avanços en aquest camp. Però la veu no serà l’única forma de comunicar-nos: hi ha també les imatges. Els joves ja no escriuen 'e-mails', no s’envien missatges. Es comuniquen per fotos, per veu, per vídeos... La veu i la imatge substituiran el text. El text, com a element de comunicació amb les màquines, anirà morint a poc a poc.

–Però el text encara s’utilitza...

–Sí, és clar, de fet, el nostre principal producte és un buscador de text. Però crec que en 10 anys serà molt diferent, probablement només parlarem amb l’ordinador, o li enviarem una imatge i tindrem una resposta. Diuen que una imatge val més que mil paraules...

–¿Quin és el principal repte que tenen ara?

–La paraula diàleg és clau: com interactuarem amb l’ordinador. Actualment, tot es basa en unes paraules clau, i a partir d’aquestes paraules la màquina dedueix què és el que vol l’usuari. No obstant, en realitat, l’usuari ha generat abans molta més informació, que és molt útil per saber què vol. Crec que aquest és el principal repte: aprofitar totes aquestes dades.

¿I què passa amb la privacitat?

Corinna Talls

RESPONSABLE DE GOOGLE RESEARCH A NOVA YORK

"Volem ajudar a l'usuari el millor que puguem basant-nos en les interaccions que ha fet en els últims 30 minuts"

–És auna cosa que ens prenem extremadament seriosament. Ens assegurem que la informació de l’usuari estigui emmagatzemada d’una manera completament segura, tot està encriptat. Però hi ha d’haver un balanç entre personalització i privacitat. Volem ajudar l’usuari tan bé com puguem basant-nos en les interaccions que ha fet en els últims 30 minuts, veure què és rellevant per a ell. Això no significa que violem la seva privacitat, sinó que és una cosa entre l’usuari, Google i la seva consulta, només això, no hi ha ningú més.

–Però moltes vegades l’usuari no sap quines dades ha generat, qui les guarda, on són...

–Tota la comunitat s’està esforçant, des de la indústria fins al món acadèmic, a educar la gent sobre les dades que genera. Treballem junts a l’hora de definir com han de ser protegides perquè l’usuari se senti segur. L’usuari de Google ja té un gran control sobre les seves dades: sap quines tenim, pot esborrar el seu historial... No hi ha secrets. De veritat.

–¿Què és exactament el machine learning i com ens canviarà?

–És l’ús de les dades per fer prediccions. Si vols ensenyar a un ordinador que un objecte és una cadira, agafes 1.000 milions d’imatges de cadires –i també de no cadires– i li 'ensenyes' que això és una cadira amb paràmetres. A Google, per exemple, fem servir el 'machine learning' per millorar els cotxes sense conductor. Però també s’utilitza en el descobriment de noves medecines i en la personalització de tractaments, a l’hora de predir canvis en la meteorologia i d’evitar accidents a les fàbriques, en la teva polsera quantificadora... Tot són dades processables per ajudar-te a tenir una vida millor.

–Llavors, ¿és millor que les decisions les prengui una màquina?

–No té per què ser millor, però l’avantatge és que l’ordinador pot tenir en compte més factors, de manera que és la forma més ràpida d’arribar a una solució millor.

–Reconeixement de veu i machine learning s’uneixen en assistents com  Google Home. ¿És el futur?

–Veurem cada vegada més assistents a les llars. Google Home incorporarà moltes més funcions, i podrà ajudar-te a organitzar millor el teu dia a dia. El buscador de Google ha arribat a totes les llars, potser els assistents també ho faran.

Notícies relacionades

–Tanta intel·ligència artificial i 'machine' learning... ¿Hem de començar a preocupar-nos que un dia les màquines parlin entre elles i muntin una revolució?

–No crec que hàgim de preocupar-nos per això, perquè cada màquina té una manera diferent de processar i parlar. No crec que passi res per l’estil en un futur pròxim.