Benvinguts a la màquina del temps (de Barcelona)

Una demògrafa i una enginyera trenquen tòpics analitzant amb intel·ligència artificial milers de documents recopilats en els últims cinc segles

zentauroepp2313508 cuaderno del domingo foto a ria del eixample de barcelona   191024201058

zentauroepp2313508 cuaderno del domingo foto a ria del eixample de barcelona 191024201058

6
Es llegeix en minuts
Michele Catanzaro
Michele Catanzaro

Periodista

ver +

La màquina del temps existeix. Però no té l’aspecte del DeLorean espurnejant de ‘Retorn al futur’. Les seves peces són escàners i ordinadors. Aquestes són les eines de treball deJoana Maria Pujades i Alícia Fornés, dues investigadores que han aconseguit penetrar en el passat de Barcelona com ningú ho havia fet abans.

Les dues científiques han analitzat amb intel·ligència artificialcentenars de milers de certificats de matrimoni, empadronaments i altres documents redactats al llarg dels últims cinc segles a Barcelonai voltants. Els resultats han trencat tòpics. Per exemple, la regla catalana de l’hereuno va ser tan fèrria com sembla. Ola revolució industrial no va augmentar gaire la desigualtat: més aviat en va canviar la naturalesa.

Un xarxa social amb el passat

Part del seu treball s’ha bolcat en una plataforma que s’assembla una mica a Facebook. El sistema permet accedir a individus que, de forma sorprenent, van viure fa dècades, quan no podien ni imaginar que acabarien en una xarxa social. ‘Big data’ conjugat en pretèrit.

Les investigadores tenen experiència en tota classe de documents. Per exemple, Fornés ha treballat fins i tot amb rotllos depianoles mecàniques. Ha convertit més de 3.500 rotllos en fitxers que es poden escoltar a la web de la Biblioteca Nacional.

Joana Maria Pujades Mora, a l’Arxiu Comarcal del Baix Llobregat. / manu mitru

Ara, les especialistes pretenen utilitzar aquesta experiència per processar la informació més inconnexa: des de fotografies i quadros fins a mapes i pentagrames. Tot això hauria de convergir a laCatalonia Time Machine: una plataforma digital que permeti una immersió al més completa i realista possible en el passat de Catalunya.

Part del treball figura en una espècie de Facebook que permet accedir a barcelonins d’altres èpoques

Es tracta de la versió local d’una tirallonga de «màquines del temps» semblants, que s’estan desenvolupant en diversos punts d’Europa, des de Venècia fins a Amsterdam. «Volem automatitzar la lectura de documents de població, com esposalles i registres. Si un document diu: ‘Pere Puig es casa amb Maria Vila a la parròquia del Pi’, el nostre sistema ha d’entendre quin és el nom del marit, de la dona, on es van casar, etcètera», explica Pujades, que és cap de l’àrea de Demografia Històrica al Centre d’Estudis Demogràfics (CED), a Bellaterra.

El2010, sota la guia d’Anna Cabré, Pujades es va posar a treballar amb 600.000 actes de matrimoni registrades a la diòcesi de Barcelona entre 1451 i 1905.Es tracta d’un registre únic, perquè la diòcesi tenia el privilegi de cobrar un impost proporcional a la renda dels nòvios, cosa que«permet estudiar la desigualtat durant cinc segles»,explica Pujades. El processat dels documents va revelar quela desigualtat a la ciutat era alta també abans de la industrialització. El que va passar amb la revolució industrial és que va canviar de causa. Abans, els qui eixamplaven la desigualtat eren els nobles, que acumulaven riquesa. Després van ser els obrers, cada vegada més pobres.

La regla de l’hereu

«Amb el mètode tradicional, aquest projecte hauria durat fins a la meva jubilació», afirma Pujades. «Hem posat tecnologia en una cosa molt tradicional, que és recollir les fonts. L’hem modernitzat i accelerat», explica. Als certificats matrimonials també apareixen els noms dels pares. Pujades i els seus col·laboradors ho van aprofitar per dibuixar arbres genealògics i estudiar com es difonia la riquesa a través les generacions.

Alícia Fornés, investigadora del Centre de Visió per Computador (CVC), a Bellatera. / elisenda pons

Segons la norma de l’hereu, el primogènit es queda amb tot el patrimoni. Així que les investigadores esperaven que els altres germans i germanes quedessin empobrits. No obstant, els impostos de matrimoni revelen que això no passa. «Encara que no heretin, segueixen en la mateixa classe social. Probablement, és el resultat d’estratègies cooperatives. Per exemple, permetre que el ramat del germà pugui pastar a terres de l’hereu», explica Pujades. 

Construir el ‘big data’ del passat és un camí de reptes. «El paper del manuscrit pot estar degradat, la grafia varia molt, el vocabulari és antic...», explica Fornés, investigadora del Centre de Visió per Computador (CVC), també a Bellaterra. 

Una troballa és que la desigualtat no va augmentar amb la revolució industrial, sinó que en va canviar la naturalesa

Fornés aborda aquests reptes per mitjà del ‘deep learning’ (aprenentatge profund), el mateix principi que Google fa servir en els seus serveis. «Volem que els ordinadors aprenguin a llegir», explica. En la pràctica, s’entrena l’ordinador per llegir unes paraules conegudes; després, per llegir totes les paraules escrites per la mateixa mà; més tard, les de mans semblants, i finalment se l’ensenya a interpretar documents de tipus diferents.

Per validar i reforçar l’aprenentatge de la màquina, Pujades i Fornés han ideat un mètode insòlit: un videojoc per al mòbil. Qualsevol persona pot descarregar-se el seu«caçador de paraules».La dinàmica del joc obliga el jugador a identificar si, entre cinc termes manuscrits que l’ordinador ha classificat com a iguals, n’hi ha algun en realitat diferent. 

Simulacre de civilització

«La diferència amb els mètodes tradicionals és en la quantitat d’informació que es gestiona, però això acaba provocant una diferència qualitativa», afirma Joan Anton Barceló, professor del Departament de Prehistòria de la Universitat Autònoma de Barcelona, i un dels capdavanters de les humanitats digitals a Espanya. «En el cas de Barcelona, ja es comença a veure que algunes de les grans reconstruccions històriques no arrelen», afirma l’investigador, que no està implicat en el treball de Pujades i Fornés.

«Els algoritmes no reconeixen   connotacions socials o errors», afirma el professor Tim Brennan

Barceló voldria anar encara més enllà. «La gran revolució són les societats artificials: crear un simulacre d’una civilització en un ordinador. El que abans es descrivia amb un text ara és un algoritme que es pot comprovar amb dades empíriques», diu. Barceló odia la investigació carregada de marcs ideològics i confia que les humanitats digitals redueixin l’arbitrarietat. 

Algoritmes i crítica

Aquesta posició genera rebuig en part de la comunitat humanista. «Hi ha molta mistificació sobre el poder dels algoritmes. En realitat, són tan bons a reconèixer patrons com ho són els que els programen. Extreuen només el que vols que extreguin», afirma Tim Brennan, professor d’Humanitats a la Universitat de Minnesota i crític amb les humanitats digitals.

«Els ordinadors no poden reconèixer connotacions socials, ironia, errors», afegeix. Brennan creu que el creixement de les humanitats digitals està incentivat per la voluntat dels departaments d’aconseguir fons d’empreses tecnològiques i de prescindir de treballadors.  

«Volem que els ordinadors aprenguin a llegir», explica la investigadora Alicia Fornés

«El més important és que aquest enfocament desplaça el pensament crític. Tendeix a ignorar que no hi ha cap posició fora d’un marc ideològic», afirma. Tot i així, Brennan concedeix en el fet que els ordinadors poden ser útils per processar grans quantitats de material si es combinen amb el control humà.

Notícies relacionades

En això, coincideix amb Fornés. «La intel·ligència artificial no reemplaçarà els humanistes. Però els permetrà accelerar el seu treball i els suggerirà patrons que hauran d’interpretar. Creiem que és fonamental mantenir els humans en el procés», afirma.

La investigadora recorda el cas d’un document amb una gran taca sobre unes paraules. L’ordinador no podia llegir-les. Llavors hi va anar un paleògraf que, fixant-se en l’època, l’estil i la parròquia a la qual pertanyia el document, va sentenciar que no hi havia dubte. Les paraules a sota de la taca eren «teixidor de llana».