¿Què hi ha en una veu?

¿Què revela la veu d'una persona? ¿És com l'ADN? S'utilitza per identificar i perseguir. Però una vintena de casos d'ús controvertit de la veu en els tribunals convida a la cautela

frecuencia de voz

frecuencia de voz

11
Es llegeix en minuts
MICHELE CATANZARO, ASTRID VICIANO, PHILIPP HUMMEL I ELISABETTA TOLA

El 2001, el texà David Shawn Pope va sortir al carrer després de 16 anys a la presó. Una prova d’ADN l’acabava d’exculpar d’una violació comesa el 1985. La seva condemna es basava, entre altres evidències, en la seva veu. La víctima l’havia reconegut. A més, un expert havia detectat la seva “empremta vocal” en uns inquietants missatges gravats al contestador de la dona. Però una trucada anònima va empènyer els investigadors a comparar el seu ADN amb les restes orgàniques del violador, i això va desmentir les proves fonètiques.

La història de Pope és una entre una vintena de controvertits casos d’ús de la veu als tribunals. Aquestes històries plantegen preguntes bàsiques sobre la naturalesa de la veu. ¿Què revela sobre la identitat d’una persona? ¿És com l’ADN o l’empremta dactilar? ¿Com la processa el cervell? La intuïció suggereix que la veu és una marca única i inequívoca d’un individu. S’utilitza per identificar degolladors emmascarats de l’Estat Islàmic; per endevinar la nacio­nalitat de refugiats indocumentats; per reco­nèixer defraudadors quan truquen a un banc, o per rastrejar missatges de terroristes en milions de trucades telefòniques. Però ­l’experiència del seu ús forense convida a la cautela

A Espanya, la veu juga un paper en centenars de judicis cada any, segons estima­cions dels experts (no hi ha un registre de peritatges). Els pèrits analitzen intercep­cions telefòniques, missatges de contestador, peti­cions de rescat, trucades d’emergència, gravacions encobertes o d’interrogatoris policials. Les seves tasques són transcriure, comparar veus, deduir l’origen dels parlants i comprovar l’autenticitat de les gravacions.

EL 'PRIMING'

Orelles i cervells disten de ser eines perfectes per a aquests fins. El 1994, el neozelandès David Bain va trucar a la policia quan va trobar a casa tots els seus familiars morts per trets. La gravació de la trucada va ser una peça important del seu llarg judici. Primer, va ser condemnat a 16 anys per ser l’assassí. Després, va ser exculpat definitivament el 2009: l’assassí suïcida podria haver sigut el seu pare. Als policies els va semblar sentir en la gravació, entre els agitats respirs de Bain, una admissió de culpabilitat: “I shot the prick” (“Jo he disparat a aquell capullo”). Si s’escolta la cinta, aquesta transcripció sembla raonable, apunta la lingüista australiana Helen Fraser. Però si es planteja una transcripció alternativa (“I cannot breathe”, “No puc respirar”), també sembla raonable. Fraser ha exposat grups d’oients a transcripcions alternatives d’una mateixa gravació real: sorprenentment, els grups tendeixen a “sentir” el text que se’ls presenta.

“Una vegada has entès una cosa, és difícil desentendre-la”, diu fent broma Fraser. Aquest fenomen, anomenat 'priming', és la mateixa il·lusió que explica els suposats missatges satànics trobats en discos de rock reproduïts al revés. O les còmiques frases que se senten en certes cançons en anglès, com “un chinito pecando” en lloc d’“and she lit up a candle”, a Hotel California, dels Eagles.

Els jutges no haurien d’acceptar peritatges basats en la simple escolta, segons sentències del 2002 (Gran Bretanya) i el 2003 (Estats Units). Però molts experts segueixen presumint d’“orella d’or”: que es poden familiaritzar amb la veu d’un sospitós fins a reconèixer-la en una gravació. El 2000, un experiment portat a terme a la Gran Bretanya va exposar un grup de voluntaris a fragments de trucades anònimes gravades per amics: alguns no aconseguien reconèixer els parlants i un no va reconèixer ni tan sols la seva pròpia veu.

L’anàlisi de la veu ha sigut exitosa en molts judicis. La Policia Nacional va estrènyer el setge al voltant dels segrestadors d’Anabel Segura (1999) al detectar el seu accent de Toledo en trucades interceptades. Però els fracassos podrien ser tan sols la punta d’un iceberg.

Durant els últims anys han aparegut estudis titulats Identificació de persones per la veu: cauteles necessàries (2003), Xerrameca en la ciència forense de la parla (2007) i Distingir entre ciència forense i pseudociència forense [de la veu] (2014), entre altres.

Alguns casos semblen justificar l’alarma. El 2011, el pèrit italià Roberto Porto va identificar la veu d’un narco com la d’Óscar Sánchez. Aquest rentacotxes de Montgat havia sigut extradit a Itàlia per narcotràfic i condemnat a 14 anys en base al peritatge. Sis peritatges més ho van desmentir i Sánchez va ser absolt després de passar dos anys a la presó: el seu espanyol era peninsular; el del narco, llatinoamericà. Porto desconeixia el castellà. La seva actuació va ser polèmica també en judicis anteriors: per exemple, va presentar dos peritatges idèntics en dos judicis sense relació entre ells. 

CASOS FALLITS

Alguns casos semblen justificar l’alarma. El 2011, el pèrit italià Roberto Porto va identificar la veu d’un narco com la d’Óscar Sánchez. Aquest rentacotxes de Montgat havia sigut extradit a Itàlia per narcotràfic i condemnat a 14 anys en base al peritatge. Sis peritatges més ho van desmentir i Sánchez va ser absolt després de passar dos anys a la presó: el seu espanyol era peninsular; el del narco, llatinoamericà. Porto desconeixia el castellà. La seva actuació va ser polèmica també en judicis anteriors: per exemple, va presentar dos peritatges idèntics en dos judicis sense relació entre ells. 

Casos tan sorprenents no escassegen. Un tècnic de so holandès va comparar la veu d’unes trucades anònimes amb un vídeo d’una actuació a Youtube.

Un pèrit italià va afirmar que la veu d’un sospitós tenia una freqüència fonamental tres vegades superior a la nota més alta cantada per Maria Callas. Un discjòquei italià va actuar com a expert en un cas de segrest. Això són més que anècdotes. La meitat de les forces de seguretat del món segueixen utilitzant mètodes espectrogràfics, entre els quals el desacreditat sistema de l’empremta vocal: així ho apunta un estudi coordinat pel pèrit Geoffrey Stewart Morrison per compte de la Interpol, presentat en una conferència al juliol. A Europa, ho fan vuit de les 22 forces enquestades.

UN MÈTODE DESACREDITAT

Inventada el 1962, l’empremta vocal va ser el primer sistema per analitzar la veu amb tecnologia de la informació. El mètode compara imatges que representen les freqüències de la parla d’un sospitós (espectres) amb altres que s’han tret de les gravacions. El 1979, l’Acadèmia Nacional de Ciències dels EUA hi va treure validesa científica, però segueix en ús. La consultoria francesa Lipsadon, l’empresa privada més gran del sector a França, autora de més de 200 peritatges segons la seva informació, segueix analitzant espectrogrames.

El mateix nom empremta vocal és enganyós. “La veu no és tan estable i distintiva com l’empremta digital i l’ADN. Quan discuteixes amb la teva parella, la teva veu és del tot diferent de quan fas bromes al teu bebè”, explica Juana Gil, directora del laboratori de fonètica del CSIC a Madrid.

“Un sospitós, per exemple un home de 40 anys, fumador, educat en una determinada ciutat, pot tenir la mateixa freqüència fonamental que una veu gravada. Encara més: ¡podria ser que tots els homes amb aquestes característiques tinguessin aquesta mateixa freqüència! No hi ha prou estadística de població per establir amb quina probabilitat podria passar”, diu Gil. “No es poden identificar parlants: només comparar veus”, afegeix. De tota manera, la meitat de les forces de seguretat enquestades per Morrison expressen les seves conclusions en termes d’identificació i exclusió (nou de 22 a Europa).

PERITATGES PRIVATITZATS

En diversos països europeus, els peritatges de veu estan privatitzats i els honoraris són ajustats. Les xifres oficials varien entre 50 i 250 euros per hora de feina a Europa. Però les retallades a la justícia obliguen a pagar menys. “Fer un peritatge correctament costa molt temps i molts diners, però els tribunals s’han acostumat a temps curts i preus baixos”, explica Morrison. “A la Gran Bretanya hi havia un laboratori forense públic que va ser dissolt per David Cameron el 2012. Ara la feina s’encarrega a operadors privats, i això ha provocat una reducció de la qualitat”, observa un expert britànic que prefereix mantenir l’anonimat. A Espanya, la majoria d’aquest treball el fan les forces de seguretat –Guàrdia Civil i Policia Nacional– i centres d’investigació, com el CSIC i la Universitat Pompeu Fabra (UPF), encara que també actuen empreses, com Cita, del pèrit madrileny Miguel Ángel Gallardo

“El sector està altament desregulat. No hi ha cap llei que estableixi els requisits per ser pèrit lingüista”, explica Jordi Cicres, expert de la Universitat de Girona i col·la­borador del Forensic Lab de la UPF. Res obliga el jutge a cenyir-se a peritatges amb base científica demostrada. En canvi, “els jutges són víctimes de l’efecte CSI”, observa Gil. És a dir, de la creença que n’hi ha prou que una tècnica tingui aspecte científic perquè produeixi proves de naturalesa superior, lliures d’incertesa, com passa en sèries com CSI.

Cada país ha desenvolupat la seva estratègia per alleujar aquesta situació. Després de la privatització, la Gran Bretanya va establir una Oficina del Regulador de la Ciència Forense, que hauria d’exercir un control de qualitat. Els Països Baixos disposen d’una llista d’experts acreditats (registre NRGD). Els Estats Units apliquen des del 1993 els estàndards de Daubert, que requereixen que els jutges s’assegurin la base científica dels mètodes. De tota manera, cap d’aquestes solucions és llei de compliment obligat per als jutges.

La Unió Europea va establir el 2009 que les dades d’ADN i empremtes dactilars intercanviades entre països han de ser produïdes per laboratoris amb acreditació ISO-17025. El 2011, la presidència polonesa va impulsar la creació d’una Àrea Europea de Ciència Forense per al 2020 (EFSA2020), que estendria aquestes garanties a altres disciplines, entre elles la parla. Tot i així, l’EFSA2020 està “en procés d’avaluació i és aviat per anunciar cap acció o esdeveniment”, afirma Milica Petrovic, portaveu de la Comissió.

DESACORDS EN LA COMUNITAT CIENTÍFICA

Però el problema de la veu als tribunals no és solament de regulació. Hi ha desacords profunds dins de la mateixa comunitat científica. “Els fonetistes, que són sobretot lingüistes, recolzen usar el software de forma supervisada, mentre que els enginyers d’àudio donen més importància als sistemes automatitzats”, explica Gil. Els primers es basen sobretot en els mètodes acusticofonètics, que es van afirmar als anys 80 després del fracàs de l’empremta vocal: els experts escolten les mostres, en seleccionen certs fragments (per exemple, les vocals) i mesuren amb ordinador paràmetres acústics i trets lingüístics. Els segons prefereixen el reconeixement automàtic del parlant, que va sorgir als 90.

En aquest sistema, un ordinador extreu automàticament els trets de la parla i calcula coeficients relacionats amb la forma del tracte vocal de cada individu. A Espanya, el laboratori de la Policia Nacional és més pròxim al primer enfocament, i el de la Guàrdia Civil, al segon. De fet, Agnitio, l’empresa més gran en el món de reconeixement automàtic del parlant, va sorgir del laboratori de la Universitat Autònoma de Madrid (UAM), que col·labora amb la Guàrdia Civil. Agnitio es va consolidar cooperant en les investigacions de l’11-M. “El que fem és cent per cent diferent del  que fan els lingüistes. El nostre sistema té una precisió mesurable i és reproduïble”, assegura Antonio Moreno, vicepresident d’Agnitio.

PRINCIPALS CRÍTIQUES

La subjectivitat i la varietat de respostes davant el mateix cas són les principals crítiques als mètodes acusticofonètics. Però des d’aquest front es replica els enginyers. “Hem comparat veus que la màquina considerava compatibles i hi hem trobat un munt de diferències, per exemple, en l’accent”, observa Gil. Fins i tot experts que usen sistemes automàtics criden a la cautela. “La pressió econòmica requereix que els productors de sistemes automàtics venguin a molts clients, incloent-hi els que no saben com usar l’eina que han comprat. Els usuaris han d’entendre el que fan: si hi posen escombraries, en surten escombraries”, observa Morrison. 

Agnitio ofereix un curs de formació de tres anys per usar el seu programa estrella, Batvox. Però el seu director reconeix que només entre un 20% i un 25% dels usuaris el completa. L’empresa ha venut un centenar de llicències, a preus d’entre 9.000 euros pel lloguer d’un any i 100.000 per la compra d’un programa multiusuari. “Sempre diem que és important que al darrere del sistema hi hagi un pèrit expert. A més, els grups avançats tenen equips multidisciplinaris”, afirma Moreno.

El problema és que els científics encara no saben amb precisió com varien en la població els múltiples trets de la veu. Imaginem-nos que un investigador troba una empremta de la talla 52 a l’escena d’un crim, i el sospitós gasta aquesta talla. En un altre cas, l’investigador troba una empremta de la talla 42 i el sospitós gasta aquesta talla. En el primer cas, la prova en contra del sospitós serà més forta que en el segon, perquè la talla 52 és molt més rara que la 42. La lliçó de la història és que no n’hi ha prou de considerar com són de semblants dues veus, sinó que també s’ha de tenir en compte si sovinteja molt aquesta semblança dins de la població. 

FALTA D'UNA MOSTRA AMPLA

Tot i així, en gairebé tots els trets de la veu s’ignora la difusió (si són rars com una empremta del 52 o freqüents com una del 42). El cost i la dificultat d’estudiar-los ho ha impedit, fins ara. A falta d’estadístiques conclusives, el remei recomanat per la Xarxa Europea d’Instituts de Ciència Forense (ENFSI) és comparar la veu del criminal no només amb la del sospitós, sinó també amb una mostra àmplia de veus que encaixin amb les condicions del cas (sexe, edat, llengua, condicions de gravació, etcètera).

Però “molts laboratoris diuen que no tenen bases de dades: això no és cap problema”, observa Daniel Ramos, investigador de la UAM que col·labora amb la Guàrdia Civil. “La Guàrdia Civil rebutja portar a terme el peritatge quan no disposa de les bases de dades adequades, és a dir, més o menys en la meitat dels casos”, apunta.

Notícies relacionades

La primera prova fonètica de la literatura occidental posa de manifest l’elusió de la veu. Al Gènesi, Jacob es presenta cobert de pells davant del seu pare cec, Isaac. Pretén simular l’abundant pèl corporal del seu germà gran, Esaú, i aconseguir la benedicció del primogènit. Isaac observa: “La veu és de Jacob, però les mans són d’Esaú”, i cau a la trampa. Avui, mil·lennis més tard, prendre decisions sobre la base de la veu segueix sent un repte. 

*Aquest article ha sigut desenvolupat amb el suport de Journalismfund.eu. Més informació a http://formicablu.github.io/hearingvoices