LLENGUA I NOVES TECNOLOGIES

Softcatalà i Mozilla impulsen un assistent de veu lliure en català

El projecte anima a gravar textos llegits per crear un model informàtic que pugui utilitzar qualsevol programador

undefined36746738 onbarcelona echo dot de amazon180309171706

undefined36746738 onbarcelona echo dot de amazon180309171706

2
Es llegeix en minuts
Carmen Jané
Carmen Jané

Redactora

Especialista en Periodista especialitzada en tecnologia, continguts digitals i elearning. Escric des de Última Hora.

ver +

La intel·ligència artificial no és en absolut poliglota. Els robots, com molts turistes, a penes surten de l’anglès i la majoria d’assistents que impliquen reconeixement i tractament del llenguatge es programen des d’aquesta llengua, la qual cosa pot acabar excloent la majoria de la població mundial.

Dels 7.623 milions d’habitants de la Terra, a penes 378 milions tenen l’anglès com a primera llengua, i 745 milions més l’entenen o el parlen amb fluïdesa com a segon o tercer idioma. La resta de persones, parla almenys un dels més de 7.000 idiomes coneguts.

Un projecte de la Fundació Mozilla, creada sense ànim de lucre i que es nodreix sobretot de voluntaris, pretén corregir aquesta deficiència i evitar, de passada, que tot el saber quedi en mans d’unes quantes empreses: Google, Amazon, Apple o Nuance. Google acaba de llançar el seu assistent de veu en castellà fa un mes i Apple té reconeixement de veu en català però el seu assistent de veu, Siri, encara no l’ha après.

El projecte Common Voice, que es va obrir a totes les llengües fa unes setmanes, anima tots els internautes a contribuir per crear un corpus lingüístic per a cada idioma del món. Qualsevol internauta pot proposar una llengua, i les comunitats de desenvolupadors tindran accés a aquest saber sense restriccions gràcies a una llicència Creative Commons 0, la més pròxima al domini públic.

Llegir en veu alta

La proposta per als usuaris és molt senzilla: es tracta de llegir en veu alta un text que apareix a la pantalla del navegador i permetre que el micròfon de l’ordinador o el mòbil el gravi. Mozilla recollirà dades que comparteixi l’usuari, com ara accent, edat i gènere, que afirmen que només associaran a les gravacions per identificar varietats dialectals. També es pot contribuir enviant textos per ser llegits.

La intenció és entrenar un sistema de reconeixement de veu i llengua a base que milions de persones llegeixin els mateixos textos que apareixen en pantalla. Només així, el sistema és capaç d’associar veu i text. Amb això, la idea és, utilitzant xarxes neuronals, generar un model informàtic que es pugui utilitzar en aplicacions o en navegadors. "La idea és que el pugui utilitzar realment qualsevol", afirma Jordi Mas, coordinador de Softcatalà. l’entitat que s’encarrega de gestionar la versió catalana i que fa 20 anys que tradueix de forma voluntària programes lliures al català.   

El Parlament, poques veus

Notícies relacionades

"Perquè funcioni necessitem tenir gravades almenys un miler d’hores d’àudios, amb la varietat de variants dialectals més gran del català, gravats per homes i dones de totes les edats", assenyala. L’objectiu de Softcatalà és comptar amb un primer model que funcioni a principis d’any. "Ja havíem intentat crear un model abans amb el corpus de TV-3 i amb el del Parlament. Amb la televisió hi havia el problema dels drets d’autor, que ens deixaven només amb els seus programes de producció pròpia, i amb el Parlament, hi havia poques veus," explica Mas.

El compromís de la Fundació Mozilla, que està preparant també el seu propi navegador basat en veu, Firefox Scout, amb el qual vol competir amb l’Alexa de Amazon, el Google Voice de Google o el Siri de Apple, és que tot i que el projecte Common Voice no es completés, faran públiques totes les dades que recullin perquè siguin reutilitzats.