LLENGUA I NOVES TECNOLOGIES
Softcatalà i Mozilla impulsen un assistent de veu lliure en català
El projecte anima a gravar textos llegits per crear un model informàtic que pugui utilitzar qualsevol programador

undefined36746738 onbarcelona echo dot de amazon180309171706
La intel·ligència artificial no és en absolut poliglota. Els robots, com molts turistes, a penes surten de l’anglès i la majoria d’assistents que impliquen reconeixement i tractament del llenguatge es programen des d’aquesta llengua, la qual cosa pot acabar excloent la majoria de la població mundial.
Dels 7.623 milions d’habitants de la Terra, a penes 378 milions tenen l’anglès com a primera llengua, i 745 milions més l’entenen o el parlen amb fluïdesa com a segon o tercer idioma. La resta de persones, parla almenys un dels més de 7.000 idiomes coneguts.
Un projecte de la Fundació Mozilla, creada sense ànim de lucre i que es nodreix sobretot de voluntaris, pretén corregir aquesta deficiència i evitar, de passada, que tot el saber quedi en mans d’unes quantes empreses: Google, Amazon, Apple o Nuance. Google acaba de llançar el seu assistent de veu en castellà fa un mes i Apple té reconeixement de veu en català però el seu assistent de veu, Siri, encara no l’ha après.
El projecte Common Voice, que es va obrir a totes les llengües fa unes setmanes, anima tots els internautes a contribuir per crear un corpus lingüístic per a cada idioma del món. Qualsevol internauta pot proposar una llengua, i les comunitats de desenvolupadors tindran accés a aquest saber sense restriccions gràcies a una llicència Creative Commons 0, la més pròxima al domini públic.
Llegir en veu alta
La proposta per als usuaris és molt senzilla: es tracta de llegir en veu alta un text que apareix a la pantalla del navegador i permetre que el micròfon de l’ordinador o el mòbil el gravi. Mozilla recollirà dades que comparteixi l’usuari, com ara accent, edat i gènere, que afirmen que només associaran a les gravacions per identificar varietats dialectals. També es pot contribuir enviant textos per ser llegits.
La intenció és entrenar un sistema de reconeixement de veu i llengua a base que milions de persones llegeixin els mateixos textos que apareixen en pantalla. Només així, el sistema és capaç d’associar veu i text. Amb això, la idea és, utilitzant xarxes neuronals, generar un model informàtic que es pugui utilitzar en aplicacions o en navegadors. "La idea és que el pugui utilitzar realment qualsevol", afirma Jordi Mas, coordinador de Softcatalà. l’entitat que s’encarrega de gestionar la versió catalana i que fa 20 anys que tradueix de forma voluntària programes lliures al català.
El Parlament, poques veus
Notícies relacionades"Perquè funcioni necessitem tenir gravades almenys un miler d’hores d’àudios, amb la varietat de variants dialectals més gran del català, gravats per homes i dones de totes les edats", assenyala. L’objectiu de Softcatalà és comptar amb un primer model que funcioni a principis d’any. "Ja havíem intentat crear un model abans amb el corpus de TV-3 i amb el del Parlament. Amb la televisió hi havia el problema dels drets d’autor, que ens deixaven només amb els seus programes de producció pròpia, i amb el Parlament, hi havia poques veus," explica Mas.
El compromís de la Fundació Mozilla, que està preparant també el seu propi navegador basat en veu, Firefox Scout, amb el qual vol competir amb l’Alexa de Amazon, el Google Voice de Google o el Siri de Apple, és que tot i que el projecte Common Voice no es completés, faran públiques totes les dades que recullin perquè siguin reutilitzats.
- Previsió estacional Catalunya s’endinsa en una tardor amb un 70% de probabilitats que faci més calor del normal i amb gran incertesa sobre les pluges
- Apunt No ens semblava bé que Lamine guanyés
- Urbanisme BCN estudia convertir en un passeig el tram sense cobrir de la Ronda del Mig
- Contracrònica de la Pilota d’Or Una gala amb ADN culer
- Iniciativa solidària Barcelona llança el seu Districte 11 per a Palestina amb Gay com a regidora i 1,5 milions de pressupost
- Benestar ¿Prefereixes quedar-te a casa abans que sortir amb amics? Això diu la psicologia sobre tu
- Així va paralitzar una marea de meduses la major central nuclear francesa aquest estiu
- El retorn a l'estadi El retorn al Camp Nou es retarda i continua sense data per deficiències en seguretat
- Cas Koldo El jutge que investiga Santos Cerdán obre una peça separada per investigar les adjudicacions d’obra pública
- Festes Un ‘influencer’ italià revela per què les ressaques a Espanya són diferents de les d’altres països