Anar al contingut

Un arxiu genòmic recopila dades de 800.000 persones

La informació inclosa a l'EGA, totalment confidencial, comença a donar els seus primers resultats per a l'anàlisi del càncer i malalties estranyes

El projecte l'impulsa el CRG de Barcelona i l'Institut Europeu de Bioinformàtica, amb el suport del BSC i la Caixa

Antonio Madridejos

Un arxiu genòmic recopila dades de 800.000 persones

JOAN PUIG

L’Arxiu Europeu de Genomes i Fenomes (EGA), una iniciativa científica amb seu a Cambridge i Barcelona, comença a donar fruits tangibles i molt valuosos després d’haver recopilat en cinc anys de funcionament dades genètiques de 800.000 persones d’arreu del món. Concretament, segons expliquen els seus promotors, la informació –que està disponible per a grups científics sota un estricte sistema de confidencialitat– ja ha permès el descobriment de les variants genètiques de dues malalties minoritàries i de la susceptibilitat genètica del glioblastoma, entre altres avanços. 

L’EGA està gestionat per l’Institut Europeu de Bioinformàtica (EMBL-IBI), amb seu a Cambridge, i el Centre de Regulació Genòmica (CRG) de Barcelona, i compten amb el suport de la Fundació La Caixa.

Emmagatzemats de forma segura

Les dades recopilades fins a la data, que per evitar problemes s’emmagatzemen duplicades al Barcelona Supercomputing Centre (BSC) i a la seu EMBL-IBI a Cambridge (Regne Unit), suposen 4,5 petabytes d’informació (4.500.000 gigabytes). La informació s’obté amb el consentiment del donant, generalment pacients d’hospitals, i es distribueix entre la comunitat científica de manera anònima. A més, està totalment encriptada per impedir-hi l’accés de persones de fora, com recorda Luis Serrano, director del CRG. «Les claus s’envien mitjançant correu físic», diu Arcadi Navarro, secretari d’Universitats i Recerca de la Generalitat i també participant en el projecte EGA.

«Molt sovint, el que passava fins ara és que un grup d’investigació seqüenciava un tumor, per exemple, i les dades obtingudes quedaven per sempre als discos durs dels seus ordinadors», comenta Navarro. Si les envien al repositori, en canvi, queden gratuïtament a l’abast de col·legues d’arreu del món. Ara, l’EGA emmagatzema, per exemple, les dades dels projectes i consorcis internacionals més rellevants en genòmica, com el Consorci Internacional del Genoma del Càncer, el Consorci Internacional de l’Epigenoma Humà i el projecte UK10K.

Classificació i accés a les dades

Les dades estan classificades –per sexe, país, malaltia– de tal manera que els científics poden accedir al que els interessa. «Primer es busca i després, quan ja sé el que hi ha, ho demano», sintetitza Navarro. Sense aquesta mena d’informació seria molt complex fer estudis comparats del genoma. «En el cas de malalties estranyes –incideix Serrano–, s’ha de tenir en compte que és difícil trobar dades de diferents afectats».

Ús habitual

Prop de 12.000 investigadors d’arreu del món ja han consultat les dades de l’EGA. Com a exemple d’accés, el director del CRG cita el cas d’un grup de l’Idibaps (Hospital Clínic de Barcelona) que utilitza les dades en les seves investigacions sobre una atàxia congènita i un altre del VHIR (Vall d’Hebron) que els utilitza per a l’estudi d’immunodeficiències primàries en nens.

«És absolutament necessari que els científics compartim aquest coneixement amb el col·lectiu mèdic perquè el retorn a la societat sigui eficient i àgil», prossegueix Serrano. De fet, el director del CRG destaca que l’Institut Carles III de Madrid obligarà a dipositar a la base de dades els resultats dels projectes que hagi finançat. «També parlem amb el ministeri perquè passi el mateix amb els estudis genòmics que finança el pla nacional de R+D», assenyala Serrano.