AVENÇOS DE CIÈNCIA

La "globalització" indoeuropea

¿D'on van venir els indoeuropeus? ¿Per què meitat dels humans parlen idiomes d'aquesta soca?

El biòleg Carles Lalueza-Fox desgrana els secrets de l'ADN humà antic a 'La forja genètica d'Europa', que surt demà traduït al castellà

forja2

forja2

18
Es llegeix en minuts
Carles Lalueza-Fox

Extracte de La forja genètica d'Europa, de Carles Lalueza-Fox (Edicions de la Universitat de Barcelona, 2017).

Edició castellana, febrer del 2018.

Selecció a càrrec de Michele Catanzaro

Actualment, prop de la meitat de la població mundial —incloent-hi els territoris colonitzats per europeus en els últims centenars d’anys, com Amèrica i Austràlia— parla llengües indoeuropees. Es tracta d’una gran família lingüística que engloba més de quatre-centes llengües i dialectes que tenen un origen comú, entre les quals hi ha pràcticament totes les que es parlen a Europa, amb la notable excepció del basc —un autèntic fòssil lingüístic indoeuropeu— i algunes altres com l’hongarès, l’estonià i el finlandès, que són degudes a influències asiàtiques molt més recents. Les diferents branques indoeuropees inclouen subfamílies com la itàlica, la cèltica, la germànica, l’hel·lènica, l’albanesa, la bàltica, l’eslava i la indoiraniana (que amb el sànscrit arriba fins a l’Índia, Bangla Desh i Sri Lanka). Es coneixen també llengües indoeuropees extintes, com l’hitita (que es parlava durant l’Imperi hitita, a l’actual Anatòlia, fins a la seva destrucció pels assiris, el 1180 abans de Crist) o el misteriós tokhari (que es parlava a la conca del Tarim, a l’oest de la Xina, i que va desaparèixer cap al segle ix de la nostra era).

Des del segle xvi, diversos viatgers i erudits van constatar algunes semblances en paraules de llengües molt diverses, com el sànscrit, el grec i el llatí, que suggerien un origen comú per a totes elles. Thomas Young —un estudiós que va intervenir també a desxifrar els jeroglífics egipcis competint amb Champollion— va ser el primer a usar, el 1813, el terme indoeuropeu per referir-se a dita genealogia lingüística. Des d’aleshores, un problema que ha fascinat de manera igual lingüistes, arqueòlegs i fins i tot genetistes és: quan va tenir lloc l’expansió de les llengües indoeuropees i què va poder catalitzar-la?

Sembla evident que aquest procés, per la seva magnitud, ha d’estar associat a una migració humana a gran escala. La posterior fragmentació en nombroses llengües no representa un problema conceptual, però l’existència d’un nucli original, denominat protoindoeuropeu, és difícil de localitzar en l’actualitat i s’ha convertit, per tant, en un tema molt controvertit. En essència, existeixen dues teories sobre l’expansió indoeuropea que difereixen tant en la ruta d’entrada a Europa com en el període en què aquesta es produeix. La primera, formulada per l’arqueòloga d’origen lituà Marija Gimbutas (1921-1994) i coneguda com la hipòtesi dels kurgans, sosté que les llengües indoeuropees entren a Europa en el neolític final, associades al moviment de grups pastoralistes nòmades procedents de les estepes pòntiques (la gran regió pòntica s’estén des del nord de la mar Negra fins a la mar Càspia). Aquestes poblacions tenen el seu nucli original en la denominada cultura iamna (en anglès Yamnaya), que data de cap a l’any 3000 abans de Crist i que es caracteritza des d’un punt de vista arqueològic per la construcció de grans túmuls funeraris coneguts com a kurgans, on normalment s’enterra un personatge rellevant. La gran extensió de les estepes i l’economia pastoralista dominada pel cavall fan que una successió d’anys climàtics favorables amb pastures abundants generin un gran excedent demogràfic, tant d’humans com d’animals. El mateix va passar en temps històrics amb les hordes mongols i anteriorment amb els huns.

Aquests pastoralistes iamna es devien moure cap a l’oest i devien entrar en contacte amb els agricultors europeus en el neolític final, amb la qual cosa van generar una nova cultura centreeuropea, anomenada ware (o ceràmica cordada), que reemplaça l’LBK. La cultura Corded Ware es caracteritza per produir ceràmiques amb decoracions fetes amb cordes nuades sobre els atuells de terrissa acabats de fer (d’aquí el seu nom). Aquestes ceràmiques acompanyen enterraments individuals en què sovint es diposita també una destral de combat feta amb pedra polida. Per les dificultats que implica aquesta construcció, es creu que es tracta de personatges de certa importància social per a la comunitat. La distribució dels kurgans és mols àmplia i engloba una gran extensió del centre i l’est d’Europa, des d’Ucraïna fins a Polònia i Dinamarca. Segons diversos investigadors, el fet que les llengües indoeuropees comparteixin termes referits al pasturatge, a la metal·lúrgia i als carros arrossegats per cavalls dóna suport també al seu origen comú en aquest període i no pas en el neolític inicial, on dites tecnologies encara no existien.

Precisament, la hipòtesi alternativa sobre l’origen de les llengües indoeuropees les situa molt més enrere en el temps, uns 6.500 anys abans de Crist, al començament mateix del neolític i l’arribada d’emigrants del Pròxim Orient (per això es coneix com la hipòtesi del neolític d’Anatòlia). El seu principal defensor durant anys ha estat Colin Renfrew (tècnicament, Lord Renfrew), un arqueòleg britànic i membre de la Cambra dels Lords que va ser professor a Cambridge. A part de fer coincidir l’esdeveniment amb un fenomen migratori indiscutible i massiu (l’inici de l’agricultura), la seva hipòtesi va trobar un suport inesperat dels mateixos lingüistes, entre els quals al principi no era gaire popular. El 2012, uns lingüistes van començar a utilitzar mitjans filogenètics per intentar datar l’antiguitat comuna de les llengües indoeuropees; les dades obtingudes (amb marges d’error lògics) eren més coincidents amb el neolític antic que amb el final. No obstant això, altres lingüistes van criticar ràpidament les assumpcions fetes en els models matemàtics (sol passar que amb els models estadístics cal aplicar tants supòsits teòrics que al final la incertesa plana sempre sobre els resultats).

Potser un punt en contra de la hipòtesi de Gimbutas és que els kurgans són típics de les estepes centreasiàtiques, però escassegen a l’Europa central i no arriben fins a l’oest del continent. Es devia haver reformulat aquesta cultura i devia haver seguit expandint-se malgrat haver-se transformat en una altra cosa? Les llengües que triomfen solen estar associades a elements de prestigi i sens dubte els enterraments en túmuls ho eren (de fet, la fastuosa tomba macedònia d’Amfípolis no deixa de ser hereva de dita tradició), però potser la seva distribució no era tan extensa com seria desitjable per a la hipòtesi indoeuropea. Per altra banda, les anàlisis genètiques fetes amb els europeus actuals no semblaven detectar un senyal global que apuntés cap a l’est. Els estudis clàssics fets amb marcadors com els grups sanguinis sí que detectaven una distribució clinal de la diversitat genètica actual coherent amb l’entrada del neolític pel sud-est d’Europa. A causa d’això, durant anys la majoria dels genetistes —i jo entre ells— es van alinear amb Renfrew per defensar un origen en el neolític inicial de les llengües indoeuropees.

Vaig conèixer Renfrew, amb setanta-quatre anys i ja jubilat, durant una visita seva a la Universitat Pompeu Fabra al març del 2012. Li vaig explicar els nostres resultats preliminars sobre La Braña —que eren encara inèdits— i es va mostrar encantat. Era tot un cavaller amb aquest punt d’excentricitat que tant agrada als anglesos. Per a ell, el fet que els caçadors i els neolítics fossin tan diferents donava suport a la gran migració que la seva hipòtesi requeria: canviava la gent, canviava la llengua.

Tot això seria coherent amb la consideració del basc com una llengua preneolítica europea —en rigor, l’única conservada d’aquell període— i, per tant, amb els bascos com una població amb un fort component mesolític que haurien conservat la seva llengua original contra vent i marea. Però quan vam analitzar el genoma complet de La Braña ja em vaig adonar que alguna cosa fallava: el caçador mesolític no estava especialment relacionat amb els bascos actuals, com hauria calgut esperar. En canvi, les anàlisis fetes amb els primers agricultors, com Stuttgart, sí que donaven una certa afinitat amb els bascos (després de donar-ne amb els sards). Aquest fet, que suggeria una arribada tardana dels indoeuropeus, va passar desapercebut en la majoria de les publicacions posteriors.

En aquesta situació, la paleogenòmica va capgirar aleshores el debat, en corroborar l’existència d’un influx genètic massiu a l’Europa continental, procedent de les estepes russes, al neolític final. El treball va estar liderat una altra vegada pel grup de David Reich i va començar a sonar en diversos congressos cap a finals del 2014 (alguns bloguers van als congressos i piulen novetats que se’ls escapen als conferenciants). El treball va sortir publicat a Nature el 2 de març de 2015 i el seu primer firmant era Wolfgang Haak. Un mitjà nord-americà va trobar el titular perfecte: «A steppe forward» (un joc de paraules amb la típica frase «A step forward»).

Aquesta vegada representava també un canvi d’enfocament tècnic: ja no es buscava generar genomes complets. Durant la nostra competició amb La Braña, Reich es va adonar de com era de difícil trobar mostres prou ben conservades per seqüenciar tot el genoma. Per a ell, que treballava amb els principis de genètica de poblacions, els genomes complets no eren necessaris; li interessaven alguns centenars de milers de posicions variables al llarg del genoma (coneguts com a SNP o single nucleotide polymorphisms) per caracteritzar individus i poblacions amb prou poder estadístic. Va descobrir també que aquestes posicions es podien capturar i seqüenciar mitjançant un array amb milers de sondes d’ADN en mostres que, d’altra banda, no eren prou bones per ser seqüenciades. Va dissenyar un sistema de captura genòmica amb 390.000 posicions informatives i es va dedicar a genotipar mostres prehistòriques de diversos períodes i procedències. Al final, va acabar amb dades ni més ni menys que de seixanta-cinc genomes prehistòrics. Quan els comparava amb tots els genomes anteriors que almenys tinguessin un 5% del genoma seqüenciat i publicats des del 2010, només sumaven 40. És a dir, en un sol treball multiplicava per 1,5 tots els genomes anteriors. Com és obvi, hi ha coses que no poden fer-se amb dades de SNP únicament. Per exemple, diverses anàlisis de selecció o estudis demogràfics requereixen seqüències cromosòmiques més extenses i no tan sols posicions variables d’un únic nucleòtid d’ADN. O potser es troba en el futur una variant interessant que no està inclosa en el conjunt d’SNP seleccionats i això només podria investigar-se en un genoma complet. Però Reich tenia com a objectiu reconstruir els processos migratoris del passat a Europa i per a aquest fi les seves dades eren més que suficients. Tenia individus que anaven des del mesolític fins a l’edat del bronze; la gran majoria procedien d’Alemanya i de Rússia. Entre aquests últims destacaven sis mostres de la cultura de les estepes, els iamna, que dataven del bronze inicial (fa entre 3.500 i 2.700 anys abans de l’era cristiana).

Atesa l’amplitud de mostres, els resultats de Reich tocaven diversos fronts en una escala sense precedents. Per començar, els investigadors descrivien un ressorgiment del component caçador recol·lector uns 1.000 o 2.000 anys després de l’arribada de les primeres poblacions d’agricultors. Aquest increment del substrat mesolític es detectava des de l’Europa central fins a la península Ibèrica; això podia deure’s simplement al col·lapse demogràfic que van experimentar els primers neolítics, associats al deteriorament del clima i a l’exhauriment dels recursos inicials. O bé al fet que van quedar grups de caçadors en algunes zones —presumiblement del nord d’Europa— que es van anar mesclant de manera progressiva amb els agricultors ja establerts en el continent. A banda, els caçadors de l’est d’Europa semblaven ser distints dels de l’oest (representats per La Braña i Loschbour) i també dels d’Escandinàvia: els primers mostraven un component poblacional més afí al genoma de Mal’ta —i, per tant, al component poblacional basal del nord d’Euràsia, l’ANE—. Reich els denominava EHG (Eastern hunter-gatherers).

Però els resultats més interessants procedien de les mostres de l’edat del coure i l’edat del bronze. Els iamna mostraven un component genòmic amb afinitats a la zona del Caucas i l’oest d’Àsia (en proporcions properes al 60% i el 40%, respectivament), que entrava amb força a l’Europa central a partir del final del neolític. Clarament, el grup de Reich havia detectat, en temps real, l’arribada d’un gran influx genètic procedent de les estepes centreasiàtiques, que havia canviat la configuració genètica de l’Europa del moment. En aquest sentit, l’horitzó arqueològic conegut com a Corded Ware semblava estar format per prop d’un 70% de component procedent dels iamna. I es tractava d’un canvi brusc, no d’aportacions genètiques progressives durant un període llarg. Les poblacions alemanyes prèvies als Corded Ware no presentaven aquest component i, com tots els genomes neolítics, s’agrupaven tranquil·lament amb els sards (i amb els LBK i els cardials). Els Corded Ware, en canvi, s’agrupaven ja amb les poblacions actuals del nord d’Europa, com Anglaterra i Alemanya. Encara que les poblacions actuals tenen menys component iamna que els Corded Ware, aquesta agrupació indica certa continuïtat des d’aleshores i fins al present.

La transformació del cromosoma Y europeu proporcionava una evidència addicional: els llinatges masculins més freqüents entre els europeus actuals són els R1b i R1a, i ambdós es troben en freqüències residuals entre els primers agricultors. En canvi, tots els homes iamna i altres individus de Rússia mostren aquests llinatges; i entre els posteriors Corded Ware augmenten fins al 50%. La seva presència ancestral a l’estepa quedava provada pel fet d’aparèixer també en dos mesolítics de Rússia. En concordança amb la seva antiguitat, alguns d’ells presentaven, dins d’ambdós llinatges, combinacions ancestrals de marcadors genètics que prefiguraven els posteriors R1b i R1a típicament europeus. El fet que tots els iamna tinguessin el mateix llinatge apuntava, a més, a una organització patrilineal d’aquests grups, units per forts vincles d’ascendència masculina. Això podria relacionar-se amb el fet que el seu equipament cultural, basat en els carros, els cavalls i les armes de bronze, apuntés a una esfera d’expansió violenta entre les comunitats agrícoles de l’oest d’Europa, que fins aquest moment mostraven pocs indicadors arqueològics de jerarquització social.

Els llinatges mitocondrials com l’N1a i llinatges del cromosoma Y com el G2a o el T1a, que són molt freqüents entre els primers agricultors, pràcticament desapareixen en períodes posteriors. El mateix ocorre amb el rar cromosoma Y de La Braña i de Kostenki 14: en aquest cas no apareixia en cap de les mostres analitzades.

Amb aquests resultats, els investigadors havien localitzat també l’entrada de l’antic component poblacional ANE a Europa, l’arribada del qual era un misteri fins aleshores, ja que, malgrat la seva antiguitat a Euràsia, la seva presència en els europeus actuals no estava associada ni als caçadors mesolítics ni als primers agricultors. La inferència que més cridava l’atenció del treball és que havien trobat el rastre genètic dels primers indoeuropeus. Aquesta gran transformació del bagatge genètic europeu coincidia en el temps amb la cultura dels kurgans i, per tant, les dades paleogenòmiques reforçaven, després de més de mig segle de debats, la hipòtesi de Gimbutas. Canviaven les persones, sí, però en el neolític final. El bagatge genòmic que vèiem en els cardials i en els altres agricultors antics quedava restringit a Sardenya, una població actual sense a penes el component ANE.

Unes setmanes després, el grup de Willerslev (encapçalat per l’investigador postdoctoral Morten Allentoft, que havia participat en el treball de La Braña) va publicar un nou treball amb genomes de l’edat del bronze amb unes conclusions semblants. Si bé els danesos reivindicaven el fet d’haver inclòs més de cent genomes antics en un sol treball, en realitat la majoria corresponien a fraccions molt limitades (properes a l’1% del genoma complet) i tan sols dinou d’ells tenien cobertures superiors a 1x. No obstant això, sí que era cert que cobrien grans àrees de l’Àsia central i detallaven l’expansió del component de les estepes no només cap a l’oest, cap a Europa, sinó també cap a l’est. Entre elles hi havia la cultura neolítica més antiga de Sibèria, l’anomenada Afanàsievo, que va aparèixer fa entre 3.500 i 2.500 anys abans de Crist.

El grup d’Eske també associava les migracions centreasiàtiques cap a Europa amb les llengües indoeuropees. El treball d’Allentoft va tenir un colofó extraordinari: normalment els genetistes analitzen les seqüències humanes que generen, però ningú no presta atenció a les que es descarten, les que no mapegen en el genoma humà. Algú en el grup d’Eske va tenir l’ocurrència de mirar què hi havia en aquests bilions de seqüències no humanes i va descobrir que en almenys set individus hi havia un nombre significatiu de seqüències del bacteri Yersinia pestis, la causant de la pesta.

Notícies relacionades

Es coneixen tres grans pandèmies europees causades per la pesta: la primera, coneguda com la plaga de Justinià (entre els anys 541 i 544) va portar a la decadència un Imperi bizantí que acabava d’inaugurar la majestuosa Santa Sofia; la segona, coneguda com la pesta negra, va assolar Europa en una primera onada entre el 1347 i el 1351 i va causar la mort d’entre un terç i la meitat de la seva població (va tenir, a més, rebrots subsegüents de forma intermitent, com la gran plaga de Londres de 1665); la tercera va emergir a la Xina cap a la meitat del segle xix i es va estendre per tot el món durant gairebé un segle. Hi ha documentats episodis anteriors, com la plaga d’Atenes (430-427 abans de Crist) o la plaga antonina (165-180 després de Crist), que van causar la decadència de la Grècia clàssica i l’inici de la gran crisi de l’Imperi romà, respectivament, però es desconeix si van ser causats pel mateix patogen. És evident, però, que els humans podien haver estat exposats a l’epidèmia des de molt abans de l’existència de fonts escrites que s’hi referien. Els investigadors danesos van decidir seqüenciar a fons els set individus descoberts i van acabar generant genomes complets del patogen en cadascun d’ells, en cobertures que anaven de 0,12x fins a 50x. Els portadors del bacteri —i que potser van morir a causa d’aquest— incloïen dos individus de la cultura Afanàsievo, datats al voltant de l’any 2800 abans de Crist, així com un Corded Ware d’Estònia i un individu de l’edat del ferro d’Armènia, entre d’altres. Amb els genomes de Yersinia pestis van poder construir arbres filogenètics que situaven els llinatges prehistòrics en posició basal, fet que era congruent amb la seva major antiguitat. Les dades van permetre calcular un origen d’uns 5.600 anys per a la soca actual del bacteri. No obstant això, també van descobrir que a les formes prehistòriques els faltaven alguns gens relacionats amb la virulència, cosa que suggeria que no hauria pogut causar la pesta bubònica —és a dir, el tipus de pesta que es transmet per picades de puça de rosegadors—, com va ocórrer amb les tres pandèmies esmentades abans. Una idea fascinant que es derivava de l’estudi mencionat, publicat a la revista Cell el 2014, és considerar que l’impacte genètic de la migració de les estepes, que tenia lloc sobre un continent ja poblat, podia haver estat més gran pel fet d’haver anat acompanyat d’una epidèmia mortal. El declivi poblacional i la crisi de les comunitats del neolític final entre l’acabament del quart mil·lenni i el principi del tercer abans de Crist podia deure’s a la introducció d’una malaltia d’origen asiàtic que fins aleshores era desconeguda pels agricultors europeus.

Per als autors d’ambdós estudis, Renfrew estava equivocat. Però alguns comentaristes no es van afanyar a liquidar encara la hipòtesi de l’origen indoeuropeu a Anatòlia. Al capdavall, argumentaven, no hi ha manera de saber quines llengües parlaven aquests emigrants iamna. La majoria dels lingüistes estan d’acord que les branques més basals de la família indoeuropea són les que inclouen el grec micènic i l’hitita. Les branques amb el sànscrit i el tocari també estarien a prop d’aquestes llengües basals i després vindrien les altres branques, que inclourien tota la resta de les llengües europees. Un origen anatòlic dels indoeuropeus no tindria problemes per explicar aquesta filogènia basant-se en expansions dels primers agricultors cap a l’est (Índia i Àsia central) i cap a l’oest (Europa). En canvi, un origen posterior a l’Àsia central o a la zona del Caucas i una entrada a Europa per l’estepa tenia dificultats per explicar l’existència de les branques més basals molt més avall, al sud-est d’Europa. Òbviament, ni el grup de Reich ni el Willerslev no disposaven de mostres antigues procedents de la zona crítica d’Anatòlia i els Balcans i no sabien com podria haver canviat el substrat poblacional allí, però sens dubte era un inconvenient que qualsevol podria entreveure. Els primers ho reconeixien amb una frase: «Les nostres dades no resolen la qüestió final de la zona d’origen dels protoindoeuropeus». Els autors suggerien fins i tot una solució intermèdia; potser els invasors de les estepes van introduir només algunes de les llengües indoeuropees (com les baltoeslaves i les germàniques) i potser els primers agricultors van desenvolupar in situ les branques més basals de la família. Alhora, l’origen genètic de les poblacions iamna originals no era clar i cap a principis del 2015 tant el grup de Reich com el de Willerslev es van llançar a buscar més mostres per tota l’Àsia central.