Creo que uno de los temas que más nos atrae es conocer nuestra especie, biológicamente e históricamente. Nos interesan saber nuestros orígenes y, por eso, nos fascina saber que han encontrado un nuevo fósil de un homínido, o si nuestra especie es o no una especie "pura". No podemos olvidar las polémicas agrias y encendidas a finales del siglo XIX, después de la publicación de libro de Darwin sobre El origen de las especies, emparentándonos con otros simios. También nos interesa saber de dónde venimos y porqué tenemos unas características físicas u otras, de aquí el gran éxito de estas empresas que ofrecen hacer el análisis genético para inferir nuestras raíces genéticas ancestrales. Queremos saber nuestra historia como humanos, tanto la más reciente como la más antigua, y hay varias disciplinas y estrategias para poder obtener datos que nos permitan formular hipótesis o inferir proximidades históricas.

Clásicamente, si hablamos de los orígenes de la especie humana, tenemos el estudio de los fósiles, la antropología física y la arqueología, que han ofrecido y nos ofrecen datos para establecer unos rangos de tiempo e hipótesis, plausibles que después, en algunos casos, han podido ser contrastadas con datos genéticos. Si hablamos de tiempos más modernos y de los humanos actuales, nos servimos de las lenguas y de nuevo, de los datos genéticos. Hasta hace poco, los datos genéticos con los cuales se podían comparar las poblaciones humanas eran limitados. Utilizábamos la secuencia del ADN mitocondrial para establecer proximidades genéticas de linajes matrilineales estrictos, y variantes del cromosoma Y para establecer las proximidades de linajes patrilineales estrictos, pero este análisis es limitado y, a pesar de ser informativo, nos faltaba una visión más global que pudiera abarcar el parentesco genético de forma más esmerada. Con la implementación de la secuenciación masiva, obtener los datos genéticos de todo un genoma ya no es un problema, sino que ahora, lo que hace falta, es saber interpretar las variantes que identificamos.

Una de las hipótesis de partida que puede complicar el análisis, sin embargo, es creer que los habitantes actuales de una zona geográfica de la tierra tienen que ser, sí o sí, descendientes de los antiguos habitantes de aquella región, es decir, que hay parentesco genético y proximidad entre las muestras que se analicen de los humanos que habitaban en la antigüedad y los actuales. Eso no siempre es cierto, porque puede haber zonas donde catástrofes (guerras, hambres y epidemias) extinguen parte de la población, puede haber también migraciones masivas en zonas lejanas y, evidentemente, el humano se ha mezclado genéticamente y ha tenido descendientes con otros humanos que no tienen por qué ser los más próximos desde el punto de vista genético, es lo que en inglés se llama admixture. Como ya expliqué, los humanos no somos una especie pura, sino que nos hemos mezclado con otros homininos, como Neandertales, denisovanos y alguna especie más que nos es todavía desconocida. Si nos centramos en Europa, hay estudios que demuestran que los europeos actuales somos descendientes de al menos tres poblaciones genéticamente diferenciadas, presentes hace unos 7.000-8.000 años. Pero es evidente que entre los humanos modernos también hemos migrado y nos hemos mezclado, y hay sucesos relevantes en la historia de los últimos siglos que han tenido un importante impacto genético, un impacto que todavía es detectable, como la expansión del imperio mogol, el tráfico de esclavos, las cruzadas, y el imperialismo colonial.

Si nos centramos en los estudios genéticos de los humanos actuales en la península Ibérica, el flujo genético con África ha sido reportado por varios grupos científicos, que calculan una proporción de entre un 2,4% y un 10,6% de ADN de origen claramente norteafricano.

Pues bien, a inicios de este mes, se ha publicado un artículo en que han colaborado científicos de Santiago de Compostela y de Oxford, que estudia los patrones de diversidad genética en la península Ibérica, ya que consideran este territorio del sur de Europa un objeto de análisis particular: la península Ibérica es lingüísticamente diversa y con una historia demográfica compleja. Estudiando el genoma de 1423 individuos de todas las zonas geográficas peninsulares, y analizando a un nivel muy fino la herencia de fragmentos de cromosoma en bloque (lo que se denomina, estudio de haplotipos, una herramienta muy precisa para estudiar relaciones de parentesco genético a través de las generaciones) pueden observar claras diferencias genéticas de este a oeste peninsular, concordante con los territorios lingüísticos del siglo XIV, así como la huella genética de las grandes migraciones humanas, en concreto la aportación genética norteafricana en los siglos de la ocupación musulmán, así como la migración norte-sur dentro de la misma península durante la Reconquista. Es decir, correlacionan las diferencias genéticas actuales dentro de la península con la geografía del territorio y los dominios lingüísticos de finales de la Edad Media, como podéis ver en la imagen (y podéis leer si os interesa el artículo, que es de acceso abierto).

Mapas de la península Ibérica: a la izquierda, mapa de las diferencias genéticas de los habitantes actuales de la península; a la derecha, mapa lingüístico del siglo XIV de la nuestra era (1300 CE). Imagen adaptada de las figuras 1 y 2 del artículo publicado por Bycroft et al. (Nature communications (2019) 10:551 doi.org/10.1038/s41467-018-08272-w).

La precisión del análisis genético que han realizado los autores es tan grande, que en las muestras de pueblos aislados en el interior de Galicia, del País Vasco y de La Rioja, separados geográficamente, por valles y ríos, pueden llegar a encontrar diferencias genéticas a una escala de 10 km de distancia. Sin embargo, lo que a mí más me sorprende es el gran impacto que la época en que los musulmanes ocuparon la Península ibérica, tuvo y tiene todavía sobre la variabilidad genética de los habitantes actuales. Pensad que más de 500 años después de que se acabara la Reconquista, todavía encontramos diferencias genéticas en la población actual que reflejan la organización territorial (de la cual la lengua es un reflejo) de aquella época.