La composition de l'ascendance | Blogue ADNTRO

La composition de l'ascendance dans un contexte mondial

LES RÉSULTATS DE LA COMPOSITION GÉNÉTIQUE DANS UN CONTEXTE MONDIAL - UNE COLLABORATION AVEC L'UNIVERSITÉ DU « TEXAS AT TYLER ».

L'une des principales caractéristiques d'ADNTRO est la description du composition de l'ascendance de chaque individu (avec la Métabolisation des Vitamines, le Sport, le Comportement, la Prédisposition aux Maladies ...) etc., mais toutes les analyses que nous réalisons ont comme source d'inspiration les meilleures études publiées sur le sujet.

Cette méthodologie alternative d' analyse ancestrale s'appuie sur une publication dans Nature (l'une des revues scientifiques les plus prestigieuses au monde) et sur la base de données 1000 Genomes ; Bien que cette méthodologie ne nous permette pas de proposer la ventilation détaillée par pays que nous proposons dans notre calculateur d'ascendance ADNTRO , il s'agit d'une méthode très robuste avec laquelle vous pouvez apprendre comment l'ascendance d'un individu est analysée .

Pour atteindre la description de la composition d'ascendance, nous utilisons des pipelines de calcul (des workflows pour le "big data" - de grands ensembles de données - qui utilisent la puissance de calcul de Google Cloud) pour comparez votre ADN avec celui de nombreux autres individus dans le monde, dans ce cas en utilisant comme point de départ la base de données 1000 Genome, qui comprend 2 504 profils génétiques d'individus anonymes de 26 populations mondiales différentes (voir la section d'informations supplémentaires ci-dessous pour plus de détails).

Sur la base de votre similitude génétique, nos algorithmes informatiques font des prédictions sur quelle partie de votre ascendance vient de différentes parties du monde et de quelle.

Il est important de situer les résultats dans un contexte global . Certaines personnes dans le monde ont des ancêtres propres à la région d'où elles viennent, mais beaucoup d'autres ont une ascendance mixte qui peut refléter des schémas de migration humaine dans un passé lointain ou récent (comme avoir un parent d'un autre pays ou même d'un continent différent).

ADNTRO a collaboré avec le Dr Joshua Banta, professeur de biologie à l'Université du Texas à Tyler, qui étudie et publie sur la génétique des populations naturelles, en utilisant les mégadonnées pour vous fournir un outil visuel qui place vos résultats génétiques dans un contexte global.

Si nous nous attardons un peu plus sur la méthodologie, nous voulons vous dire que nous utilisons un algorithme de factorisation matricielle non négative (sNMF) implémenté par la fonction 'snmf' du package LEA appartenant au langage de programmation R. Cet algorithme estime les contributions au génome des groupes ancestraux hypothétiques de chaque individu dans l'analyse, sur la base des similitudes / différences génétiques des séquences d'ADN les unes par rapport aux autres.

Pour trouver le nombre optimal de groupes ancestraux (K), différents nombres d'ancêtres hypothétiques ont été simulés et les différentes simulations ont été comparées pour déterminer laquelle correspondait le mieux aux données avec lesquelles nous avons traité et, par conséquent, quel nombre de K groupes devrait être utilisé. pour ce nouvel outil. Nous avons testé différents nombres de K groupes, compris entre 5 et 12, en utilisant le critère d'entropie de la fonction sNMF, qui évalue la qualité de l'ajustement du modèle statistique aux données en utilisant une technique de validation croisée (Voir informations complémentaires (1)).

Le modèle avec un certain nombre de K groupes est privilégié lorsque le critère d'entropie est minimisé (Voir complément d'information (2)).

Sur la base de ces critères, nous constatons que le nombre optimal de groupes K est de 5 (Figure 1).

Pour plus de détails sur les méthodes, vous pouvez consulter les informations complémentaires en fin d'article).

Figure 1. Le nombre de groupes ancestraux est optimal pour une valeur de cinq. L'entropie est minimisée lorsque la valeur de K est cinq, cinq étant le nombre qui correspond le mieux à nos données.

VOTRE COMPOSITION D'ANCESTRALITÉ AU NIVEAU GÉOGRAPHIQUE

Ces cinq groupes ancestraux peuvent être décrits visuellement comme les ancêtres de l'Afrique (représentée en rouge), de l' Amérique (représentée en vert), de l' Europe (représentée en bleu clair), de l'Asie de l'Est (représentée en jaune) et de l'Asie du Sud (représentée en bleu foncé) .

Pour obtenir la contribution de ces groupes ancestraux dans votre ADN, nous effectuons l'analyse avec les données de 1000 génomes avec vos données pour générer les résultats qui incluent votre ascendance dans un contexte mondial (Figure 2). Les résultats sont affichés sous forme de "diagramme à barres empilées", avec une flèche indiquant où vous vous situez par rapport au reste du graphique représentant les résultats des personnes de 1000 génomes:

Figure 2. Un graphique à barres empilées montrant des personnes de la base de données mondiale d'ADN de 1000 génomes ainsi que votre profil ADN (indiqué par une flèche rouge). La flèche se déplacera en fonction de votre profil ADN, voici un exemple. Le graphique est composé de petites barres qui montent et descendent verticalement. Chacune de ces barres représente un individu différent de 1000 génomes ainsi que vos résultats ADNTRO. Les différentes ascendances qu'un individu comprend sont indiquées par différentes couleurs sur la barre verticale de la personne. Plus vous avez d'une couleur, plus vous aurez de pourcentage de ce groupe ancestral.

Ce graphique se comprend plus facilement si l'on "zoom" sur vos résultats et sur la moyenne des individus de 1000 Génomes de votre groupe ancestral auquel vous correspondez majoritairement. Avec cela, vous pourrez voir plus clairement le modèle des groupes ancestraux, c'est-à-dire la contribution des différentes ascendances à votre ADN (Figure 3).

Figure 3. Le même diagramme à barres dme empilé de la figure 2 agrandi pour vos résultats et la moyenne des individus de 1000G de votre groupe ancestral majoritaire.

De nouveau, chaque colonne multicolore représente une référence individuelle différente par rapport à vous, et les individus de cet exemple ont des couleurs mélangées "empilées" les unes sur les autres en raison de petites quantités d'ascendance mélangée. Fait intéressant, si vous examinez attentivement la figure 2, vous verrez que les profils génétiques des peuples d'Amérique sont ceux qui présentent la plus grande variabilité.

De nombreuses personnes ont une ascendance importante associée à l'Europe (bleu clair), ainsi que des contributions substantielles associées à l'ascendance africaine (rouge). Cela reflète l'histoire complexe des peuples africains avec la traite négrière et avec les peuples des Amériques, où les peuples autochtones se sont mélangés aux colons européens.

MOTIFS ANCESTRAUX

Si vous faites déjà partie de la communauté ADNTRO, vous savez que nous aimons aller plus loin, être créatifs et proposer à nos utilisateurs des résultats innovants. Pour cette raison, nous avons développé un visionneuse comparative de modèles ancestraux basée sur des corrélations. En utilisant les données de 1000 génomes et le vôtre nous avons analysé dans quelle mesure votre ADN est-il similaire et différent de l'ADN « typique » des 26 populations différentes de 1000 génomes.

C'est une nouvelle façon de voir votre ascendance. Les zones du graphique (Figure 4) que vous voyez les plus élevées sont les populations avec lesquelles vous partagez un grand nombre de marqueurs spécifiques présents dans cette population. Au contraire, les zones les plus basses du graphique représentent les populations avec lesquelles vous présentez le moins de similitudes.

Chez ADNTRO, nous aimons offrir de nouveaux angles et innover, en gardant toujours à l'esprit l'importance de comprendre votre ADN dans son ensemble ; Ceci est ce que vous permet d'obtenir votre patron ancestral et de le comparer avec différents patrons ancestraux dans le monde. Quelque chose d'inédit dans le monde de test génétique directement au consommateur d'aujourd'hui.

Figure 4. Comparaison entre le modèle africain « typique » et le vôtre. Ce graphique est un exemple dans lequel nous utilisons un échantillon européen. Cependant, le modèle changera en fonction de vos informations génétiques. De la même manière, vous pouvez modifier les populations de référence contre lesquelles vous souhaitez vous comparer.

Le fait que votre schéma ressemble étroitement à des populations similaires à vous est tout à fait normal. Deux individus européens, par exemple, ont un schéma très similaire si on le regarde dans son ensemble et ne présentent que de petites différences qui méritent d'être explorées (les différences sont si petites qu'il faudrait les exagérer sur une échelle logarithmique).

Il est important que vous gardiez à l'esprit que le fait que votre schéma ait une très grande similitude avec une autre personne ne signifie pas que vous êtes apparenté au niveau familial , mais que votre schéma ancestral est très similaire car vous présentez des ancêtres communs .

Mais cela ne s'arrête pas là ! Nous vous dirons également avec quelles populations de 1000 Génomes vous ressemblez le plus et avec lesquelles vous présentez une plus grande différence. De plus, si vous êtes déjà client ADNTRO, vous pourrez télécharger votre modèle avec une population de référence et un alias, pour pouvoir le partager avec d'autres modèles dans le monde non inclus dans la base de données 1000G.

Aimez-vous cet outil? Êtes-vous curieux de connaître votre modèle ancestral dans un contexte mondial ? Voulez-vous pouvoir le comparer avec d'autres? Entrez dans ADNTRO 😊, achetez votre kit ou téléchargez votre « Raw » et découvrez-le !

INFORMATION COMPLÉMENTAIRE

(1) Vous pouvez consulter la page 926 du Article, dans la première colonne, près du bas de la page, dans la section "Analyse de la structure de la population")

(2) Vous pouvez consulter la page 927 du Article, à la fin.

Plus de détails sur les méthodes : Tant pour les jeux de données 1000 Genomes que pour vos propres résultats, nous filtrons notre base de données de polymorphismes (SNP) pour ne conserver que ceux qui sont bialléliques, avec un MAF ≥ 0,05 et avec un espacement d'au moins 2kb.

Quelles populations comprend le projet 1000 Génomes ? :

fr_FRFrançais