La composizione dell'ascendenza | Blog ADNTRO

La composizione dell'ascendenza in un contesto globale

I RISULTATI DELLA COMPOSIZIONE GENETICA IN UN CONTESTO GLOBALE - UNA COLLABORAZIONE CON L'UNIVERSITÀ DEL “TEXAS AT TYLER”.

Una delle caratteristiche principali di ADNTRO è la descrizione del composizione di ascendenza di ogni individuo (insieme alla Metabolizzazione delle Vitamine, Sport, Comportamento, Predisposizione alle Malattie...) ecc., ma tutte le analisi che effettuiamo hanno come fonte di ispirazione i migliori studi pubblicati sull'argomento.

Questa metodologia alternativa di analisi ancestrale si basa su una pubblicazione su Nature (una delle riviste scientifiche più prestigiose al mondo) e sul database 1000 Genomes; Sebbene questa metodologia non ci permetta di offrire la suddivisione dettagliata per paese che offriamo nel nostro calcolatore di antenati ADNTRO , è un metodo molto robusto con cui puoi imparare come viene analizzato l'ascendenza di un individuo .

Realizzare la descrizione della composizione di ascendenza, utilizziamo pipeline di calcolo (flussi di lavoro per "big data" - grandi set di dati - che utilizzano la potenza di calcolo di Google Cloud) per confronta il tuo DNA con quello di molti altri individui in tutto il mondo, in questo caso utilizzando come punto di partenza il database 1000 Genome, che comprende 2.504 profili genetici di individui anonimi provenienti da 26 diverse popolazioni mondiali (per maggiori dettagli si veda la sezione delle informazioni aggiuntive di seguito).

In base alla tua somiglianza genetica, i nostri algoritmi informatici fanno previsioni su quale parte dei tuoi antenati proviene da diverse parti del mondo e da quale.

È importante collocare i risultati in un contesto globale . Alcune persone in tutto il mondo hanno antenati unici della regione da cui provengono, ma molte altre hanno antenati misti che possono riflettere modelli di migrazione umana in un lontano passato o in tempi recenti (come avere un genitore di un paese diverso o addirittura di un continente diverso).

ADNTRO ha collaborato con il Dr. Joshua Banta, Professore di Biologia presso l'Università del Texas a Tyler, che studia e pubblica sulla genetica delle popolazioni naturali, utilizzando i Big data per fornirvi un strumento visivo che colloca i tuoi risultati genetici in un contesto globale.

Se ci soffermiamo un po' di più sulla metodologia, vogliamo dirvi che utilizziamo un algoritmo di factoring a matrice non negativo (sNMF) implementato dalla funzione 'snmf' dal pacchetto LEA appartenente al linguaggio di programmazione R. Questo algoritmo stima i contributi al genoma di ipotetici gruppi ancestrali di ciascun individuo nell'analisi, sulla base delle somiglianze/differenze genetiche delle sequenze di DNA tra loro.

Per trovare il numero ottimale di gruppi ancestrali (K), sono stati simulati diversi numeri di ipotetici antenati e le diverse simulazioni sono state confrontate per determinare quale si adatta meglio ai dati con cui abbiamo trattato e, quindi, quale numero di gruppi K dovrebbe essere utilizzato. per questo nuovo strumento. Abbiamo testato diversi numeri di gruppi K, tra 5 e 12, utilizzando il criterio di entropia della funzione sNMF, che valuta la qualità dell'adattamento del modello statistico ai dati utilizzando una tecnica di convalida incrociata (Vedi informazioni aggiuntive (1)).

Il modello con un certo numero di gruppi K è favorito quando il criterio dell'entropia è minimizzato (Vedi informazioni aggiuntive (2)).

Sulla base di questi criteri, troviamo che il numero ottimale di gruppi K è 5 (Figura 1).

Per maggiori dettagli sulle modalità è possibile consultare le informazioni aggiuntive a fine articolo).

Figura 1. Il numero di gruppi ancestrali è ottimale per un valore di cinque. L'entropia è ridotta al minimo quando il valore di K è cinque, dove cinque è il numero che meglio si adatta ai nostri dati.

LA TUA COMPOSIZIONE DI ANTENATI A LIVELLO GEOGRAFICO

Questi cinque gruppi ancestrali possono essere descritti visivamente come antenati dell'Africa (rappresentata in rosso), America (rappresentata in verde), Europa (rappresentata in azzurro), Asia orientale (rappresentata in giallo) e Asia meridionale (rappresentata in blu scuro). .

Per ottenere il contributo di questi gruppi ancestrali nel tuo DNA, eseguiamo l'analisi con i dati di 1000 genomi insieme ai tuoi dati per generare i risultati che includono i tuoi antenati in un contesto globale (Figura 2). I risultati vengono visualizzati come un "diagramma a barre impilate", con una freccia che indica dove ti trovi rispetto al resto del grafico che rappresenta i risultati delle persone di 1000 genomi:

Figura 2. Un grafico a barre sovrapposte che mostra le persone del database mondiale del DNA di 1000 genomi insieme al tuo profilo DNA (indicato da una freccia rossa). La freccia si sposterà in base al tuo profilo DNA, ecco un esempio. Il grafico è composto da piccole barre che salgono e scendono verticalmente. Ognuna di queste barre rappresenta un diverso individuo di 1000 genomi insieme ai tuoi risultati ADNTRO. I diversi antenati che un individuo comprende sono indicati da colori diversi sulla barra verticale della persona. Più hai di un colore, più percentuale avrai di quel gruppo ancestrale.

Questo grafico può essere compreso più facilmente se "ingrandiamo" sui tuoi risultati e sulla media degli individui di 1000 Genomi del tuo gruppo ancestrale a cui corrispondi maggiormente. Con questo, sarai in grado di vedere più chiaramente il modello dei gruppi ancestrali, cioè il contributo di diversi antenati al tuo DNA (Figura 3).

Figura 3. Lo stesso diagramma a barre dme impilato della Figura 2 ingrandito per i risultati e la media degli individui di 1000 G del tuo gruppo ancestrale di maggioranza.

Ancora, ogni colonna multicolore rappresenta un riferimento individuale diverso rispetto a te, e gli individui in questo esempio hanno colori misti "impilati" uno sopra l'altro a causa di piccole quantità di antenati misti. È interessante notare che, se si esamina attentamente la figura 2, si vedrà che i profili genetici dei popoli d'America sono quelli con la maggiore variabilità.

Ci sono molti individui che hanno un'ascendenza sostanziale associata all'Europa (azzurro), così come contributi sostanziali associati all'ascendenza africana (rosso). Ciò riflette la complessa storia dei popoli africani con la tratta degli schiavi e con i popoli delle Americhe, dove le popolazioni indigene si mescolavano con i coloni europei.

MODELLI ANCESTRALI

Se fai già parte della community di ADNTRO, saprai che ci piace andare oltre, essere creativi e offrire ai nostri utenti risultati innovativi. Per questo motivo abbiamo sviluppato un visualizzatore comparativo di modelli ancestrali basati su correlazioni. Utilizzo dei dati di 1000 genomi e la tua l'abbiamo analizzata quanto è simile e quanto è diverso il tuo DNA dal DNA "tipico" delle 26 diverse popolazioni di 1000 genomi.

Questo è un nuovo modo di guardare ai tuoi antenati. Le aree del grafico (Figura 4) che vedi più in alto sono le popolazioni con cui condividi un gran numero di marcatori specifici presenti in quella popolazione. Al contrario, le aree più basse del grafico rappresentano quelle popolazioni con le quali si presenta la minore somiglianza.

In ADNTRO ci piace offrire nuove angolazioni e innovare, tenendo sempre presente l'importanza di comprendere il proprio DNA nel suo insieme; questo è ciò ti consente di ottenere il tuo modello ancestrale e confrontarlo con diversi modelli ancestrali in tutto il mondo. Qualcosa di senza precedenti nel mondo di test genetico direttamente al consumatore di oggi.

Figura 4. Confronto tra il modello africano “tipico” con il tuo. Questo grafico è un esempio in cui utilizziamo un campione europeo. Tuttavia, il modello cambierà in base alle tue informazioni genetiche. Allo stesso modo, puoi modificare le popolazioni di riferimento con cui vuoi confrontarti.

Il fatto che il tuo modello assomigli molto a popolazioni simili a te è molto normale. Due individui europei, ad esempio, hanno uno schema molto simile se lo guardiamo nel suo insieme e presentano solo piccole differenze che vale la pena esplorare (le differenze sono così piccole che dovremmo esagerarle su una scala logaritmica).

È importante tenere a mente che il fatto che il tuo modello abbia una somiglianza molto elevata con un'altra persona non significa che sei imparentato a livello familiare , ma che il tuo modello ancestrale è molto simile perché presenti antenati comuni .

Ma questo non finisce qui! Ti diremo anche con quali popolazioni di 1000 Genomi assomigli di più e con quali presenti una differenza maggiore. Inoltre, se sei già cliente ADNTRO, potrai caricare il tuo pattern insieme a una popolazione di riferimento e un alias, per poterlo condividere con altri pattern nel mondo non inclusi nel database 1000G.

Ti piace questo strumento? Sei curioso di conoscere il tuo modello ancestrale in un contesto globale? Vuoi essere in grado di confrontarlo con gli altri? Entra in ADNTRO 😊, acquista il tuo kit o carica il tuo “Raw” e scoprilo!

INFORMAZIONI AGGIUNTIVE

(1) Puoi consultare la pagina 926 del Articolo, nella prima colonna, in fondo alla pagina, nella sezione "Analisi della struttura della popolazione")

(2) Potete consultare la pagina 927 del Articolo, alla fine.

Maggiori dettagli sui metodi: Sia per i set di dati 1000 Genomes che per i tuoi risultati, filtriamo il nostro database di polimorfismi (SNP) per rimanere solo con quelli biallelici, con un MAF ≥ 0,05 e con una spaziatura di almeno 2kb.

Quali popolazioni include il progetto 1000 Genomes? :

it_ITItaliano