Die Zusammensetzung der Vorfahren | Blog ADNTRO

Die Zusammensetzung der Vorfahren im globalen Kontext

DIE ERGEBNISSE DER GENETISCHEN ZUSAMMENSETZUNG IM GLOBALEN KONTEXT – EINE ZUSAMMENARBEIT MIT DER UNIVERSITÄT „TEXAS AT TYLER“.

Eines der Hauptmerkmale von ADNTRO ist die Beschreibung der Zusammensetzung der Abstammung jedes Individuums (zusammen mit Vitaminstoffwechsel, Sport, Verhalten, Veranlagung für Krankheiten ...) usw., aber alle von uns durchgeführten Analysen haben Inspirationsquelle die besten Studien zu diesem Thema.

Diese alternative Methode der Ahnenanalyse basiert auf einer Veröffentlichung in Nature (einer der renommiertesten wissenschaftlichen Zeitschriften der Welt) und auf der Datenbank 1000 Genomes; Obwohl diese Methodik es uns nicht erlaubt, die detaillierte Aufschlüsselung nach Ländern anzubieten, die wir in unserem ADNTRO-Ahnenrechner anbieten, ist es eine sehr robuste Methode, mit der Sie lernen können, wie die Vorfahren einer Person analysiert werden .

Erreichen die Beschreibung der Abstammungszusammensetzung, verwenden wir Computational Pipelines (Workflows für „Big Data“ – große Datensätze – die die Rechenleistung von Google Cloud nutzen) um Vergleichen Sie Ihre DNA mit der vieler anderer Personen auf der ganzen Welt, in diesem Fall unter Verwendung der 1000 Genome-Datenbank als Ausgangspunkt, die 2.504 genetische Profile von anonymen Individuen aus 26 verschiedenen Weltpopulationen umfasst (weitere Details finden Sie im Abschnitt „Zusätzliche Informationen“ weiter unten).

Basierend auf Ihrer genetischen Ähnlichkeit, unsere Computeralgorithmen machen Vorhersagen über Welcher Teil deiner Vorfahren stammt aus verschiedenen Teilen der Welt und aus welchen.

Es ist wichtig, die Ergebnisse in einen globalen Kontext zu stellen . Einige Menschen auf der ganzen Welt haben Vorfahren, die in der Region, aus der sie stammen, einzigartig sind, aber viele andere haben gemischte Vorfahren , die möglicherweise Muster der menschlichen Migration in der fernen Vergangenheit oder in jüngster Zeit widerspiegeln (z anderer Kontinent).

ADNTRO hat mit dem . zusammengearbeitet Dr. Joshua Banta, Professor für Biologie an der University of Texas in Tyler, der die Genetik natürlicher Populationen untersucht und veröffentlicht und Big Data nutzt, um Ihnen ein visuelles Tool, das Ihre genetischen Ergebnisse in einen globalen Kontext stellt.

Wenn wir ein wenig mehr auf die Methodik eingehen, möchten wir Ihnen sagen, dass wir einen nicht-negativen Matrixfaktorierungsalgorithmus (sNMF) verwenden, der durch die Funktion implementiert wird 'snmf' aus dem LEA-Paket gehört zur Programmiersprache R. Dieser Algorithmus schätzt die Beiträge zum Genom hypothetischer Ahnengruppen jedes Individuums in der Analyse, basierend auf den genetischen Ähnlichkeiten / Unterschieden der DNA-Sequenzen untereinander.

Um die optimale Anzahl von Vorfahrengruppen (K) zu finden, wurden verschiedene Anzahlen von hypothetischen Vorfahren simuliert und die verschiedenen Simulationen verglichen, um zu bestimmen, welche am besten zu den von uns behandelten Daten passt und daher welche Anzahl von K-Gruppen verwendet werden sollte. für dieses neue Werkzeug. Wir testeten verschiedene Anzahlen von K-Gruppen zwischen 5 und 12 unter Verwendung des Entropiekriteriums der sNMF-Funktion, die die Qualität der Anpassung des statistischen Modells an die Daten mithilfe einer Kreuzvalidierungstechnik bewertet (siehe zusätzliche Informationen (1)).

Das Modell mit einer bestimmten Anzahl von K-Gruppen wird bevorzugt, wenn das Entropiekriterium minimiert wird (siehe Zusatzinformationen (2)).

Basierend auf diesen Kriterien stellen wir fest, dass die optimale Anzahl von K-Gruppen 5 beträgt (Abbildung 1).

Weitere Informationen zu den Methoden finden Sie in den zusätzlichen Informationen am Ende des Artikels).

Abbildung 1. Die Anzahl der Ahnengruppen ist für einen Wert von fünf optimal. Die Entropie wird minimiert, wenn der Wert von K fünf ist, wobei fünf die Zahl ist, die am besten zu unseren Daten passt.

IHRE ZUSAMMENSETZUNG DER ANSÄTZE AUF GEOGRAFISCHER EBENE

Diese fünf Ahnengruppen können visuell als Vorfahren von Afrika (dargestellt in Rot), Amerika (dargestellt in Grün), Europa (dargestellt in Hellblau), Ostasien (dargestellt in Gelb) und Südasien (dargestellt in Dunkelblau) beschrieben werden. .

Um den Beitrag dieser Ahnengruppen in Ihrer DNA zu erhalten, Wir führen die Analyse mit den Daten von 1000 Genome zusammen mit Ihren Daten, um die Ergebnisse zu generieren, die Ihre Vorfahren in einem globalen Kontext einbeziehen (Figur 2). Die Ergebnisse werden als "gestapeltes Balkendiagramm" angezeigt, wobei ein Pfeil anzeigt, wo Sie im Verhältnis zum Rest des Diagramms stehen, das die Ergebnisse der Personen von darstellt 1000 Genome:

Abbildung 2. Ein gestapeltes Balkendiagramm mit Personen aus der weltweiten DNA-Datenbank von 1000 Genome zusammen mit Ihrem DNA-Profil (gekennzeichnet durch einen roten Pfeil). Der Pfeil bewegt sich basierend auf Ihrem DNA-Profil, hier ist ein Beispiel. Der Chart besteht aus kleinen Balken, die vertikal nach oben und unten verlaufen. Jeder dieser Balken repräsentiert ein anderes Individuum von 1000 Genome zusammen mit Ihren ADNTRO-Ergebnissen. Die verschiedenen Vorfahren, die eine Person umfasst, werden durch unterschiedliche Farben auf dem vertikalen Balken der Person angezeigt. Je mehr Farbe Sie haben, desto mehr Prozent haben Sie von dieser Ahnengruppe.

Diese Grafik lässt sich besser verstehen, wenn wir auf Ihre Ergebnisse und auf den Durchschnitt der Individuen von 1000 Genomen Ihrer Vorfahrengruppe, der Sie am meisten entsprechen, "zoomen". Damit können Sie das Muster der Ahnengruppen, dh den Beitrag verschiedener Vorfahren zu Ihrer DNA, deutlicher sehen (Abbildung 3).

Abbildung 3. Das gleiche gestapelte dme-Balkendiagramm von Abbildung 2 vergrößert für Ihre Ergebnisse und den Mittelwert der Individuen von 1000G Ihrer Mehrheits-Ahnengruppe.

Wieder, jede mehrfarbige Spalte stellt eine andere individuelle Referenz gegenüber Ihnen dar, und die Individuen in diesem Beispiel haben gemischte Farben, die aufgrund geringer Mengen gemischter Abstammung übereinander "gestapelt" sind. Interessanterweise werden Sie bei sorgfältiger Betrachtung von Abbildung 2 feststellen, dass die genetischen Profile der Völker Amerikas die größte Variabilität aufweisen.

Es gibt viele Personen, deren Vorfahren mit Europa (hellblau) verbunden sind, sowie wesentliche Beiträge, die mit afrikanischen Vorfahren (rot) verbunden sind. Dies spiegelt die komplexe Geschichte der afrikanischen Völker mit dem Sklavenhandel und den Völkern Amerikas wider, wo sich indigene Völker mit europäischen Siedlern vermischten.

Ahnenmuster

Wenn Sie bereits Teil der ADNTRO-Community sind, wissen Sie, dass wir gerne weiter gehen, kreativ sind und unseren Nutzern innovative Ergebnisse bieten. Aus diesem Grund haben wir a vergleichender Betrachter von Ahnenmustern basierend auf Korrelationen. Daten von verwenden 1000 Genome und deine haben wir analysiert wie ähnlich und wie unterschiedlich ist Ihre DNA von der "typischen" DNA der 26 verschiedenen Populationen von 1000 Genome.

Dies ist eine neue Art, Ihre Vorfahren zu betrachten. Die Bereiche des Diagramms (Abbildung 4), die Sie am höchsten sehen, sind die Populationen, mit denen Sie eine große Anzahl spezifischer Marker teilen, die in dieser Population vorhanden sind. Im Gegenteil, die untersten Bereiche des Diagramms stellen die Populationen dar, mit denen Sie die geringste Ähnlichkeit aufweisen.

Bei ADNTRO bieten wir gerne neue Perspektiven und Innovationen, wobei wir immer daran denken, wie wichtig es ist, Ihre DNA als Ganzes zu verstehen. das ist was ermöglicht es Ihnen, Ihr Ahnenmuster zu erhalten und es mit verschiedenen Ahnenmustern weltweit zu vergleichen. Etwas noch nie dagewesenes in der Welt von Gentest heute direkt an den Verbraucher.

Abbildung 4. Vergleich des „typischen“ afrikanischen Musters mit Ihrem. Diese Grafik ist ein Beispiel, in dem wir eine europäische Stichprobe verwenden. Das Muster ändert sich jedoch entsprechend Ihrer genetischen Informationen. Auf dieselbe Weise können Sie die Referenzpopulationen ändern, mit denen Sie sich selbst vergleichen möchten.

Die Tatsache, dass Ihr Muster sehr ähnlichen Populationen ähnelt wie Sie, ist ganz normal. Zwei europäische Individuen haben zum Beispiel ein sehr ähnliches Muster, wenn wir es als Ganzes betrachten und nur kleine Unterschiede darstellen, die es wert sind, untersucht zu werden (die Unterschiede sind so klein, dass wir sie logarithmisch übertreiben müssten).

Es ist wichtig, dass Sie bedenken, dass die Tatsache, dass Ihr Muster eine sehr hohe Ähnlichkeit mit einer anderen Person aufweist, nicht bedeutet, dass Sie auf Familienebene verwandt sind , sondern dass Ihr Ahnenmuster sehr ähnlich ist, weil Sie gemeinsame Vorfahren haben .

Aber damit ist noch nicht Schluss! Wir werden Ihnen auch sagen, mit welchen Populationen von 1000 Genomen Sie am meisten ähneln und mit welchen Sie einen größeren Unterschied aufweisen. Wenn Sie bereits ADNTRO-Kunde sind, können Sie Ihr Muster zusammen mit einer Referenzpopulation und einem Alias hochladen, um es mit anderen Mustern in der Welt zu teilen, die nicht in der 1000G-Datenbank enthalten sind.

Gefällt Ihnen dieses Werkzeug? Sind Sie neugierig, Ihre Vorfahrenmuster in einem globalen Kontext zu kennen? Möchten Sie es mit anderen vergleichen? Geben Sie ADNTRO 😊 ein, kaufen Sie Ihr Kit oder laden Sie Ihr „Raw“ hoch und finden Sie es heraus!

WEITERE INFORMATIONEN

(1) Sie können Seite 926 des Artikel, in der ersten Spalte, unten auf der Seite, im Abschnitt "Analyse der Bevölkerungsstruktur")

(2) Sie können Seite 927 des Artikel, schlussendlich.

Mehr Details zu den Methoden: Sowohl für die 1000 Genome Datensätze als auch für Ihre eigenen Ergebnisse filtern wir unsere Datenbank der Polymorphismen (SNPs) so, dass sie nur bei solchen bleiben, die biallelisch sind, mit einem MAF ≥ 0,05 und mit einem Abstand von mindestens 2kb.

Welche Populationen umfasst das 1000- Genome-Projekt? :

de_DEDeutsch