Titelaufnahme

Titel
Scalable Data Analysis of Mitochondrial DNA in the Era of High-Throughput Data Generation
VerfasserWeissensteiner, Hansi
GutachterSpecht, Günther
Erschienen2017
HochschulschriftInnsbruck, Univ., Diss., 2017
Anmerkung
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft
Datum der AbgabeJuli 2017
SpracheEnglisch
DokumenttypDissertation
Schlagwörter (DE)Bioinformatik / paralleles Rechnen / Phylogenie / mitochondriale DNA / mtdna / Next-Generation Sequenzierung / NGS / Alignment / k-mer / Hash-Tabelle / Analyse / MapReduce / Hadoop / Kontamination / DNS / Haplogruppen / haplogrep / mtdna-server
Schlagwörter (EN)Bioinformatics / distributed computing / phylogenetic / mitochondrial DNA / mtdna / Next-Generation Sequencing / NGS / alignment / k-mer / Hash-Table / analysis / MapReduce / Hadoop / contamination / DNA / haplogroups / haplogrep / mtdna-server
Zugriffsbeschränkung
 Das Dokument ist ausschließlich in gedruckter Form in der Bibliothek vorhanden.
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Computergestützte Methoden nehmen eine zusehends wichtigere Rolle im Bereich der Genetik ein; hier spielen vor allem die Reproduzierbarkeit von Ergebnissen und Qualitätskontrolle eine große Bedeutung. Dies gilt insbesondere für die Analyse mitochondrialer DNA (mtDNA), welche in einer Vielzahl von Disziplinen von essenzieller Bedeutung ist: unter anderem um genetische Ereignisse in der Evolution zu rekonstruieren, in der Forensik zum identifizieren von Personen oder sterblichen Überresten, sowie in klinischen Studien, in der Forschung und in Therapie-Ansätzen. Mit der steigende Anzahl von genetischen Daten, welche durch neue Hochdurchsatz-Methoden mit steigendem Datenvolumen in immer größeren Studienkollektiven produziert werden, steigt auch die Fehlerwahrscheinlichkeit und erfordert neue Methoden zur Qualitätskontrolle. Die vorliegende Arbeit beschäftigt sich mit Algorithmen und Methoden für Sequenzalignment, Klassifizierung von mtDNA Daten, parallelen Ansätzen zum Mapping von mtDNA Sequenzdaten sowie Detektion und Annotation von Mutationen. Mit Hilfe phylogenetischer Cluster, Haplogruppen genannt, wird ein neues Verfahren zur Qualitätskontrolle sowie zur Detektion von Kontaminationen in mtDNA Daten vorgestellt. Die hier vorgestellten Ansätze und Werkzeuge werden von Forschern und Firmen zur Auswertung und Qualitätskontrolle von mtDNA Daten weltweit eingesetzt. Durch Verwendung dieser Methoden kann einer Veröffentlichung von falschen und irreführenden Ergebnissen vorgebeugt werden.

Zusammenfassung (Englisch)

Computational methods are progressively required for data reproducibility and quality control in Genetics. This is especially true for mitochondrial DNA (mtDNA), which is used in a variety of disciplines, from archeogenetics, population- and forensic genetics or as well as clinical disease association studies. New methods for data generation increase the sample output and the data volume per sample, requiring sophisticated computational methods for quality control. This work presents new algorithms and workflows to manage and analyze mtDNA data derived from high-throughput devices, like massive parallel sequencing data. One central aspect of this thesis is the classification of mtDNA data to phylogenetic clusters, used for mtDNA quality control and for detection of contamination patterns. Subsequently all required computational steps from sequence alignment, mapping, mutation detection, annotation and quality control are presented. To process the huge amount of data, all algorithms were parallelized within this work. The developed tools help researchers working with mtDNA data on a daily base with in-depth quality control and are highly accepted by the community. Additionally contamination can be uncovered in massive parallel sequencing studies, where mtDNA data is available to prevent false and misleading results.data is available to prevent false and misleading results.