Abstract
In den letzten Jahren führten die Fortschritte in den Analysetechnologien von DNA, RNA und Proteinen zu verbesserten Möglichkeiten zur Quantifizierung und Dekodierung von Nukleotid- bzw. Aminosäuresequenzen. Insbesondere Hochdurchsatztechnologien in den Bereichen Genomik, Transkriptomik und Proteomik führten zu großen Datenmengen und enormen Möglichkeiten in der biologischen und medizinischen Forschung. Dementsprechend steigt auch der Bedarf an leistungsfähigen, bioinformatischen Algorithmen und Pipelines.In ihrer Forschung konzentrierte sich die Autorin dieser Arbeit auf die Entwicklung effizienter Algorithmen und Frameworks für die Analyse von krankheitsassoziierten Genomdaten, gemessen mittels Next-Generation-Sequencing (NGS) oder Microarrays. Das Resultat sind zwei Frameworks: eines für die Analyse von Immunrepertoire-NGS-Daten mit Unique Molecular Identifiers (UMIs) und eines für NGS-Daten einzelner Gene mit UMI-Tags, sowie ein Workflow für die Verarbeitung und Analyse von Genexpressionsdaten. Die Entwicklung dieser drei effizienten Datenverarbeitungspipelines zielt darauf ab, Reproduzierbarkeit und Transparenz sicherzustellen. Insbesondere der ImmunoDataAnalyzer (IMDA) ermöglicht die automatisierte Verarbeitung von NGS-Daten des Immunrepertoires; das Interface for Point Mutation Identification (IMPI) ermöglicht die Identifizierung von Punktmutationen, und der Genexpressionsanalyse-Workflow dient der automatisierten Evaluierung von öffentlich verfügbaren Genexpressionsdatensätzen aus NCBI's Gene Expression Omnibus (GEO). Jedes Framework wurde implementiert, um unterschiedliche biologische Forschungsfragen zu beantworten, jedoch wurde jedes so generisch gestaltet, dass eine Nutzung für ähnliche Fragestellungen möglich ist. Darüber hinaus wurden State-of-the-Art-Tools integriert, um die Reproduzierbarkeit zu gewährleisten. Ein zusätzlicher Schwerpunkt wurde auf die Integration von Algorithmen des maschinellen Lernens (ML) bzw. die auf Generierung von geeigneten Output-Formaten für ML-Frameworks gelegt.In der vorliegenden Arbeit werden initial der Kontext definiert und die Ziele der Studien beschrieben. Anschließend wird ein umfassender Überblick über die veröffentlichten Artikel, die in den Anhängen zu finden sind, gegeben. Abschließend werden die Ergebnisse zusammengefasst, diskutiert und ein Ausblick auf zukünftige Forschungsarbeiten gegeben.
Originalsprache | Englisch (Amerika) |
---|---|
Qualifikation | Dr. rer. nat. |
Gradverleihende Hochschule |
|
Betreuer/-in / Berater/-in |
|
Datum der Bewilligung | 22 Mai 2024 |
Publikationsstatus | Veröffentlicht - 22 Mai 2024 |