Abstract
Diese Masterarbeit befasst sich mit der Untersuchung der grundlegenden Eigenschaftenvon Automated Machine Learning (AutoML) und dessen Abgrenzung zu traditionellen
Methoden des maschinellen Lernens (ML). Die zentrale Forschungsfrage ist, wie die drei
AutoML-Bibliotheken Auto-sklearn, TPOT und AutoGluon funktionieren und in welcher Weise sie optimiert werden können. Um diese Frage zu beantworten, wurde eine
detaillierte vergleichende Analyse der drei AutoML-Bibliotheken durchgeführt. Die Methodik umfasste eine umfassende Literaturrecherche und die experimentelle Bewertung
der Bibliotheken anhand von binären Klassifikations- und Regressionsaufgaben, wobei
besonderes Augenmerk auf das Optimierungspotenzial der einzelnen Bibliotheken durch
Datenvorverarbeitung gelegt wurde.
Der Versuch, die AutoML-Bibliotheken durch Datenvorverarbeitung zu optimieren, zeigte, dass nicht jede Art der Vorverarbeitung geeignet ist. Es konnte festgestellt werden,
dass die traditionelle Vorverarbeitungsschritte LDA und kPCA zu schlechteren Ergebnissen führten, als wenn die Modelle auf den originalen Daten trainiert wurden. Ebenso
wurde gezeigt, dass herkömmliche Vorverarbeitungsschritte bei der Klassifikationsaufgabe zu den besten Ergebnissen führten.
So lässt sich sagen, dass die Datenvorverarbeitung Möglichkeiten bietet, die Ergebnisse
von AutoML zu verbessern, jedoch mit Vorsicht angewendet werden sollte. Diese Erkenntnisse bieten Einblicke für weitere Optimierungen und Entwicklungen im Bereich
AutoML.
| Datum der Bewilligung | 2024 |
|---|---|
| Originalsprache | Englisch (Amerika) |
| Betreuer/-in | Bogdan Burlacu (Betreuer*in) |
Studiengang
- Human-Centered Computing