Strategien zur Überwindung des Sparsity Problems in erklärbaren Empfehlungssystemen für Werbeanzeigen

  • Daniel Stütz

Studienabschlussarbeit: Masterarbeit

Abstract

Durch die wachsende Menge an digitalen Angeboten werden Empfehlungssysteme immer wichtiger, um User*innen personalisierte Empfehlungen für Items zu liefern und sie
somit in der Auswahl von Items zu unterstützen. Das Sparsity Problem im Bereich von
Empfehlungssystemen entsteht durch die geringe Menge an User*innen, welche Items
bewerten. Bei einer geringen Anzahl an Feedback für Items ist es für Empfehlungssysteme schwierig, relevante personalisierte Empfehlungen für User*innen zu erstellen.
Außerdem stellen Items mit einer kurzen Gültigkeit eine Herausforderung dar, da diese
nur innerhalb einer bestimmten Zeitspanne empfohlen werden können.
Diese Arbeit zeigt Strategien zur Überwindung des Sparsity Problems auf, indem Zusatzinformationen über User*innen in die ursprünglichen Interessenswerte eingebunden
werden. Dafür wird implizites Feedback in eine numerische Interessens-Repräsentation
transformiert. Des Weiteren werden maschinelle Lernverfahren eingesetzt, welche auf
Basis von bekannten Interessen eines*einer User*in Interessenswerte für andere Kategorien vorhersagen können. Die verwendeten Methoden zur Vorhersage der Interessensinformation für User*innen sind Korrelationskoeffizienten, Matrixfaktorisierung, Singulärwertzerlegung, Assoziationsregeln, lineare Regression, Entscheidungsbäume, Gradient Boosting und Random Forest. Außerdem wird eine Möglichkeit erläutert, wie für
User*innen, über welche keine Interessen bekannt sind, Empfehlungen erstellt werden
können.
Zur Auswertung der entwickelten Strategien wird neben einer Offline-Evaluierung
auch eine Online-Evaluierung durchgeführt, indem die entwickelten Methoden auf französischen User*innen getestet werden. Dafür wurden zwei A/B-Tests mit einer Laufzeit
von je 14 Tagen durchgeführt. Beim ersten Test wird zwischen der Standard Itemreihung in Gruppe A und einer zufälligen Itemreihung in Gruppe B unterschieden. Der
zweite Test erstellt in Gruppe A Empfehlungen auf Basis der Informationen, welche
von User*innen gesammelt und in Interessenswerte transformiert werden, während in
Gruppe B diese Interessenswerte um weitere Kategorien angereichert werden, um neue
interessante Kategorien für den*die User*in zu ermitteln. Es konnte eine signifikante
Steigerung der durchschnittlichen Anzahl von Klicks auf Items durch die entwickelten
Strategien im Vergleich zu Standard bzw. randomisierten Empfehlungen erreicht werden. Außerdem kann durch die Anreicherung der Interessen von User*innen eine erhöhte
Anzahl von Klicks um 5 % festgestellt werden.
Datum der Bewilligung2024
OriginalspracheDeutsch (Österreich)
Betreuer/-inUlrich Bodenhofer (Betreuer*in)

Zitieren

'