Strategien zur Überwindung des Sparsity Problems in erklärbaren Empfehlungssystemen für Werbeanzeigen

  • Daniel Stütz

    Studienabschlussarbeit: Masterarbeit

    Abstract

    Durch die wachsende Menge an digitalen Angeboten werden Empfehlungssysteme immer wichtiger, um User*innen personalisierte Empfehlungen für Items zu liefern und sie
    somit in der Auswahl von Items zu unterstützen. Das Sparsity Problem im Bereich von
    Empfehlungssystemen entsteht durch die geringe Menge an User*innen, welche Items
    bewerten. Bei einer geringen Anzahl an Feedback für Items ist es für Empfehlungssysteme schwierig, relevante personalisierte Empfehlungen für User*innen zu erstellen.
    Außerdem stellen Items mit einer kurzen Gültigkeit eine Herausforderung dar, da diese
    nur innerhalb einer bestimmten Zeitspanne empfohlen werden können.
    Diese Arbeit zeigt Strategien zur Überwindung des Sparsity Problems auf, indem Zusatzinformationen über User*innen in die ursprünglichen Interessenswerte eingebunden
    werden. Dafür wird implizites Feedback in eine numerische Interessens-Repräsentation
    transformiert. Des Weiteren werden maschinelle Lernverfahren eingesetzt, welche auf
    Basis von bekannten Interessen eines*einer User*in Interessenswerte für andere Kategorien vorhersagen können. Die verwendeten Methoden zur Vorhersage der Interessensinformation für User*innen sind Korrelationskoeffizienten, Matrixfaktorisierung, Singulärwertzerlegung, Assoziationsregeln, lineare Regression, Entscheidungsbäume, Gradient Boosting und Random Forest. Außerdem wird eine Möglichkeit erläutert, wie für
    User*innen, über welche keine Interessen bekannt sind, Empfehlungen erstellt werden
    können.
    Zur Auswertung der entwickelten Strategien wird neben einer Offline-Evaluierung
    auch eine Online-Evaluierung durchgeführt, indem die entwickelten Methoden auf französischen User*innen getestet werden. Dafür wurden zwei A/B-Tests mit einer Laufzeit
    von je 14 Tagen durchgeführt. Beim ersten Test wird zwischen der Standard Itemreihung in Gruppe A und einer zufälligen Itemreihung in Gruppe B unterschieden. Der
    zweite Test erstellt in Gruppe A Empfehlungen auf Basis der Informationen, welche
    von User*innen gesammelt und in Interessenswerte transformiert werden, während in
    Gruppe B diese Interessenswerte um weitere Kategorien angereichert werden, um neue
    interessante Kategorien für den*die User*in zu ermitteln. Es konnte eine signifikante
    Steigerung der durchschnittlichen Anzahl von Klicks auf Items durch die entwickelten
    Strategien im Vergleich zu Standard bzw. randomisierten Empfehlungen erreicht werden. Außerdem kann durch die Anreicherung der Interessen von User*innen eine erhöhte
    Anzahl von Klicks um 5 % festgestellt werden.
    Datum der Bewilligung2024
    OriginalspracheDeutsch (Österreich)
    Betreuer/-inUlrich Bodenhofer (Betreuer*in)

    Zitieren

    '