Two-Tower-Modell
Eine Architektur mit zwei separaten Encodern (User-Tower, Item-Tower), deren Embeddings per Ähnlichkeitssuche effizient gematcht werden.
Two-Tower-Modelle encodieren User und Items separat und matchen per Ähnlichkeitssuche – die Standardarchitektur für RecSys bei Milliarden Items.
Erklärung
Jeder Tower erzeugt unabhängig Embeddings. Zur Inferenz werden Item-Embeddings vorberechnet und via ANN (Approximate Nearest Neighbor) effizient durchsucht. Skaliert auf Milliarden Items.
Relevanz für Marketing
Two-Tower ist die Standard-Architektur für die Kandidaten-Generierung in großen RecSys (YouTube, Google, Meta).
Beispiel
Google Search nutzt Two-Tower für Anzeigen-Retrieval: User-Kontext und Anzeigen-Features werden separat encodiert, dann per ANN gematcht.
Häufige Fallstricke
Dot-Product-Interaktion ist weniger ausdrucksstark als Cross-Attention. Negative Sampling Strategie ist entscheidend.
Entstehung & Geschichte
YouTube (Covington et al., 2016) popularisierte die Architektur. Google veröffentlichte 2019 den Dual-Encoder für Retrieval. Meta's DLRM und Googles TF-Ranking formalisierten Two-Tower als Industry-Standard.
Abgrenzung & Vergleiche
Two-Tower-Modell vs. Cross-Encoder
Cross-Encoder verarbeitet User+Item gemeinsam (genauer, aber langsam); Two-Tower encodiert separat (schnell, skalierbar).