Textklassifikation
Die automatische Zuordnung von Texten zu vordefinierten Kategorien durch ein ML-Modell.
Text Classification ordnet Texte automatisch Kategorien zu – von Spam-Erkennung über Intent Detection bis Content-Moderation, heute meist mit Transformer-Modellen.
Erklärung
Text Classification umfasst Spam-Erkennung, Topic Labeling, Intent Detection und Sentiment Analysis als Spezialfall.
Relevanz für Marketing
Text Classification automatisiert Content-Routing, Support-Ticket-Triage, Spam-Filterung und Content-Moderation.
Beispiel
Ein Support-System klassifiziert eingehende Tickets automatisch nach Kategorie (Billing, Technical, Feature Request) und Priorität.
Häufige Fallstricke
Class Imbalance verzerrt Ergebnisse. Domänen-Shift zwischen Training und Produktion. Multi-Label vs Single-Label nicht klar definiert.
Entstehung & Geschichte
Naive Bayes war der erste populäre Textklassifikator (1990er). SVMs dominierten 2000-2012. BERT (2018) setzte neue Standards. Zero-Shot Classification mit LLMs (2020+) ermöglicht Klassifikation ohne Training.
Abgrenzung & Vergleiche
Textklassifikation vs. Sentiment Analysis
Sentiment Analysis ist ein Spezialfall von Text Classification mit Stimmung als Kategorie.
Textklassifikation vs. Named Entity Recognition
Text Classification gibt ein Label pro Text; NER gibt Labels auf Token-/Wort-Ebene.