AI Glossar
Verständliche Erklärungen zu den wichtigsten Begriffen aus KI, Marketing und Technologie.
A
A*-Suche (A-Star Search)
A* (sprich: "A-Stern") ist ein klassischer Suchalgorithmus, der den kürzesten Pfad zwischen einem Start- und Zielknoten in einem Graphen findet, indem er pro Knoten die Gesamtkosten f(n) = g(n) + h(n) minimiert — die Summe aus tatsächlichen Pfadkosten und einer geschätzten Restdistanz (Heuristik).
A/B Testing
Ein Experiment, bei dem zwei Varianten (A und B) verglichen werden, um festzustellen, welche besser performt.
A2A (Agent-to-Agent Protocol)
A2A (Agent-to-Agent) ist ein von Google initiierter offener Standard für die direkte Kommunikation zwischen autonomen KI-Agenten — unabhängig davon, mit welchem Framework (LangChain, OpenAI, Claude, AutoGen) sie gebaut wurden.
A2A Commerce
Handelsmodell, in dem KI-Agenten im Auftrag von Nutzern oder Unternehmen Käufe, Vergleiche und Verhandlungen mit anderen Agenten direkt abwickeln.
A2A Protocol
Googles offener Standard für die Kommunikation zwischen KI-Agenten verschiedener Anbieter – ermöglicht Interoperabilität in Multi-Agent-Systemen.
Abductive Logic Programming (ALP)
Ein Framework in der logischen Programmierung, das bestimmte Prämissen unspezifiziert lässt und plausible Erklärungen für Beobachtungen ableitet.
Abduktives Schlussfolgern
Eine Form der logischen Schlussfolgerung, die von einer Beobachtung ausgeht und die einfachste und wahrscheinlichste Erklärung dafür sucht.
Ablation
In der KI-Forschung bezeichnet Ablation das Entfernen oder Deaktivieren einer Komponente eines Systems, um deren Auswirkung auf die Gesamtleistung zu bewerten.
Absprungrate
Der Prozentsatz der Besucher, die eine Website verlassen, ohne eine weitere Seite zu besuchen.
Abstrakter Datentyp (ADT)
Ein konzeptuelles Modell einer Datenstruktur, das durch sein Verhalten (Operationen und Eigenschaften) definiert ist, nicht durch eine spezifische Implementierung.
Abstraktion
Der Prozess der Vereinfachung von Komplexität durch Fokussierung auf High-Level-Konzepte und Ausblenden von Low-Level-Details.
Accountability
Die Verpflichtung, Verantwortung für KI-Entscheidungen zu übernehmen und deren Auswirkungen erklären zu können.
Action Schema
Action Schema ist eine Erweiterung des schema.org-Vokabulars (PotentialAction, Schema.Action), mit der Websites maschinenlesbar deklarieren, welche Aktionen (Kaufen, Buchen, Reservieren, Subscriben, Kontaktieren) ein Nutzer oder Agent auf der Seite ausführen kann.
Active Learning
ML-Strategie, bei der das Modell die informativsten Samples zum Labeln auswählt.
Actor-Critic
RL-Architektur mit zwei Komponenten: ein Actor (Policy) wählt Aktionen, ein Critic (Value Function) bewertet sie – kombiniert Stärken von Policy Gradient und Value-Based Methods.
Ad Exchange
Ein Ad Exchange ist ein digitaler Marktplatz, der Publisher (Angebot) und Advertiser (Nachfrage) verbindet und Werbeinventar in Echtzeit-Auktionen handelt.
Ad Rank
Googles Wertung, die Position und Sichtbarkeit einer Anzeige in den Suchergebnissen bestimmt.
Adafactor
Memory-effizienter Optimizer, der Adams zweiten Moment durch eine faktorisierte Approximation ersetzt – spart bis zu 50% Optimizer-Memory.
AdaGrad
Optimizer, der die Lernrate pro Parameter adaptiv anpasst – häufig aktualisierte Parameter erhalten kleinere Raten, seltene größere.
Adam Optimizer
Adaptiver Optimierungsalgorithmus mit Momentum und adaptiven Lernraten.
AdamW
Korrigierte Variante des Adam-Optimizers, die Weight Decay vom Gradientenupdate entkoppelt – der De-facto-Standard für LLM- und Transformer-Training.
Adaptiver Algorithmus
Ein Algorithmus, der sein Verhalten oder seine Parameter als Reaktion auf die Probleminstanz oder Umgebung während der Ausführung ändert.
Adaptives Lernen
Eine Bildungsmethodik (oft mit KI implementiert), die Lerninhalte und -tempo an die individuellen Bedürfnisse und Leistungen jedes Lernenden anpasst.
Adaptives Neuro-Fuzzy-Inferenzsystem (ANFIS)
Ein hybrides System, das neuronale Netze und Fuzzy-Logik kombiniert, um aus Daten zu lernen und dabei menschenähnliches Reasoning anzuwenden.
Admissible Heuristik (Admissible Heuristic)
Eine Heuristik h(n) heißt admissible (zulässig), wenn sie die tatsächlichen Restkosten vom Knoten n bis zum Ziel niemals überschätzt — sie liefert also stets eine optimistische untere Schranke. Diese Eigenschaft garantiert, dass Suchalgorithmen wie A* einen optimalen Pfad finden.
Adversarial Attacks
Gezielte Manipulationen von Inputs, die KI-Systeme zu Fehlklassifikationen oder falschem Verhalten bringen.
Adversarielle Robustheit
Die Fähigkeit eines ML-Modells, korrekte Vorhersagen zu liefern, auch wenn Eingaben gezielt manipuliert werden.
AEO (Answer Engine Optimization)
Answer Engine Optimization (AEO) ist die Disziplin, Inhalte und Marken so aufzubereiten, dass sie von KI-getriebenen Antwort-Engines (ChatGPT Search, Perplexity, Google AI Overviews, Claude) als Zitations- oder Antwortquelle ausgewählt werden.
Agent Handoff
Der Prozess, bei dem ein KI-Agent eine Aufgabe an einen anderen spezialisierten Agenten oder an einen Menschen weitergibt.
Agent Loop
Der iterative Zyklus eines KI-Agenten: Beobachten → Denken → Handeln → Ergebnis bewerten → Wiederholen, bis das Ziel erreicht ist.
Agent Memory
Systeme zur Speicherung von Informationen, die KI-Agenten über das Kontextfenster hinaus nutzen können – von Kurzzeit-Scratchpads bis zu persistenten Wissensspeichern.
Agent Orchestration
Koordination und Steuerung mehrerer KI-Agenten, um komplexe Workflows auszuführen, inklusive Aufgabenverteilung, Kommunikation und Fehlerbehandlung.
Agent Swarms
Ein System aus mehreren spezialisierten KI-Agenten, die autonom zusammenarbeiten, Aufgaben untereinander verteilen und koordiniert komplexe Ziele erreichen – inspiriert von Schwarmverhalten in der Natur.
Agent-to-Agent (A2A)
Direkte Kommunikation zwischen autonomen KI-Agenten ohne menschliche Vermittlung – etwa für Verhandlung, Buchung oder Datenaustausch.
Agent-to-Agent Protocol (A2A)
Ein von Google entwickeltes offenes Protokoll, das die Kommunikation und Zusammenarbeit zwischen verschiedenen KI-Agenten standardisiert.
AgentBench
Ein Benchmark zur Bewertung von LLM-Agenten in 8 verschiedenen interaktiven Umgebungen wie Webseiten, Datenbanken, Spielen und Operating Systems.
Agenten-Architektur
Die zugrunde liegende Struktur und Komponenten eines intelligenten Agentensystems, die beschreibt, wie der Agent intern organisiert ist.
Agentic AI
KI-Systeme, die autonom Ziele verfolgen, Entscheidungen treffen, Tools nutzen und mehrstufige Aufgaben ohne kontinuierliche menschliche Anleitung ausführen können.
Agentic Coding
Ein Paradigma, bei dem KI-Agenten autonom Code schreiben, testen, debuggen und iterieren – mit minimaler menschlicher Intervention.
Agentic Commerce
Agentic Commerce bezeichnet eine neue Form des Handels, in der autonome KI-Agenten im Auftrag von Konsumenten oder Unternehmen Bedarfe antizipieren, Optionen vergleichen, verhandeln und Transaktionen ausführen — ohne dass ein Mensch jeden einzelnen Schritt freigibt.
Agentic Engine Optimization (AEO)
Optimierung von Marken, Produkten und APIs für die Auswahl durch autonome KI-Agenten in agentischen Workflows.
Agentic Marketing
Agentic Marketing ist die Praxis, autonome KI-Agenten Marketing-Kampagnen zielbasiert planen, ausführen und optimieren zu lassen — statt vordefinierte Workflows oder Templates abzuarbeiten.
Agentic RAG
Agentic RAG ist eine Weiterentwicklung von Retrieval-Augmented Generation, bei der ein KI-Agent dynamisch entscheidet, wann, welche und wie viele Quellen er abfragt — anstatt einer starren Retrieval-Pipeline mit fester Top-k-Vektorsuche zu folgen.
Agentic Security
Multi-Agent-Systeme, die Bedrohungen autonom erkennen, triagieren und neutralisieren – jenseits klassischer SOC-Automatisierung.
AI Abundance Economy
Wirtschaftsmodell, in dem KI Produktionskosten für Wissen, Software und Content gegen Null treibt und Knappheit primär bei Energie, Compute und Aufmerksamkeit liegt.
AI Act Compliance
Operationelle Umsetzung der Anforderungen der EU AI Act in Unternehmen – von Risikoklassifizierung bis Logging-Pflichten.
AI Agent (KI-Agent)
Ein autonomes Software-System, das KI nutzt, um Aufgaben selbstständig zu planen und auszuführen.
AI Agents
Autonome AI-Systeme, die selbstständig Ziele verfolgen, Pläne erstellen, Tools nutzen und mit der Umgebung interagieren – über einfache Prompt-Response hinaus.
AI Agents Frameworks
Software-Frameworks und Bibliotheken, die die Entwicklung von autonomen KI-Agenten vereinfachen, indem sie vorgefertigte Komponenten für Planung, Tool-Nutzung, Gedächtnis und Orchestrierung bereitstellen.
AI Agents für Search
Autonome AI-Systeme, die komplexe Recherchen durchführen – mehrere Quellen durchsuchen, synthetisieren, Schlüsse ziehen.
AI Alignment
Das Forschungsfeld und die Praxis, KI-Systeme so zu entwickeln, dass sie menschliche Werte, Absichten und Ziele verstehen und zuverlässig verfolgen.
AI Art
Visuelle Kunst, die ganz oder teilweise durch KI-Systeme erstellt wird – von Prompt-basierter Bildgenerierung bis zu interaktiven Installationen.
AI Avatare
Computergenerierte, fotorealistische digitale Menschen, die per KI animiert werden und beliebige Inhalte präsentieren können.
AI Code Review
KI-gestützte automatische Überprüfung von Code-Änderungen auf Bugs, Sicherheitslücken, Best Practices und Stil.
AI Coding Assistants
KI-gestützte Tools, die Entwickler bei der Programmierung unterstützen – von Autocomplete über Code-Generierung bis hin zu kompletten Feature-Implementierungen.
AI Debugging
Die Nutzung von KI zur automatischen Identifikation, Analyse und Behebung von Software-Fehlern.
AI Developer Tools
Das Ökosystem von AI-gestützten Tools, die Softwareentwicklung auf allen Ebenen unterstützen und beschleunigen.
AI Discovery
AI-Systeme, die proaktiv relevante Inhalte, Produkte oder Informationen empfehlen – ohne explizite Suchanfrage.
AI Ethics
Das interdisziplinäre Feld, das moralische Prinzipien, Werte und Richtlinien für die Entwicklung, den Einsatz und die Auswirkungen von KI-Systemen auf Gesellschaft und Individuen untersucht.
AI Gateway
Middleware-Schicht zwischen Anwendungen und KI-Modell-APIs für Routing, Monitoring, Rate-Limiting und Caching.
AI Governance Board
Interdisziplinäres Unternehmensgremium, das KI-Strategie, Risikoentscheidungen, Use-Case-Freigaben und Compliance steuert.
AI Influencer
Vollständig KI-generierte Persönlichkeit mit konsistentem Erscheinungsbild und eigenem Social-Media-Auftritt für Brand-Kooperationen.
AI Observability
Die Praxis der Echtzeit-Überwachung, Evaluierung und Fehlerbehebung von KI-Systemen in Produktion – von klassischen ML-Modellen bis zu LLM-Anwendungen und autonomen Agenten.
AI Overviews (Google)
AI Overviews sind die KI-generierten Antwortblöcke, die Google seit 2024 oben in den Suchergebnissen einblendet — basierend auf Gemini-Modellen, die mehrere Web-Quellen zusammenfassen und mit Zitationen verlinken.
AI Pair Programming
Programmieransatz bei dem eine AI als "Partner" fungiert – kontinuierlich mitdenkt, vorschlägt und Code reviewt.
AI Red Teaming
Systematisches Testen von KI-Systemen durch ein Angreifer-Team, um Schwachstellen, Bias und Missbrauchspotenzial zu identifizieren.
AI Safety
Das Forschungsfeld, das sich damit beschäftigt, KI-Systeme sicher, kontrollierbar und im Einklang mit menschlichen Werten zu gestalten.
AI Search
Suchmaschinen, die LLMs nutzen, um Anfragen zu verstehen und direkte Antworten statt Link-Listen zu liefern.
AI Search Optimization (AIO)
Strategie zur Maximierung der Markensichtbarkeit über alle KI-Suchoberflächen hinweg – von Antwortmaschinen bis zu agentischen Browsern.
AI Shopping Agent
Ein AI Shopping Agent ist ein autonomes KI-System, das im Auftrag eines Konsumenten Produkte recherchiert, vergleicht, verhandelt und kauft — von einfachen Empfehlungen (Perplexity Shopping) bis zu vollautomatischer Beschaffung mit AP2-Mandat (ChatGPT Operator, Claude Computer Use).
AI Slop
Abwertender Begriff für minderwertige, massenhaft produzierte KI-generierte Inhalte, die das Internet überschwemmen und keinen echten Mehrwert bieten.
AI Watermarking
Techniken zum Einbetten unsichtbarer Markierungen in KI-generierte Inhalte, um deren Herkunft nachweisen und Deepfakes erkennen zu können.
AI-Audit
Die unabhängige Prüfung von KI-Systemen auf Fairness, Bias, Sicherheit, Compliance und Performance durch externe oder interne Auditoren.
AI-Coding
Einsatz von KI-Systemen zur Unterstützung, Beschleunigung und Automatisierung der Softwareentwicklung – von Code-Completion bis Full-Stack-Generierung.
AI-Copyright
Die rechtliche Frage, wem Urheberrechte an KI-generierten Inhalten zustehen und wie Trainingsdaten-Nutzung legal einzuordnen ist.
AI-Developed Zero-Day
Bisher unbekannte Software-Schwachstelle, die von einem KI-System eigenständig identifiziert und/oder ausnutzbar gemacht wurde.
AI-gestützte CDP
Customer Data Platforms mit integrierten AI/ML-Fähigkeiten für automatisierte Segmentierung, Prognosen und Aktivierung.
AI-Haftung
Die rechtliche Verantwortung für Schäden, die durch KI-Systeme verursacht werden, und die Frage, wer haftet: Entwickler, Betreiber oder Nutzer.
AI-Personalisierung
Nutzung von KI, um Marketing-Inhalte, Produkte und Erlebnisse in Echtzeit an individuelle Nutzer anzupassen.
AI-Regulierung
Die Gesamtheit gesetzlicher Vorschriften und Richtlinien, die Entwicklung, Einsatz und Auswirkungen von KI-Systemen regeln.
AI-Risikomanagement
Die systematische Identifikation, Bewertung und Steuerung von Risiken, die durch KI-Systeme entstehen können.
AI-Targeting
Nutzung von KI, um die richtige Zielgruppe für Werbung zu identifizieren und zu erreichen – basierend auf Verhaltens- und Prädiktionsmodellen.
AI-Transparenz
Die Offenlegung, wie KI-Systeme funktionieren, trainiert wurden und Entscheidungen treffen, sowie die Kennzeichnung KI-generierter Inhalte.
Aider Polyglot Benchmark
Coding-Benchmark, der LLMs auf realen Multi-File-Edits in mehreren Programmiersprachen testet.
Aktionsauswahl
Der Prozess, durch den ein intelligenter Agent entscheidet, welche Aktion als nächstes ausgeführt werden soll.
Aktionsmodell-Lernen
Ein Machine-Learning-Ansatz, der einem KI-Agenten ermöglicht, die Ergebnisse und Anforderungen seiner Aktionen in einer Umgebung zu lernen.
Aktionssprache
Eine formale Sprache zur Beschreibung von Zustandsänderungen in einem System – wie Aktionen den Zustand der Welt über die Zeit beeinflussen.
Aktivierungsfunktion
Eine mathematische Funktion in neuronalen Netzen, die den Output eines Neurons basierend auf seinen Inputs bestimmt.
Algorithmic Impact Assessment
Systematische Bewertung der potenziellen Auswirkungen eines algorithmischen Systems auf Individuen, Gruppen und die Gesellschaft vor und während des Einsatzes.
Algorithmische Effizienz (Algorithmic Efficiency)
Algorithmische Effizienz misst, wie sparsam ein Algorithmus mit Rechenzeit, Speicher und Energie umgeht – typischerweise ausgedrückt in Big-O-Notation für Skalierungsverhalten.
Algorithmische Wahrscheinlichkeit
Ein theoretisches Maß, das einer Beobachtung eine Wahrscheinlichkeit zuweist, basierend auf allen möglichen Algorithmen, die diese Beobachtung erzeugen könnten.
ALiBi (Attention with Linear Biases)
Eine Methode zur Positionskodierung, die lineare Biases direkt auf Attention-Scores addiert, statt Position-Embeddings zu lernen.
Alignment
Das Problem sicherzustellen, dass KI-Systeme die beabsichtigten Ziele und Werte ihrer Entwickler und der Gesellschaft verfolgen.
Alignment Tax
Die Performance-Einbußen, die durch Alignment- und Safety-Training entstehen – ein Modell wird sicherer, aber möglicherweise weniger fähig.
Alpha-Beta Pruning
Eine Optimierungstechnik für den Minimax-Algorithmus, die Teile des Spielbaums abschneidet, ohne das Ergebnis zu ändern.
Amazon Rufus
KI-Shopping-Assistent von Amazon, der Produktfragen beantwortet, Vergleiche zieht und Empfehlungen direkt in der Amazon-App liefert.
Amazon SageMaker Pipelines
AWS-Managed-Service für CI/CD-fähige ML-Pipelines mit integriertem Experiment Tracking, Model Registry und Deployment-Automatisierung.
Ameisenkolonie-Optimierung
Eine probabilistische Optimierungstechnik, inspiriert vom Verhalten von Ameisen bei der Futtersuche und ihrer Nutzung von Pheromonspuren.
Amortisationszeit
Die Amortisationszeit (Payback Period) ist die Zeitspanne, die benötigt wird, um eine Investition durch deren Erträge vollständig zurückzugewinnen.
Analytics
Die systematische Analyse von Daten zur Gewinnung von Erkenntnissen und zur Unterstützung von Entscheidungen.
Anchor Box
Vordefinierte Bounding Boxes verschiedener Größen und Seitenverhältnisse, die als Startpunkte für Objekterkennung dienen.
Anomaly Detection
Identifikation von ungewöhnlichen Mustern oder Ausreißern in Daten.
Answer Engine Optimization (AEO)
Optimierung von Content, um in AI-generierten Antworten zitiert zu werden – die Evolution von SEO für AI-Suchmaschinen.
Anthropic
Ein KI-Sicherheitsunternehmen, gegründet von ehemaligen OpenAI-Forschern, bekannt für Claude – einen der fortschrittlichsten LLMs mit Fokus auf Sicherheit und Ehrlichkeit.
Anytime-Algorithmus (Anytime Algorithm)
Ein Anytime-Algorithmus ist ein Algorithmus, der nach jeder Zwischenstufe eine valide, wenn auch noch nicht optimale, Lösung zurückliefern kann — und mit zusätzlicher Rechenzeit die Lösungsqualität monoton verbessert.
AP2 (Agent Payments Protocol)
Das Agent Payments Protocol (AP2) ist ein 2025 von Google gemeinsam mit über 60 Partnern (u. a. Mastercard, PayPal, American Express, Coinbase) initiierter offener Standard, der KI-Agenten erlaubt, im Namen von Nutzern oder Unternehmen sicher und prüfbar Zahlungen auszulösen.
Apache Airflow
Open-Source-Plattform für die Orchestrierung komplexer Data- und ML-Workflows als DAGs (Directed Acyclic Graphs).
API (Application Programming Interface)
Eine Schnittstelle, die es Softwareanwendungen ermöglicht, miteinander zu kommunizieren und Daten auszutauschen.
API Rate Limiting
Mechanismen, die die Anzahl der API-Anfragen pro Zeiteinheit begrenzen – kritisch für AI-API-Kosten und System-Stabilität.
Approximationsfehler
Die Differenz zwischen einem exakten, wahren Wert und einem approximativen Wert, der von einem Algorithmus oder Modell verwendet oder erhalten wird.
ARC (AI2 Reasoning Challenge)
Ein Multiple-Choice-Benchmark mit Naturwissenschafts-Fragen auf Grundschul- und Mittelstufenniveau in Easy und Challenge Sets.
ARC-AGI-2
Benchmark der ARC Prize Foundation, der die generelle Reasoning-Fähigkeit von KI-Systemen anhand abstrakter Muster misst.
ARIMA
Ein klassisches statistisches Modell für Zeitreihenprognosen, das Autoregression, Differenzierung und gleitende Durchschnitte kombiniert.
Arize AI
Eine AI-Observability-Plattform, die über 50 Millionen Evaluierungen pro Monat durchführt und mehr als 1 Billion Inferences bedient. Arize hilft bei der Überwachung, Evaluierung und Optimierung von ML-Modellen und generativen KI-Anwendungen.
ARPU (Average Revenue Per User)
Der durchschnittliche Umsatz pro Nutzer über einen bestimmten Zeitraum.
Array
Ein Array ist eine zusammenhängende Datenstruktur, die Elemente desselben Typs (in vielen Sprachen) speichert und über Index zugreifbar ist.
Assessment
Assessment ist die Messung von Wissen, Skills oder Performance – verwendet um aktuelle Fähigkeiten zu diagnostizieren, Feedback zu geben und Lernergebnisse zu zertifizieren.
Attention Mechanism
Ein neuronaler Netzwerk-Mechanismus, der es Modellen ermöglicht, sich dynamisch auf relevante Teile der Eingabe zu "konzentrieren" – die Schlüsselinnovation hinter modernen LLMs.
Attention Pooling
Attention Pooling aggregiert eine Sequenz von Vektoren zu einem einzigen Repräsentationsvektor, indem gelernten Attention-Gewichten den wichtigsten Elementen mehr Bedeutung gegeben wird.
Attention Sink
Ein Phänomen in LLMs, bei dem das erste Token (BOS) unverhältnismäßig hohe Attention erhält, auch wenn es semantisch irrelevant ist.
Attribution
Die Zuordnung von Credit zu Marketing-Touchpoints, die zu einer Conversion beigetragen haben – um zu bestimmen, welche Kanäle oder Kampagnen effektiv sind.
Attributioneller Kalkül
Ein logisches Framework, das Prädikatenlogik mit mehrwertiger (Fuzzy-)Logik kombiniert, um Attribute von Entitäten lesbar darzustellen.
AUC (Area Under the Curve)
Die Fläche unter der ROC-Kurve – eine einzelne Zahl (0-1), die die Gesamtqualität eines binären Klassifikators zusammenfasst.
Audience (Zielgruppe)
Die Gruppe von Personen, die ein Unternehmen mit seinen Marketing-Botschaften erreichen möchte.
Audio Deepfake
KI-generierte Audioaufnahmen, die eine echte Person täuschend echt imitieren und für Betrug, Fehlinformation oder Manipulation genutzt werden können.
Audio Generation
Die Erzeugung von Audio-Inhalten durch KI-Modelle – von Musik über Soundeffekte bis hin zu Sprache und Ambient-Sounds.
Audio Language Models
KI-Modelle, die Audio direkt verstehen und generieren können – von Spracherkennung über Musik-Analyse bis hin zu natürlicher Sprachgenerierung mit Emotionen und Intonation.
Audit Logging
Audit Logging zeichnet sicherheitsrelevante Ereignisse (Zugriff, Policy-Entscheidungen, Admin-Änderungen, Tool-Aktionen) auf unveränderliche oder manipulationssichere Weise auf.
Auto-Complete (Autovervollständigung)
Auto-Complete bezeichnet eine Funktionalität, die während der Eingabe von Text automatisch passende Vorschläge zur Vervollständigung anbietet — auf Basis von Wörterbüchern, Suchhistorie, statistischen Sprachmodellen oder, seit 2023, generativen LLMs.
Autoencoder
Ein neuronales Netzwerk, das eine komprimierte Repräsentation (Encoding) von Eingabedaten lernt und die Originaldaten daraus rekonstruiert.
AutoGPT
Ein experimentelles Open-Source-Projekt, das GPT-4 autonom Ziele verfolgen lässt – Pionier der Agentic AI-Bewegung.
Automatentheorie
Der Zweig der Informatik, der sich mit abstrakten Maschinen (Automaten) und den von ihnen lösbaren Berechnungsproblemen befasst.
Automation (Marketing Automation)
Der Einsatz von Software zur Automatisierung repetitiver Marketing-Aufgaben wie E-Mail-Kampagnen, Social Media Posts oder Lead-Nurturing.
Automatisiertes Machine Learning (AutoML)
Der Prozess der Automatisierung des End-to-End-Prozesses der Anwendung von Machine Learning, einschließlich Datenvorverarbeitung, Modellauswahl und Hyperparameter-Tuning.
Automatisiertes Planen (Automated Planning)
Automatisiertes Planen ist das KI-Teilgebiet, das Algorithmen entwickelt, um aus einem Startzustand, einem Zielzustand und einer Menge möglicher Aktionen automatisch eine Sequenz von Aktionen (einen Plan) zu finden, die das Ziel erreicht.
AutoML
AutoML automatisiert Teile des Machine-Learning-Lifecycles wie Modellselektion, Feature-Preprocessing, Hyperparameter-Tuning und Validierung.
Autonomes Fahren
Der Einsatz von KI-Systemen zur vollständigen oder teilweisen Steuerung von Fahrzeugen ohne menschliches Eingreifen, klassifiziert in SAE Level 0-5.
Autonomous Agent
Ein KI-Agent, der ohne menschliche Eingriffe Ziele verfolgt, Entscheidungen trifft und Aktionen ausführt – der höchste Autonomie-Level.
Autoregressives Modell
Ein autoregressives Modell generiert Sequenzen Token für Token, wobei jeder neue Token von allen vorherigen abhängt – die Architektur hinter GPT, LLaMA und allen modernen LLMs.
Autorisierung
Autorisierung bestimmt, was eine authentifizierte Identität tun darf (Berechtigungen), wie das Lesen bestimmter Daten oder Ausführen bestimmter Aktionen.
Awareness
Die erste Phase im Marketing-Funnel, in der potenzielle Kunden auf eine Marke oder ein Produkt aufmerksam werden.
B
B2B Marketing
Marketing von Produkten oder Dienstleistungen an andere Unternehmen statt an Endverbraucher.
Backpropagation
Ein Algorithmus zur Berechnung von Gradienten in neuronalen Netzen, der die Fehler rückwärts durch das Netz propagiert, um Gewichte anzupassen.
Backtesting
Validierung eines Prognosemodells anhand historischer Daten zur Out-of-Sample-Performance-Schätzung.
Backtracking
Eine algorithmische Technik, die systematisch alle möglichen Lösungen durchsucht und bei Sackgassen zum letzten Entscheidungspunkt zurückkehrt.
Bag of Words (BoW)
Einfachste Textrepräsentation, die einen Text als ungeordnete Menge von Wörtern mit Häufigkeiten darstellt.
Bagging
Ein Ensemble-Lernverfahren, das mehrere Modelle auf Bootstrap-Samples trainiert und deren Vorhersagen aggregiert.
Bandit-basierte Empfehlung
Empfehlungssysteme, die Multi-Armed Bandits nutzen, um Exploration neuer Items mit Exploitation bekannter Präferenzen zu balancieren.
Batch Normalization
Eine Normalisierungstechnik, die Aktivierungen in neuronalen Netzen über Mini-Batches normalisiert – stabilisiert Training und ermöglicht höhere Learning Rates.
Batch Size
Anzahl der Trainingsbeispiele pro Gradient-Update.
Batch-Verarbeitung
Verarbeitung großer Datenmengen in gesammelten Blöcken statt in Echtzeit.
Bayessche Optimierung
Bayessche Optimierung ist ein Ansatz zur Optimierung teurer Black-Box-Funktionen (z.B. Modell-Hyperparameter) mittels eines probabilistischen Surrogatmodells und einer Acquisition-Funktion.
Beam Search
Beam Search ist ein heuristischer Suchalgorithmus, der pro Suchschritt nur die k besten Teil-Lösungen ("Beam Width") weiterverfolgt — ein Kompromiss zwischen erschöpfender Breitensuche (hohe Qualität, hoher Aufwand) und Greedy-Suche (niedrige Qualität, niedriger Aufwand).
Behavioral AI
AI-Systeme, die Nutzerverhalten analysieren, Muster erkennen und zukünftige Aktionen prognostizieren.
Bellman-Ford Algorithmus
Der Bellman-Ford Algorithmus berechnet kürzeste Pfade von einem Startknoten in einem gewichteten Graphen und kann negative Kantengewichte handhaben (und negative Zyklen erkennen).
Benchmark
Ein Referenzpunkt oder Standard, gegen den Performance gemessen und verglichen wird.
BentoML
Open-Source-Framework zum Paketieren, Deployen und Skalieren von ML-Modellen als produktionsreife APIs.
BERT
BERT (Bidirectional Encoder Representations from Transformers) ist ein von Google entwickeltes Sprachmodell, das Text bidirektional verarbeitet und tiefes Kontextverständnis ermöglicht.
BERT (Google)
Googles Transformer-Modell für bidirektionales Sprachverständnis.
BERTScore
Eine semantische Evaluationsmetrik, die BERT-Embeddings nutzt, um Ähnlichkeit zwischen generiertem und Referenztext zu messen.
Beschleunigte Veränderung
Die wahrgenommene Zunahme der Rate technologischer Innovation und gesellschaftlichen Fortschritts im Laufe der Zeit.
BGE Embedding
BGE (BAAI General Embedding) ist eine Familie von Open-Source-Embedding-Modellen der Beijing Academy of AI, die Top-Ergebnisse auf MTEB erreichen.
Bi-Encoder
Eine Encoder-Architektur, die Query und Dokument unabhängig voneinander in Embeddings transformiert – ermöglicht schnelle Ähnlichkeitssuche über vorberechnete Vektoren.
Bias (KI)
Systematische Verzerrungen in KI-Systemen, die zu unfairen oder diskriminierenden Ergebnissen für bestimmte Personengruppen führen, oft verursacht durch unausgewogene Trainingsdaten oder fehlerhafte Annahmen.
Bias-Varianz-Tradeoff
Fundamentaler Tradeoff: einfache Modelle haben hohen Bias (Underfitting), komplexe hohe Varianz (Overfitting).
Bidding
Bidding ist das Setzen von Geboten für Werbeinventar in auktionsbasierten Werbesystemen, um Auslieferung, Kosten und Ergebnisse zu beeinflussen.
BIG-Bench
Ein kollaborativer Benchmark mit 200+ Tasks, erstellt von 400+ Forschern, um LLM-Fähigkeiten jenseits existierender Benchmarks zu testen.
Big-O-Notation
Big-O-Notation beschreibt, wie die Zeit- oder Speicheranforderungen eines Algorithmus mit der Eingabegröße wachsen, und drückt eine obere Schranke für asymptotisches Verhalten aus (z.B. O(log n), O(n), O(n²)).
Bildgenerierung
Image Generation ist die automatische Erstellung von Bildern durch KI-Modelle basierend auf Text-Prompts, anderen Bildern oder anderen Inputs.
Bildklassifikation
Die Zuordnung eines gesamten Bildes zu einer oder mehreren vordefinierten Kategorien durch ein ML-Modell.
Bildsegmentierung
Die Aufteilung eines Bildes in bedeutungsvolle Regionen oder Objekte auf Pixelebene.
Binäre Suche
Die binäre Suche findet einen Zielwert in einer sortierten Liste, indem sie den Suchbereich wiederholt halbiert.
Bing Copilot
Microsofts AI-gestützte Suchmaschine, die GPT-4 mit Bing-Suche kombiniert – integriert in Windows, Edge, Office.
BLEU Score
Metrik zur automatischen Bewertung von Übersetzungsqualität.
BM25 Ranking
BM25 ist eine klassische lexikalische Ranking-Funktion in der Informationssuche, die Dokumente basierend auf Termfrequenz, inverser Dokumentfrequenz und Längennormalisierung bewertet.
Boosting
Ein Ensemble-Lernverfahren, das schwache Lerner sequenziell kombiniert, um einen starken Klassifikator zu erstellen.
Bootstrapping
Statistische Resampling-Methode, die wiederholt Stichproben mit Zurücklegen aus dem Datensatz zieht.
BPE (Byte Pair Encoding)
Subword-Tokenisierungsalgorithmus, der häufige Zeichenpaare iterativ zusammenfasst, um ein optimales Vokabular zu erstellen.
Brand Lift
Die messbare Verbesserung von Markenmetriken (Bekanntheit, Consideration, Präferenz) durch Werbung.
Breitensuche
Ein Graph-Traversierungsalgorithmus, der alle Nachbarknoten auf der aktuellen Tiefe erkundet, bevor er zur nächsten Tiefenstufe übergeht.
Breitensuche (BFS)
Breitensuche (BFS) durchläuft einen Graphen Ebene für Ebene und erkundet alle Nachbarn eines Knotens, bevor sie tiefer geht.
Brier Score
Eine Metrik, die die Qualität probabilistischer Vorhersagen misst – der MSE auf Wahrscheinlichkeiten (0=perfekt).
Browser Agent
Autonomer KI-Agent, der einen Webbrowser bedient, um Aufgaben wie Recherche, Buchungen oder Käufe stellvertretend für den Nutzer durchzuführen.
Business Continuity
Business Continuity ist die Fähigkeit, kritische Geschäftsfunktionen während und nach Störungen (technische Ausfälle, Sicherheitsvorfälle, Katastrophen) aufrechtzuerhalten.
Business Intelligence
Business Intelligence (BI) ist die Praxis und Tooling zur Transformation von Daten in Dashboards, Reports und Analysen, die Geschäftsentscheidungen unterstützen.
Buyer Persona
Eine semi-fiktive Darstellung des idealen Kunden basierend auf Marktforschung und echten Kundendaten.
C
C2PA Content Credentials
Offener Standard zur Kennzeichnung der Herkunft und Bearbeitungshistorie digitaler Medien, entwickelt von der Coalition for Content Provenance and Authenticity.
CAC (Customer Acquisition Cost)
Die durchschnittlichen Kosten für die Gewinnung eines neuen Kunden, inklusive Marketing und Vertrieb.
Canary Deployment
Deployment-Strategie, bei der eine neue Version schrittweise auf einen kleinen Prozentsatz des Traffics ausgerollt wird, bevor sie vollständig deployed wird.
Canonical URL
Eine Canonical URL ist die bevorzugte "offizielle" URL für einen Inhalt, wenn mehrere URLs ähnlichen oder identischen Inhalt zeigen könnten.
Causal Masking (Kausale Maskierung)
Causal Masking verhindert, dass Tokens auf zukünftige Positionen zugreifen – die Technik, die autoregressive Generierung in Decodern wie GPT ermöglicht.
CDP (Customer Data Platform)
Eine Plattform, die Kundendaten aus verschiedenen Quellen vereinheitlicht, um umfassende Kundenprofile zu erstellen.
CER (Character Error Rate)
Metrik für Spracherkennung und OCR auf Zeichenebene.
Certificate Authority (CA)
Eine Certificate Authority (CA) stellt digitale Zertifikate aus und signiert sie, wobei sie öffentliche Schlüssel an Identitäten innerhalb einer PKI bindet.
Certified Defense
Verteidigungsmethoden gegen adversariale Angriffe, die mathematisch beweisbare Robustheitsgarantien bieten.
Chain of Agents
Architektur-Pattern, bei dem mehrere spezialisierte KI-Agenten sequenziell oder hierarchisch zusammenarbeiten, um komplexe Aufgaben zu lösen.
Chain of Custody
Chain of Custody ist der dokumentierte Trail, wie ein Artefakt (Daten, Evidenz, Content) gesammelt, gehandhabt, gespeichert und zugegriffen wurde – um Integrität und Accountability sicherzustellen.
Chain of Thought
Prompting-Technik und Modell-Fähigkeit, bei der das Modell seinen Denkprozess explizit in Zwischenschritten ausformuliert, bevor es zur finalen Antwort kommt.
Chain-of-Thought Prompting
Eine Prompting-Technik, die LLMs dazu bringt, ihre Gedanken schrittweise darzulegen, bevor sie eine finale Antwort geben – was zu deutlich besseren Ergebnissen bei komplexen Aufgaben führt.
Changepoint Detection
Erkennung von Zeitpunkten, an denen sich die statistische Eigenschaft einer Zeitreihe signifikant ändert.
Chatbot
Ein Softwareprogramm, das Konversationen mit Menschen simuliert, typischerweise über Text- oder Sprachschnittstellen.
Chatbot Arena
Ein öffentliches Elo-basiertes Leaderboard, bei dem User blind zwischen zwei LLMs wählen – der wichtigste Benchmark für LLM-Ranking.
ChatGPT
Ein konversationelles KI-System, das auf großen Sprachmodellen basiert und menschenähnliche Antworten auf Benutzeranfragen generiert.
ChatGPT Agent
Autonomer Modus von ChatGPT, der mehrstufige Aufgaben im Browser, in Apps und in Dateien selbstständig ausführt.
ChatGPT Checkout
Funktion in ChatGPT, die Käufe direkt im Chat-Interface abschließt – ohne Weiterleitung auf Händler-Websites.
Chief Agent Officer (CAO)
C-Level-Rolle, die für Strategie, Governance und Performance autonomer KI-Agenten in Unternehmen verantwortlich ist – die Weiterentwicklung des CMO im Agentic-Zeitalter.
Chinchilla Optimal
Die Erkenntnis, dass für compute-optimales LLM-Training die Anzahl der Trainings-Tokens proportional zur Parameterzahl skalieren sollte.
Chunking
Die Aufteilung großer Dokumente in kleinere, semantisch kohärente Textabschnitte für effizientes Embedding und Retrieval in RAG-Systemen.
Churn-Vorhersage
Die Verwendung von statistischen oder ML-Modellen zur Schätzung der Wahrscheinlichkeit, dass ein Kunde ein Produkt nicht mehr nutzt.
CI/CD für ML
Continuous Integration und Continuous Delivery angepasst für Machine-Learning-Workflows mit Daten-, Code- und Modell-Validierung.
CIDEr
Eine Metrik für Image Captioning, die TF-IDF-gewichtete N-Gram-Ähnlichkeit misst.
Citation Optimization
Strategien, um die Wahrscheinlichkeit zu erhöhen, dass AI-Systeme den eigenen Content als Quelle zitieren.
Classifier-Free Guidance (CFG)
Classifier-Free Guidance steuert, wie stark ein Diffusionsmodell dem Text-Prompt folgt – höhere Werte erzeugen prompttreuere, aber potenziell überzeichnete Bilder.
Claude
Anthropics Familie von LLMs, bekannt für lange Kontextfenster, nuancierte Antworten und einen Fokus auf Sicherheit und Ehrlichkeit.
Claude Code
Anthropics offizielles CLI-Tool für agentisches Software-Engineering: Claude Sonnet 4.6 läuft direkt im Terminal und bearbeitet Code-Repositories autonom.
Claude Computer Use
Fähigkeit von Claude, einen Desktop-Computer zu bedienen: Maus, Tastatur, Screenshots und Anwendungen wie ein menschlicher Nutzer.
Claude Cowork
Kollaborativer Multi-User-Modus von Claude für gemeinsame Projektarbeit mit geteiltem Kontext und Rollenverteilung.
Claude Design
Visueller Design-Modus von Claude für UI-Mockups, Brand-Asset-Generierung und Layout-Iteration über natürliche Sprache.
Claude Haiku
Anthropics schnellstes und kostengünstigstes KI-Modell, optimiert für Geschwindigkeit und Volumen bei Aufgaben wie Klassifikation, Chatbots und Echtzeit-Verarbeitung.
Claude Opus
Anthropics leistungsstärkstes und teuerstes KI-Modell, konzipiert für komplexe Analyse, strategische Planung und Aufgaben, die höchste kognitive Tiefe erfordern.
Claude Opus 4.6
Anthropics Flaggschiff-LLM 2026 mit erweitertem Reasoning, 1M-Token-Kontext und nativen Computer-Use-Fähigkeiten.
Claude Skills
Modulares System von Anthropic, das wiederverwendbare Fähigkeiten (Prompt + Tools + Daten) für Claude bündelt.
Claude Sonnet
Anthropics ausgewogenes KI-Modell, das optimale Balance zwischen Qualität, Geschwindigkeit und Kosten bietet – der Allrounder der Claude-Familie.
ClearML
Open-Source-MLOps-Plattform für Experiment Tracking, Pipeline-Orchestrierung, Data Management und Model Serving.
Click-Through-Rate (CTR)
Verhältnis von Klicks zu Impressionen, ausgedrückt als Prozentsatz.
Clickstream-Daten
Ein zeitlich geordneter Datensatz von Benutzerinteraktionen (Klicks, Seitenaufrufe, Events) auf digitalen Properties wie Websites und Apps.
CLIP (Contrastive Language–Image Pretraining)
Ein multimodaler Modellansatz, der abgestimmte Repräsentationen von Bildern und Text lernt durch Training auf passenden Bild-Text-Paaren.
Clustering
Eine unüberwachte Lerntechnik, die Datenpunkte so in Gruppen (Cluster) einteilt, dass Elemente im selben Cluster ähnlicher zueinander sind.
Code-Generierung
Die automatische Erstellung von Programmcode durch KI-Modelle basierend auf natürlichsprachlichen Beschreibungen, Beispielen oder partiellen Code-Snippets.
Codex 5.3
OpenAIs spezialisiertes Coding-Modell 2026 für agentische Software-Entwicklung und Long-Running-Tasks in Repositories.
Cohen's Kappa
Eine Statistik zur Messung der Inter-Rater-Reliabilität für kategoriale Bewertungen, die für zufällige Übereinstimmung korrigiert.
Cohere
Ein Enterprise-fokussiertes KI-Unternehmen, das auf RAG, Embeddings und mehrsprachige LLMs spezialisiert ist.
Cohere Embed
Coheres kommerzielle Embedding-API mit spezieller Optimierung für Retrieval und Unterscheidung zwischen Query- und Document-Embeddings.
ColBERT
ColBERT ist eine Late-Interaction-Retrieval-Architektur, die Token-Level-Embeddings für Query und Dokument erstellt und erst bei der Suche durch MaxSim aggregiert.
Cold-Start-Problem
Das Problem, wenn ein System unzureichende Daten über einen neuen Nutzer, ein neues Item oder einen neuen Kontext hat.
Column Store
Eine Column Store Datenbank speichert Daten spaltenweise und optimiert für analytische Workloads (OLAP) und das Scannen spezifischer Felder über viele Zeilen.
Comet ML
ML-Plattform für Experiment Tracking, Model Production Monitoring und LLM-Evaluation (Opik).
ComfyUI
ComfyUI ist ein visueller, node-basierter Workflow-Editor für Stable Diffusion und andere Diffusionsmodelle – der professionelle Standard für komplexe Bildgenerierungs-Pipelines.
Command R
Coheres RAG-optimiertes Sprachmodell, speziell für Enterprise-Retrieval, mehrsprachige Anwendungen und Tool-Use entwickelt.
Computer Use
Die Fähigkeit von AI-Modellen, Computer wie Menschen zu bedienen – Screenshots interpretieren, Maus und Tastatur steuern, durch Interfaces navigieren.
Computer Vision
Das KI-Teilgebiet, das Computern das Verstehen und Interpretieren visueller Informationen ermöglicht.
Computer-Use Sandboxing
Sichere, isolierte Ausführungsumgebung für KI-Agenten, die Maus, Tastatur, Browser oder Desktop kontrollieren – mit klar definierten Berechtigungen und Audit-Trail.
Conditional Generation
Conditional Generation erzeugt Outputs basierend auf Bedingungen wie Text, Klasse, Bild oder anderen Steuerungssignalen.
Confidential Computing
Ein Ansatz, bei dem Daten während der Verarbeitung durch hardwarebasierte Trusted Execution Environments (TEEs) geschützt werden – Schutz nicht nur at-rest und in-transit, sondern auch in-use.
Conformal Prediction
Ein framework-agnostisches Verfahren, das Vorhersagen mit garantierten Konfidenzintervallen liefert, ohne Annahmen über die Modellverteilung.
Confounding
Ein Confounder ist eine Variable, die sowohl die unabhängige als auch die abhängige Variable beeinflusst und so einen Scheinzusammenhang erzeugt.
Consistency Model
Consistency Models generieren Bilder in einem oder wenigen Schritten, indem sie lernen, von jedem Punkt auf der Diffusionsbahn direkt zum Ergebnis zu springen.
Constitutional AI
Ein von Anthropic entwickelter Ansatz, bei dem KI-Systeme anhand einer Reihe von ethischen Prinzipien ("Verfassung") trainiert werden, um sich selbst zu korrigieren und schädliche Outputs zu vermeiden.
Constitutional Classifiers
Vorgelagerte Klassifikator-Modelle, die auf Basis einer expliziten „Verfassung" Eingaben und Ausgaben eines LLMs gegen Jailbreaks und Policy-Verstöße absichern.
Content Delivery Network (CDN)
Verteiltes Netzwerk von Servern zur schnellen Auslieferung von Web-Inhalten.
Content Filter
Systeme, die KI-Inputs und -Outputs auf unerwünschte Inhalte prüfen und blockieren.
Content Fingerprinting
Content Fingerprinting erstellt eine kompakte Signatur (Fingerprint) von Content, um Identifizierung, Deduplizierung, Similarity-Detection oder Provenance-Tracking zu ermöglichen.
Content Marketing
Eine Marketing-Strategie, die auf die Erstellung und Verbreitung wertvoller Inhalte zur Kundengewinnung setzt.
Content Policy
Eine Content Policy definiert, welcher Content in einem System erlaubt, eingeschränkt oder verboten ist – für Inputs und Outputs.
Content-Based Filtering
Empfehlungen basierend auf Eigenschaften von Items, die ein Nutzer mochte.
Content-Erstellung
Content-Erstellung ist die Planung, Produktion und Veröffentlichung von Materialien (Text, Bilder, Video, Audio), die darauf abzielen, eine Zielgruppe zu informieren, überzeugen oder engagieren.
Content-Personalisierung
Dynamische Anpassung von Inhalten basierend auf Nutzerprofil und -verhalten.
Context Caching
Eine Optimierungstechnik, bei der berechnete Attention-Zustände (Key-Value-Paare) für wiederholte Kontexte zwischengespeichert werden – spart Compute und senkt Latenz bei ähnlichen Anfragen.
Context Engineering
Die Praxis des Designs, der Auswahl und Strukturierung der Informationen, die ein LLM erhält, um zuverlässigere und relevantere Outputs zu erzeugen.
Context Window
Die maximale Menge an Text (gemessen in Tokens), die ein KI-Sprachmodell gleichzeitig verarbeiten und "im Gedächtnis" behalten kann – je größer, desto mehr Kontext kann berücksichtigt werden.
Contextual AI Targeting
AI-gestützte Werbeplatzierung basierend auf Seiteninhalt statt Nutzer-Tracking – die Cookie-lose Alternative.
Contextual Bandit
Ein Entscheidungsalgorithmus, der unter Nutzung aktueller Kontextmerkmale zwischen Aktionen wählt, während er aus Feedback lernt.
Continual Learning
Die Fähigkeit eines ML-Modells, kontinuierlich aus neuen Daten zu lernen, ohne zuvor gelerntes Wissen zu vergessen – das "Lifelong Learning"-Problem der KI.
Continuous Batching
Eine Serving-Technik, die neue Requests in laufende Batches einfügt, sobald andere Requests abgeschlossen sind, statt auf Batch-Completion zu warten.
Contrastive Learning
Ein Ansatz zum Repräsentationslernen, der Modelle trainiert, ähnliche Paare näher zusammen und unähnliche Paare weiter auseinander im Embedding-Raum zu platzieren.
ControlNet
ControlNet ist eine neuronale Netzwerkarchitektur, die zusätzliche Bedingungen (Kanten, Pose, Tiefe) zu Diffusionsmodellen hinzufügt, um präzise Kontrolle über die Bildgenerierung zu ermöglichen.
Conversational AI
Conversational AI bezeichnet KI-Systeme, die natürliche, menschenähnliche Gespräche über Text oder Sprache führen können – von Chatbots bis zu Voice Agents.
Conversational Search
Conversational Search ermöglicht die Informationssuche durch natürliche Dialoge statt starrer Keywords – die Zukunft von Suchmaschinen und Enterprise Search.
Conversion Rate Optimization (CRO)
Der systematische Prozess zur Steigerung des Prozentsatzes von Nutzern, die eine gewünschte Aktion durchführen, durch Experimente und UX-Verbesserungen.
Convolutional Neural Network (CNN)
Eine neuronale Netzwerkarchitektur, die Faltungsoperationen nutzt, um hierarchische Feature-Repräsentationen aus Bildern zu lernen.
Copilot Agent
Anpassbarer KI-Agent innerhalb der Microsoft-Copilot-Plattform, der auf Unternehmensdaten zugreift und in Teams, Outlook und Microsoft 365 eingebettet wird.
Copywriting
Das Verfassen von Werbetexten und Marketing-Inhalten zur Überzeugung und Konversion.
Cosine Annealing
Eine Learning-Rate-Schedule-Strategie, die die Lernrate gemäß einer Kosinuskurve von einem Maximalwert sanft auf nahe Null absenkt.
Cost per Acquisition (CPA)
Durchschnittskosten für eine gewünschte Aktion wie Kauf oder Anmeldung.
CPC (Cost Per Click)
Das Preismodell, bei dem Werbetreibende pro Klick auf ihre Anzeige bezahlen.
CPM (Cost Per Mille)
Die Kosten pro 1.000 Impressionen einer Anzeige.
CrewAI
Ein Python-Framework für Multi-Agent-Systeme, bei dem Agenten als "Crew" mit definierten Rollen zusammenarbeiten.
Cross-Attention
Cross-Attention berechnet Attention zwischen zwei verschiedenen Sequenzen – z.B. zwischen Text-Conditioning und Bildgenerierung in Diffusionsmodellen.
Cross-Encoder
Eine Encoder-Architektur, die Query und Dokument gemeinsam verarbeitet und einen Relevanz-Score ausgibt – präziser als Bi-Encoder, aber langsamer.
Cross-Entropy Loss
Verlustfunktion für Klassifikationsaufgaben basierend auf Informationstheorie.
CSS
CSS (Cascading Style Sheets) ist die Stilsprache des Webs, die das visuelle Erscheinungsbild von HTML-Elementen definiert – Farben, Layouts, Animationen und responsive Design.
CTA (Call to Action)
Eine Aufforderung an den Nutzer, eine bestimmte Aktion auszuführen, wie "Jetzt kaufen" oder "Mehr erfahren".
CTC (Connectionist Temporal Classification)
CTC ist ein Training-Algorithmus für Sequenz-zu-Sequenz-Probleme, bei denen Input und Output unterschiedliche Längen haben – der Schlüssel zu modernem ASR.
CTR (Click-Through Rate)
Der Prozentsatz der Nutzer, die auf einen Link oder eine Anzeige klicken, bezogen auf die Gesamtzahl der Impressionen.
Curriculum Learning
Trainingsstrategie, bei der Samples in einer sinnvollen Reihenfolge präsentiert werden – von einfach zu schwer, ähnlich wie ein Lehrplan.
Cursor
Ein AI-nativer Code-Editor (Fork von VS Code), der tiefe KI-Integration für Code-Generierung, Refactoring und natürlichsprachliche Programmierung bietet.
Custom GPT
Auf einen spezifischen Use Case zugeschnittener GPT mit eigenem Prompt, Wissensbasis und Tool-Set, gehostet bei OpenAI.
Customer Data Platform (CDP)
Zentrales System zur Vereinheitlichung von Kundendaten aus allen Quellen.
Customer Journey
Die gesamte Erfahrung eines Kunden mit einer Marke, von der ersten Wahrnehmung bis zur langfristigen Loyalität.
Customer Lifetime Value
Prognostizierter Gesamtwert eines Kunden über die gesamte Geschäftsbeziehung.
Customer Lifetime Value (LTV)
Gesamter erwarteter Umsatz eines Kunden über die gesamte Beziehungsdauer.
CutMix
Data-Augmentation-Technik, die einen rechteckigen Bereich eines Bildes ausschneidet und durch einen Bereich eines anderen Bildes ersetzt.
Cyclical Learning Rate (CLR)
Learning-Rate-Schedule, der die LR zyklisch zwischen einem Minimum und Maximum variiert – verhindert Stagnation und hilft, Sattelpunkte zu überwinden.
D
DAG (Directed Acyclic Graph)
Ein gerichteter Graph ohne Zyklen, d.h. man kann nicht von einem Knoten starten und durch gerichtete Kanten zum selben Knoten zurückkehren.
Dagster
Open-Source-Orchestrierungsplattform mit Software-Defined-Assets-Ansatz für Data- und ML-Pipelines.
DALL-E 3
OpenAIs neueste Text-zu-Bild-Generation, integriert in ChatGPT, bekannt für präzise Prompt-Befolgung und Text-Rendering.
Dashboard
Eine visuelle Oberfläche, die wichtige Metriken, Trends und Alerts zur Unterstützung der Entscheidungsfindung präsentiert.
Data Clean Room
Eine sichere Umgebung, in der mehrere Parteien ihre Daten für gemeinsame Analysen zusammenführen können, ohne Rohdaten zu teilen.
Data Drift
Die Veränderung der statistischen Eigenschaften von Eingabedaten über die Zeit, die die Modellleistung beeinträchtigen kann.
Data Governance
Das Framework für Policies, Prozesse und Verantwortlichkeiten zur Verwaltung von Datenassets im Unternehmen.
Data Labeling
Prozess der Annotation von Daten mit Ground Truth für überwachtes Lernen.
Data Lake
Zentraler Speicher für große Mengen unstrukturierter und strukturierter Daten.
Data Layout
Die physische oder logische Anordnung von Daten im Speicher oder auf Datenträgern, die Zugriffsgeschwindigkeit, Cache-Effizienz und Verarbeitungsperformance beeinflusst.
Data Leakage
Situation, in der Informationen aus dem Testset oder der Zukunft ins Training gelangen und unrealistisch gute Ergebnisse erzeugen.
Data Mesh
Dezentraler Ansatz zur Datenarchitektur mit domänenorientierten Daten-Produkten.
Data Mining
Der Prozess der Entdeckung von Mustern, Anomalien und Zusammenhängen in großen Datensätzen mithilfe statistischer und maschineller Lernmethoden.
Data Parallelism
Die einfachste Form verteilten Trainings: Jede GPU hält eine vollständige Modellkopie und verarbeitet verschiedene Daten-Batches – Gradienten werden synchronisiert.
Data Poisoning
Ein Angriff, bei dem manipulierte Daten in den Trainingsprozess eingeschleust werden, um das Modellverhalten gezielt zu beeinflussen.
Data Processing Agreement (DPA)
Ein rechtlich bindender Vertrag zwischen Datenverantwortlichem und Auftragsverarbeiter, der die Bedingungen für die Verarbeitung personenbezogener Daten gemäß DSGVO regelt.
Data Validation (ML)
Automatisierte Prüfung von Datenqualität, Schema-Konformität und statistischen Eigenschaften in ML-Pipelines.
Data Warehouse
Ein System, das für strukturierte Analyseabfragen über kuratierte, bereinigte Daten optimiert ist – oft mit starker Governance.
Databricks
Databricks ist eine Unified-Analytics-Plattform, die Data Engineering, Data Science und Machine Learning auf Apache Spark vereint.
Datasheets for Datasets
Standardisierte Dokumentation für ML-Datensätze, die Herkunft, Zusammensetzung, Erhebungsmethoden, empfohlene Verwendung und bekannte Limitierungen beschreibt.
Datenanreicherung
Das Hinzufügen zusätzlicher Attribute zu bestehenden Daten – über interne Joins oder externe Quellen.
Datenerweiterung
Techniken zur künstlichen Erweiterung von Trainingsdaten durch Transformationen.
Datenherkunft
Datenherkunft beschreibt, woher Daten kommen, wie sie sich durch Systeme bewegen und wie sie in Downstream-Datasets und Outputs transformiert werden.
Datenkatalog
Ein durchsuchbares Inventar der Datenbestände einer Organisation, einschließlich Metadaten, Eigentümerschaft und Dokumentation.
Datenpipeline
Eine Sequenz von Prozessen, die Daten von Quellen zu Zielen (Lake, Warehouse, Feature Store, Vector Index) bewegt und transformiert.
Datenstruktur
Eine organisierte Methode zum Speichern und Verwalten von Daten, die effiziente Operationen wie Suchen, Einfügen und Löschen ermöglicht.
Datenvisualisierung
Die grafische Darstellung von Daten zur Kommunikation von Insights und Mustern.
Datenvorverarbeitung
Die Transformation von Rohdaten in eine für Modellierung oder Analyse geeignete Form (Bereinigung, Normalisierung, Kodierung).
Datenwörterbuch
Dokumentation, die die Bedeutung, das Format, erlaubte Werte und die Verwendung von Datenfeldern definiert.
DBSCAN
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) ist ein Clustering-Algorithmus, der Cluster basierend auf der Dichte von Datenpunkten findet und Ausreißer automatisch identifiziert.
DDIM (Denoising Diffusion Implicit Model)
DDIM ist ein beschleunigter Sampling-Algorithmus für Diffusionsmodelle, der deterministische Generierung mit deutlich weniger Schritten ermöglicht.
DDPM (Denoising Diffusion Probabilistic Model)
DDPM ist das grundlegende Framework für Diffusionsmodelle, das Bilder durch schrittweises Entrauschen aus reinem Rauschen generiert.
Decision Support System
Ein Decision Support System (DSS) hilft Menschen, bessere Entscheidungen zu treffen, indem es Daten, Modelle und Benutzeroberflächen kombiniert.
Decoder
Der Teil eines Modells, der eine komprimierte Repräsentation zurück in das ursprüngliche Format transformiert.
Decoding-Strategie
Die Methode, die verwendet wird, um die Token-Wahrscheinlichkeitsverteilung eines Modells in eine tatsächliche Ausgabesequenz umzuwandeln.
Deduktives Schlussfolgern
Eine Form der logischen Schlussfolgerung, bei der aus allgemeinen Prämissen spezifische Schlüsse gezogen werden – wenn die Prämissen wahr sind, ist die Konklusion garantiert wahr.
Deduplizierung
Deduplizierung ist das Identifizieren und Entfernen von doppelten (oder fast-doppelten) Elementen, um Redundanz zu reduzieren und Qualität zu verbessern.
Deep Compression
Eine dreistufige Kompressionspipeline (Pruning → Quantization → Huffman Coding), die neuronale Netze um 35-49x komprimieren kann – das Grundlagenwerk der Modellkompression.
Deep Learning
Ein Teilgebiet des maschinellen Lernens, das tiefe neuronale Netze mit vielen Schichten nutzt, um komplexe Muster aus Daten zu lernen.
Deep Reinforcement Learning
Reinforcement Learning, das tiefe neuronale Netze verwendet, um Policies zu lernen, die Aktionen zur Maximierung langfristiger Belohnungen wählen.
Deepfake
Deepfakes sind KI-generierte oder -manipulierte Medien (Video, Audio, Bilder), die Personen zeigen, die etwas tun oder sagen, was nie passiert ist.
Deepfake-Erkennung
Technologien und Methoden zur Identifizierung von KI-generierten oder manipulierten Medieninhalten wie Videos, Audios und Bildern.
DeepSeek
Chinesisches KI-Startup, das leistungsstarke Open-Source Sprachmodelle entwickelt und mit deutlich geringeren Kosten mit westlichen Anbietern konkurriert.
DeepSeek R1
Ein Open-Source Reasoning-Modell von DeepSeek, das bei komplexen Denk- und Coding-Aufgaben mit GPT-4 und Claude konkurriert.
DeepSeek V4
Open-Weight-Flaggschiff von DeepSeek, das mit 1/10 der Trainingskosten westlicher Modelle vergleichbare Benchmarks erreicht.
DeepWalk
Ein Graph-Embedding-Algorithmus, der Random Walks auf Graphen mit Word2Vec kombiniert, um Knotenrepräsentationen zu lernen.
Default Reasoning
Default Reasoning zieht Schlüsse unter Verwendung von 'Defaults', die in typischen Fällen gelten, während Ausnahmen bei neuen Informationen erlaubt sind.
Dekodierung
Der Prozess der Umwandlung kodierter Daten oder Signale zurück in ihre ursprüngliche oder nutzbare Form, in ML speziell die Token-für-Token-Generierung von Ausgaben.
Demand Forecasting
Vorhersage zukünftiger Nachfrage basierend auf historischen Daten und Faktoren.
Demographic Parity
Fairness-Kriterium: Ein Modell erfüllt Demographic Parity, wenn die Vorhersage-Raten (z.B. Approval-Rate) über alle geschützten Gruppen gleich sind.
Denoising
Denoising ist der Prozess der Rauschentfernung aus einem Signal; in Diffusions-Modellen ist es die iterative Transformation von verrauschten Latents zu einem sauberen Sample.
Dense Passage Retrieval (DPR)
Ein Retrieval-Ansatz, der Bi-Encoder-Embeddings für Query und Passagen nutzt – die Grundlage moderner semantischer Suche.
Dense Retrieval
Retrieval-Methode, die dichte Vektorrepräsentationen (Embeddings) nutzt, um semantisch ähnliche Dokumente zu finden.
Dependency Parsing
Die Analyse der grammatischen Struktur eines Satzes, indem Abhängigkeitsbeziehungen zwischen Wörtern identifiziert werden.
Depthwise Separable Convolution
Eine effiziente Convolution-Variante, die eine Standard-Faltung in zwei Schritte zerlegt – Depthwise (pro Kanal) und Pointwise (1x1 Faltung) – für 8-9x weniger Berechnungen.
Design Pattern
Ein Design Pattern ist eine wiederverwendbare Lösungsvorlage für häufige Softwaredesign-Probleme (Struktur, Verhalten, Kollaboration).
Destillation
Eine Technik, bei der ein kleineres "Schüler"-Modell trainiert wird, das Verhalten eines größeren "Lehrer"-Modells zu imitieren, um Wissen zu transferieren.
Detokenisierung
Der Prozess, Tokens zurück in lesbaren Text umzuwandeln – die Umkehrung der Tokenization.
DETR
Ein Transformer-basiertes Modell für Object Detection, das Bounding Boxes als Set-Prediction ohne Anchor Boxes vorhersagt.
Devin
Der erste "AI Software Engineer" von Cognition Labs, der komplexe Programmieraufgaben autonom über längere Zeit bearbeiten kann.
Dialogflow
Dialogflow ist Googles Cloud-Plattform für den Bau von Conversational AI – mit visuellen Flow-Editoren, NLU und Multi-Channel-Deployment.
Dialogue Management
Komponente eines Conversational AI-Systems, die den Gesprächsfluss steuert.
Difference-in-Differences
Quasi-experimentelle Methode, die kausale Effekte schätzt, indem sie Veränderungen über die Zeit zwischen Treatment- und Kontrollgruppe vergleicht.
Differential Privacy
Eine mathematisch rigorose Definition von Privatsphäre, die garantiert, dass die Teilnahme einer Einzelperson an einem Datensatz statistisch nicht nachweisbar ist – selbst gegen Angreifer mit beliebigem Hintergrundwissen.
Differenzierung
Differenzierung ist das Schaffen von wahrgenommener und realer Einzigartigkeit, die Kunden Ihr Angebot gegenüber Alternativen bevorzugen lässt.
Diffusion LLM
Sprachmodell, das Text nicht autoregressiv Token-für-Token, sondern parallel über einen Denoising-Prozess erzeugt – analog zu Bild-Diffusionsmodellen.
Diffusion Model
Diffusion Models sind generative KI-Modelle, die lernen, Rauschen schrittweise aus Daten zu entfernen, um hochwertige Samples (Bilder, Audio, Video) zu erzeugen.
Digital Farming
Digital Farming ist ein strategisches Framework, das Daten als Boden, Technologie als Werkzeug und Content als Ernte betrachtet – ein iterativer, messbarer und nachhaltiger Ansatz für datengetriebenes Marketing.
Digitale Transformation
Der fundamentale Wandel von Geschäftsprozessen, Kultur und Kundenerfahrungen durch die Integration digitaler Technologien in alle Unternehmensbereiche.
Digitaler Zwilling
Eine virtuelle Echtzeit-Repräsentation eines physischen Systems, Prozesses oder Produkts, die durch Sensordaten kontinuierlich aktualisiert wird.
Dijkstras Algorithmus
Dijkstras Algorithmus berechnet die kürzesten Pfaddistanzen von einem einzelnen Quellknoten zu allen anderen Knoten in einem gewichteten Graphen mit nicht-negativen Kantengewichten.
Dilated Convolution
Dilated Convolution erweitert das rezeptive Feld eines Filters durch Einfügen von Lücken zwischen Filterwerten – größerer Kontext ohne mehr Parameter.
Dimensionsreduktion
Techniken zur Reduzierung der Anzahl von Features bei Erhaltung wichtiger Informationen.
Disaster Recovery
Strategien und Prozesse zur Wiederherstellung kritischer Systeme und Daten nach katastrophalen Ereignissen wie Hardwareausfällen, Cyberangriffen oder Naturkatastrophen.
Disclosure UX
Disclosure UX ist die Menge an Interface-Patterns, die wichtige Systemfakten transparent an Benutzer kommunizieren (z.B. KI-Beteiligung, Limitationen, Datennutzung, Konfidenz und Provenance).
Diskriminierung in KI (Algorithmic Discrimination)
Diskriminierung in KI bezeichnet die systematische Benachteiligung bestimmter Personengruppen durch algorithmische Entscheidungssysteme – häufig als Folge verzerrter Trainingsdaten oder unausgewogener Modellarchitekturen.
Disparate Impact
Ein rechtliches Konzept: Eine scheinbar neutrale Regel oder Praxis, die eine geschützte Gruppe unverhältnismäßig negativ betrifft.
Display Advertising
Online-Werbung mit visuellen Elementen wie Banner, Videos oder interaktiven Formaten.
Disruption
Disruption ist eine Marktverschiebung, bei der neue Technologien oder Geschäftsmodelle Kundenerwartungen und Kostenstrukturen umgestalten und oft Incumbents verdrängen.
Distribution Shift
Eine Veränderung der statistischen Verteilung zwischen Trainings- und Produktionsdaten, die Modell-Performance degradiert.
Diversität in Empfehlungen
Strategien zur Erhöhung der Vielfalt in Empfehlungslisten, um Filter Bubbles zu vermeiden und Nutzerzufriedenheit zu steigern.
DMP (Data Management Platform)
Eine Plattform zur Sammlung, Organisation und Aktivierung von Zielgruppendaten für Marketing.
Document AI
KI-Systeme zur intelligenten Verarbeitung und Analyse von Dokumenten.
Double Machine Learning
Kausale Inferenzmethode, die ML-Modelle nutzt, um Confounding flexibel zu kontrollieren und dabei valide statistische Inferenz zu ermöglichen.
DP-SGD
Ein Trainingsalgorithmus, der Differential Privacy in Stochastic Gradient Descent integriert – durch Gradient Clipping und kalibrierten Noise.
DPO (Direct Preference Optimization)
Eine vereinfachte Alternative zu RLHF, die Modelle direkt auf Präferenz-Daten optimiert, ohne separates Reward Model oder RL-Training.
DPO (Direct Preference Optimization)
Eine vereinfachte Alternative zu RLHF, die menschliche Präferenzen direkt in die Modellgewichte einbettet, ohne ein separates Reward-Modell zu trainieren – einfacher, stabiler und günstiger.
DreamBooth
Eine Fine-Tuning-Methode, die Diffusionsmodelle mit wenigen Bildern (3-5) eines Subjekts personalisiert, um es in beliebigen Kontexten zu generieren.
DROP
Ein Reading-Comprehension-Benchmark, der numerisches Reasoning über Textpassagen erfordert (Zählen, Sortieren, Arithmetik).
Dropout
Eine Regularisierungstechnik, die zufällig Neuronen während des Trainings deaktiviert.
DSGVO
Die EU-Datenschutz-Grundverordnung (seit 2018), die einheitliche Regeln für die Verarbeitung personenbezogener Daten durch Unternehmen festlegt und betroffenen Personen umfassende Rechte einräumt.
DSGVO & KI
Die Anwendung der DSGVO-Prinzipien auf KI-Systeme, insbesondere bei automatisierter Entscheidungsfindung und Profiling.
DSP (Demand-Side Platform)
Eine Plattform, über die Werbetreibende programmatisch Werbeinventar einkaufen.
Durchsatz
Die Anzahl der Tokens oder Requests, die ein System pro Zeiteinheit verarbeiten kann – ein Schlüsselmaß für ML-Inference-Effizienz.
DVC (Data Version Control)
Open-Source-Tool für Daten- und Modell-Versionierung, das Git-Workflows auf ML-Artefakte erweitert.
Dynamic Creative
Automatische Anpassung von Werbemitteln basierend auf Zielgruppen-, Kontext- oder Performance-Daten.
Dynamic Creative Optimization (DCO)
AI-Technologie, die Werbemittel in Echtzeit aus modularen Komponenten zusammenstellt und für jeden User optimiert.
Dynamic Pricing
Algorithmus-basierte Preisanpassung in Echtzeit basierend auf Nachfrage und anderen Faktoren.
Dynamisches Batching
Das Gruppieren mehrerer Inferenz-Anfragen zur Laufzeit, um Durchsatz zu verbessern und Kosten pro Anfrage zu reduzieren.
E
E-Mail-Marketing
Direktmarketing über E-Mail zur Kundenkommunikation und Verkaufsförderung.
E5 Embedding
E5 ist eine Familie von Embedding-Modellen von Microsoft Research, die durch Text-to-Text-Contrastive-Training erstellt werden.
Early Stopping
Regularisierungstechnik, die Training beendet wenn Validation-Loss steigt.
Economics of AGI
Forschungs- und Diskursfeld zu volkswirtschaftlichen Auswirkungen artifizieller allgemeiner Intelligenz auf Arbeit, Produktivität und Wertschöpfung.
Edge AI
KI-Verarbeitung, die auf lokalen Geräten (Edge) statt in der Cloud stattfindet, für niedrige Latenz und Datenschutz.
Edge Computing
Datenverarbeitung nahe an der Datenquelle statt in zentralen Clouds.
Edge MLOps
MLOps-Praktiken speziell für das Deployment, Monitoring und Update von ML-Modellen auf Edge-Geräten und eingebetteten Systemen.
Effektgröße
Quantifiziert die Stärke eines Unterschieds oder Zusammenhangs – unabhängig von der Stichprobengröße, im Gegensatz zum p-Wert.
Einwilligung
Einwilligung (Consent) ist die ausdrückliche, informierte Zustimmung einer Person zur Verarbeitung ihrer personenbezogenen Daten, wie von DSGVO und ePrivacy gefordert.
ELBO (Evidence Lower Bound)
ELBO ist die untere Schranke der Log-Likelihood in Variational Inference – die zentrale Zielfunktion für VAEs und Diffusionsmodelle.
Elo Rating
Ein Bewertungssystem zur Messung relativer Fähigkeiten, ursprünglich aus dem Schach – jetzt Standard für LLM-Leaderboards.
ELT
ELT (Extract, Load, Transform) ist ein Datenintegrations-Paradigma, bei dem Rohdaten erst in ein Data Warehouse geladen und dort transformiert werden.
ELU (Exponential Linear Unit)
Eine Aktivierungsfunktion, die negative Werte exponentiell gegen einen negativen Sättigungswert dämpft – glatter als ReLU mit zero-mean Outputs.
Embedding
Ein Embedding ist eine dichte Vektor-Repräsentation diskreter Daten (Wörter, Bilder, Nutzer, Produkte), bei der semantisch ähnliche Objekte im Vektorraum nahe beieinander liegen.
Embedding Model
Spezialisiertes KI-Modell, das Text, Bilder oder Audio in numerische Vektoren überführt, die semantische Ähnlichkeit messbar machen.
Embedding Models
Spezialisierte Modelle, die Text, Bilder oder andere Daten in dichte Vektoren umwandeln, die semantische Bedeutung erfassen und Ähnlichkeitssuche ermöglichen.
Embeddings
Vektorrepräsentationen von Daten (Wörter, Sätze, Bilder) in einem niedrigdimensionalen Raum, die semantische Ähnlichkeit erfassen.
Embodied Reasoning (ER)
Fähigkeit eines multimodalen Modells, über die physische Welt zu schlussfolgern – Geometrie, Affordanzen, Kausalität – statt nur Pixel zu klassifizieren.
Emergent Abilities
Fähigkeiten, die bei LLMs erst ab einer bestimmten Modellgröße plötzlich erscheinen, ohne bei kleineren Modellen beobachtbar zu sein.
Emotion Recognition
Emotion Recognition erkennt emotionale Zustände (Freude, Wut, Trauer) aus Sprache, Gesichtsausdrücken oder Text – mit Fokus auf Audio-basierte Analyse.
Encoder
Der Teil eines Modells, der Eingabedaten in eine komprimierte Repräsentation transformiert.
Encoder-Decoder
Architektur, die Eingabe in eine Repräsentation kodiert und daraus Ausgabe dekodiert.
Endlicher Automat
Ein mathematisches Modell der Berechnung, das sich in genau einem von endlich vielen Zuständen befindet und durch Eingaben zwischen diesen Zuständen wechselt.
Endpoint
Eine URL, an der ein API-Service erreichbar ist und Anfragen entgegennimmt.
Energy-Based Model (EBM)
Energy-Based Models ordnen Datenpunkten Energiewerte zu – niedrige Energie für wahrscheinliche Daten, hohe für unwahrscheinliche – und generieren durch Energieminimierung.
Engagement Rate
Der Prozentsatz der Nutzer, die mit Inhalten interagieren, im Verhältnis zur Gesamtreichweite.
Ensemble Learning
Die Kombination mehrerer Modelle, um bessere Vorhersagen zu erzielen als jedes einzelne Modell allein.
Entity Extraction
Die automatische Identifizierung und Klassifizierung benannter Entitäten in Text.
Entity Linking
Entity Linking ist der Prozess, Texterwähnungen von Entitäten mit eindeutigen Einträgen in einer Wissensbasis (z. B. Wikidata) zu verknüpfen.
Entity Resolution
Entity Resolution ist der Prozess, mehrere Datensätze aus unterschiedlichen Quellen zu identifizieren, zu matchen und zu derselben realen Entität (Person, Unternehmen, Produkt) zusammenzuführen — auch wenn Schreibweisen, IDs oder Felder nicht identisch sind.
Entscheidungsbaum
Ein ML-Modell, das Entscheidungen als Baumstruktur mit Verzweigungen basierend auf Feature-Werten darstellt.
Entscheidungsfindung
Entscheidungsfindung ist der Prozess der Auswahl einer Aktion (oder Nicht-Aktion) unter Alternativen basierend auf Zielen, Evidenz, Einschränkungen und Unsicherheit.
Entscheidungsschwelle
Der Grenzwert, der verwendet wird, um einen Modell-Score in eine Aktion umzuwandeln (z.B. genehmigen/ablehnen, routen/eskalieren).
Entscheidungstheorie
Die Entscheidungstheorie untersucht, wie Agenten unter Unsicherheit Entscheidungen treffen sollten, oft durch Maximierung des erwarteten Nutzens unter Constraints.
Envelope Encryption
Envelope Encryption verschlüsselt Daten mit einem kurzlebigen Datenschlüssel, dann verschlüsselt diesen Datenschlüssel mit einem langlebigeren Master-Schlüssel (oft in KMS/HSM).
Episodic Memory (Agent Memory Layer)
Persistente, durchsuchbare Speicherschicht, in der ein Agent Ereignisse, Entscheidungen und Nutzerpräferenzen über Sessions hinweg ablegt – jenseits des Context-Windows.
Epistemische vs. Aleatorische Unsicherheit
Epistemische Unsicherheit entsteht aus fehlendem Wissen (reduzierbar durch mehr Daten); aleatorische Unsicherheit ist inhärentes Rauschen in den Daten (nicht reduzierbar).
Epoche (Epoch) im Machine Learning
Eine Epoche bezeichnet im Machine Learning einen vollständigen Durchlauf eines Lernalgorithmus durch den gesamten Trainingsdatensatz — also die Situation, in der jedes Trainingsbeispiel genau einmal verwendet wurde, um die Modellgewichte zu aktualisieren.
Equalized Odds
Fairness-Kriterium: Ein Modell erfüllt Equalized Odds, wenn True Positive Rate und False Positive Rate über alle geschützten Gruppen gleich sind.
Ereignisgesteuerte Architektur
Softwarearchitektur, in der Komponenten durch Events kommunizieren.
Erklärbare KI (XAI)
Erklärbare KI (XAI) umfasst Methoden und Produktpraktiken, die KI-Outputs verständlich, nachvollziehbar und auditierbar machen.
Erklärbarkeit
Die Fähigkeit, die Entscheidungen oder Vorhersagen eines KI-Modells für Menschen verständlich zu machen.
Error Rate
Error Rate ist der Anteil der Ergebnisse, die relativ zu einer definierten Ground Truth oder Akzeptanzkriterien falsch sind.
ETL
Extract, Transform, Load – der Prozess der Datenextraktion, Transformation und Laden in Zielsysteme.
EU AI Act
Die erste umfassende gesetzliche Regulierung für Künstliche Intelligenz weltweit, die 2024 vom EU-Parlament verabschiedet wurde und risikobasierte Anforderungen für KI-Systeme festlegt.
EU AI Act
EU-Verordnung 2024/1689, die KI-Systeme nach Risikoklassen reguliert und ab 2026 stufenweise anwendbar ist.
Euklidische Distanz
Geometrische Distanz zwischen zwei Punkten im Vektorraum.
Eval Framework
Systematisches Framework zur Bewertung von LLM-Outputs anhand definierter Kriterien wie Korrektheit, Relevanz, Sicherheit und Stil.
Evaluation Harness
Ein Framework zur systematischen Bewertung von Modell-Performance über verschiedene Metriken und Testfälle.
Event Tracking
Die Erfassung und Analyse von Nutzerinteraktionen und -aktionen auf digitalen Plattformen.
Exit Rate
Der Prozentsatz der Besucher, die eine Website von einer bestimmten Seite aus verlassen.
Expected Calibration Error (ECE)
Die Standard-Metrik zur Messung der Kalibrierungsqualität eines Klassifikators – der gewichtete Durchschnitt der Differenz zwischen Konfidenz und Accuracy über Bins.
Experiment Tracking
Systematische Protokollierung und Verwaltung von ML-Experimenten.
Explainability UX Patterns
Explainability UX Patterns sind Interface-Muster, die Benutzern helfen zu verstehen, warum ein KI-System ein Ergebnis erzeugt hat, welche Evidenz es verwendet hat und welche Aktionen es durchgeführt (oder verweigert) hat.
Exploration vs. Exploitation
Das fundamentale RL-Dilemma: Soll der Agent bekannte gute Aktionen ausnutzen (Exploitation) oder neue Optionen erkunden (Exploration)?
Explorative Datenanalyse
Der Prozess der visuellen und statistischen Untersuchung von Daten vor dem Modellbau.
Exponential Backoff
Exponential Backoff erhöht die Wartezeit zwischen Retries exponentiell nach jedem Failure (z.B. 100ms → 200ms → 400ms → 800ms…).
Exponential Moving Average (EMA)
Technik, die einen exponentiell gewichteten Durchschnitt der Modellgewichte über den Trainingsverlauf pflegt – das EMA-Modell generalisiert oft besser als das finale Modell.
Exponentielle Glättung
Eine Familie statistischer Zeitreihen-Methoden, die aktuelle Beobachtungen exponentiell stärker gewichtet als vergangene.
Exponentielles Wachstum
Ein Wachstumsmuster, bei dem eine Größe proportional zu ihrem aktuellen Wert wächst, was zu einer Verdopplung in konstanten Zeitintervallen führt.
F
F&E (Forschung & Entwicklung)
Systematische Aktivitäten zur Gewinnung neuer Erkenntnisse (Forschung) und deren Anwendung zur Entwicklung neuer Produkte, Dienstleistungen oder Prozesse (Entwicklung).
F1 Score
Das harmonische Mittel aus Precision und Recall, eine einzelne Metrik, die beide Aspekte der Klassifikationsleistung balanciert.
Facebook Ads
Die Werbeplattform von Meta für bezahlte Anzeigen auf Facebook und Instagram.
Fairness
Das Ziel, dass KI-Systeme alle Gruppen gleichberechtigt behandeln und keine systematische Diskriminierung verursachen.
FAISS
Eine Open-Source-Library von Meta für effiziente Ähnlichkeitssuche und Clustering von dichten Vektoren – der Standard für lokale Vektor-Indizes.
Faithfulness
Wie genau ein LLM-Output den bereitgestellten Quellen und Instruktionen entspricht.
FastText
Facebooks Open-Source-Library für effiziente Textklassifikation und Wort-Embeddings mit Sub-Word-Informationen.
Feature Engineering
Der Prozess der Auswahl, Transformation und Erstellung von Eingabevariablen (Features) für Machine-Learning-Modelle, um deren Vorhersagekraft zu verbessern.
Feature Extraction
Der Prozess der automatischen Ableitung relevanter Merkmale aus Rohdaten.
Feature Importance
Feature Importance quantifiziert, wie viel jedes Input-Feature zu den Vorhersagen eines Modells beiträgt (global oder für eine spezifische Vorhersage).
Feature Store
Eine zentrale Infrastruktur für die Verwaltung, Speicherung und Bereitstellung von ML-Features über Training und Serving hinweg.
Federated Learning
Ein dezentraler Trainingsansatz, bei dem Modelle auf vielen Geräten lokal trainiert werden und nur Modell-Updates (nicht Rohdaten) an einen zentralen Server gesendet werden – Training ohne Datenzentralisierung.
Feed-Forward Network (FFN)
Im Transformer-Kontext: ein zweischichtiges MLP, das nach der Attention-Schicht auf jede Position unabhängig angewandt wird.
Feedback-Loop
Ein System, in dem Outputs zurückgeführt werden, um zukünftige Inputs oder Entscheidungen zu beeinflussen.
Fehleranalyse
Systematische Untersuchung von Modellfehlern zur Identifizierung von Mustern und Verbesserungsmöglichkeiten.
Fehlertoleranz
Fehlertoleranz ist die Fähigkeit eines Systems, bei Komponentenausfällen korrekt weiterzuarbeiten (oder sicher zu degradieren).
Few-Shot Learning
Eine Technik, bei der dem Modell wenige Beispiele im Prompt gegeben werden, um das gewünschte Output-Format oder die Aufgabe zu demonstrieren.
Fiddler AI
Eine Enterprise-Plattform für Model Performance Management, die Unternehmen hilft, KI-Modelle schneller zu launchen und zu aktualisieren, indem sie Probleme automatisch erkennt und die Effizienz steigert.
Fine-Tuning
Das Anpassen eines vortrainierten Modells an eine spezifische Aufgabe durch weiteres Training auf aufgabenspezifischen Daten.
FinOps
Eine Disziplin für das Management von Cloud-Kosten, die Engineering, Finance und Business zusammenbringt, um datengesteuerte Entscheidungen über Cloud-Ausgaben zu treffen.
FinOps für KI
FinOps für KI wendet Financial-Operations-Praktiken (Kostentransparenz, Optimierung, Budgetierung, Accountability) auf KI-Workloads und KI-Produktnutzung an.
Fireworks AI
Hochleistungs-Inferenz-Plattform für generative KI mit Fokus auf schnelle, kosteneffiziente Modell-Bereitstellung.
First-Party-Data-KI
Strategischer Ansatz, eigene Kundendaten als Differenzierungs-Layer auf generischen Foundation-Modellen einzusetzen.
First-Party-Daten
Daten, die direkt von eigenen Kunden und Nutzern gesammelt werden.
Flash Attention
Eine optimierte Implementierung des Attention-Mechanismus, die Speicherzugriffe reduziert und GPU-Effizienz maximiert durch Tiling und Kernel-Fusion.
Flow Matching
Flow Matching ist eine generative Modellierungstechnik, die gerade Transportpfade zwischen Rausch- und Datenverteilung lernt – schneller und stabiler als klassische Diffusion.
Flux
Ein neues Open-Source-Bildgenerierungsmodell von Black Forest Labs (ex-Stability AI), das in Qualität mit Midjourney konkurriert.
Focal Loss
Modifizierte Cross-Entropy-Loss, die schwer klassifizierbare Beispiele stärker gewichtet und leichte Beispiele herunterskaliert.
Fokusgruppe
Eine qualitative Forschungsmethode mit einer kleinen Gruppe für tiefgehende Diskussionen.
Forward Pass
Die Berechnung des Modell-Outputs durch Vorwärtspropagation durch alle Schichten.
Foundation Model
Ein großes, auf breiten Daten vortrainiertes Modell, das für viele nachgelagerte Aufgaben angepasst werden kann.
Fraud Detection
KI-gestützte Erkennung von betrügerischen Aktivitäten und Transaktionen.
Frequency Capping
Begrenzung der Anzahl, wie oft eine Anzeige einem Nutzer gezeigt wird.
FSDP (Fully Sharded Data Parallel)
PyTorchs native Implementierung von Parameter-Sharding – verteilt Modell-Parameter, Gradienten und Optimizer-States über GPUs für memory-effizientes Training.
Full-Stack
Entwicklung, die sowohl Frontend als auch Backend einer Anwendung umfasst.
Function Calling
Die Fähigkeit von LLMs, strukturiert externe Funktionen aufzurufen – das Modell entscheidet welche Funktion mit welchen Parametern, die Ausführung erfolgt extern.
Function Calling (LLM)
Function Calling ermöglicht LLMs, strukturierte Funktionsaufrufe zu generieren – die Brücke zwischen natürlicher Sprache und APIs, Datenbanken oder externen Tools.
Funnel-Analyse
Die Analyse von Konversionsraten durch die verschiedenen Stufen einer Customer Journey.
Fuzzy Inferenz System
Ein Fuzzy Inferenz System verwendet Fuzzy-Logik-Regeln, um Eingaben auf Ausgaben abzubilden, wenn Konzepte unscharf sind (z.B. "hohes Risiko", "mittlere Nachfrage").
Fuzzy Matching
Techniken zum Finden von ungefähren statt exakten Übereinstimmungen in Daten.
G
G-Eval
Ein LLM-Evaluation-Framework, das Chain-of-Thought-Reasoning und gewichtete Wahrscheinlichkeiten für nuanciertere Bewertungen nutzt.
Gauß-Verteilung
Eine symmetrische Wahrscheinlichkeitsverteilung, auch Normalverteilung genannt.
Gaussian Mixture Model (GMM)
Ein probabilistisches Modell, das Daten als Mischung von Gauß-Verteilungen darstellt.
Gebotsmanagement
Die Optimierung von Geboten in Echtzeit-Auktionen für digitale Werbung.
GELU (Gaussian Error Linear Unit)
Eine glatte Aktivierungsfunktion, die Inputs mit ihrer kumulativen Normalverteilungs-Wahrscheinlichkeit gewichtet – Standard in BERT, GPT-2 und vielen Transformern.
Gemeinsame Verteilung
Die Wahrscheinlichkeitsverteilung, die die Wahrscheinlichkeit von Kombinationen mehrerer Zufallsvariablen beschreibt.
Gemini
Googles multimodales AI-Modell – nativ für Text, Bild, Audio, Video und Code gebaut, nicht nachträglich zusammengesetzt.
Gemini 3.1 Pro
Googles Flaggschiff-LLM 2026 mit nativ multimodaler Architektur und 2M-Token-Kontext.
Gemma 4
Open-Weight-Modellfamilie von Google für On-Device- und Edge-Inferenz mit Größen von 2B bis 27B Parametern.
Genauigkeit
Eine Metrik im maschinellen Lernen, die den Anteil korrekter Vorhersagen an allen Vorhersagen misst.
Generalisierung
Die Fähigkeit eines Modells, auf neuen, ungesehenen Daten gut zu performen.
Generative Adversarial Network (GAN)
Architektur mit zwei konkurrierenden Netzwerken zur Generierung realistischer Daten.
Generative AI
KI-Modelle, die neue Inhalte erstellen – Text, Bilder, Audio, Code oder strukturierte Daten.
Generative Engine Optimization (GEO)
Optimierung von Inhalten für die Sichtbarkeit in generativen KI-Suchmaschinen wie ChatGPT, Perplexity und Google AI Mode.
GEO (Generative Engine Optimization)
Generative Engine Optimization (GEO) ist die strategische Optimierung von Inhalten, Marke und Datenstruktur für generative KI-Suchmaschinen wie ChatGPT, Perplexity, Google AI Overviews und Claude — mit dem Ziel, sowohl zitiert als auch als Antwortquelle aktiv genutzt zu werden.
Geo-Targeting
Auslieferung von Inhalten oder Anzeigen basierend auf dem Nutzerstandort.
Gewichts-Initialisierung
Gewichts-Initialisierung bestimmt die Startwerte der Netzwerk-Parameter – kritisch für stabiles Training und schnelle Konvergenz.
GGUF
Ein Dateiformat für quantisierte LLM-Gewichte, das von llama.cpp entwickelt wurde und effiziente Inference auf CPU und Consumer-GPUs ermöglicht.
GitHub Copilot
Ein AI Coding Assistant von GitHub/Microsoft, der auf Basis von OpenAI-Modellen Code-Vorschläge in Echtzeit direkt im Editor liefert.
GloVe
GloVe (Global Vectors for Word Representation) ist ein Worteinbettungsverfahren, das globale Kookkurrenz-Statistiken eines Textkorpus nutzt, um semantische Wortvektoren zu erzeugen.
Google Ads
Google Ads ist Googles Werbeplattform für Such-, Display-, Video- und App-Kampagnen, die Auktionsmechanismen zur Anzeigenauslieferung nutzt.
Google AI Overviews
Googles AI-generierte Zusammenfassungen am Anfang der Suchergebnisse – synthetisiert aus mehreren Quellen.
Google Analytics
Ein Web-Analytics-Dienst von Google zur Messung und Analyse von Website-Traffic.
Google Colab
Google Colab (Colaboratory) ist eine kostenlose, cloudbasierte Jupyter-Notebook-Umgebung mit GPU/TPU-Zugang für Machine Learning und Datenanalyse.
Google DeepMind
Googles fusionierte KI-Forschungsabteilung, entstanden aus DeepMind und Google Brain, verantwortlich für Gemini und bahnbrechende AI-Forschung.
Google Flow
Googles KI-gestützte Kreativplattform für Bildgenerierung und -bearbeitung, die Nano Banana 2 als Standard-Modell nutzt.
Google Search Console
Kostenloses Tool von Google zur Überwachung und Optimierung der Suchpräsenz.
Google Vertex AI
Googles Unified-ML-Plattform auf Google Cloud für Training, Deployment und Management von ML-Modellen mit AutoML und Custom Training.
Governance
Governance ist die Menge an Rollen, Regeln, Prozessen und Kontrollen, die sicherstellen, dass ein System verantwortungsvoll und vorhersehbar genutzt wird – ausgerichtet auf Risiko, Compliance und Geschäftsziele.
GPQA
Ein Benchmark mit 448 Experten-Level-Fragen aus Physik, Biologie und Chemie, die so schwer sind, dass auch PhDs ohne Expertise nur 30% erreichen.
GPQA Diamond
Hochanspruchsvoller Wissenschafts-Benchmark mit Fragen auf Promotionsniveau in Biologie, Physik und Chemie.
GPT (Generative Pre-trained Transformer)
Eine Familie von großen Sprachmodellen von OpenAI, die auf der Transformer-Architektur basieren.
GPT Orchestration
Architekturansatz, mehrere spezialisierte GPTs/LLMs koordiniert und mit Routing-Logik zu komplexen Workflows zu verbinden.
GPT-4
OpenAIs fortschrittlichstes multimodales Sprachmodell, das Text, Bilder und Code verarbeiten kann und als Maßstab für LLM-Leistung gilt.
GPT-4V (Vision)
OpenAIs GPT-4 Erweiterung mit Bildverständnis – der Durchbruch, der ChatGPT das "Sehen" beibrachte.
GPT-5
OpenAIs fortschrittlichstes Sprachmodell (2026), das multimodale Verarbeitung, erweitertes Reasoning und natives Tool-Use in einem Modell vereint.
GPT-5.4
OpenAIs Flaggschiff-LLM 2026 mit Thinking-Mode, multimodaler Verarbeitung und Agent-Native-Architektur.
GPU (Graphics Processing Unit)
Spezialisierter Prozessor für parallele Berechnungen, ideal für KI-Training.
GQA
Eine Attention-Variante, bei der mehrere Query-Heads sich ein Key-Value-Paar teilen, um KV-Cache-Größe und Speicherverbrauch zu reduzieren.
Grad-CAM
XAI-Methode, die Heatmaps generiert, um zu zeigen, welche Bildbereiche ein CNN für seine Entscheidung am wichtigsten findet.
Gradient Accumulation
Gradient Accumulation summiert Gradienten über mehrere Mini-Batches auf, bevor ein Optimierungsschritt erfolgt – simuliert größere Batch-Sizes ohne mehr GPU-Memory.
Gradient Centralization
Einfache Technik, die den Mittelwert der Gradienten subtrahiert, bevor sie auf die Gewichte angewendet werden – verbessert Generalisierung ohne Kosten.
Gradient Checkpointing
Gradient Checkpointing spart GPU-Memory, indem Zwischen-Aktivierungen verworfen und beim Backward-Pass neu berechnet werden – tauscht Compute gegen Memory.
Gradient Clipping
Gradient Clipping begrenzt die Norm oder den Wert von Gradienten während des Trainings, um Exploding Gradients zu verhindern.
Gradient Noise
Das natürliche Rauschen in Gradientenschätzungen durch Mini-Batch-Sampling – wirkt als implizite Regularisierung und hilft, bessere Minima zu finden.
Gradientenabstieg
Ein Optimierungsalgorithmus, der iterativ Parameter in Richtung des steilsten Abstiegs der Verlustfunktion anpasst.
Graph Attention Network (GAT)
Graph Attention Networks nutzen Aufmerksamkeitsmechanismen, um beim Message Passing automatisch zu lernen, welche Nachbar-Knoten wichtiger sind.
Graph Classification
Die Aufgabe, einen gesamten Graphen einer Klasse zuzuordnen, basierend auf seiner Struktur und Knoteneigenschaften.
Graph Convolutional Network
Eine GNN-Variante, die Faltungsoperationen auf Graphen verallgemeinert, um Knotenrepräsentationen zu lernen.
Graph Isomorphism Network
Ein GNN mit maximaler Diskriminierungskraft unter Message-Passing-Architekturen, theoretisch fundiert durch den Weisfeiler-Leman-Test.
Graph Neural Network
Eine Klasse neuronaler Netze, die direkt auf Graphstrukturen operieren und Knoten-, Kanten- und Grapheigenschaften lernen.
Graph Transformer
Graph Transformers kombinieren Transformer-Architekturen mit Graph-Strukturen und nutzen Self-Attention direkt auf Graph-Knoten.
Graph-Datenbank
Eine Graph-Datenbank speichert Daten als Knoten (Entitäten) und Kanten (Beziehungen) und ist optimiert für Abfragen über vernetzte Strukturen.
Graph-Traversierung
Graph-Traversierung ist das systematische Besuchen von Knoten und Kanten in einem Graphen (z.B. mittels BFS oder DFS), um Struktur zu erkunden oder Ziele zu finden.
GraphSAGE
Ein induktives GNN-Framework, das durch Sampling und Aggregation von Nachbarschaften skalierbare Knotenrepräsentationen lernt.
Graphsuche
Graphsuche ist der Prozess des Erkundens eines Graphen, um einen Zielknoten, einen Pfad oder eine optimale Lösung unter einem definierten Ziel (z.B. kürzester Pfad, niedrigste Kosten) zu finden.
Great Expectations
Open-Source-Framework für Datenvalidierung, Dokumentation und Profiling mit einem deklarativen Expectation-System.
Greedy Best-First Search
Eine Suchstrategie, die den Knoten erweitert, der dem Ziel am nächsten erscheint, basierend nur auf einem heuristischen Score h(n), ohne die bisherigen Kosten zu berücksichtigen.
Greedy Decoding
Eine Decoding-Strategie, die immer das Token mit der höchsten Wahrscheinlichkeit wählt – deterministisch, aber oft repetitiv.
Greedy-Algorithmus
Ein Algorithmus, der in jedem Schritt die lokal optimale Wahl trifft.
Grid Search
Hyperparameter-Tuning-Methode, die systematisch alle Kombinationen eines vordefinierten Parameterraums durchprobiert.
Griffin
Googles Hybrid-Architektur, die lineare Recurrences (Gated RNN) mit lokaler Attention kombiniert und in RecurrentGemma produktionalisiert wurde.
Grok
xAIs LLM mit Echtzeit-Zugang zu X (Twitter), bekannt für humorvollen, unzensierten Stil und aktuelle Informationen.
Groq
KI-Inferenz-Plattform mit proprietärer LPU-Hardware (Language Processing Unit), die extrem schnelle Token-Generierung ermöglicht.
Ground Truth
Die tatsächlichen, korrekten Daten oder Labels, die als Referenz für Modelltraining und -evaluation dienen.
Grounding
Techniken zur Verankerung von LLM-Outputs in verifizierbaren Quellen – das Modell bezieht sich explizit auf Dokumente, Daten oder Fakten statt frei zu generieren.
Group Normalization
Group Normalization teilt Channels in Gruppen und normalisiert innerhalb jeder Gruppe – funktioniert batch-unabhängig und ist ideal für kleine Batch-Größen.
Growth Hacking
Experimentelle Marketingstrategien mit Fokus auf schnelles, kostengünstiges Wachstum.
GRPO (Group Relative Policy Optimization)
GRPO ist eine RL-Alignment-Methode, die ohne separates Reward Model auskommt – stattdessen werden Gruppen von Antworten relativ zueinander bewertet.
GRU (Gated Recurrent Unit)
Eine vereinfachte RNN-Architektur mit Gates zur Kontrolle des Informationsflusses.
GRU (Gated Recurrent Unit)
GRU ist eine vereinfachte RNN-Architektur mit Update- und Reset-Gate – weniger Parameter als LSTM bei vergleichbarer Leistung.
GSM8K
Ein Benchmark mit 8.500 Grundschul-Matheaufgaben, die mehrstufiges Reasoning erfordern.
Guardrails
Mechanismen und Systeme, die KI-Outputs überwachen, filtern und korrigieren, um sicherzustellen, dass sie innerhalb definierter Grenzen für Sicherheit, Ethik und Markenrichtlinien bleiben.
Guardrails
Mechanismen zur Einschränkung und Validierung von AI-Outputs – verhindert toxische, falsche oder off-brand Inhalte und unkontrollierte Agenten-Aktionen.
Guidance Scale
Guidance Scale ist ein Parameter (häufig in Classifier-Free Guidance), der kontrolliert, wie stark ein Diffusions-Modell dem Text-Prompt folgt versus diversere Outputs generiert.
H
Hallucination Detection
Methoden und Tools zur Erkennung von "Halluzinationen" – falschen oder erfundenen Informationen, die LLMs mit hoher Zuversicht als Fakten präsentieren.
Halluzination (KI)
Das Phänomen, bei dem KI-Modelle plausibel klingende, aber faktisch falsche oder erfundene Informationen generieren, die nicht in den Trainingsdaten enthalten waren.
Halluzinationsrate
Der Prozentsatz der KI-generierten Ausgaben, die nicht durch Fakten oder Quellen gestützte Informationen enthalten.
Handlungsrelevante Insights
Informationen, die direkt zur Entscheidungsfindung oder Verbesserung genutzt werden können, oft aus Datenanalyse oder KI-Insights abgeleitet.
Hardware Security Module (HSM)
Ein HSM ist ein manipulationsresistentes Hardware-Gerät, das kryptografische Schlüssel sicher generiert, speichert und verwendet.
Hash-Funktion
Eine Funktion, die Eingabedaten auf einen festen Ausgabewert abbildet, idealerweise kollisionsfrei.
Hash-Tabelle
Eine Hash-Tabelle bildet Schlüssel auf Werte mittels einer Hash-Funktion ab und ermöglicht durchschnittlich O(1) Lookups, Einfügungen und Löschungen.
Headless CMS
Ein Content-Management-System, das Inhalte über APIs bereitstellt ohne festgelegtes Frontend.
Heatmap
Eine visuelle Darstellung von Daten, bei der Werte durch Farbintensität kodiert werden.
HellaSwag
Ein Benchmark für Common-Sense-Reasoning, bei dem LLMs die plausibelste Fortsetzung eines Szenarios wählen müssen.
HELM
Ein umfassendes Evaluations-Framework von Stanford, das LLMs auf Dutzenden von Dimensionen wie Accuracy, Fairness, Robustness und Efficiency gleichzeitig bewertet.
Hero Section
Der prominente, visuelle Bereich am Anfang einer Webseite mit Hauptbotschaft und Call-to-Action.
Heterogener Graph
Ein Graph mit verschiedenen Typen von Knoten und/oder Kanten, der unterschiedliche Entitätsarten und Beziehungen modelliert.
Heuristik
Eine praktische Bewertungsregel oder Schätzung, die Suche oder Entscheidungsfindung zu vielversprechenden Optionen leitet, ohne Optimalität zu garantieren.
Heuristische Suche
Heuristische Suche ist eine Familie von Suchalgorithmen, die eine Heuristik (eine leitende Schätzung) nutzen, um einen Problemraum effizienter zu erkunden als uninformierte Suche.
High-Level Representation
Eine High-Level Representation abstrahiert Rohdaten in bedeutungsvollere Strukturen (Symbole, Konzepte, latente Variablen oder Zusammenfassungen).
Hit Rate
Misst den Anteil der Queries, für die mindestens ein relevantes Ergebnis in den Top-k gefunden wurde – oft als Recall@1.
HNSW
Hierarchical Navigable Small World – ein Graph-basierter Algorithmus für effiziente Approximate Nearest Neighbor Search.
HNSW Index
HNSW (Hierarchical Navigable Small World) ist eine Methode zur approximativen nächsten Nachbarsuche (ANN), die geschichtete Graphstrukturen für schnelle Ähnlichkeitssuche in hochdimensionalen Vektorräumen verwendet.
Hochverfügbarkeit
Ein Systemdesign-Ansatz, der kontinuierlichen Betrieb und minimale Ausfallzeiten gewährleistet, typischerweise durch Redundanz und automatisches Failover.
Hold-Out Validierung
Einfachste Evaluationsmethode: Datensatz wird einmalig in Training und Testset aufgeteilt (z.B. 80/20).
Homomorphe Verschlüsselung
Ein kryptografisches Verfahren, das Berechnungen direkt auf verschlüsselten Daten ermöglicht, ohne sie vorher entschlüsseln zu müssen.
Horizontale Skalierung
Erhöhung der Kapazität durch Hinzufügen weiterer Maschinen statt durch Aufrüsten einzelner Systeme.
HTTPS (Hypertext Transfer Protocol Secure)
HTTPS ist HTTP über TLS und bietet verschlüsselten Transport, Integrität und Server-Authentifizierung für Web-Kommunikation.
HuBERT
HuBERT (Hidden-Unit BERT) ist ein Self-Supervised-Speech-Modell von Meta, das durch Vorhersage von diskretisierten Audio-Clustern hochwertige Speech-Representations lernt.
Hugging Face
Die führende Open-Source-Plattform für Machine Learning, die als "GitHub für AI" fungiert und über 500.000 Modelle hostet.
Hugging Face Tokenizers
Hochperformante Rust-basierte Tokenizer-Library von Hugging Face mit BPE, WordPiece und Unigram-Support.
Human Evaluation
Die Bewertung von KI-Outputs durch menschliche Annotatoren – der Gold-Standard für Qualitätsmessung, aber teuer und langsam.
Human-in-the-Loop
Designprinzip bei dem Menschen an kritischen Punkten in automatisierten KI-Workflows einbezogen werden, um Entscheidungen zu validieren, korrigieren oder freizugeben.
HumanEval
Ein Benchmark für Code-Generierung mit 164 Python-Programmieraufgaben, evaluiert durch Pass@k (Code muss Tests bestehen).
Hybrid Search
Eine Suchmethode, die lexikalische Suche (BM25/Keyword) mit semantischer Suche (Embeddings) kombiniert, um die Stärken beider Ansätze zu nutzen.
Hybrides Empfehlungssystem
Ein Empfehlungssystem, das mehrere Ansätze (Collaborative Filtering, Content-Based, Knowledge-Based) kombiniert für bessere Empfehlungsqualität.
Hybrides KI-System
Ein hybrides KI-System kombiniert mehrere KI-Paradigmen—typischerweise symbolische/regelbasierte Methoden mit statistischen/ML-Modellen (einschließlich LLMs).
Hyena
Ein subquadratischer Attention-Ersatz basierend auf langen Convolutions und datengesteuerten Gates, der O(N log N) statt O(N²) skaliert.
Hyper-Personalisierung
Die nächste Stufe der Personalisierung: AI nutzt Echtzeit-Daten und Kontext für ultra-individuelle Erlebnisse in jedem Moment.
Hyperparameter
Konfigurationseinstellungen, die vor dem Training gewählt werden und beeinflussen, wie ein Modell lernt.
Hyperparameter-Optimierung
Der systematische Prozess der Suche nach den besten Hyperparameter-Einstellungen für ein ML-Modell.
Hypothesengenerierung
Hypothesengenerierung ist das Produzieren von Kandidaten-Erklärungen (oder Kandidaten-Lösungen), die beobachtete Evidenz plausibel erklären könnten.
Hypothesentests
Hypothesentests sind statistische Verfahren, mit denen geprüft wird, ob eine über Stichprobendaten beobachtete Aussage über eine Grundgesamtheit (Alternativhypothese) im Vergleich zu einer Standardannahme (Nullhypothese) statistisch belastbar ist.
I
ICP
Eine detaillierte Beschreibung des idealen Kunden für ein Produkt oder eine Dienstleistung.
Identität
Identität ist die Repräsentation eines Principals (Benutzer, Service, Gerät), der in einem System authentifiziert und autorisiert werden kann.
Identity and Access Management (IAM)
IAM ist die Menge von Prozessen und Systemen, die Identitäten verwalten und ihren Zugang zu Ressourcen kontrollieren (Authentifizierung + Autorisierung + Governance).
Ideogram
Ein Text-zu-Bild-Modell, das sich durch herausragende Text-Rendering-Fähigkeiten in generierten Bildern auszeichnet.
IFEval
Ein Benchmark, der testet, wie gut LLMs explizite Format-Anweisungen befolgen (z.B. "Antworte in genau 3 Absätzen", "Beginne jeden Satz mit einem Großbuchstaben").
Image Captioning
Automatische Generierung von Textbeschreibungen für Bilder.
Image Understanding
Die Fähigkeit von AI, nicht nur Objekte zu erkennen, sondern den semantischen Kontext und die Bedeutung von Bildern zu verstehen.
Image-to-Image
Modelle, die ein Eingabebild in ein modifiziertes oder transformiertes Ausgabebild umwandeln.
Image-to-Image (img2img)
Image-to-Image transformiert ein Eingabebild basierend auf einem Text-Prompt und einem Denoise-Stärke-Parameter – von subtilen Änderungen bis zur kompletten Neugestaltung.
Image-to-Text
AI-Generierung von natürlichsprachigen Beschreibungen für Bilder – von einfachen Captions bis zu detaillierten Analysen.
Image-to-Video
KI-Technologie, die statische Bilder in bewegte Videos verwandelt, indem sie realistische Animation, Kamerabewegung und Szenenentwicklung hinzufügt.
ImageBind
Metas multimodales Embedding-Modell, das sechs Modalitäten (Bild, Text, Audio, Video, Tiefe, Thermal) in einem gemeinsamen Vektorraum vereint.
Imitationslernen
Ein ML-Ansatz, bei dem ein Agent lernt, indem er Expertenverhalten beobachtet und nachahmt.
Implizites Feedback
Nutzersignale, die aus Verhalten abgeleitet werden (Klicks, Verweildauer, Käufe) statt aus expliziten Bewertungen.
Impression
Einzelne Einblendung einer Anzeige oder eines Inhalts.
In-Context Learning
Die Fähigkeit von LLMs, aus dem Kontext des Prompts zu lernen, ohne Modellgewichte zu ändern – das Fundament moderner Prompt-Techniken.
Incident Response
Strukturierte Prozesse und Verfahren zur Erkennung, Analyse, Eindämmung und Behebung von Sicherheitsvorfällen oder Systemausfällen.
Incrementality
Der kausale, zusätzliche Effekt einer Marketing-Maßnahme über das hinaus, was ohnehin passiert wäre.
Indexierung
Der Prozess, bei dem Suchmaschinen Webseiten entdecken, crawlen und in ihre Datenbank aufnehmen.
Induktives Schlussfolgern
Eine Form der logischen Schlussfolgerung, bei der aus spezifischen Beobachtungen allgemeine Regeln oder Muster abgeleitet werden – die Konklusion ist wahrscheinlich, aber nicht garantiert.
Inference
Der Prozess, bei dem ein trainiertes KI-Modell auf neue Eingaben angewendet wird, um Vorhersagen oder Outputs zu generieren.
Inference-Optimierung
Die Gesamtheit aller Techniken zur Beschleunigung und Effizienzsteigerung der LLM-Inference, einschließlich Quantisierung, Batching, Caching und Hardware-Optimierung.
Inference-Time Compute
Eine Technik, bei der KI-Modelle bei der Antwortgenerierung (Inferenz) zusätzliche Rechenzeit nutzen, um durch längeres "Nachdenken" bessere Ergebnisse zu erzielen.
Inferenzmaschine
Die Kernkomponente eines Expertensystems, die logische Regeln auf eine Wissensbasis anwendet, um neue Fakten abzuleiten oder Entscheidungen zu treffen.
Influencer Marketing
Marketing durch Zusammenarbeit mit Personen, die eine engagierte Follower-Basis haben.
Information Hiding
Ein Softwaredesign-Prinzip, das interne Implementierungsdetails eines Moduls vor anderen Systemteilen verbirgt, um Änderungen zu lokalisieren.
Information Retrieval
Das Finden relevanter Dokumente oder Informationen aus einer großen Sammlung.
Informationsextraktion
Die automatische Extraktion strukturierter Informationen (Entitäten, Relationen, Fakten) aus unstrukturiertem Text.
Innovation
Die Einführung neuer Ideen, Methoden, Produkte oder Prozesse, die Wert schaffen und bestehende Lösungen verbessern oder ersetzen.
Inpainting
Das Auffüllen fehlender oder maskierter Bereiche in einem Bild mit plausiblem Inhalt.
Insights
Insights sind bedeutungsvolle Interpretationen von Daten, die Unsicherheit reduzieren und bessere Entscheidungen ermöglichen (deskriptiv, diagnostisch, prädiktiv oder präskriptiv).
Instance Normalization
Instance Normalization normalisiert jede Feature-Map (Channel) jedes Samples einzeln – Standard in Style Transfer und Bildgenerierung.
Instruction Tuning
Eine Fine-Tuning-Methode, bei der Modelle auf (Instruktion, Antwort)-Paaren trainiert werden, um Anweisungen in natürlicher Sprache zu befolgen – der Schritt, der Base Models zu hilfreichen Assistenten macht.
Instructor Embedding
Ein Embedding-Modell, das task-spezifische Instruktionen im Prompt nutzt, um Embeddings für verschiedene Aufgaben zu optimieren.
Instrumentalvariable
Eine Variable, die die Treatment-Variable beeinflusst, aber das Outcome nur über das Treatment – nicht direkt. Ermöglicht kausale Schätzungen trotz Confounding.
Integrated Gradients
XAI-Methode, die Feature-Attributionen berechnet, indem Gradienten entlang eines Pfads von einer Baseline zum tatsächlichen Input integriert werden.
Integrationstests
Tests, die das Zusammenspiel mehrerer Komponenten oder Systeme überprüfen.
Intelligentes Tutorsystem
Ein Intelligentes Tutorsystem (ITS) ist ein KI-gesteuertes Lernsystem, das Unterricht, Feedback und Übungen auf die Bedürfnisse des Lernenden personalisiert.
Intent Recognition
KI-Fähigkeit, die Absicht hinter einer Nutzeräußerung zu erkennen.
Intent-Klassifikation
Die Bestimmung der Absicht oder des Ziels hinter einer Benutzeranfrage.
Inter-Annotator Agreement (IAA)
Eine Metrik zur Messung der Übereinstimmung zwischen verschiedenen Annotatoren bei der Bewertung derselben Daten.
Interface
Ein Interface definiert einen Vertrag zwischen Systemkomponenten – die Methoden, Eigenschaften oder Protokolle, über die sie miteinander kommunizieren, ohne interne Details offenzulegen.
Interpretable ML
ML-Modelle, die von Natur aus verständlich sind – ihre Entscheidungslogik kann direkt inspiziert werden, ohne zusätzliche Erklärungsmethoden.
Interpretierbarkeit
Der Grad, zu dem Menschen verstehen können, wie ein Modell zu seinen Entscheidungen kommt.
Inverse Reinforcement Learning
IRL lernt die Reward-Funktion aus beobachtetem Experten-Verhalten – anstatt eine Reward-Funktion vorzugeben, wird sie aus Demonstrationen abgeleitet.
iOS 27 Siri
Die in iOS 27 tief mit ChatGPT integrierte Siri-Generation, die als persönlicher On-Device-Agent fungiert.
IoU (Intersection over Union)
Eine Metrik, die die Überlappung zwischen einer vorhergesagten und einer Ground-Truth-Region misst, berechnet als Schnittmenge geteilt durch Vereinigung.
IP-Adapter
IP-Adapter ermöglicht Bildprompts für Diffusionsmodelle – ein Referenzbild steuert Stil, Komposition oder Gesichtsidentität der Generierung.
IPO
Eine Alignment-Methode, die DPO erweitert, um stabileres Training zu ermöglichen.
Iterative Vertiefung
Iterative Vertiefung ist eine Suchstrategie, die wiederholt tiefenbeschränkte Suche mit steigenden Tiefenlimits ausführt, bis eine Lösung gefunden oder ein Budget erschöpft ist.
Iteratives Prompting
Ein Prompt-Ansatz, bei dem Ergebnisse verfeinert werden durch mehrere aufeinanderfolgende Prompts.
J
Jaccard-Ähnlichkeit
Ein Ähnlichkeitsmaß zwischen zwei Mengen, definiert als Größe der Schnittmenge geteilt durch die Größe der Vereinigungsmenge.
Jailbreak
Techniken, die LLM-Sicherheitsvorkehrungen umgehen, um unerwünschte oder schädliche Outputs zu erzeugen.
Jailbreaking
Techniken, die darauf abzielen, Sicherheitsmaßnahmen und ethische Einschränkungen von KI-Modellen zu umgehen.
Jamba
AI21 Labs' Hybrid-Architektur, die Transformer-Attention mit Mamba SSM-Schichten und MoE kombiniert für effiziente lange Kontexte.
JAX
JAX ist Googles High-Performance-Framework für numerische Berechnungen und Machine Learning, das NumPy-Syntax mit automatischer Differenzierung und GPU/TPU-Beschleunigung kombiniert.
Jevons-Paradoxon
Das Jevons-Paradoxon besagt, dass technologischer Fortschritt, der die Effizienz einer Ressource steigert, oft zu einem höheren statt niedrigeren Gesamtverbrauch dieser Ressource führt – weil sinkende Kosten die Nachfrage überproportional erhöhen.
JIT-Kompilierung
Just-In-Time Compilation übersetzt Code zur Laufzeit in Maschinencode für bessere Performance.
Jitter
Jitter fügt Zufälligkeit zu Retry-Delays hinzu, damit viele Clients nicht gleichzeitig retrien.
Job Scheduling
Das Planen und Ausführen von Aufgaben zu bestimmten Zeiten oder basierend auf Ereignissen.
Journey Mapping
Die Visualisierung aller Touchpoints und Erfahrungen eines Kunden mit einer Marke.
JSON Mode
Ein Modell-Modus, der garantiert, dass die Ausgabe valides JSON ist.
JSON Schema
Ein Vokabular zur Annotation und Validierung von JSON-Dokumenten.
JSON-LD
Ein Format zur Serialisierung von Linked Data unter Verwendung von JSON-Syntax.
Judge LLM
Ein LLM, das verwendet wird, um Outputs anderer LLMs zu bewerten und zu ranken.
Jupyter Notebook
Eine interaktive Computing-Umgebung, die Code, Visualisierungen und Text in einem Dokument kombiniert.
JWT
Ein kompakter, URL-sicherer Token-Standard für die sichere Übertragung von Claims zwischen Parteien.
K
K-Anonymity
K-Anonymity ist eine Datenschutz-Eigenschaft, bei der jeder Datensatz von mindestens k−1 anderen Datensätzen bezüglich Quasi-Identifikatoren nicht unterscheidbar ist.
K-Armed Bandit
Das K-Armed Bandit Problem modelliert die Auswahl zwischen k Optionen, um Reward zu maximieren und Exploration vs Exploitation zu balancieren.
K-Fold
Kreuzvalidierungs-Variante, die den Datensatz in k gleich große Teile aufteilt und k Modelle trainiert.
K-Fold Cross-Validation
K-Fold Cross-Validation ist eine Evaluationsmethode, bei der Daten in k Teile geteilt werden; das Modell trainiert auf k−1 Folds und wird auf dem verbleibenden getestet.
K-Means Clustering
K-Means ist ein unüberwachter Algorithmus, der Daten in k Cluster partitioniert, indem Within-Cluster-Distanz zu Zentroiden minimiert wird.
K-Means++
K-Means++ ist eine Initialisierungsmethode für K-Means, die Startcentroide wählt, um Konvergenz und Cluster-Qualität zu verbessern.
K-Shot Prompting
K-Shot Prompting stellt k Beispiele im Prompt bereit, um das Modellverhalten zu steuern (Format, Reasoning-Pattern, Ton).
Kafka
Apache Kafka ist eine verteilte Event-Streaming-Plattform zum Publizieren, Speichern und Verarbeiten von Event-Streams in großem Maßstab.
Kalibrierung
Der Prozess, die Vorhersagewahrscheinlichkeiten eines Modells so anzupassen, dass sie tatsächliche Ereigniswahrscheinlichkeiten widerspiegeln.
Kalman Filter
Ein Kalman-Filter ist ein Algorithmus zur Schätzung des verborgenen Zustands eines Systems über die Zeit aus verrauschten Messungen.
Kanonisierung
Kanonisierung ist die Wahl einer einzelnen "kanonischen" Repräsentation unter mehreren äquivalenten oder ähnlichen Varianten (Datensätze oder URLs).
Kapazitätsplanung
Kapazitätsplanung stellt sicher, dass Systeme ausreichende Ressourcen (Compute, Storage, Network, Quotas) haben, um die Nachfrage bei gleichzeitiger SLO-Einhaltung und Kostenkontrolle zu erfüllen.
Kaplan-Meier Estimator
Der Kaplan-Meier Estimator schätzt eine Survival-Funktion (Wahrscheinlichkeit von "noch nicht gechurnt" über Zeit) und handhabt zensierte Daten.
Kapselung
Ein Programmierkonzept, das Daten und die Methoden, die auf diese Daten zugreifen, in einer Einheit (Klasse/Modul) bündelt und den direkten Zugriff von außen einschränkt.
Kausalinferenz
Kausalinferenz ist die Disziplin der Schätzung von Ursache-Wirkungs-Beziehungen (was würde passieren, wenn wir X ändern), nicht nur Korrelationen.
Kernel (ML)
In ML ist ein Kernel eine Funktion, die Ähnlichkeit zwischen Datenpunkten misst und Algorithmen in implizit hochdimensionalen Feature-Räumen operieren lässt.
Kernel Trick
Der Kernel-Trick erlaubt Algorithmen, Dot-Products in einem implizit höherdimensionalen Raum zu berechnen, ohne die Daten explizit zu transformieren.
Key Management Service (KMS)
KMS ist ein verwalteter Service zum Erstellen, Speichern, Rotieren und Auditieren kryptografischer Schlüssel (oft mit HSM-gestützten Optionen).
Key Rotation
Key Rotation ist die Praxis, kryptographische Schlüssel regelmäßig zu ersetzen, um Exposure bei Kompromittierung zu reduzieren.
Keyword Cannibalization
Keyword Cannibalization tritt auf, wenn mehrere Seiten einer Website um die gleiche Query-Intent konkurrieren und Ranking-Klarheit reduzieren.
Keyword Difficulty
Keyword Difficulty ist eine Schätzung, wie schwer es ist, für ein Keyword zu ranken, basierend auf Wettbewerb und Backlink-Stärke.
Keyword Research
Keyword Research ist das Identifizieren und Priorisieren der Queries, die Menschen nutzen, und das Mappen auf Content, der Intent befriedigt.
KI-Agent
Autonomes KI-System, das Aufgaben eigenständig plant, Tools nutzt und mehrere Schritte ohne Menschen-Eingriff ausführt, um ein Ziel zu erreichen.
KI-Beschleuniger
Spezialisierte Hardware, die darauf ausgelegt ist, KI-Aufgaben zu beschleunigen, insbesondere die rechenintensiven Operationen im maschinellen Lernen.
KI-Governance
Der Rahmen aus Richtlinien, Prozessen und Verantwortlichkeiten für die verantwortungsvolle Entwicklung, Bereitstellung und Nutzung von KI-Systemen in Organisationen.
KI-Haftung
Rechtliche und organisatorische Verantwortung für Schäden, die durch KI-Systeme oder autonome Agenten entstehen.
KI-Musikgenerierung
KI-Musikgenerierung erzeugt Musikstücke aus Text-Prompts, Melodien oder Stilvorgaben – von Hintergrundmusik bis zu vollständigen Songs.
KI-Orchestrierung
Die koordinierte Steuerung und Integration mehrerer KI-Modelle, Agenten und Tools zur Ausführung komplexer, mehrstufiger Aufgaben in einem automatisierten Workflow.
KI-vollständig
Ein Problem wird als KI-vollständig bezeichnet, wenn dessen maschinelle Lösung im Wesentlichen allgemeine menschliche Intelligenz erfordern würde.
Klassenungleichgewicht
Situation, in der eine Klasse im Trainingsdatensatz deutlich häufiger vorkommt als andere.
Klassifikation
Ein überwachter ML-Algorithmus, der Daten in vordefinierte Kategorien oder Klassen einteilt.
Kling AI
Kuaishous chinesisches Text-zu-Video-Modell, das mit Sora konkurriert und realistische Videos bis zu 2 Minuten generiert.
KMS (Key Management Service)
Ein Key Management Service (KMS) ist ein gemanagtes System zum Erstellen, Speichern, Rotieren und Kontrollieren des Zugriffs auf kryptographische Schlüssel.
KNN (k-Nearest Neighbors)
KNN ist eine Methode, die Outcomes basierend auf den k ähnlichsten Beispielen in einem Datensatz vorhersagt.
KNN Search
KNN Search retrievet die k nächsten Vektoren zu einem Query-Vektor unter einer Distanz-Metrik.
Knowledge Base (KB)
Eine Knowledge Base ist ein kuratiertes Repository von Informationen (Artikel, FAQs, Policies), designed für Retrieval und Wiederverwendung.
Knowledge Cutoff
Knowledge Cutoff ist der Zeitpunkt, nach dem die Trainingsdaten eines Modells keine neuen Informationen mehr enthalten.
Knowledge Distillation
Eine Technik zum Übertragen von Wissen aus einem großen, komplexen "Lehrer"-Modell auf ein kleineres, effizienteres "Schüler"-Modell, das ähnliche Leistung bei geringerem Ressourcenverbrauch erreicht.
Knowledge Graph Embedding
Knowledge Graph Embeddings lernen niedrig-dimensionale Vektorrepräsentationen für Entitäten und Relationen eines Knowledge Graphs.
Kohortenanalyse
Kohortenanalyse gruppiert Nutzer oder Entitäten nach einem gemeinsamen Start-Event/Zeit (z.B. Signup-Woche) und trackt Verhalten über die Zeit.
Kollaboratives Filtern
Ein Empfehlungsansatz, der die Präferenzen eines Nutzers basierend auf dem Verhalten ähnlicher Nutzer oder Ähnlichkeiten zwischen Items vorhersagt.
Konfusionsmatrix
Eine Tabelle, die die Klassifikationsleistung zusammenfasst durch Zählung von True Positives, False Positives, True Negatives und False Negatives.
Kontrafaktische Erklärung
Erklärungsmethode, die zeigt, welche minimale Eingabe-Änderung zu einem anderen Modell-Ergebnis geführt hätte.
Konvergenz
Der Punkt, an dem ein Modell aufhört, signifikant besser zu werden – der Loss stabilisiert sich und weitere Epochen bringen keinen Fortschritt.
Koreferenzauflösung
Die Identifikation aller Textstellen, die auf dieselbe Entität verweisen (z.B. "Angela Merkel" → "sie" → "die Kanzlerin").
Kosinus-Ähnlichkeit
Ein Maß für die Ähnlichkeit zwischen zwei Vektoren, das den Kosinus des Winkels zwischen ihnen berechnet, unabhängig von ihrer Länge.
Kostenkontrolle
Systematische Prozesse zur Überwachung, Steuerung und Optimierung von Ausgaben, um finanzielle Ziele zu erreichen und Ressourcen effizient einzusetzen.
KPI (Key Performance Indicator)
Ein KPI ist eine Metrik, die ausgewählt wird, um Fortschritt zu einem Geschäftsziel zu messen (Revenue, Pipeline, Activation, Retention, Cost).
KPI Tree
Ein KPI Tree ist eine strukturierte Zerlegung eines Top-Level KPIs in beitragende Drivers und Sub-Metriken.
Kreativität
Die Fähigkeit, originelle und wertvolle Ideen, Konzepte oder Lösungen zu generieren, die über konventionelles Denken hinausgehen.
Kreuzvalidierung
Eine Technik zur Bewertung der Modell-Performance durch Training und Test auf verschiedenen Datenteilmengen.
Krisenkommunikation
Krisenkommunikation ist die Strategie und Durchführung von Messaging während Vorfällen, die Reputation, Vertrauen oder Betrieb bedrohen.
Kryptographie
Die Wissenschaft der sicheren Kommunikation durch mathematische Verfahren, die Daten verschlüsseln, Integrität gewährleisten und Authentizität beweisen.
KServe
Kubernetes-natives Model-Serving-Framework (ehemals KFServing) für standardisiertes, skalierbares ML-Inference auf Kubernetes.
KTO (Kahneman-Tversky Optimization)
Eine Alignment-Methode, die nur binäres Feedback (gut/schlecht) statt paarweiser Präferenzen benötigt, inspiriert von Prospect Theory.
Kubeflow
Kubernetes-native Open-Source-Plattform für das Deployment, die Skalierung und das Management von ML-Workflows.
Kubernetes (K8s)
Kubernetes ist eine Container-Orchestrierungs-Plattform für Deployment, Skalierung und Management containerisierter Anwendungen.
Künstliche Allgemeine Intelligenz
Eine hypothetische Form von KI, die menschenähnliche kognitive Fähigkeiten über alle Domänen hinweg besitzt und selbstständig lernen und sich anpassen kann.
Künstliches Neuronales Netz (Artificial Neural Network)
Ein Künstliches Neuronales Netz (ANN) ist ein vom biologischen Gehirn inspiriertes Rechenmodell aus Schichten verbundener Neuronen, das durch Anpassung von Gewichten lernen kann, komplexe Muster aus Daten zu extrahieren.
Kürzester Pfad
Ein Algorithmus-Problem, das den optimalen (kürzesten, schnellsten oder günstigsten) Weg zwischen zwei Knoten in einem Graphen findet.
KV-Cache
Ein Speichermechanismus, der die Key- und Value-Tensoren der Attention-Layer zwischenspeichert, um redundante Berechnungen bei autoregenerativer Generierung zu vermeiden.
L
L1 Regularization (Lasso)
L1-Regularisierung fügt eine Strafe hinzu, die proportional zum absoluten Wert der Modellgewichte ist und Sparsität fördert (viele Gewichte werden genau null).
L2 Regularization (Ridge)
L2-Regularisierung fügt eine Strafe hinzu, die proportional zum Quadrat der Modellgewichte ist und kleinere Gewichte fördert.
Label Leakage (Datenleck der Zielvariable)
Label Leakage beschreibt den Fall, dass im Trainingsdatensatz eines Machine-Learning-Modells Features enthalten sind, die direkte oder indirekte Information über die zu vorhersagende Zielvariable (das Label) enthalten — und in der Produktion zum Vorhersagezeitpunkt gar nicht verfügbar wären.
Label Smoothing
Label Smoothing ist eine Trainingstechnik, die harte Labels (0 oder 1) durch leicht abgeschwächte Ziele ersetzt (z.B. 0.9 und 0.1).
Label Studio
Open-Source-Plattform für Datenannotation und -labeling mit Unterstützung für Text, Bilder, Audio, Video und Multi-Modal-Daten.
LAMB
Optimizer für extrem große Batch Sizes (bis 64K+), der Lernraten pro Layer adaptiert und so stabiles Training bei massiver Parallelisierung ermöglicht.
Landing Page
Speziell gestaltete Zielseite für Marketing-Kampagnen mit klarem CTA.
Landing Page Optimization (LPO)
Landing Page Optimization ist die Verbesserung einer Landing Page, um gewünschte Outcomes (Signups, Demos, Käufe) zu steigern.
LangChain
Ein Open-Source-Framework zum Aufbau von LLM-Anwendungen – bietet Abstraktionen für Chains, Agents, Memory, Retrieval und Tool-Integration.
Längenstrafe
Eine Decoding-Anpassung, die verhindert, dass Generierungsalgorithmen (insbesondere Beam Search) übermäßig kurze Sequenzen unfair bevorzugen.
LangGraph
Ein Framework von LangChain für den Aufbau zustandsbehafteter Multi-Agent-Workflows als Graphen mit Knoten (Agenten) und Kanten (Übergänge).
Language Model (LM)
Ein Language Model ist ein Modell, das die Wahrscheinlichkeit von Token-Sequenzen schätzt und Tasks wie Prediction, Generation und Classification ermöglicht.
Large Language Model (LLM)
Ein großes neuronales Netzwerk, das auf riesigen Textmengen trainiert wurde, um menschenähnlichen Text zu verstehen und zu generieren.
Large Language Model (LLM)
Ein großes neuronales Netzwerk, das auf massiven Textmengen trainiert wurde und menschenähnlichen Text verstehen und generieren kann.
LARS
Optimizer, der SGD mit Layer-weiser Lernratenanpassung kombiniert – ermöglicht stabiles Training mit großen Batch Sizes für Computer Vision.
Last-Click Attribution
Last-Click Attribution weist 100% des Conversion-Credits dem letzten Touchpoint vor der Conversion zu.
Late Interaction
Ein Retrieval-Paradigma, bei dem Query- und Dokument-Tokens unabhängig encodiert werden, aber erst bei der Suche über Token-Level-Ähnlichkeit interagieren.
Latency Budget
Ein Latency Budget ist eine explizite Zuweisung der maximal erlaubten Zeit für jede Systemkomponente, um ein Gesamt-SLA zu erfüllen.
Latent Diffusion
Latent Diffusion führt den Diffusionsprozess im komprimierten Latent Space statt im Pixel-Space durch – 10-100x schneller bei vergleichbarer Qualität.
Latent Variable
Eine latente Variable ist eine unbeobachtete Variable, die aus beobachteten Daten abgeleitet wird, um verborgene Strukturen zu erklären.
Latenter Raum
Ein komprimierter, niedrigdimensionaler Raum, in dem ein Modell interne Repräsentationen von Daten speichert.
Latenz
Die Zeit zwischen Anfrage und Antwort in einem System.
Layer
Ein Layer (Schicht) ist eine abstrakte Ebene in einem geschichteten System, die eine spezifische Funktion kapselt und über definierte Schnittstellen mit anderen Schichten kommuniziert.
Layer Dropping
Eine Komprimierungstechnik, die ganze Transformer-Layer aus einem trainierten Modell entfernt – der einfachste Weg, ein LLM kleiner und schneller zu machen.
Layer Normalization
Layer Normalization ist eine Technik, die Aktivierungen innerhalb eines Layers normalisiert, um Training in tiefen Netzwerken zu stabilisieren.
Lead Lifecycle Stages
Lead Lifecycle Stages sind standardisierte Zustände, durch die ein Lead fortschreitet (z.B. Lead → MQL → SQL → Opportunity → Customer).
Lead Scoring
Quantifizierung der Wahrscheinlichkeit, dass ein Lead zu einem Kunden wird.
Lead-Generierung
Lead-Generierung ist der Prozess, potenzielle Kunden (Leads) zu identifizieren und zu gewinnen, die Interesse an Produkten oder Dienstleistungen eines Unternehmens zeigen.
Leaky ReLU
Eine Variante von ReLU, die negative Werte mit kleinem Faktor (z.B. 0.01) durchlässt statt sie auf 0 zu setzen – verhindert das Dead-Neuron-Problem.
Learning Rate Finder
Diagnostische Methode, die die Learning Rate exponentiell erhöht und den Loss beobachtet – findet den optimalen LR-Bereich in einem einzigen Training-Run.
Learning Rate Schedule
Ein Learning Rate Schedule ändert die Lernrate während des Trainings (Warmup, Decay, Cosine, Step, Exponential).
Learning Record Store (LRS)
Ein Learning Record Store (LRS) ist ein System, das Lernaktivitätsdaten speichert – typischerweise als xAPI-Statements – und Reporting und Analytics über Lernerfahrungen ermöglicht.
Learning to Rank
ML-Ansätze zum Lernen optimaler Ranking-Funktionen für Suchergebnisse, Empfehlungen oder Feeds.
Least Privilege
Least Privilege gewährt nur die minimalen Berechtigungen, die zur Ausführung einer Aufgabe erforderlich sind – nicht mehr, nicht länger als nötig.
Lemmatisierung
Linguistisch fundierte Reduktion von Wörtern auf ihre Grundform (Lemma) unter Berücksichtigung von Wortart und Kontext.
Leonardo AI
Eine AI-Bildgenerierungs-Plattform mit Fokus auf Gaming, Concept Art und professionelle kreative Workflows.
Lernmanagementsystem
Ein Lernmanagementsystem (LMS) ist Software zur Bereitstellung, Verwaltung und Verfolgung von Training und Lerninhalten (Kurse, Aufgaben, Abschluss, Assessments).
Lernrate
Ein Hyperparameter, der bestimmt, wie stark die Modellgewichte bei jedem Trainingsschritt angepasst werden.
Lernziele
Lernziele sind klare, messbare Aussagen darüber, was ein Lernender nach der Instruktion können sollte.
Lexical Search
Lexical Search retrievet Dokumente basierend auf exakten Wörtern/Terms (Keyword-Matching), typischerweise mit Inverted Indexes und BM25.
Liability Target
Klar definierte Entität (Mensch, Rolle oder Organisation), die für Entscheidungen oder Schäden eines KI-Agenten haftet.
LiDAR
Eine Fernerkundungstechnologie, die Laserpulse nutzt, um präzise 3D-Punktwolken der Umgebung zu erstellen – das "3D-Auge" autonomer Fahrzeuge.
Lifecycle Marketing
Lifecycle Marketing ist das Gestalten von Messaging und Erlebnissen über den Kundenlebenszyklus (Acquisition → Activation → Retention → Expansion → Advocacy).
Lift
Lift ist die inkrementelle Änderung eines Outcomes, die einer Intervention zugeordnet werden kann.
Lift Chart
Ein Lift Chart zeigt, wie gut ein Modell Positives ranked, indem Outcomes über gescorte Segmente verglichen werden.
LIME
LIME (Local Interpretable Model-agnostic Explanations) erklärt eine einzelne Modellvorhersage, indem ein einfaches, interpretierbares Surrogat-Modell um diesen spezifischen Input herum angepasst wird.
Linear Attention
Attention-Varianten, die die quadratische Komplexität O(N²) auf lineare O(N) reduzieren durch Kernel-Approximation oder alternative Berechnungsreihenfolge.
Link Equity
Link Equity ist der SEO-Wert, der durch Links weitergegeben wird und beeinflusst, wie Autorität und Relevanz über Seiten fließt.
Link Graph
Ein Link Graph ist das Netzwerk von Seiten (Knoten), die durch Links (Kanten) verbunden sind, sowohl intern als auch extern.
Link Prediction
Link Prediction sagt vorher, welche Verbindungen zwischen Knoten in einem Graphen wahrscheinlich existieren oder entstehen werden.
Linting
Linting ist das automatische Prüfen von Code (oder strukturiertem Content) auf Fehler, Style-Violations und Quality Issues basierend auf Regeln.
Lion Optimizer
Von Google Brain durch AutoML-Suche entdeckter Optimizer, der nur das Vorzeichen der Gradienten nutzt – einfacher als Adam, oft vergleichbare Ergebnisse.
Lip Sync AI
KI-Technologie, die Lippenbewegungen in Videos automatisch an neue Audio-Spuren anpasst, sodass gesprochene Worte natürlich aussehen.
LiveCodeBench
Kontaminationsfreier Coding-Benchmark, der laufend neue Programmieraufgaben aus Wettbewerben einbindet.
Llama
Metas Open-Weight-LLM-Familie, die als Grundlage für tausende Fine-Tuned-Modelle dient und Open-Source-AI demokratisiert hat.
LLM Evals
Systematische Tests, die Qualität, Sicherheit und Verhalten von Large Language Models über definierte Aufgaben und Metriken messen.
LLM Observability
LLM Observability ist das Sammeln und Analysieren von Telemetrie, die LLM-Systemverhalten in der Produktion erklärt.
LLM Routing
LLM Routing wählt aus, welches Modell/Workflow pro Request verwendet wird, basierend auf Intent, Risiko und Cost Constraints.
LLM Security
Das Feld der Sicherheitsforschung und -praktiken speziell für Large Language Models und generative KI.
LLM-as-a-Judge
LLM-as-a-Judge nutzt ein Modell, um andere Modell-Outputs gegen Rubrics wie Correctness, Groundedness, Style und Safety zu evaluieren.
LLM-as-Judge
Eine Evaluationsmethode, bei der ein LLM die Qualität von Outputs eines anderen (oder desselben) Modells bewertet.
LLMO (Large Language Model Optimization)
Large Language Model Optimization (LLMO) bezeichnet die Disziplin, Marken-, Produkt- und Themen-Wissen so im Web zu verteilen, dass Large Language Models es korrekt verstehen, zitieren und in Antworten reproduzieren — sowohl in Echtzeit-Such- als auch in Trainings-Pipelines.
LLMOps
Praktiken und Tools für Entwicklung, Deployment, Monitoring und Optimierung von Large Language Model-Anwendungen in Produktion.
llms.txt
llms.txt ist eine 2024 vorgeschlagene, 2025/26 stark verbreitete Markdown-Datei im Root einer Website (/llms.txt), die LLMs eine kuratierte, leicht extrahierbare Übersicht der wichtigsten Inhalte einer Site liefert — vergleichbar mit sitemap.xml für Suchmaschinen, aber human-readable und für KI-Modelle optimiert.
LMSYS
LMSYS (Large Model Systems Organization) ist eine Forschungsorganisation, die das bekannte Chatbot Arena Benchmark betreibt und LLM-Leistungsvergleiche durch menschliche Bewertungen ermöglicht.
Load Balancing
Load Balancing verteilt eingehenden Traffic auf mehrere Server, um Verfügbarkeit, Durchsatz und Latenz zu verbessern.
Locality-Sensitive Hashing (LSH)
LSH ist eine Technik, die Items so hasht, dass ähnliche Items wahrscheinlicher im selben Bucket landen.
Locality-Sensitive Hashing (LSH)
Locality-Sensitive Hashing (LSH) ist eine Technik, die ähnliche Items mit hoher Wahrscheinlichkeit in dieselben "Buckets" hasht, was schnelle approximative Similarity-Suche ermöglicht.
Log Loss
Eine Verlustfunktion, die die Qualität vorhergesagter Wahrscheinlichkeiten bewertet – bestraft falsche aber konfidente Vorhersagen exponentiell.
Log-Likelihood
Log-Likelihood ist der Logarithmus der Likelihood, die ein probabilistisches Modell beobachteten Daten zuweist.
Log-Sum-Exp
Log-Sum-Exp ist ein numerischer Trick, um log(∑ᵢ eˣⁱ) stabil ohne Overflow/Underflow zu berechnen.
Logit
Ein Logit ist der rohe, unnormalisierte Score, den ein Modell vor der Konvertierung zu Wahrscheinlichkeiten (z.B. via Softmax) ausgibt.
Logit Bias
Logit Bias ist eine Technik, um die Wahrscheinlichkeit bestimmter Tokens während der Generierung zu erhöhen oder zu verringern.
Long Context
Long Context bezieht sich auf die Fähigkeit eines LLM, eine große Anzahl von Input-Tokens (längeres Context Window) in einer einzelnen Anfrage zu akzeptieren und zu nutzen.
Long-Tail Keywords
Long-Tail Keywords sind hochspezifische, niedrigvolumige Queries, die oft starken Intent widerspiegeln.
Lookahead Optimizer
Meta-Optimizer, der zwei Gewichtssätze pflegt: "schnelle" Gewichte (normaler Optimizer) und "langsame" Gewichte, die periodisch in Richtung der schnellen interpoliert werden.
Lookalike Audience
Zielgruppe, die bestehenden Kunden basierend auf gemeinsamen Merkmalen ähnelt.
LoRA (Low-Rank Adaptation)
Eine effiziente Fine-Tuning-Methode, die nur kleine Adapter-Matrizen trainiert statt das gesamte Modell, wodurch Speicher und Trainingskosten drastisch sinken.
LoRA Fine-Tuning
Eine effiziente Fine-Tuning-Methode, die nur kleine "Adapter"-Matrizen trainiert statt aller Modellgewichte – typischerweise <1% der Parameter bei vergleichbarer Leistung.
LoRA vs Full Fine-Tuning
Ein Vergleich zwischen der Anpassung eines Modells via LoRA-Adapter versus dem Update aller Parameter (Full Fine-Tuning).
Loss Landscape
Die mehrdimensionale Oberfläche, die den Loss als Funktion der Modellparameter darstellt – der "Berg", den Gradient Descent hinabsteigt.
Lottery Ticket Hypothesis
Die Hypothese, dass jedes große neuronale Netz ein kleines Subnetz ("Winning Ticket") enthält, das bei gleicher Initialisierung allein trainiert die volle Leistung des großen Netzes erreichen kann.
Lovable
Eine AI-Plattform, die komplette Web-Anwendungen aus natürlichsprachlichen Beschreibungen generiert – inklusive Frontend, Backend und Deployment.
LSTM (Long Short-Term Memory)
LSTM ist eine RNN-Variante mit Gate-Mechanismen (Forget, Input, Output Gate), die das Lernen von Langzeitabhängigkeiten in Sequenzen ermöglicht.
Luma AI
Ein AI-Unternehmen spezialisiert auf 3D-Capture und Video-Generierung, bekannt für Dream Machine und NeRF-Technologie.
M
Mac mini M4 Pro
Apples kompakter Desktop mit M4-Pro-Chip und Neural Engine, beliebt als günstige On-Device-AI-Workstation.
Machine Legibility
Machine Legibility bezeichnet das Maß, in dem eine Website, ein Produktkatalog oder eine Marke maschinell — insbesondere von KI-Agenten und LLMs — verstanden, navigiert und in Antworten oder Transaktionen genutzt werden kann.
Machine Unlearning
Techniken, um den Einfluss spezifischer Trainingsdaten aus einem ML-Modell zu entfernen, ohne das gesamte Modell neu zu trainieren.
Macro Conversion
Eine Macro Conversion ist eine User-Aktion, die direkt einem primären Business-Ziel zugeordnet werden kann (z.B. Kauf, Demo-Anfrage, Subscription).
MAE (Mean Absolute Error)
Der Durchschnitt der absoluten Differenzen zwischen Vorhersage und Realität – robust gegenüber Ausreißern.
Mamba
Mamba ist eine neuronale Netzwerkarchitektur, die auf selektiven State Space Models (SSMs) basiert und für effizientes Modellieren langer Sequenzen mit linearer Skalierung konzipiert ist.
Manus AI
Ein autonomer General-Purpose AI-Agent, der komplexe Aufgaben wie Recherche, Coding und Datenanalyse selbstständig ausführen kann.
MAP (Mean Average Precision)
Der Durchschnitt der Average Precision über alle Queries – berücksichtigt sowohl Precision als auch Ranking-Position aller relevanten Dokumente.
Marginal CPA
Marginal CPA sind die Kosten für zusätzliche Conversions am Margin – oft ausgedrückt als ΔKosten ÷ ΔConversions zwischen zwei Spend/Volumen-Szenarien.
Marginal ROAS (mROAS)
Marginal ROAS schätzt den inkrementellen Umsatz, der durch die nächste Einheit Ad Spend generiert wird – d.h. "was bekommen wir, wenn wir 1€ mehr ausgeben?"
Markenbekanntheit
Das Maß, in dem Konsumenten eine Marke erkennen und sich an sie erinnern können.
Marketing Agent
Spezialisierter KI-Agent, der Marketing-Aufgaben wie Content-Erstellung, Kampagnen-Management, Analyse und Reporting autonom ausführt.
Marketing Automation
Marketing Automation verwendet Software zur Automatisierung wiederkehrender Marketing-Aufgaben mit Regeln und Workflows (z.B. getriggerte E-Mails, Lead-Routing, Segmentierung).
Marketing Funnel
Modell der Customer Journey von Awareness bis Conversion.
Marketing Measurement Framework
Ein Marketing Measurement Framework ist ein strukturiertes System, das Marketing-Ziele mit KPIs, Datenquellen und Measurement-Methoden (Attribution, Experimente, MMM) alignt, damit Performance konsistent evaluiert werden kann.
Marketing Mix Modeling
Marketing Mix Modeling (MMM) ist ein statistischer Ansatz, der schätzt, wie verschiedene Marketing-Aktivitäten (Kanäle, Spend, Promotions) zu Geschäftsergebnissen (Sales, Conversions) beitragen, basierend auf aggregierten Zeitreihendaten.
Marktstimmung
Marktstimmung ist die Gesamteinstellung oder Stimmung der Marktteilnehmer gegenüber einem Asset, einer Marke oder einem Markt—oft abgeleitet aus Nachrichten, Social Media und Preis-/Volumensignalen.
Maschinelle Übersetzung
Die automatische Übersetzung von Text oder Sprache von einer natürlichen Sprache in eine andere durch ein KI-System.
Maschinelles Lernen
Ein Teilgebiet der KI, bei dem Systeme aus Daten lernen, um Vorhersagen oder Entscheidungen zu treffen, ohne explizit programmiert zu werden.
Masked Language Modeling (MLM)
MLM ist ein Trainings-Objective, bei dem ein Modell maskierte Tokens in einer Textsequenz vorhersagt (z.B. Wörter durch ein spezielles [MASK]-Token ersetzen).
Master Data Management (MDM)
Master Data Management (MDM) ist ein Ansatz zur Sicherstellung, dass kritische Unternehmensdaten (z.B. Kunden, Produkte, Standorte) konsistent, genau und über Systeme hinweg governed sind – oft mit dem Ziel einer "Single Source/Version of Truth".
Mastery Learning
Mastery Learning ist ein Instruktionsansatz, bei dem Lernende erst fortschreiten, nachdem sie Beherrschung eines Skills oder Objectives demonstriert haben, mit gezielter Remediation bei Bedarf.
MATH Benchmark
Ein Benchmark mit 12.500 Wettbewerbs-Mathematikproblemen (von Algebra bis Zahlentheorie), der fortgeschrittenes mathematisches Reasoning testet.
Matrixfaktorisierung
Eine Technik zur Zerlegung einer Matrix in das Produkt kleinerer Matrizen.
Matryoshka Embedding
Ein Embedding-Training-Ansatz, bei dem die ersten N Dimensionen eines Vektors bereits nutzbar sind – ermöglicht flexible Kompression ohne Qualitätsverlust.
Matryoshka Representation Learning (MRL)
Matryoshka Representation Learning (MRL) ist ein Embedding-Ansatz, der Informationen auf mehreren Granularitäten kodiert, sodass ein einzelnes Embedding auf kleinere Dimensionen gekürzt werden kann, während es für nachgelagerte Aufgaben nützlich bleibt.
Max Tokens
Ein API-Parameter, der die maximale Anzahl der Tokens begrenzt, die ein LLM in einer Antwort generieren kann.
MBPP
Ein Benchmark mit 974 einfachen Python-Programmieraufgaben, die grundlegende Programmierfähigkeiten von LLMs testen.
MCP (Model Context Protocol)
Ein offenes Protokoll von Anthropic, das standardisiert, wie AI-Modelle sicher mit externen Datenquellen, Tools und Services kommunizieren.
MCP (Model Context Protocol)
Das Model Context Protocol (MCP) ist ein offener, von Anthropic Ende 2024 veröffentlichter Standard, mit dem KI-Modelle strukturiert auf externe Tools, Daten und Systeme zugreifen — eine Art „USB-C für KI".
MCP Protocol
Offenes Protokoll von Anthropic, das LLMs einen standardisierten Zugriff auf Tools, Datenquellen und externe Services ermöglicht.
MCP Server
Server-Komponente, die einem KI-Modell standardisierten Zugriff auf Tools, Datenquellen oder APIs gemäß dem Model Context Protocol (MCP) bereitstellt.
Mechanistic Interpretability
Mechanistic Interpretability ist der Versuch, neuronale Netzwerke durch Identifizierung interner Mechanismen (Features, Circuits, Algorithmen) zu reverse-engineeren, die Outputs produzieren.
Media Mix
Ein Media Mix ist die Mischung von Kommunikationskanälen, die ein Unternehmen nutzt, um ein Publikum zu erreichen (oft mit Betonung auf Paid Channels, je nach Definition).
Mel-Spektrogramm
Ein Mel-Spektrogramm ist eine visuelle Darstellung von Audio-Frequenzen auf der Mel-Skala – die Standard-Eingabe für moderne Speech- und Audio-KI-Modelle.
Membership Inference Attack
Ein Angriff, der bestimmt, ob ein bestimmter Datenpunkt im Training-Datensatz eines ML-Modells enthalten war.
Memory Augmentation
Techniken zur Erweiterung des effektiven Kontexts von LLMs über das Token-Limit hinaus – ermöglicht Erinnerung an frühere Gespräche, Fakten und Nutzerpräferenzen.
Memory Bandwidth
Memory Bandwidth ist die Datenmenge, die pro Zeiteinheit zum/vom Speicher bewegt werden kann; bei GPUs beeinflusst sie stark, wie schnell Daten in die Berechnung eingespeist werden können.
Mentales Modell
Eine interne Repräsentation, die beschreibt, wie eine Person glaubt, dass ein System, Prozess oder Konzept funktioniert, basierend auf Erfahrung und Annahmen.
MER (Media Efficiency Ratio)
MER (oft "Media Efficiency Ratio" oder "Marketing Efficiency Ratio") ist eine Top-Level-Effizienz-Metrik, typischerweise ausgedrückt als Gesamtumsatz ÷ Gesamtmarketing/Ad Spend.
Message Match
Message Match ist die Konsistenz zwischen einer Ad/E-Mail-Nachricht und der Landing Page Experience, die der Nutzer nach dem Klick sieht.
Message Passing
Message Passing ist das grundlegende Berechnungsparadigma von Graph Neural Networks, bei dem Knoten Informationen mit ihren Nachbarn austauschen.
Message Passing Neural Network
Ein vereinheitlichendes Framework für GNNs, bei dem Knoten Nachrichten von Nachbarn empfangen, aggregieren und ihre Repräsentation aktualisieren.
Meta AI
Die KI-Forschungsabteilung von Meta (Facebook), bekannt für die Open-Source-Veröffentlichung von Llama und führende Forschung in Multimodalität.
Meta-Learning
Meta-Learning ("Lernen zu lernen") zielt darauf ab, Modelle oder Systeme zu trainieren, die sich schnell an neue Tasks mit begrenzten Daten oder wenigen Beispielen anpassen.
Metadata Filtering (Vector Search)
Metadata Filtering beschränkt Vector-Search-Ergebnisse unter Verwendung strukturierter Felder (z.B. tenant_id, Timestamps, doc_type) zusätzlich zur Similarity Search.
Metaprompt
Ein Metaprompt ist ein höherstufiger Prompt, der die Regeln, Struktur und Constraints für die Generierung anderer Prompts oder einer ganzen Klasse von Outputs definiert.
METEOR
Eine Evaluationsmetrik für maschinelle Übersetzung, die unigram-Matching mit Stemming, Synonymen und Wortstellung kombiniert.
Metric Learning
Metric Learning trainiert Modelle, eine Distanzfunktion (Embedding-Raum) zu erlernen, bei der "ähnliche Elemente nah beieinander" und "unähnliche Elemente weit voneinander entfernt" sind.
Micro Conversion
Eine Micro Conversion ist eine kleinere Aktion, die Fortschritt in Richtung einer Macro Conversion anzeigt (z.B. Pricing ansehen, Checklist downloaden, Produktvideo ansehen).
Microservices
Architekturstil, bei dem eine Anwendung aus kleinen, unabhängigen Services besteht.
Midjourney
Das führende kommerzielle Text-zu-Bild-Modell, bekannt für hochästhetische, künstlerische Bildgenerierung über Discord.
MinHash
MinHash ist eine Technik zur effizienten Schätzung der Ähnlichkeit zwischen Mengen (besonders Jaccard-Ähnlichkeit), häufig für Near-Duplicate-Detection verwendet.
Minimale Beschreibungslänge
Minimale Beschreibungslänge (MDL) ist ein Prinzip für Modellauswahl, das das Modell bevorzugt, das die kürzeste Gesamtbeschreibung von Modell plus den unter ihm kodierten Daten liefert.
Minimum Detectable Effect (MDE)
MDE ist die kleinste echte Effektgröße, die ein Experiment zuverlässig erkennen kann, gegeben Traffic, Varianz, Signifikanzniveau und Power.
Mish
Mish = x · tanh(softplus(x)) – eine glatte, selbst-regularisierende Aktivierungsfunktion, die in YOLOv4 und einigen CNNs eingesetzt wird.
Mistral AI
Ein französisches KI-Startup, das Open-Weight-Modelle entwickelt und als europäische Alternative zu US-KI-Unternehmen gilt.
Mixed Precision Training
Mixed Precision Training verwendet eine Mischung aus niedrigerer Präzision (z.B. FP16/BF16) und Single-Precision (FP32) Repräsentationen, um das Training zu beschleunigen und dabei Genauigkeit zu erhalten.
Mixtral
Mistral AIs Mixture-of-Experts-Modell, das durch Aktivierung nur eines Teils der Parameter effiziente Performance auf GPT-4-Niveau erreicht.
Mixture of Experts
Eine KI-Architektur, bei der ein großes Modell aus spezialisierten "Experten"-Subnetzen besteht, von denen nur die relevantesten für jede Anfrage aktiviert werden – was Effizienz bei hoher Leistung ermöglicht.
Mixture-of-Recursion (MoR)
Architektur, die dem Modell pro Token dynamisch entscheidet, wie oft ein Layer-Block rekursiv durchlaufen wird – effiziente Tiefe statt fester Layer-Zahl.
Mixup
Data-Augmentation-Technik, die neue Trainingsbeispiele durch lineare Interpolation zwischen zwei existierenden Beispielen erzeugt.
ML Pipeline
Automatisierte Sequenz von Schritten für Datenverarbeitung, Feature Engineering, Training, Evaluation und Deployment eines ML-Modells.
MLCommons
Industrie-Konsortium, das offene Benchmarks (MLPerf), Datensätze und Best Practices für ML-Performance entwickelt.
MLflow
Open-Source-Plattform für den gesamten ML-Lifecycle: Experiment Tracking, Model Registry, Deployment und Evaluation.
MLOps
MLOps ist die Praxis der Operationalisierung von Machine Learning – Deployment, Monitoring, Versionierung und Governance von ML-Systemen zuverlässig.
MMLU (Massive Multitask Language Understanding)
Ein Multi-Choice-Benchmark mit 57 Fachgebieten (STEM, Humanities, Social Sciences) zur Messung von LLM-Weltwissen.
MMLU-Pro
Erweiterter MMLU-Benchmark mit anspruchsvolleren Multiple-Choice-Fragen und reduziertem Rate-Vorteil.
MMR (Maximal Marginal Relevance)
MMR ist eine Retrieval-Diversifizierungsmethode, die Items auswählt, die sowohl relevant zur Query als auch nicht-redundant zueinander sind.
Moat
Ein Moat ist ein dauerhafter Wettbewerbsvorteil, der ein Unternehmen über Zeit vor Wettbewerbern schützt.
Modal
Cloud-Plattform für serverless GPU-Computing, die ML-Inference und Batch-Jobs als Python-Funktionen deployt.
Mode Collapse
Mode Collapse tritt auf, wenn ein generatives Modell nur eine begrenzte Vielfalt an Outputs produziert und große Teile der Datenverteilung ignoriert.
Model Card
Eine Model Card ist ein standardisiertes Dokumentationsartefakt, das die beabsichtigte Verwendung, Limitierungen, Training Data Context, Evaluationsergebnisse und ethische/Safety-Erwägungen eines Modells beschreibt.
Model Cards
Standardisierte Dokumentation für ML-Modelle, die Training, Fähigkeiten, Limitationen, Bias-Analysen und empfohlene Anwendungsfälle beschreibt.
Model Collapse
Model Collapse ist ein Degradations-Phänomen, bei dem Training auf synthetischen/modell-generierten Daten (besonders wiederholt) Diversity und Qualität reduzieren kann, wodurch das Modell zu engeren Outputs "kollabiert".
Model Compression
Techniken zur Reduzierung der Größe von ML-Modellen bei erhaltener Leistung.
Model Context Protocol (MCP)
Ein offener Standard von Anthropic, der eine einheitliche Schnittstelle zwischen KI-Modellen und externen Datenquellen, Tools und Services definiert.
Model Drift
Model Drift ist Performance-Degradation über die Zeit durch Änderungen in Datenverteilungen, Nutzerverhalten, Umgebung oder Upstream-Systemen.
Model Extraction
Angriffe, die versuchen, ein proprietäres ML-Modell durch systematische Queries zu rekonstruieren oder zu klonen.
Model Extraction Attack
Ein Angriff, bei dem ein Gegner durch systematische API-Abfragen eine funktional äquivalente Kopie eines ML-Modells erstellt.
Model Governance
Prozesse und Controls für den gesamten Lebenszyklus von ML-Modellen: Entwicklung, Validierung, Deployment, Monitoring und Retirement.
Model Merging
Techniken zum Kombinieren mehrerer trainierter Modelle zu einem einzigen Modell, das die Stärken aller Quellmodelle vereint – ohne zusätzliches Training.
Model Monitoring
Kontinuierliche Überwachung von ML-Modellen in Produktion hinsichtlich Performance-Degradation, Drift, Fairness und Anomalien.
Model Registry
Zentrale Versionsverwaltung für trainierte ML-Modelle.
Model Routing
Automatische Weiterleitung von AI-Anfragen an das optimale Modell basierend auf Aufgabentyp, Kosten, Latenz und Qualitätsanforderungen.
Model Serving
Die Infrastruktur und Prozesse zum Bereitstellen trainierter ML-Modelle als API-Endpunkte für Echtzeit- oder Batch-Inferenz in Produktionsumgebungen.
Model Simplification
Model Simplification reduziert Komplexität um Interpretierbarkeit, Effizienz, Robustheit oder Deployment-Machbarkeit zu verbessern.
Model Spec
Ein Model Spec ist eine schriftliche Spezifikation, die beschreibt, wie sich ein Modell verhalten soll – einschließlich beabsichtigtem Verhalten, Constraints und Prinzipien – oft zur Steuerung von Training, Alignment und Deployment-Policy verwendet.
Model Watermarking
Techniken zum Einbetten unsichtbarer Kennzeichnungen in ML-Modelle oder deren Outputs, um Urheberschaft nachzuweisen oder unauthorisierte Nutzung zu erkennen.
Model-Based Learning
Model-Based Learning lernt ein Modell der Umgebung (Dynamiken) und nutzt es für Planung, Vorhersage oder Kontrolle.
Model-Based Reinforcement Learning
Model-Based RL lernt ein Modell der Umgebung (Dynamics Model) und plant mit diesem Modell, statt nur aus direkter Erfahrung zu lernen.
Modell-Destillation
Eine Technik, bei der ein großes "Lehrer"-Modell sein Wissen an ein kleineres, effizienteres "Schüler"-Modell überträgt.
Modell-Versionierung
Systematische Verwaltung verschiedener Versionen trainierter ML-Modelle inklusive Metadaten, Artefakte und Lineage.
Moderation
Moderation ist der Erkennungs-, Review- und Enforcement-Prozess, der Content Policy auf User-Inputs, generierte Outputs und Plattform-Verhalten anwendet.
Modular Content
Content-Strategie, bei der Inhalte in wiederverwendbare, KI-zusammensetzbare Bausteine zerlegt werden statt monolithisch produziert.
Modulares Design
Modulares Design strukturiert Systeme als kohäsive Module mit klaren Verantwortlichkeiten und stabilen Interfaces, minimiert Kopplung.
Modularität
Ein Designprinzip, das Systeme in unabhängige, austauschbare Komponenten (Module) unterteilt, die über definierte Schnittstellen kommunizieren.
Momentum
Beschleunigungstechnik für Gradient Descent, die vergangene Gradientenrichtungen akkumuliert, um schneller zu konvergieren und über lokale Minima hinwegzukommen.
Monte Carlo Dropout (MC Dropout)
Monte Carlo Dropout schätzt Modell-Unsicherheit, indem Dropout zur Inferenz-Zeit aktiv gehalten und mehrere stochastische Forward Passes durchgeführt werden, deren Ergebnisse dann aggregiert werden.
Monte Carlo Tree Search (MCTS)
MCTS ist ein Planungsalgorithmus, der durch zufällige Simulationen einen Entscheidungsbaum aufbaut und die vielversprechendsten Aktionen identifiziert.
Mooresches Gesetz
Die Beobachtung, dass sich die Anzahl der Transistoren auf integrierten Schaltkreisen etwa alle zwei Jahre verdoppelt, was zu exponentiellem Wachstum der Rechenleistung führt.
MQL (Marketing Qualified Lead)
Ein MQL ist ein Lead, der vordefinierte Kriterien erfüllt, die eine höhere Wahrscheinlichkeit anzeigen, eine Sales Opportunity zu werden.
MRR (Mean Reciprocal Rank)
Der Durchschnitt der reziproken Ränge des ersten relevanten Ergebnisses über alle Queries – MRR = 1/n × Σ(1/rank_i).
MSE (Mean Squared Error)
Der Durchschnitt der quadrierten Differenzen zwischen vorhergesagten und tatsächlichen Werten – Standard-Loss für Regression.
MT-Bench
Ein Multi-Turn-Konversations-Benchmark für LLMs mit 80 Fragen in 8 Kategorien, bewertet durch GPT-4-as-Judge.
MTEB
Der Massive Text Embedding Benchmark – ein umfassender Benchmark für Text-Embedding-Modelle über 56+ Datensätze in 8 Aufgaben.
mTLS (Mutual TLS)
mTLS ist ein TLS-Setup, bei dem sich Client und Server gegenseitig mit Zertifikaten authentifizieren (Zwei-Wege-Authentifizierung).
Multi-Agent System
System aus mehreren spezialisierten KI-Agenten, die zusammenarbeiten, um komplexe Aufgaben zu lösen, die ein einzelner Agent nicht bewältigen könnte.
Multi-Agent Systems
Systeme aus mehreren spezialisierten AI-Agenten, die zusammenarbeiten – jeder Agent hat eine Rolle (Researcher, Writer, Critic) und sie kommunizieren, um komplexe Tasks zu lösen.
Multi-Armed Bandit
Ein Algorithmus für sequenzielle Entscheidungsfindung, der Exploration und Exploitation balanciert.
Multi-Head Attention
Multi-Head Attention führt mehrere Attention-Berechnungen parallel mit verschiedenen gelernten Projektionen durch und kombiniert die Ergebnisse.
Multi-Objective Optimization
Multi-Objective Optimization (Pareto Optimization) ist Optimierung mit mehreren Zielen, die oft konfligieren, wobei Sie typischerweise Pareto-optimale Lösungen statt eines einzelnen Optimums suchen.
Multi-Query Attention (MQA)
Multi-Query Attention teilt sich einen einzigen Key-Value-Kopf über alle Query-Köpfe – reduziert KV-Cache um bis zu 8x bei minimalem Qualitätsverlust.
Multi-Region
Eine Architektur, die Anwendungen und Daten über mehrere geografische Rechenzentren verteilt, um Latenz, Verfügbarkeit und Compliance zu optimieren.
Multi-Teacher Distillation
Eine Distillationsmethode, bei der ein Student-Modell von mehreren spezialisierten Teacher-Modellen gleichzeitig lernt – kombiniert Expertise verschiedener Domains.
Multi-tenancy
Multi-tenancy ist eine Software-Architektur, bei der eine einzelne Instanz einer Anwendung mehrere Kunden ("Tenants") bedient, während die Daten/Konfiguration jedes Tenants getrennt und sicher gehalten werden.
Multi-Touch Attribution (MTA)
Attribution, die Credit auf alle Touchpoints der Customer Journey verteilt.
Multi-Turn Conversation
Eine Multi-Turn Conversation ist eine Interaktion, bei der Kontext und Intent sich über mehrere Austausche entwickeln statt einer einzelnen Query-Response.
Multimodal
KI-Systeme, die mehrere Datentypen (Text, Bild, Audio, Video) gleichzeitig verarbeiten und verstehen können.
Multimodal Embeddings
Vektorrepräsentationen, die verschiedene Datentypen (Text, Bilder, Audio) in denselben semantischen Raum projizieren – ermöglicht modalitätsübergreifendes Suchen und Verstehen.
Multimodal Model
Ein Multimodal Model kann über mehrere Datentypen (z.B. Text, Bilder, Audio, Video) hinweg verarbeiten und/oder generieren.
Multimodale KI
KI-Systeme, die mehrere Datentypen wie Text, Bilder, Audio und Video gleichzeitig verarbeiten, verstehen und generieren können.
Multimodale KI
KI-Systeme, die Text, Bild, Audio und Video gemeinsam verarbeiten und in beliebigen Modalitäten antworten können.
N
N-gram Blocking
N-gram Blocking ist ein Decoding Constraint, der verhindert, dass ein Modell ein N-gram (Sequenz von N Tokens) generiert, das bereits im generierten Text erschienen ist.
N-Gramm
Zusammenhängende Sequenz von N Elementen (Zeichen oder Wörtern) aus einem Text.
N-Shot Prompting
N-Shot Prompting stellt N Beispiele im Prompt bereit, um dem Modell das gewünschte Muster beizubringen (0-shot = nur Anweisungen; few-shot = kleines N).
N-Tier Architecture
N-Tier Architecture ist ein System-Design, das eine Anwendung in logische Layers (Tiers) trennt—typischerweise Presentation, Application/Business Logic und Data—um Skalierbarkeit, Wartbarkeit und Sicherheit zu verbessern.
N+1 Tool Call Problem
Das N+1 Tool Call Problem tritt auf, wenn ein KI-Workflow einen initialen Tool Call macht und dann N zusätzliche Tool Calls (oft einen pro Retrieved Item), was unnötige Latenz und Kosten verursacht.
NAC (Network Access Control)
Network Access Control (NAC) ist ein Security Approach, der Network Access basierend auf Device Identity, Posture und Policy einschränkt (z.B. nur compliant Devices können auf sensitive Services zugreifen).
NACK (Negative Acknowledgment)
Ein NACK ist eine Nachricht, die anzeigt, dass ein Request/Message nicht erfolgreich verarbeitet wurde (das Gegenteil von einem ACK).
NAdam
Optimizer, der Nesterov Momentum in Adam integriert – kombiniert die Look-Ahead-Korrektur von NAG mit Adams adaptiven Lernraten.
Named Account List Governance
Named Account List Governance ist der Prozess und die Regeln dafür, wie Target Account Lists created, updated, owned und operationalized werden über Marketing und Sales.
Named Accounts
Named Accounts sind eine definierte Liste von Target Companies, priorisiert für Go-to-Market Efforts, häufig in ABM (Account-Based Marketing) verwendet.
Named Entity Canonicalization
Entity Canonicalization ist die Standardisierung verschiedener Surface Forms derselben Entity in eine kanonische Repräsentation (z.B. "OpenAI Inc.", "OpenAI", "Open AI").
Named Entity Linking (NEL)
Named Entity Linking verbindet eine Entity-Mention in Text (z.B. "OpenAI", "Apple", "Paris") mit einer spezifischen kanonischen Entity ID in einer Knowledge Base.
Named Entity Recognition (NER)
Die Identifikation und Klassifikation von benannten Entitäten in Text (Personen, Orte, Organisationen).
Named Entity Recognition (NER)
NLP-Aufgabe zur Identifikation und Klassifikation benannter Entitäten in Text.
Namespace Collision
Eine Namespace Collision passiert, wenn zwei Resources denselben Namen in einem Context teilen, wo Namen unique sein müssen, was Ambiguity oder Runtime Errors verursacht.
Namespace Isolation Patterns
Namespace Isolation Patterns sind Design-Ansätze (oft in Kubernetes), die Namespaces, Policies, Quotas und Secrets Boundaries nutzen, um Environments oder Tenants zu isolieren.
Namespace-Scoped Secrets
Namespace-Scoped Secrets sind Secrets, die innerhalb einer spezifischen Namespace Boundary (häufig in Kubernetes) verwaltet werden, was limitiert, welche Workloads darauf zugreifen können.
NaN (Not a Number)
NaN ist ein spezieller Floating-Point Wert, der "Not a Number" bedeutet, verwendet um undefinierte oder nicht repräsentierbare numerische Ergebnisse darzustellen (z.B. 0/0).
Nano Banana
Codename für Googles Bildbearbeitungs-Modell (Gemini 2.5 Flash Image), das pixelgenaue Edits per Prompt ermöglicht.
Nano Banana 2
Googles KI-Bildgenerierungsmodell der zweiten Generation, basierend auf Gemini 3.1 Flash Image, das Pro-Qualität mit Flash-Geschwindigkeit kombiniert.
Narrow AI
Narrow AI (auch "Weak AI") ist KI, die entwickelt wurde, um eine spezifische Aufgabe oder einen begrenzten Satz von Aufgaben auszuführen, anstatt allgemeines Reasoning über Domains.
NAT (Network Address Translation)
NAT mappt private IP Adressen auf public IP Adressen (und vice versa), was private Networks ermöglicht, auf externe Networks zuzugreifen, während Public IP Usage reduziert wird.
Native Advertising
Native Advertising ist Paid Media, designed um Form und Funktion der Plattform zu matchen, auf der es erscheint (z.B. Sponsored Articles, In-Feed Sponsored Posts).
Natural Experiment
Ein Natural Experiment nutzt reale Ereignisse oder operationale Änderungen (nicht von Ihnen randomisiert), die zufällige Zuweisung approximieren und kausale Inferenz unter Annahmen ermöglichen.
Natural Gradient
Natural Gradient ist ein Optimierungsansatz, der die Geometrie des Parameterraums berücksichtigt und oft zu effizienteren Schritten als Standard Gradient Descent in einigen probabilistischen Modellen führt.
Natural Language Generation
Natural Language Generation (NLG) ist der Prozess, menschlich lesbaren Text aus Daten, Intention oder internen Repräsentationen (Regeln, Templates oder neuronale Modelle) zu produzieren.
Natural Language Processing (NLP)
Der Bereich der KI, der sich mit der Interaktion zwischen Computern und menschlicher Sprache befasst.
Natural Language Understanding (NLU)
NLU ist die KI-Fähigkeit, die Bedeutung, Absicht und Struktur natürlicher Sprache zu verstehen – nicht nur Wörter zu erkennen, sondern ihren Sinn zu erfassen.
Natural Questions
Ein Question-Answering-Benchmark von Google mit echten Suchanfragen und Wikipedia-Artikeln als Antwortquellen.
NCCL (NVIDIA Collective Communications Library)
NCCL ist eine Library für schnelle GPU-zu-GPU Communication Primitives (Collectives) wie all-reduce, broadcast und all-gather—häufig in Distributed Training und Inference.
NCCL All-Reduce
All-Reduce ist eine Collective Operation, die Daten (oft Summierung) über Devices aggregiert und das Ergebnis zurück an alle Devices verteilt.
NDCG (Normalized Discounted Cumulative Gain)
Eine Ranking-Metrik, die sowohl Relevanzgrade als auch Positionen im Ranking berücksichtigt – höher gerankte relevante Items werden stärker gewichtet.
NDJSON (Newline-Delimited JSON)
NDJSON ist ein Format, bei dem jede Zeile ein valides JSON Object ist—was es einfach macht zu streamen, appenden und Logs/Events at Scale zu verarbeiten.
NDR (Net Dollar Retention)
Net Dollar Retention (NDR) ist im Wesentlichen dieselbe Metric-Familie wie NRR: wie viel Revenue von bestehenden Customers Sie über Zeit behalten, inklusive Expansion und Churn (Terminologie variiert nach Organisation).
Near-Duplicate-Erkennung
Near-Duplicate-Erkennung identifiziert Elemente, die nicht exakt identisch, aber hochgradig ähnlich sind (z.B. gleicher Inhalt mit kleinen Änderungen, Boilerplate-Unterschieden oder Formatierungsänderungen).
Negative Binomial Regression
Negative Binomial Regression ist ein statistisches Modell für Count Data (z.B. Clicks, Conversions), das Overdispersion (Varianz > Mittelwert) behandelt, anders als Poisson Regression.
Negative Control
Eine Negative Control ist eine Variable, ein Ergebnis oder eine Testbedingung, die von einer Intervention nicht beeinflusst werden sollte—verwendet zur Erkennung von Bias, Confounding oder Measurement-Artefakten.
Negative Gewichte
Negative Gewichte sind negative Kantenkosten in einem gewichteten Graphen (d.h. eine Aktion/Transition reduziert die Gesamtkosten).
Negative Prompt
Ein Negative Prompt beschreibt, was in einem generierten Bild NICHT erscheinen soll – steuert Diffusionsmodelle durch Ausschluss unerwünschter Elemente.
Negative Prompting
Negative Prompting ist das explizite Sagen an ein generatives Modell, was vermieden werden soll (Content, Stil, Formatierung, Claims) während der Generierung.
Negative Transfer
Negative Transfer tritt auf, wenn Wissenstransfer von einem vortrainierten Modell oder Source Task die Performance auf dem Target Task verschlechtert.
Negativer Zyklus
Ein negativer Zyklus ist ein Zyklus in einem gewichteten Graphen, dessen Gesamtgewicht negativ ist, was es ermöglicht, Pfadkosten durch Schleifen unbegrenzt zu reduzieren.
Neo4j
Neo4j ist die führende Graph-Datenbank, die Daten als Knoten und Beziehungen speichert und effiziente Abfragen über vernetzte Datenstrukturen ermöglicht.
Neptune.ai
MLOps-Plattform für Experiment Tracking, Modell-Registry und Metadaten-Management mit Fokus auf Enterprise-Skalierung.
NeRF (Neural Radiance Fields)
NeRFs sind neuronale Methoden zur Repräsentation von 3D-Szenen, die eine Funktion lernen, die räumliche Koordinaten und Blickrichtung auf Farbe und Dichte mappt, um Novel View Synthesis zu ermöglichen.
Nesterov Momentum
Verbesserte Momentum-Variante, die den Gradienten am "vorausgeblickten" Punkt berechnet statt am aktuellen – schnellere und stabilere Konvergenz.
Net New ARR
Net New ARR ist die Veränderung des jährlich wiederkehrenden Umsatzes von Periodenstart bis -ende, unter Berücksichtigung von Neuverkäufen, Expansion, Kontraktion und Churn.
Net Present Value (NPV)
NPV ist der heutige Wert zukünftiger Cashflows, abgezinst mit einem Satz, der Zeitwert und Risiko widerspiegelt.
Net Revenue Retention (NRR)
NRR misst, wie viel wiederkehrenden Umsatz Sie von bestehenden Kunden über einen Zeitraum behalten, einschließlich Expansion und Churn.
Network Bandwidth
Network Bandwidth ist die Rate, mit der Daten über ein Netzwerk übertragen werden können (z.B. Mbps, Gbps).
Network DLP
Network Data Loss Prevention (DLP) ist ein Set von Controls, die sensible Daten erkennen und verhindern, dass sie eine Netzwerkgrenze durch ausgehenden Traffic verlassen (Egress).
Network Effects
Network Effects treten auf, wenn ein Produkt wertvoller wird, je mehr Menschen (oder Organisationen) es nutzen.
Network Egress
Network Egress ist ausgehender Traffic, der ein System/Netzwerk verlässt (z.B. von Ihrer VPC ins Internet oder zu externen SaaS APIs).
Network Jitter
Network Jitter ist Variation in Paket-Delays über Zeit (inkonsistente Latency), auch wenn durchschnittliche Latency akzeptabel ist.
Network Latency
Network Latency ist die Zeit, die Daten benötigen, um über ein Netzwerk zwischen Systemen zu reisen (Client ↔ Server, Service ↔ Service).
Network Load Balancer
Ein Network Load Balancer verteilt eingehenden Network Traffic auf mehrere Server/Instances, um Availability und Performance zu verbessern.
Network Partition
Eine Network Partition ist ein Fehler, bei dem Teile eines verteilten Systems nicht miteinander kommunizieren können, obwohl jeder Teil noch läuft.
Network Rate Limiting
Network Rate Limiting schränkt Request Rates ein, um Services vor Overload, Abuse oder Cost Blowups zu schützen.
Network Segmentation
Network Segmentation ist die Aufteilung eines Netzwerks in isolierte Segmente, um Attack Surface zu reduzieren, Lateral Movement zu begrenzen und Least Privilege Access durchzusetzen.
Network Topology
Network Topology beschreibt, wie Netzwerkkomponenten angeordnet und verbunden sind (physisches und logisches Layout).
Network-Aware Batching
Network-Aware Batching gruppiert Requests, um Network Overhead zu reduzieren und Throughput zu verbessern, besonders wenn Network Latency dominiert.
NetworkPolicy (Kubernetes)
Eine Kubernetes NetworkPolicy definiert, wie Pods miteinander und mit externen Endpoints kommunizieren dürfen, und ermöglicht Micro-Segmentation innerhalb von Clustern.
Neural Architecture Search (NAS)
Ein AutoML-Ansatz, bei dem Algorithmen automatisch die optimale Architektur neuronaler Netze für eine gegebene Aufgabe entdecken – der "KI designt KI"-Ansatz.
Neural Audio Codec
Neural Audio Codecs komprimieren Audio in diskrete Tokens – die Brücke zwischen Audio und Language Models, die Musik- und Sprachgenerierung ermöglicht.
Neural Code Search
Neural Code Search ruft relevante Code-Snippets oder Files mithilfe von Embeddings und semantischem Matching ab, anstatt exakter Keyword-Suche.
Neural Collaborative Filtering
Ein Deep-Learning-Ansatz, der neuronale Netze statt klassischer Matrixfaktorisierung für Collaborative Filtering einsetzt.
Neural Collapse
Neural Collapse ist ein Phänomen in deep Classifiers gegen Ende des Trainings, bei dem gelernte Representations und Classifier Weights eine hochstrukturierte Geometry aufweisen (Klassen werden eng geclustert und symmetrisch angeordnet).
Neural Embeddings
Neural Embeddings sind gelernte Vektor-Repräsentationen von Items (Text, User, Produkte, Dokumente), sodass Distanz im Vektorraum Ähnlichkeit widerspiegelt.
Neural Index Rebuild
Ein Neural Index Rebuild ist das Re-Generieren von Embeddings und Neuaufbauen von Vector (oder Hybrid) Indexes nach Änderungen an Content, Chunking oder dem Embedding Model.
Neural Indexing
Neural Indexing verwendet gelernte Repräsentationen und neuronale Methoden, um einen Index für Retrieval zu bauen oder zu optimieren.
Neural IR (Neural Information Retrieval)
Neural IR ist die Verwendung neuronaler Modelle (Embeddings, Cross-Encoder, Reranker) zum Abrufen und Ranken von Dokumenten basierend auf semantischer Relevanz.
Neural Ordinary Differential Equation (Neural ODE)
Neural ODEs modellieren Transformationen als kontinuierliche Zeitdynamiken, definiert durch ein neuronales Netzwerk, was bestimmte Effizienz- und Modellierungseigenschaften ermöglicht.
Neural Processing Unit (NPU)
Eine NPU ist spezialisierte Hardware, die neuronale Netzwerk-Berechnungen (Matrix-Multiplikationen, Convolutions, Attention-artige Ops) effizient beschleunigt—oft mit starken Power/Performance-Vorteilen für spezifische Workloads.
Neural Processing Unit (NPU)
Ein NPU ist spezialisierte Hardware, designed um Neural Network Computations (Matrix Multiplications, Convolutions, Attention-like Ops) effizient zu beschleunigen—oft mit starken Power/Performance Advantages für spezifische Workloads.
Neural Pruning
Neural Pruning entfernt Gewichte, Neuronen, Attention Heads oder ganze Strukturen aus einem Modell, um Compute/Memory zu reduzieren während Performance erhalten bleibt.
Neural Rendering
Neural Rendering kombiniert neuronale Netze mit Computergrafik, um fotorealistische Bilder und Videos zu erzeugen – von 3D-Szenen-Rendering bis Style-Manipulation.
Neural Reranking
Neural Reranking verwendet ein Modell (oft einen Cross-Encoder), um einen ersten Satz abgerufener Kandidaten basierend auf tieferem Query-Kandidat-Verständnis neu zu bewerten und zu ordnen.
Neural Retrieval
Neural Retrieval ist das Abrufen relevanter Elemente mithilfe gelernter Repräsentationen (dense Embeddings und Ähnlichkeitssuche) anstatt rein auf Keyword-Matching zu basieren.
Neural Scaling Laws
Scaling Laws beschreiben empirische Beziehungen, die zeigen wie Model-Performance vorhersagbar besser wird, wenn Compute, Daten und/oder Model-Parameter erhöht werden—oft Power-Law-artigen Trends folgend.
Neural Style Transfer (NST)
Neural Style Transfer ist eine Technik, die den "Style" eines Bildes (Textures, Patterns) auf den "Content" eines anderen anwendet, unter Verwendung von Neural Representations.
Neural Topic Routing
Neural Topic Routing verwendet ML/Embeddings, um einen Input (Query, Pageview, Conversation) in ein Topic, Workflow oder Handler basierend auf semantischer Bedeutung zu klassifizieren oder zu routen.
Neural Voice Transfer
KI-Technologie, die die Stimmcharakteristiken einer Aufnahme in Echtzeit auf eine andere Stimme überträgt, während der Inhalt erhalten bleibt.
Neuro-Symbolic "Verification Layer"
Eine Neuro-Symbolic Verification Layer ist eine Systemkomponente, die neuronale Outputs gegen symbolische Constraints (Regeln, Schemas, Policies) prüft, bevor gehandelt oder publiziert wird.
Neuro-Symbolic AI
Neuro-Symbolic AI kombiniert neuronale Methoden (LLMs, Embeddings) mit symbolischen Methoden (Regeln, Logik, Knowledge Graphs) zur Verbesserung von Zuverlässigkeit, Interpretierbarkeit und Constraint-Erfüllung.
Neuromorphic Computing
Neuromorphic Computing ist ein Approach zu Hardware und Computation, inspiriert von biologischen neuronalen Systemen, oft mit Betonung auf Event-Driven Processing und Energy Efficiency.
Neuronales Netzwerk
Ein Berechnungsmodell, das von der Struktur biologischer Neuronen inspiriert ist und aus miteinander verbundenen Knoten (Neuronen) in Schichten besteht.
New-to-File (NTF)
New-to-File bezieht sich auf Leads oder Customers, die neu in Ihrer Database/CRM sind—oft als Acquisition Indicator in B2B verwendet.
Next Best Action (NBA)
AI-System, das für jeden Kunden in jedem Moment die optimale nächste Interaktion ermittelt – Angebot, Content, Kanal, Timing.
Next Best Question (NBQ)
Next Best Question ist ein Conversational Design und Decisioning Pattern, bei dem ein System die single most valuable klärende Frage stellt, um zu einem korrekten Outcome zu gelangen.
Next Sentence Prediction (NSP)
Next Sentence Prediction ist ein Training Objective, bei dem ein Modell vorhersagt, ob ein Satz wahrscheinlich auf einen anderen im Originaltext folgt.
NHST (Null Hypothesis Significance Testing)
NHST ist das traditionelle statistische Test-Framework, bei dem Sie testen, ob beobachtete Daten unter einer Nullhypothese (oft "kein Effekt") unwahrscheinlich sind, typischerweise mit p-Werten.
Nicht-monotone Logik
Ein logisches System, in dem Schlussfolgerungen zurückgenommen werden können, wenn neue Informationen eintreffen, die bisherige Annahmen widerlegen.
NIST Cybersecurity Framework (NIST CSF)
Das NIST Cybersecurity Framework ist ein strukturiertes Framework für das Management von Cybersecurity-Risiken durch gemeinsame Sprache, Kategorien und Praktiken in der Organisation.
NIST SP 800-53
NIST SP 800-53 ist ein Katalog von Security und Privacy Controls, verwendet als Reference für das Designen und Assessieren sicherer Systeme.
NIST SP 800-63 (Digital Identity)
NIST SP 800-63 ist Guidance für digitale Identität: Identity Proofing, Authentication und Federation Concepts und Requirements.
NL2SQL (Natural Language to SQL)
NL2SQL konvertiert natürlichsprachliche Fragen in SQL-Queries, die gegen eine Datenbank ausgeführt werden können.
NLP (Natural Language Processing)
Natural Language Processing (NLP) ist das Teilgebiet der KI, das sich mit der maschinellen Verarbeitung, Interpretation und Generierung natürlicher Sprache beschäftigt.
NLTK (Natural Language Toolkit)
Die älteste und umfassendste Python-Library für NLP – optimiert für Lehre, Forschung und Prototyping.
NMI (Normalized Mutual Information)
NMI ist eine Metrik zum Vergleichen von Clustering-Zuweisungen, indem gemessen wird, wie viel Information ein Clustering mit einem anderen teilt, normalisiert für Skalierungsfreundlichkeit.
No Free Lunch Theorem
Das No Free Lunch Theorem (in Optimization/Learning) besagt, dass gemittelt über alle möglichen Probleme kein Algorithmus besser performt als alle anderen—Performance hängt von der Problem-Distribution ab.
Node Affinity
Node Affinity ist ein Kubernetes Scheduling Feature, das einschränkt, auf welchen Nodes Pods laufen können (basierend auf Node Labels), und Placement Control ermöglicht.
Node Pool
Ein Node Pool ist eine Gruppe von Compute Nodes (oft in Kubernetes oder Managed Clusters) mit ähnlichen Charakteristiken, zusammen verwaltet für Scaling und Scheduling.
Node Selector
Node Selector ist ein Kubernetes-Mechanismus, um Pods auf Nodes mit passenden Labels zu constrainen.
Node2Vec
Node2Vec ist ein Algorithmus, der Knoten eines Graphen als niedrig-dimensionale Vektoren repräsentiert, basierend auf Random Walks über die Graph-Struktur.
Noise Injection
Noise Injection ist das absichtliche Hinzufügen von Rauschen während Training oder Processing, um Robustheit, Generalisierung oder Privacy zu verbessern.
Noise Schedule
Ein Noise Schedule definiert, wie viel Rauschen in jedem Schritt der Forward- und Reverse-Prozesse eines Diffusion-Modells hinzugefügt (und später entfernt) wird.
Noise-to-Signal Ratio
Noise-to-Signal Ratio misst, wie viel zufällige Variation (Noise) relativ zum bedeutungsvollen Pattern (Signal) existiert, das Sie detecten wollen.
Noisy Student Training
Noisy Student Training ist ein Semi-Supervised Learning Ansatz, bei dem ein "Teacher"-Modell unlabeled Data labelt, und ein "Student"-Modell auf einem Mix aus labeled + pseudo-labeled Data mit Noise/Augmentation trainiert wird.
Nomic Embed
Open-Source-Embedding-Modelle von Nomic AI mit voller Reproduzierbarkeit – alle Trainingsdaten und Code sind öffentlich.
Non-Blocking I/O
Non-Blocking I/O ermöglicht es einem Programm, I/O-Operationen zu initiieren, ohne synchron auf deren Abschluss zu warten, was Concurrency und besseren Durchsatz ermöglicht.
Non-Brand Keywords
Non-Brand Keywords sind Search Queries, die Ihren Brand Name nicht enthalten (z.B. "RAG Evaluation Checklist" vs "Davies Meyer AI").
Non-Idempotent Operation
Eine Non-Idempotent Operation ist eine, bei der das Wiederholen derselben Request mehrmals unterschiedliche Ergebnisse produzieren kann (oder doppelte Side Effects).
Non-Maximum Suppression (NMS)
Non-Maximum Suppression ist ein Post-Processing-Schritt in Object Detection, der redundante überlappende Bounding Boxes entfernt und nur die konfidentesten behält.
Non-Negative Matrix Factorization (NMF)
NMF faktorisiert eine nicht-negative Matrix in zwei kleinere nicht-negative Matrizen, oft verwendet für interpretierbare topic-artige Dekompositionen.
Non-Production Data Masking
Non-Production Data Masking ist die Praxis des Anonymisierens, Tokenisierens oder Synthetisierens sensitiver Daten, bevor sie in Dev/Staging/Test Environments verwendet werden.
Non-Production Environment
Ein Non-Production Environment ist jedes Environment, das nicht live Customer Production ist (z.B. dev, staging, test), verwendet für Entwicklung und Validierung.
Non-Repudiation
Non-Repudiation ist die Fähigkeit zu beweisen, dass eine Aktion stattfand und dass ein spezifischer Akteur sie ausführte—sodass sie es später nicht glaubwürdig leugnen können.
Non-Retryable Error
Ein Non-Retryable Error ist ein Fehler, der wahrscheinlich nicht erfolgreich ist, wenn Sie einfach retriyen (z.B. invalid Input, Permission Denied).
Nonce Reuse
Nonce Reuse ist ein Security Flaw, bei dem ein "used once" Value versehentlich wiederverwendet wird, was potenziell Replay Attacks oder kryptographische Failures ermöglicht (je nach Context).
Nonlinear Activation Function
Eine Nonlinear Activation Function führt Nonlinearity in neurale Networks ein (z.B. ReLU, GELU, tanh), was es ihnen ermöglicht, komplexe Beziehungen jenseits linearer Transformations zu modellieren.
Normal Form (Database)
In Datenbanken beschreiben Normal Forms (1NF, 2NF, 3NF, BCNF) Normalisierungsgrade, die Redundanz reduzieren und Datenintegrität verbessern.
Normalisierung (Normalization)
Normalisierung ist die Transformation numerischer Daten auf einen einheitlichen Wertebereich (oft 0–1 oder Mittelwert 0 / Standardabweichung 1), um die Trainingsstabilität von Machine-Learning-Modellen zu verbessern.
Normalization Layer
Eine Normalization Layer ist eine neuronale Netzwerkkomponente, die Aktivierungen normalisiert, um Training Stability und Convergence zu verbessern (z.B. LayerNorm, RMSNorm).
Normalized Cost per Answer
Normalized Cost per Answer sind die Kosten für die Generierung einer KI-Antwort, angepasst für Vergleichbarkeit (z.B. normalisiert nach Antwortlänge, Tokens, Difficulty Tier oder Traffic Segment).
Normalized RMSE (NRMSE)
NRMSE ist RMSE normalisiert durch einen Scale Factor (z.B. Range, Mean oder Standard Deviation), um Errors über Datasets vergleichbar zu machen.
Normalizing Flow
Ein Normalizing Flow ist ein generativer Modellierungsansatz, der eine einfache Verteilung (z.B. Gaussian) über eine Sequenz invertierbarer Transformationen mit tractierbaren Likelihoods in eine komplexe transformiert.
NoSQL
NoSQL bezieht sich auf nicht-relationale Datenbanken, die für Skalierbarkeit und Flexibilität konzipiert sind (Document, Key-Value, Wide-Column, Graph Databases).
Notarization (Software Artifact)
Software Notarization ist der Prozess des Verifizierens und Attestierens, dass ein Software Artifact (Binary/Container/Package) bestimmte Integrity und Security Requirements erfüllt, bevor es distributed oder ausgeführt wird.
Notebook (Jupyter Notebook)
Ein Notebook ist ein interaktives Dokument, das Code, Outputs und narrativen Text mischt—häufig für Data Science Exploration und Prototyping verwendet (z.B. Jupyter).
Notification Fatigue
Notification Fatigue ist reduzierte Responsiveness oder negative Stimmung, verursacht durch exzessive Alerts, Nachrichten oder Nudges.
Novel Class Discovery (NCD)
Novel Class Discovery findet previously unbekannte Kategorien in unlabeled Data, während Knowledge von bekannten Classes genutzt wird.
Nowcasting
Prognose des aktuellen oder unmittelbar bevorstehenden Zustands unter Nutzung hochfrequenter Echtzeit-Daten.
NT-Xent Loss (Normalized Temperature-Scaled Cross-Entropy)
NT-Xent ist eine Contrastive Learning Loss, verwendet um Embeddings zu trainieren, indem Positive Pairs zusammengezogen und Negatives auseinandergedrückt werden, mit einem Temperature Term, der Distribution Sharpness kontrolliert.
Null Value
Ein Null Value repräsentiert fehlende oder unbekannte Daten (unterschiedlich von Zero, leerem String oder False).
NUMA (Non-Uniform Memory Access)
NUMA ist eine Speicherarchitektur, bei der die Memory-Zugriffszeit davon abhängt, an welchem CPU-Socket/Node der Speicher angeschlossen ist (lokaler Speicher ist schneller als entfernter).
Numerical Precision
Numerical Precision ist, wie genau Zahlen repräsentiert und berechnet werden (z.B. FP32 vs FP16/bfloat16), beeinflusst Rundung und Stabilität.
Nurture Marketing
Nurture Marketing ist das Führen von Prospects über Zeit mit helpful, staged Content und Experiences, bis sie bereit für eine Conversion oder Sales Engagement sind.
Nurture Sequence
Eine Nurture Sequence ist eine definierte Serie von Touches (Emails, In-App Messages, Retargeting, Content Steps), getriggert durch Behavior oder Segment Membership.
Nutzenfunktion
Eine Nutzenfunktion bildet Ergebnisse auf numerische Werte ab, die Präferenzen repräsentieren, und ermöglicht Tradeoffs zwischen konkurrierenden Zielen.
NVIDIA AI
Der dominierende Anbieter von GPU-Hardware und AI-Infrastruktur, dessen Chips das Fundament für praktisch alle großen KI-Modelle bilden.
NVLink
NVLink ist ein High-Speed GPU-Interconnect, der schnellere GPU-zu-GPU-Kommunikation als Standard-PCIe in vielen Setups ermöglicht.
NVMe
NVMe ist ein Storage-Protokoll/Interface, das für High-Speed-Zugriff auf SSDs konzipiert ist und typischerweise signifikant niedrigere Latenz und höheren Throughput als ältere Interfaces bietet.
O
OAuth 2.0
Ein Autorisierungs-Framework, das Anwendungen ermöglicht, auf Ressourcen im Namen eines Nutzers oder Services zuzugreifen, ohne Passwörter zu teilen.
Object Detection
Identifikation und Lokalisierung von Objekten in Bildern oder Videos.
Object Storage
Speichert Daten als Objekte (Blob + Metadaten + ID), optimiert für Haltbarkeit und Skalierbarkeit (z.B. Dokumente, Bilder, Logs).
Objektorientierte Programmierung (OOP)
Ein Programmierparadigma, das Software um "Objekte" organisiert – Datenstrukturen, die Zustand (Attribute) und Verhalten (Methoden) kapseln.
Observability
Die Fähigkeit, den internen Zustand eines Systems aus seinen Outputs zu verstehen – typischerweise über Logs, Metriken und Traces.
Observability für LLM-Apps
LLM-Observability erweitert klassische Observability um KI-spezifische Signale: Prompt/Version-Tracking, Retrieval-Evidence, Tool-Traces, Token-Nutzung und Qualitäts-/Sicherheitsmetriken.
Observed vs Expected
Vergleicht tatsächliches Systemverhalten mit einer Baseline oder einem Modell des erwarteten Verhaltens, um Anomalien und Regressionen zu erkennen.
OCR (Optical Character Recognition)
Konvertiert Text in Bildern (Scans, Screenshots, Fotos, PDFs-als-Bilder) in maschinenlesbaren Text.
Off-Policy Evaluation (OPE)
Schätzt, wie eine neue Entscheidungs-Policy performen würde, unter Verwendung von Daten, die von einer anderen (bestehenden) Policy gesammelt wurden – ohne die neue Policy zu deployen.
Offline-Evaluation
Messung der Modell-/Systemleistung anhand vordefinierter Datensätze und Metriken vor dem Produktions-Rollout.
OLAP (Online Analytical Processing)
Eine Technologie für schnelle, multidimensionale Analysen großer Datenmengen, die Slice, Dice, Drill-Down und Roll-Up Operationen ermöglicht.
Ollama
Ein benutzerfreundliches Tool zum lokalen Ausführen von LLMs auf Consumer-Hardware, mit einfacher Installation und Docker-artiger Modell-Verwaltung.
Omnichannel
Nahtlose Kundenexperience über alle Kanäle und Touchpoints hinweg.
Omnichannel Marketing
Koordination von Messaging und Experience über Kanäle hinweg (Web, E-Mail, Paid Media, Social, Sales), sodass die Customer Journey konsistent und verbunden wirkt.
On-Call
Eine operative Praxis, bei der designierte Engineers auf Incidents reagieren, die System-Reliability, Performance oder Sicherheit betreffen.
On-Call Rotation
Ein strukturierter Schedule, wer über die Zeit für Incident Response verantwortlich ist, oft mit Eskalations-Pfaden und Backup-Rollen.
On-Device AI
KI-Inferenz direkt auf Endgeräten (Smartphones, Laptops, IoT) ohne Cloud-Verbindung – ermöglicht Echtzeit-Verarbeitung, Datenschutz und Offline-Fähigkeit.
On-Device Inference
Ausführung eines Modells lokal auf dem Gerät des Nutzers (Smartphone, Laptop, Edge-Hardware) statt über eine Cloud-API.
Onboarding
Die Experience und der Prozess, der einem Nutzer (oder Kunden-Team) hilft, schnell und selbstbewusst sinnvollen Wert zu erreichen.
Once-for-All (OFA)
Eine Trainingsmethode, die ein einziges "Supernet" trainiert, aus dem viele spezialisierte Subnetzwerke für verschiedene Hardware-Constraints extrahiert werden können – trainiere einmal, deploye überall.
One-Cycle Policy
Learning-Rate-Schedule, der die LR erst hochfährt (Warmup) und dann auf einen sehr niedrigen Wert absenkt – ermöglicht Training in einem Bruchteil der üblichen Epochen.
One-Hot Encoding
Repräsentation eines kategorialen Werts als Vektor aus Nullen mit einer einzelnen 1 am Kategorie-Index.
One-Shot Learning
Fähigkeit, aus einem einzigen Beispiel zu lernen und zu generalisieren.
One-Shot Prompting
Bereitstellung eines einzelnen Beispiels im Prompt, um das gewünschte Output-Muster zu demonstrieren.
Online Distillation
Eine Distillationsvariante, bei der mehrere Modelle gleichzeitig trainiert werden und sich gegenseitig als Teacher dienen – kein vortrainierter Teacher nötig.
Online Learning
Aktualisiert ein Modell inkrementell, wenn neue Daten eintreffen, anstatt von Grund auf in großen Batches neu zu trainieren.
Online-Evaluation
Messung der Performance auf echtem Nutzer-Traffic (A/B-Tests, Canaries, Interleaving, Holdouts) nach dem Deployment.
ONNX (Open Neural Network Exchange)
Ein offenes Format für den Austausch von ML-Modellen zwischen verschiedenen Frameworks – trainiere in PyTorch, deploye mit TensorRT oder CoreML.
Ontologie
Formale Beschreibung von Konzepten, Eigenschaften und Beziehungen in einem Wissensbereich.
Ontologie (Formal)
Eine formale Repräsentation von Konzepten und Beziehungen in einer Domäne (Entitäten, Klassen, Eigenschaften, Constraints).
Open Graph Protocol
Ein Set von Metadaten-Tags, die kontrollieren, wie eine Seite beim Teilen auf sozialen Plattformen und Messaging-Apps erscheint (Titel, Beschreibung, Preview-Bild).
Open-Domain Dialogue
Open-Domain Dialogue bezeichnet KI-Systeme, die über beliebige Themen frei konversieren können – ohne auf vordefinierte Intents oder Domains beschränkt zu sein.
Open-Weight-Modell
Ein Modell, dessen trainierte Gewichte öffentlich verfügbar sind (oder unter bestimmten Bedingungen), was Self-Hosting und tiefere Anpassung ermöglicht.
OpenAI
Ein führendes KI-Forschungsunternehmen und Entwickler von ChatGPT, GPT-4, DALL-E und der weltweit meistgenutzten KI-Anwendungen.
OpenAI Codex
OpenAIs spezialisiertes AI-Modell für Programmierung – die Technologie hinter GitHub Copilot und Basis für Code-LLMs.
OpenAI Embeddings
OpenAIs kommerzielle Embedding-API mit text-embedding-3-small und text-embedding-3-large – der einfachste Weg zu hochwertigen Embeddings.
OpenAI o1
OpenAI's erstes Modell der o-Serie, das explizites Reasoning mit Chain-of-Thought für komplexe Problemlösungen verwendet.
OpenAI o3
Weiterentwickeltes Reasoning-Modell von OpenAI mit verbesserter Leistung bei Mathematik, Coding und wissenschaftlichem Denken.
OpenAPI Specification
Ein Standard zur Beschreibung von REST-APIs in einem maschinenlesbaren Format (Endpoints, Parameter, Auth, Request/Response-Schemas).
OpenAPI Specification
Ein standardisiertes Format zur Beschreibung von REST APIs – wird von AI-Systemen genutzt, um automatisch Tool-Definitionen für Function Calling zu generieren.
OpenID Connect (OIDC)
Eine Identitätsschicht auf OAuth 2.0, die Authentifizierung (wer der Nutzer ist) mittels standardisierter Identity-Tokens ermöglicht.
OpenLLM Leaderboard
Ein öffentliches Leaderboard von Hugging Face, das Open-Source-LLMs auf standardisierten Benchmarks (MMLU, HellaSwag, etc.) vergleicht.
OpenRouter
Einheitliche API-Plattform, die Zugang zu hunderten KI-Modellen verschiedener Anbieter über eine einzige Schnittstelle bietet.
OpenTelemetry (OTel)
Ein Set von Standards und Tools zur Sammlung und Export von Telemetrie – Traces, Metriken und Logs.
OpenVINO
Intels Open-Source-Toolkit zur Optimierung und Beschleunigung von Deep-Learning-Inferenz auf Intel-Hardware (CPU, GPU, VPU, FPGA).
Operationalisierung
Das Umwandeln eines Konzepts, Modells oder Prototyps in eine wiederholbare, zuverlässige, governierte Produktionsfähigkeit mit klarem Ownership, Monitoring und Change Control.
Operator (Kubernetes Operator)
Software, die das Management komplexer Anwendungen auf Kubernetes automatisiert, unter Verwendung von Custom Resources und Controllers.
Operator Fusion
Eine Compiler-Optimierung, die mehrere aufeinanderfolgende Operationen in neuronalen Netzen zu einem einzigen Kernel verschmilzt – reduziert Memory-Zugriffe und beschleunigt Inferenz.
Opportunity-to-Win Rate
Der Prozentsatz der Sales-Opportunities, die zu Closed-Won konvertieren.
Opt-In Rate
Der Prozentsatz der Nutzer, die zustimmen, Kommunikation zu erhalten oder ein Feature zu aktivieren.
Optimierung
Der Prozess, Parameterwerte zu finden, die eine Loss-Funktion minimieren oder ein Ziel unter Constraints maximieren.
Optimizer
Der Algorithmus, der Modellparameter während des Trainings aktualisiert (z.B. SGD, Adam), basierend auf Gradienten und Konfiguration.
Optische Zeichenerkennung
Konvertierung von Bildern mit Text in maschinenlesbaren Text.
Optischer Fluss
Die Berechnung von Bewegungsvektoren zwischen aufeinanderfolgenden Video-Frames, die zeigen wohin sich jedes Pixel bewegt.
Orchestration
Koordiniert mehrere Schritte, Services und Tools in einen zuverlässigen Workflow – oft mit State, Retries und Observability.
Orchestrator
Die Systemkomponente, die Orchestration-Logik implementiert – den nächsten Schritt entscheiden, Tools aufrufen, State verwalten, Budgets/Guardrails durchsetzen.
Organic Growth Loop
Ein selbstverstärkender Mechanismus, bei dem Produkt-/Content-Nutzung Outputs erzeugt, die mehr Discovery und Nutzung treiben, ohne proportionale Paid-Ausgaben.
Organic Search
Traffic, der aus unbezahlten Suchmaschinen-Ergebnissen gewonnen wird.
Orphan Page
Eine Seite ohne interne Links, die auf sie zeigen, was es für Nutzer und Crawler schwer macht, sie zu entdecken.
ORPO
Eine Weiterentwicklung von DPO, die SFT und Preference-Alignment in einem einzigen Trainingsschritt kombiniert.
Out-of-Distribution (OOD) Detection
Identifizierung von Eingaben, die sich signifikant von dem unterscheiden, worauf ein Modell trainiert wurde.
Outage
Eine Periode, in der ein Service für seinen beabsichtigten Zweck nicht verfügbar oder nutzbar ist (vollständig oder teilweise).
Outage Budget (Error Budget)
Eine praktische Toleranz für Downtime/Unzuverlässigkeit innerhalb einer Periode, abgeleitet von SLOs und Risikoappetit.
Outage Postmortem
Eine strukturierte Analyse, die dokumentiert, was passiert ist, Impact, Root Causes, Contributing Factors und Corrective Actions nach einem Incident.
Outbound Marketing
Outbound Marketing bezeichnet alle proaktiven, sender-initiierten Marketing-Maßnahmen, bei denen Unternehmen aktiv auf potenzielle Kunden zugehen — etwa per Cold E-Mail, LinkedIn-Outreach, Cold Calling, Direktwerbung oder klassischer TV-/Print-Werbung.
Outbox Pattern
Ein Distributed-Systems-Design, bei dem ein Service seine Zustandsänderungen und ein "zu publizierendes Event" in dieselbe Datenbank-Transaktion schreibt, dann das Event später zuverlässig publiziert.
Outcome Metrics
Metriken, die das reale Ergebnis messen, das Sie interessiert (Revenue, Qualified Pipeline, Resolution Rate, Risikoreduktion), nicht nur Aktivität oder Engagement.
Outlier
Ein Datenpunkt, der signifikant vom Rest der Verteilung abweicht.
Outlier Detection
Identifizierung anomaler Datenpunkte oder Verhaltensweisen, die von erwarteten Mustern abweichen.
Outpainting
Outpainting erweitert ein Bild über seine ursprünglichen Grenzen hinaus, indem KI kontextbewussten Inhalt generiert.
Output Guardrails
Kontrollen, die auf Modell-Outputs angewandt werden, um Sicherheits-, Policy-, Formatierungs- und Korrektheitsbeschränkungen durchzusetzen.
Output Length Control
Die Menge an Techniken zur Formung von Antwortlänge und -struktur (Token-Limits, Section-Caps, Templates, Validators).
Output Parsing
Extraktion strukturierter Felder aus Modell-Output (JSON, YAML, XML oder Muster), damit nachgelagerte Systeme es zuverlässig nutzen können.
Output Token
Ein Token, das von einem Sprachmodell als Teil seiner Antwort generiert wird.
Over-Generation
Mehr Output produzieren als nötig (zu lang, zu verbose, zu viele Schritte), was Kosten erhöht und Nutzer-Klarheit reduziert.
Over-Retrieval
Zu viele Dokumente/Chunks für eine Anfrage abrufen, was Kosten erhöht und oft Antwortqualität durch Rauschen und Kontext-Verdünnung senkt.
Overfitting
Wenn ein Modell die Trainingsdaten zu gut lernt und auf neuen Daten schlecht generalisiert.
Overlapping Chunks
Eine Chunking-Strategie, bei der aufeinanderfolgende Text-Chunks etwas wiederholten Inhalt (Overlap) teilen, um Kontext über Chunk-Grenzen zu erhalten.
OWASP LLM Top 10
Eine standardisierte Liste der kritischsten Sicherheitsrisiken für LLM-Anwendungen, veröffentlicht von OWASP.
Owned Media
Content und Kanäle, die Sie kontrollieren (Website, E-Mail-Liste, Webinars, Produkt-Docs), im Gegensatz zu Paid oder Earned Media.
P
p-Hacking
Manipulation von Analyse-Entscheidungen (Stopping Rules, Segmentierung, Metriken, Ausschlüsse), um statistisch signifikante Ergebnisse zu erhalten.
p-Wert
Die Wahrscheinlichkeit, Ergebnisse mindestens so extrem wie beobachtet zu sehen, wenn die Nullhypothese wahr wäre.
P95 / P99 Latency
Perzentil-Maße der Antwortzeit: 95% (oder 99%) der Requests schließen schneller als dieser Wert ab.
Page Experience
Wie Nutzer die Erfahrung der Interaktion mit einer Seite wahrnehmen – Geschwindigkeit, Stabilität, Usability und Vertrauenssignale.
PagedAttention
Eine Memory-Management-Technik inspiriert von OS Virtual Memory, die KV-Cache in Blöcken verwaltet und so GPU-Memory-Fragmentierung eliminiert.
PageRank
Googles ursprünglicher Algorithmus zur Bewertung der Wichtigkeit von Webseiten.
Parallel Tool Calls
Ausführung mehrerer Tool-/API-Calls gleichzeitig statt sequentiell, um End-to-End-Latenz zu reduzieren.
Parallelism
Gleichzeitiges Ausführen von Berechnungen, um Durchsatz zu verbessern oder Time-to-Result zu reduzieren.
Parameter Count
Die Anzahl der gelernten Gewichte in einem Modell, oft als grober Proxy für Kapazität und Compute-Anforderungen verwendet.
Parameter Sharing
Eine Modellierungstechnik, bei der mehrere Teile eines neuronalen Netzes dieselben Gewichte wiederverwenden statt separate Parameter zu haben.
Passage Reranking
Reordnung abgerufener Passagen mit einem stärkeren Relevanz-Modell (oft Cross-Encoder), um Präzision vor Generation zu verbessern.
Passage Retrieval
Findet relevante Textpassagen (Chunks) statt ganzer Dokumente, um Präzision für Question Answering und RAG zu verbessern.
PCI DSS
Ein Sicherheitsstandard für Organisationen, die Zahlungskartendaten speichern, verarbeiten oder übertragen.
PDDL
Eine standardisierte Sprache zur Beschreibung von Planungsproblemen in der Künstlichen Intelligenz, die Zustände, Aktionen und Ziele formal definiert.
PEFT
Eine Familie von Techniken, die LLMs anpassen, indem nur ein kleiner Teil der Parameter trainiert wird, anstatt das gesamte Modell zu aktualisieren.
Penetration Testing
Autorisiertes Sicherheitstesting, bei dem Experten versuchen, Schwachstellen in einem System zu finden und auszunutzen.
Perceptron
Das Perceptron ist die einfachste Form eines künstlichen Neurons und die Grundlage moderner neuronaler Netze – ein linearer Klassifikator, der Eingaben gewichtet summiert und durch eine Aktivierungsfunktion leitet.
Performance Marketing
Marketing, das auf messbare Outcomes (Leads, Pipeline, Revenue, Conversions) optimiert ist mit starkem Fokus auf Attribution und Experimentation.
Perplexity
Eine Sprachmodell-Metrik, abgeleitet von der durchschnittlichen negativen Log-Likelihood; misst, wie "überrascht" ein Modell von Text ist.
Perplexity
Eine AI-First Suchmaschine, die Fragen mit zitierten, zusammengefassten Antworten beantwortet – der führende Google-Herausforderer.
Persona
Eine forschungsbasierte Repräsentation eines Nutzersegments mit gemeinsamen Zielen, Constraints und Entscheidungskriterien.
Personalization
Anpassung von Content, Messaging oder Erlebnissen basierend auf Nutzer-Kontext, Intent oder Segment.
Personhood Credentials
Kryptografische Nachweise, die im Agent-Web bestätigen, dass hinter einer Interaktion ein Mensch (nicht ein anderer Agent) steht – ohne Identität zu enthüllen.
Pfadfindung
Der Prozess, eine Route zwischen Knoten in einem Graphen zu finden, die ein Ziel optimiert (kürzeste, günstigste, sicherste, schnellste).
Phi
Microsofts Small Language Models (SLMs), die trotz geringer Größe überraschend starke Performance zeigen und On-Device-AI ermöglichen.
PII (Personally Identifiable Information)
Informationen, die eine Person direkt oder indirekt identifizieren können (z.B. Name, E-Mail, Telefonnummer, Ausweis-IDs).
Pika Labs
Ein AI-Video-Startup mit benutzerfreundlicher Text-zu-Video- und Bild-zu-Video-Generierung, beliebt für kurze Clips.
Pipeline Parallelism
Eine Parallelisierungsstrategie, die verschiedene Modell-Schichten auf verschiedene GPUs verteilt – Daten fließen wie in einer Pipeline durch die GPU-Kette.
Pipeline Velocity
Misst, wie schnell Opportunities durch den Funnel (Stages) Richtung Closed-Won bewegen.
PKI (Public Key Infrastructure)
PKI ist das System aus Zertifikaten, Zertifizierungsstellen und Prozessen, das sichere Identitätsverifizierung und Verschlüsselung mittels öffentlicher/privater Schlüssel ermöglicht.
Planning
Die Fähigkeit von KI-Agenten, komplexe Ziele in ausführbare Schritte zu zerlegen und eine Strategie zur Zielerreichung zu entwickeln.
Poisoning Attack
Ein Angriff, bei dem ein Gegner Trainingsdaten, Retrieval-Korpora oder Feedback-Signale manipuliert, um Modellverhalten zu degradieren.
Policy
Eine Policy ist eine Regel oder Strategie, die bestimmt, welche Aktionen unter welchen Bedingungen ausgeführt werden.
Policy Decision Point (PDP)
Die Komponente, die Policies evaluiert und eine Entscheidung zurückgibt (z.B. erlauben/verweigern/Step-Up-Auth) für einen gegebenen Request.
Policy Drift
Wenn die Regeln, die ein System durchsetzen soll, im Laufe der Zeit durch Änderungen in Code, Prompts, Tools oder Infrastruktur divergieren.
Policy Enforcement Point (PEP)
Die Komponente, die Policy-Entscheidungen zur Laufzeit durchsetzt (erlauben/verweigern/ändern/Bestätigung erfordern).
Policy Engine
Eine Komponente, die Regeln und Constraints zur Laufzeit durchsetzt (wer was darf, welche Tools erlaubt sind, welche Outputs erlaubt sind).
Policy Gradient
Methoden, die eine Policy direkt optimieren, indem Parameter in die Richtung angepasst werden, die den erwarteten Reward verbessert.
Policy-as-Code
Ausdrücken von Governance-Regeln in maschinenlesbarem, versionskontrolliertem Code, sodass Policies wie Software getestet und deployed werden können.
Popularitäts-Bias
Die systematische Überrepräsentation populärer Items in Empfehlungen, die Nischen-Items benachteiligt und Filter Bubbles verstärkt.
POS-Tagging
Die automatische Zuordnung von Wortarten (Nomen, Verb, Adjektiv etc.) zu jedem Wort in einem Satz.
Pose Estimation
Die Erkennung und Lokalisierung von Körpergelenken und Skelett-Keypoints in Bildern oder Videos.
Positional Encoding
Eine Methode, die Transformer-Modellen Informationen über die Position von Tokens in einer Sequenz gibt, da sie keine inhärente Ordnungsinformation haben.
Positional Interpolation
Eine Technik zur Erweiterung der nutzbaren Kontextlänge eines Modells durch Reskalierung der Positions-Repräsentation.
Positioning
Wie Sie Ihr Produkt/Service in den Köpfen Ihrer Zielgruppe definieren – was es ist, für wen, warum es anders ist und warum das wichtig ist.
Post-Training
Jede Trainingsphase nach dem Pretraining, um ein Modell für gewünschte Verhaltensweisen zu formen – Hilfsbereitschaft, Sicherheit, Instruction-Following.
Post-Training Quantization (PTQ)
Reduziert Modell-Präzision (z.B. FP16 → INT8/INT4) nach dem Training, um Speichernutzung zu senken und Inferenz zu beschleunigen.
Posterior Collapse
Posterior Collapse tritt bei VAEs auf, wenn der Encoder lernt, den Prior zu kopieren statt informative latente Repräsentationen zu erzeugen.
Power-Analyse
Berechnung der notwendigen Stichprobengröße, um einen Effekt bestimmter Größe mit gewünschter Wahrscheinlichkeit (Power) zu entdecken.
PPC (Pay-Per-Click)
Ein Paid-Advertising-Modell, bei dem Sie zahlen, wenn jemand Ihre Anzeige klickt.
Präzision
Der Anteil der korrekt als positiv klassifizierten Fälle an allen als positiv klassifizierten Fällen.
Pre-LN vs. Post-LN
Bezeichnet die Position der Layer Normalization in Transformer-Blöcken: Pre-LN normalisiert vor Attention/FFN, Post-LN danach.
Pre-Training
Die erste Trainingsphase eines LLMs, in der das Modell auf riesigen Textmengen (oft Billionen Tokens) lernt, Sprache zu verstehen und zu generieren – bevor spezialisiertes Fine-Tuning folgt.
Precision und Recall
Zwei komplementäre Metriken zur Bewertung von Klassifikationsmodellen bei unbalancierten Daten.
Precision@k
Misst, wie viele der Top-k abgerufenen Items relevant sind (relevante Items in Top-k ÷ k).
Predictive Maintenance
KI-gestütztes Vorhersagen von Maschinenausfällen, bevor sie eintreten, um ungeplante Stillstände zu vermeiden.
Predictive Personalization
AI sagt voraus, was ein Kunde als nächstes braucht – und personalisiert proaktiv, bevor der Kunde selbst es weiß.
Prefect
Modernes Python-natives Workflow-Orchestrierungstool als Alternative zu Apache Airflow mit einfacherer API.
Preference Data
Datensätze, in denen Menschen (oder AI-Judges) angeben, welche von zwei Modell-Antworten besser ist – das Trainingsmaterial für RLHF, DPO und ähnliche Alignment-Methoden.
Preference Optimization
Training oder Anpassung von Modellen mit Preference-Signalen (A bevorzugt über B), um Alignment mit gewünschten Outputs zu verbessern.
Prefill
Die Inferenz-Phase, in der das Modell den Prompt verarbeitet, um den initialen internen State aufzubauen, bevor Output-Tokens generiert werden.
Prefill Latency
Die Zeit, die für die Verarbeitung des Input-Prompts aufgewandt wird, bevor das Modell Token generieren kann.
Prefix Cache
Wiederverwendung von berechnetem Modell-State (oft KV-Cache) für wiederholte Prompt-Prefixes, um wiederholte Prefill-Berechnung zu vermeiden.
Prefix Caching
Prefix Caching speichert KV-Cache-Berechnungen für häufig wiederverwendete Prompt-Prefixe (z.B. System Prompts) und teilt sie zwischen Requests.
Prefix Tuning
Eine parameter-effiziente Adaptationstechnik, bei der Sie kleine "Prefix"-Vektoren lernen, die Attention Layers steuern, statt alle Modell-Gewichte zu fine-tunen.
PReLU (Parametric ReLU)
Eine ReLU-Variante mit lernbarem negativem Steigungsparameter – der Leak-Faktor wird während des Trainings optimiert.
Pretraining
Training eines Modells auf großen Datenmengen (oft selbstüberwacht), um allgemeine Repräsentationen zu lernen, bevor aufgabenspezifische Anpassung erfolgt.
Principle of Least Privilege
Das Prinzip, Usern/Services nur die minimalen Berechtigungen zu geben, die für ihre Aufgaben nötig sind – nicht mehr.
Privacy Budget
Ein quantitatives Maß (Epsilon, ε) für den gesamten Datenschutzverlust, der durch wiederholte Abfragen auf privacy-geschützten Daten akkumuliert wird.
Privacy by Design
Ein Ansatz, bei dem Datenschutzmaßnahmen von Anfang an in die Systemarchitektur eingebaut werden, nicht nachträglich aufgesetzt.
Privacy Enhancing Technologies
Der Oberbegriff für Technologien, die Datennutzung bei gleichzeitigem Datenschutz ermöglichen: DP, FHE, SMPC, TEEs, Synthetic Data und mehr.
Privacy-Preserving Machine Learning
Ein Set von Techniken, die Datenschutzrisiken beim Training oder Serving von Modellen reduzieren.
Product Quantization (PQ)
Eine Vektor-Kompressionstechnik, die hochdimensionale Vektoren mit kompakten Codes approximiert für schnellere ANN-Suche.
Product-Market Fit
Wenn ein Produkt eine starke Marktnachfrage befriedigt – Nutzer wählen es wiederholt, Retention ist gesund und Wachstum wird einfacher.
Produktempfehlung
KI-System zur Vorhersage und Anzeige relevanter Produkte für jeden Nutzer.
Programmatic Advertising
Programmatic Advertising ist der automatisierte Kauf und Verkauf von digitalem Werbeinventar durch Software und Algorithmen statt manueller Verhandlungen.
Programmatic Internal Linking
Automatisches Erstellen und Pflegen interner Links mit Regeln, Taxonomien, Embeddings und Governance-Constraints.
Programmatic SEO (pSEO)
Erstellung vieler Landing Pages in großem Maßstab mit Templates und Daten, die auf Long-Tail-Queries mit konsistenter Struktur abzielen.
Progressive Disclosure
Ein UX-Pattern, das essentielle Informationen zuerst zeigt und tiefere Details auf Nachfrage offenlegt (Expanders, Tabs, "mehr erfahren").
Progressive Shrinking
Eine Trainingstechnik, bei der ein großes Netzwerk schrittweise verkleinert wird – erst Kernel, dann Tiefe, dann Breite – um ein Supernet zu trainieren, das viele Subnetze unterstützt.
Prompt
Die Eingabe (Anweisungen + Kontext + Beispiele + Constraints), die einem Sprachmodell bereitgestellt wird, um eine gewünschte Ausgabe zu erhalten.
Prompt A/B Testing
Vergleich zweier Prompt-Versionen auf realem Traffic, um Unterschiede in Outcomes und Guardrails zu messen.
Prompt Budget
Eine explizite Allokation von Tokens für Anweisungen, Kontext, abgerufene Evidence und Beispiele.
Prompt Caching
Eine Optimierungstechnik, bei der häufig verwendete Prompt-Präfixe zwischengespeichert werden, um API-Kosten und Latenz zu reduzieren.
Prompt Chaining
Das Verbinden mehrerer Prompts, wobei der Output eines Prompts als Input für den nächsten dient, um komplexe Aufgaben zu lösen.
Prompt Compression
Reduzierung der Prompt-Länge bei Erhalt wesentlicher Constraints und Kontext.
Prompt Engineering
Die Kunst und Wissenschaft der Gestaltung von Eingabeaufforderungen (Prompts), um gewünschte Outputs von LLMs zu erhalten.
Prompt Hardening
Stärkung von Prompts und umgebenden Controls gegen Missbrauch, Injection und unsichere Outputs.
Prompt Injection
Eine Angriffstechnik, bei der bösartige Eingaben verwendet werden, um das Verhalten eines KI-Systems zu manipulieren und dessen Sicherheitsrichtlinien zu umgehen.
Prompt Leakage
Unbeabsichtigte Offenlegung von System-Prompts, versteckten Anweisungen oder sensitivem Kontext – durch Modell-Outputs, Logs oder UI/Debug-Tools.
Prompt Leaking
Techniken, um versteckte System-Prompts aus LLM-Anwendungen zu extrahieren.
Prompt Linting
Automatisierte statische Analyse von Prompts, um Probleme vor dem Deployment zu erkennen (Konflikte, fehlende Constraints, unsichere Formulierungen).
Prompt Registry
Ein System zum Speichern, Versionieren, Testen und Governer von Prompts als Produktions-Artefakte.
Prompt Regression Testing
Ausführung einer stabilen Evaluations-Suite gegen Prompt-Änderungen, um Qualitäts-, Sicherheits-, Format- und Kosten-Regressionen zu erkennen.
Prompt Router
Wählt das beste Prompt-Template (oder Workflow) für einen Request basierend auf Intent, Schwierigkeit, Risiko und Kontext.
Prompt Sandbox
Eine sichere Umgebung zum Testen von Prompts mit kontrollierten Daten, Tools und Logs vor Produktion.
Prompt Template
Eine wiederverwendbare Prompt-Struktur mit Variablen (Platzhaltern), die dynamisch gefüllt werden können.
Prompt Tokens
Die vom Modell-Input verbrauchten Tokens (System-Anweisungen, Nutzer-Nachricht, abgerufener Kontext, Tool-Schemas, Beispiele).
Prompt Tuning
Parameter-effiziente Methode, bei der nur lernbare Token-Embeddings am Input trainiert werden, während das gesamte Modell eingefroren bleibt.
Propensity Modeling
Vorhersage der Wahrscheinlichkeit, dass ein Kunde eine bestimmte Aktion durchführt.
Prophet
Ein von Meta entwickeltes Open-Source-Forecasting-Tool, das automatisch Trend, Saisonalität und Feiertags-Effekte modelliert.
Provenienz
Provenienz sind Metadaten, die den Ursprung, die Historie und den Transformationspfad von Daten oder Content beschreiben – woher es kam, wie es sich geändert hat und wer/was es geändert hat.
Proximal Policy Optimization (PPO)
Ein Reinforcement-Learning-Algorithmus, der Policies auf eingeschränkte Weise aktualisiert, um übermäßig große, instabile Änderungen zu vermeiden.
Pruning
Eine Technik zur Modellkompression, die unwichtige Gewichte oder Neuronen aus einem neuronalen Netzwerk entfernt, um Größe zu reduzieren und Inferenz zu beschleunigen.
Pseudonymisierung
Ersetzt Identifikatoren durch Pseudonyme, sodass Daten nicht direkt einer Person zugeordnet werden können ohne zusätzliche separate Informationen.
Public Key Infrastructure (PKI)
PKI ist das System von Zertifikaten, CAs, Richtlinien und Lifecycle-Prozessen zur Verwaltung von Vertrauen für öffentliche/private Schlüssel im großen Maßstab.
Q
Q-Former
Ein Q-Former ist ein abfragebasiertes Transformer-Modul, das in manchen multimodalen Systemen verwendet wird, um Informationen aus einer Modalität zu extrahieren und zu komprimieren.
Q-Funktion
Die Q-Funktion (Action-Value-Funktion) ordnet einem Zustand-Aktions-Paar den erwarteten Return zu: Q(s, a).
Q-Learning
Q-Learning ist eine Reinforcement-Learning-Methode, die eine Wertefunktion Q(s, a) lernt, um die erwartete Belohnung einer Aktion in einem Zustand zu schätzen.
QA (Quality Assurance)
Quality Assurance ist der systematische Prozess, der sicherstellt, dass Outputs definierte Standards erfüllen – Korrektheit, Konsistenz, Sicherheit, Usability und Compliance.
QAT (Quantization-Aware Training)
Quantization-Aware Training trainiert ein Modell unter Simulation von Quantisierungseffekten, was die Genauigkeit nach Quantisierung im Vergleich zu PTQ verbessert.
QBR (Quarterly Business Review)
Ein QBR ist ein strukturiertes vierteljährliches Review zwischen Vendor/Team und Stakeholdern zur Bewertung von Performance, Outcomes, Risiken, Roadmap und Prioritäten.
QDF (Query Deserves Freshness)
QDF ist ein SEO-Konzept, das beschreibt, wann Suchmaschinen frischeren Content für Anfragen mit starkem Aktualitätsintent priorisieren.
Qdrant
Qdrant ist eine Vector-Datenbank zum Speichern von Embeddings und für Similarity Search (oft für RAG und semantische Suche).
QKV (Query–Key–Value)
QKV bezieht sich auf die Query (Q), Key (K) und Value (V) Matrizen, die in Transformer-Attention-Mechanismen verwendet werden.
QLoRA
Eine Kombination aus Quantisierung und LoRA, die Fine-Tuning von LLMs mit stark reduziertem Speicherbedarf ermöglicht, indem das Basismodell quantisiert und nur LoRA-Adapter in voller Präzision trainiert werden.
QoS (Quality of Service)
Quality of Service ist die Fähigkeit, Traffic zu priorisieren und zu verwalten, sodass kritische Workloads Performance-Garantien erfüllen.
QPS (Queries Per Second)
QPS misst, wie viele Anfragen ein System pro Sekunde verarbeiten kann – oft für Search-Services, APIs und Inference-Endpoints verwendet.
Quadratische Attention-Kosten
Quadratische Attention-Kosten beziehen sich auf die klassische Skalierung von Full Self-Attention, die etwa mit dem Quadrat der Sequenzlänge wächst (O(n²)).
Quality Drift
Quality Drift ist eine graduelle Degradation der Output-Qualität über Zeit durch Änderungen in Daten, Prompts, Retrieval-Korpora, Nutzerverhalten oder System-Abhängigkeiten.
Quality Filter
Ein Quality Filter ist eine Regel oder ein Modell, das Outputs blockiert, flaggt oder degradiert, die Qualitätskriterien nicht erfüllen.
Quality Gates
Quality Gates sind automatisierte (und manchmal manuelle) Checks, die Content oder System-Änderungen vor Release oder Publikation passieren müssen.
Quality Score
Googles Bewertung der Qualität und Relevanz von Anzeigen und Keywords.
Quality Score (Paid Search)
Quality Score ist eine Plattform-Metrik, die erwartete Anzeigenqualität und Relevanz widerspiegelt und oft Anzeigenrang und CPC beeinflusst.
Quality-Adjusted Cost per Answer
Quality-Adjusted Cost per Answer ist Cost-per-Answer interpretiert zusammen mit Qualitätsmetriken, um sicherzustellen, dass Kosteneinsparungen nicht aus degradierten Outputs kommen.
Quality-of-Answer Score
Ein Quality-of-Answer Score ist eine zusammengesetzte Metrik, die schätzt, wie gut eine AI-Antwort ist (Nützlichkeit, Korrektheit, Klarheit, Groundedness, Sicherheit).
Quantil
Ein Quantil ist ein Wert, unterhalb dessen ein bestimmter Prozentsatz der Beobachtungen liegt (z.B. p50/Median, p95, p99).
Quantil-Regression
Quantil-Regression prognostiziert ein gewähltes Quantil der Zielverteilung (z.B. p90 Outcome) statt des Mittelwerts.
Quantization
Eine Komprimierungstechnik, die die Präzision der Modellgewichte von 32-Bit-Fließkommazahlen auf niedrigere Bit-Formate (INT8, INT4) reduziert, um Speicher und Rechenaufwand drastisch zu senken.
Quantization-Aware Training (QAT)
Eine Trainingsmethode, die Quantisierungsfehler während des Trainings simuliert, damit das Modell lernt, mit niedrigerer Präzision umzugehen – höhere Qualität als Post-Training Quantization.
Quantum Machine Learning (QML)
Quantum Machine Learning erforscht die Nutzung von Quantencomputing-Konzepten (Qubits, Superposition, Verschränkung), um bestimmte ML-Berechnungen zu beschleunigen.
Quarantine (Quarantäne)
Quarantäne isoliert Content, Inputs oder Events, die verdächtig, unsicher oder von geringem Vertrauen sind, damit sie Produktions-Outputs nicht beeinflussen können.
Quasi-Experiment
Ein Quasi-Experiment schätzt kausale Effekte ohne Randomisierung, mit Designs wie Difference-in-Differences, Regression Discontinuity oder Matching.
Quasi-Identifier
Ein Quasi-Identifier ist ein Datenattribut (oder Kombination), das allein niemanden identifiziert, aber in Kombination mit anderen Attributen identifizieren kann.
Query (Suchanfrage)
Eine Query ist die Sucheingabe eines Benutzers – getippt oder gesprochen –, die Intent ausdrückt und Retrieval, Ranking und Ergebnisgenerierung auslöst.
Query Cache
Ein Query Cache speichert Ergebnisse häufiger Anfragen, sodass nachfolgende identische Anfragen schneller und günstiger bedient werden können.
Query Embeddings
Query Embeddings sind Vektor-Repräsentationen von Suchanfragen, die für semantisches Similarity-Matching gegen eingebettete Dokumente/Passagen verwendet werden.
Query Fan-Out
Query Fan-Out ist, wenn eine Anfrage viele nachgelagerte Queries/Tool-Calls auslöst, um Kontext oder Ergebnisse zu sammeln.
Query Federation
Query Federation führt eine Anfrage über mehrere Systeme/Quellen (Datenbanken, Services, Indizes) aus und kombiniert die Ergebnisse.
Query Likelihood Model
Ein Query Likelihood Model ist ein Information-Retrieval-Ansatz, bei dem Dokumente nach der Wahrscheinlichkeit gerankt werden, dass ihr Sprachmodell die Query generieren würde.
Query Optimizer
Ein Query Optimizer ist die Systemkomponente, die einen effizienten Query Plan wählt, oft basierend auf Statistiken und Heuristiken.
Query Plan
Ein Query Plan ist die Ausführungsstrategie, die eine Datenbank/Suchengine verwendet, um eine Anfrage zu beantworten (Joins, Index-Nutzung, Filter, Scan-Reihenfolge).
Query Reranking
Query Reranking ordnet Such-/Retrieval-Ergebnisse mit einer stärkeren Scoring-Funktion (oft Cross-Encoder oder LLM-basierter Scorer) neu, um Relevanz an der Spitze zu verbessern.
Query Rewrite
Query Rewrite ist das Modifizieren einer Suchanfrage, um die Retrieval-Qualität (Recall/Precision) zu verbessern, oft durch Klärung der Intention, Term-Erweiterung oder Vokabular-Normalisierung.
Query Rewriting
Transformation einer Benutzeranfrage in eine Form, die bessere Retrieval-Ergebnisse liefert.
Query String (URL-Parameter)
Ein Query String ist der Teil einer URL nach ?, der Parameter übergibt (z.B. ?utm_source=...).
Query Understanding Evaluation
Query Understanding Evaluation misst, wie gut Ihr System User-Intent, Entities, Constraints und Risikolevel aus Queries interpretiert.
Query-Expansion
Query-Expansion ergänzt eine Anfrage mit zusätzlichen Begriffen oder semantischen Signalen, um den Retrieval-Recall zu verbessern.
Query-Routing
Query-Routing sendet eine Anfrage an die am besten geeignete Engine, Modell, Index oder Workflow basierend auf Intent, Konfidenz und Constraints.
Query-Time-Filtering
Query-Time-Filtering wendet Einschränkungen während des Retrievals an – wie Berechtigungen, Tenant-Grenzen, Aktualitätsfenster, Sprache oder Dokumenttyp.
Query-to-Content Mapping
Query-to-Content Mapping ist die Praxis, spezifische Query-Intents auf den relevantesten Seitentyp, Section-Layout und nächsten Schritt (CTA) auszurichten.
Question Answering (QA)
Question Answering ist eine Aufgabe, bei der ein System Fragen basierend auf einem Korpus, einer Wissensbasis oder Modellwissen beantwortet.
Question Decomposition
Question Decomposition zerlegt eine komplexe Frage in kleinere Teilfragen, die zuverlässiger beantwortet werden können.
Queue
Eine Queue ist eine Datenstruktur nach dem FIFO-Prinzip (First In, First Out), bei der Elemente in der Reihenfolge ihres Eintreffens verarbeitet werden.
Queue Depth
Queue Depth ist die Anzahl der ausstehenden Nachrichten/Jobs, die in einer Queue warten.
Queue Latency
Queue Latency ist die Verteilung der Queue Time (p50/p95/p99) für queued Tasks.
Queue Time
Queue Time ist die Zeit, die eine Anfrage/Job in einer Queue wartet, bevor die Verarbeitung beginnt.
Queueing Theory
Queueing Theory untersucht Warteschlangen, um Durchsatz, Auslastung und Latenz unter Last zu verstehen.
Quick Fix
Ein Quick Fix ist eine kleine, schnelle Änderung zur sofortigen Problemminderung (oft ein taktischer Patch), gefolgt von einem tieferen Root-Cause-Fix.
Quickstart
Ein Quickstart ist ein minimaler, geführter Pfad, der Usern hilft, ein erstes erfolgreiches Ergebnis schnell zu erreichen (oft 5-15 Minuten).
Quiet Period
Eine Quiet Period ist ein definiertes Zeitfenster, in dem Teams Änderungen vermeiden, die Messung verfälschen oder Risiko erhöhen könnten.
Quorum
Ein Quorum ist die minimale Anzahl von Teilnehmern/Nodes, die zustimmen oder anwesend sein müssen, damit ein System eine gültige Entscheidung treffen kann.
Quota Exhaustion
Quota Exhaustion tritt auf, wenn ein User/Tenant ein Quota-Limit erreicht und weitere Aktionen blockiert oder gedrosselt werden.
Quota-Aware Routing
Quota-Aware Routing wählt Modelle/Workflows basierend auf verbleibendem Quota und Cost Budgets (z.B. einfache Queries zu günstigeren Modi routen wenn Budget niedrig).
Quotas
Quotas sind durchgesetzte Limits für die Nutzung einer Ressource (Requests, Tokens, Compute, Storage, Tool-Calls) innerhalb eines definierten Scopes.
Quoted Query
Eine Quoted Query verwendet Anführungszeichen, um exaktes Phrase-Matching in manchen Suchmaschinen/Tools zu erzwingen (Verhalten variiert nach Engine).
Qwen
Alibabas Open-Weight-LLM-Familie, die in vielen Benchmarks mit Llama und Mistral konkurriert und starke mehrsprachige Fähigkeiten bietet.
R
R² (Bestimmtheitsmaß)
Der Anteil der Varianz in der Zielvariable, der durch das Modell erklärt wird (0-1).
RAG (Retrieval-Augmented Generation)
Retrieval-Augmented Generation (RAG) ist eine Architektur, bei der ein LLM eine Antwort unter Verwendung abgerufener externer Informationen (Dokumente/Chunks) als Evidenz generiert, anstatt sich nur auf seine internen Parameter zu verlassen.
RAG Chunking Strategie
Eine RAG Chunking Strategie definiert, wie Quelldokumente in abrufbare Einheiten aufgeteilt werden (Chunk-Größe, Overlap, Struktur-Erhaltung, Metadaten).
RAG Evaluation
Die systematische Bewertung von RAG-Systemen über Retrieval-Qualität, Antwort-Relevanz, Groundedness und Faithfulness.
RAG Poisoning
RAG Poisoning ist ein Angriff oder Fehlermodus, bei dem der Retrieval-Korpus manipuliert wird, sodass bösartiger oder irreführender Content als "Evidenz" abgerufen wird und Outputs verschlechtert oder das System beeinflusst.
Ragas
Ragas ist ein populärer Evaluations-Ansatz/Library für RAG-Systeme, der praktische Metriken und Workflows zur Bewertung von Retrieval + Generation-Qualität bietet.
Random Search
Hyperparameter-Tuning durch zufälliges Sampling aus dem Parameterraum – effizienter als Grid Search bei gleichem Rechenbudget.
Rasa
Rasa ist ein Open-Source-Framework für den Bau von Conversational AI – mit NLU, Dialogue Management und Integrationen für Enterprise-Chatbots.
Rate Limiting
Rate Limiting beschränkt, wie viele Requests (oder Aktionen) ein Client in einem gegebenen Zeitfenster ausführen kann.
Rate-Limit Backoff
Rate-Limit Backoff passt Request-Verhalten an, wenn Throttling-Signale empfangen werden (z.B. HTTP 429), typischerweise durch Verlangsamen, späteren Retry und/oder Load Shedding.
Ray Serve
Skalierbares Model-Serving-Framework auf Basis von Ray für Echtzeit-Inferenz mit Composition-Patterns und Auto-Scaling.
RBAC (Role-Based Access Control)
RBAC weist Rollen (z.B. "Viewer", "Editor", "Admin") Berechtigungen zu und ordnet User/Services diesen Rollen zu.
RBAC/ABAC
RBAC (Role-Based Access Control) gewährt Berechtigungen über Rollen; ABAC (Attribute-Based Access Control) gewährt Berechtigungen über Policies auf Attribute (Benutzer, Ressource, Kontext).
RCA (Root Cause Analysis)
Root Cause Analysis ist der Prozess, die zugrundeliegenden Ursachen eines Incidents zu identifizieren – nicht nur Symptome – und korrigierende Maßnahmen zu definieren.
RDF
RDF (Resource Description Framework) ist ein Standardmodell zum Austausch von Daten im Web, das Informationen als Subjekt-Prädikat-Objekt-Tripel (Fakten) darstellt.
Re-Embedding
Re-Embedding regeneriert Embeddings für einen Korpus (Dokumente/Chunks) mit demselben oder einem neuen Embedding Model und aktualisiert dann den Vector Index entsprechend.
ReAct (Reason + Act)
ReAct ist ein agentisches Pattern, bei dem ein Modell zwischen Reasoning und Aktionen (Tool Calls) alterniert und Beobachtungen einbezieht, bevor es fortfährt.
ReAct Prompting
Ein Prompting-Paradigma, das Reasoning (Denken) und Acting (Handeln) in einer Schleife verbindet – das LLM denkt laut nach, führt Aktionen aus und reflektiert die Ergebnisse.
Real-Time Bidding (RTB)
Auktionsbasierter Echtzeitkauf von Werbeflächen pro Impression.
Real-Time Bidding (RTB)
Real-Time Bidding (RTB) ist ein automatisierter Auktionsprozess, bei dem Werbeinventar in Millisekunden während des Seitenladens versteigert wird.
Real-Time Personalization
Personalisierung, die während der laufenden Session passiert – jeder Klick verändert sofort das Erlebnis.
Reasoning Model
KI-Modelle, die explizite Denkschritte durchführen und zeigen, bevor sie eine finale Antwort generieren – optimiert für komplexes Schlussfolgern.
Reasoning Models
Eine neue Klasse von LLMs (OpenAI o1, o3, DeepSeek R1), die explizites Schritt-für-Schritt-Reasoning vor der Antwort durchführen – "Denken" wird sichtbar und verbessert komplexe Problemlösung.
Recall
Der Anteil der korrekt identifizierten positiven Fälle an allen tatsächlich positiven Fällen.
Recall@k
Recall@k misst, wie oft die benötigten relevanten Items innerhalb der top-k abgerufenen Ergebnisse erscheinen.
Recency Bias
Recency Bias ist die Tendenz, neuere Informationen überzubewerten – entweder in menschlicher Beurteilung oder im Systemverhalten (Ranking, Context Usage).
Recht auf Erklärung
Das rechtliche oder ethische Recht von Betroffenen, eine verständliche Erklärung für automatisierte Entscheidungen zu erhalten.
Reciprocal Rank Fusion (RRF)
RRF kombiniert mehrere gerankte Ergebnislisten zu einer, indem es reziproke Ränge summiert – verbessert Robustheit, wenn verschiedene Retrieval-Methoden bei verschiedenen Queries excellieren.
Recommendation Engine
System, das personalisierte Empfehlungen basierend auf Nutzerverhalten generiert.
Red Teaming
Der systematische Versuch, Schwachstellen und gefährliche Verhaltensweisen in KI-Systemen zu finden, bevor sie von böswilligen Akteuren ausgenutzt werden.
Redaction
Redaction ist das Entfernen oder Maskieren sensibler Informationen (PII, Secrets, Credentials) aus Text, Logs, Dokumenten oder Outputs.
Redirects
Redirects leiten eine Anfrage von einer URL zu einer anderen weiter, häufig mit HTTP-Statuscodes wie 301 (permanent) und 302 (temporär).
Reflection Agent
Ein Agenten-Pattern, bei dem das LLM seine eigenen Outputs kritisch bewertet und iterativ verbessert – wie ein internes Code-Review.
Regression
ML-Methode zur Vorhersage kontinuierlicher numerischer Werte.
Regression Testing
Regression Testing stellt sicher, dass Änderungen (Code, Prompts, Retrieval Config, Model Versions) bestehendes Verhalten oder Qualität nicht brechen.
Regularisierung
Techniken, die Overfitting verhindern, indem sie die Komplexität des Modells einschränken.
Reinforcement Learning
Ein Lernparadigma, bei dem ein Agent durch Interaktion mit einer Umgebung lernt, Belohnungen zu maximieren.
Reinforcement Learning (RL)
Reinforcement Learning ist ein Paradigma, bei dem ein Agent lernt, Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und kumulativen Reward optimiert.
Rekurrentes Neuronales Netz (RNN)
RNNs verarbeiten Sequenzen, indem sie einen Hidden State über Zeitschritte weitergeben – die ursprüngliche Architektur für Sprache und Zeitreihen, heute größtenteils durch Transformer ersetzt.
Rekursion
Ein Programmierkonzept, bei dem eine Funktion sich selbst aufruft, um ein Problem in kleinere, gleichartige Teilprobleme zu zerlegen.
Relation Extraction
Relation Extraction identifiziert und klassifiziert semantische Beziehungen zwischen Entitäten in unstrukturiertem Text.
ReLU (Rectified Linear Unit)
ReLU ist die meistgenutzte Aktivierungsfunktion im Deep Learning: f(x) = max(0, x) – einfach, schnell und effektiv gegen Vanishing Gradients.
Remarketing
Wiederansprache von Nutzern, die bereits mit der Marke interagiert haben.
Reparameterization Trick
Der Reparameterization Trick ermöglicht Backpropagation durch stochastische Sampling-Operationen, indem Zufälligkeit als externe Variable behandelt wird.
Replicate
Cloud-Plattform für das Hosten und Ausführen von Open-Source-ML-Modellen via API mit Cog-Packaging.
Replit AI
Die AI-Funktionen der Cloud-Entwicklungsplattform Replit – vom Code-Assistenten bis zum autonomen App-Builder.
Reporting
Der Prozess der Sammlung, Organisation und Präsentation von Daten in strukturierten Formaten (Berichte, Dashboards), um Stakeholder zu informieren und Entscheidungen zu unterstützen.
Reproducibility
Reproducibility ist die Fähigkeit, dieselben (oder äquivalente) Outputs und Verhalten bei gleichen Inputs, Versionen und Konfiguration zu reproduzieren.
Request Coalescing
Request Coalescing merged mehrere identische (oder ähnliche) concurrent Requests zu einem einzelnen Upstream-Request und teilt dann das Ergebnis.
Reranker
Ein Reranker ist ein Modell, das abgerufene Kandidaten (Dokumente/Chunks) neu bewertet und neu ordnet, um Relevanz an der Spitze zu verbessern.
Reranking
Neuordnung von Retrieval-Ergebnissen mit einem leistungsfähigeren Modell für bessere Relevanz.
Residual Connection (Skip Connection)
Residual Connections addieren den Input einer Schicht zu ihrem Output, sodass Gradienten direkt durch tiefe Netzwerke fließen können.
ResNet
Eine CNN-Architektur mit Skip Connections (Residualverbindungen), die das Training sehr tiefer Netzwerke ermöglicht.
Response Generation
KI-Prozess zur Generierung natürlichsprachlicher Antworten.
Response Schema
Ein Response Schema ist eine formale Struktur, die das System für Outputs erfordert (Fields, Types, Required Sections), oft mit Validation durchgesetzt.
Response Streaming
Response Streaming sendet Model Output inkrementell an den Client, während er generiert wird, und verbessert die wahrgenommene Responsiveness (Time-to-First-Token).
Response Validation
Response Validation prüft, ob Outputs erforderliche Struktur, Policy Constraints und Quality Rules vor Display oder Execution erfüllen.
Responsible AI
Ein ganzheitlicher Ansatz zur Entwicklung und Nutzung von KI-Systemen, der ethische Prinzipien wie Fairness, Transparenz, Datenschutz und menschliche Kontrolle in den Mittelpunkt stellt.
Retargeting
Retargeting zeigt Ads an User, die zuvor mit Ihrer Site oder Content interagiert haben, mit dem Ziel, sie zur Conversion zurückzubringen.
RetNet (Retentive Network)
Eine Architektur von Microsoft, die Transformer-Qualität mit linearer Inferenz-Komplexität kombiniert durch einen "Retention"-Mechanismus.
Retrieval Confidence
Retrieval Confidence ist ein Signal, das schätzt, ob abgerufene Ergebnisse ausreichende, relevante Evidenz enthalten, um die Query zuverlässig zu beantworten.
Retrieval Drift
Retrieval Drift ist eine Änderung im Retrieval-Verhalten/Qualität über Zeit durch Korpus-Updates, Embedding-Model-Änderungen, Indexing-Settings, Query-Distributions-Shifts oder Metadaten-Änderungen.
Retrieval-Augmented Generation
Eine KI-Architektur, die Large Language Models mit externen Wissensquellen verbindet, indem relevante Dokumente abgerufen und als Kontext für die Antwortgenerierung verwendet werden.
Retrieval-Augmented Generation (RAG)
Eine Technik, die LLM-Generierung mit externem Wissensabruf kombiniert, um fundiertere und aktuellere Antworten zu liefern.
Retrieval-First Policy
Eine Retrieval-First Policy zwingt das System, Evidenz abzurufen, bevor es substantive Antworten generiert, besonders für faktische oder High-Risk Queries.
Retriever
Ein Retriever ist die Komponente, die Kandidaten-Dokumente/Chunks relevant zu einer Query auswählt (Keyword, Vector, Hybrid oder federated).
Retriever-Reranker Cascade
Eine Retriever-Reranker Cascade ist ein zweistufiger Retrieval-Ansatz: ein schneller Retriever generiert Kandidaten, dann selektiert ein langsamerer, genauerer Reranker die besten top-k.
Retry
Ein Retry ist das erneute Versuchen einer fehlgeschlagenen Operation (API Call, Tool Call, Retrieval Request), um von transienten Fehlern zu recovern.
Retry Storm
Ein Retry Storm ist eine Feedback-Schleife, bei der fehlgeschlagene Requests Retries auslösen, die Last erhöhen, mehr Failures verursachen und noch mehr Retries auslösen.
Retryable Error
Ein Retryable Error ist ein Fehler, der beim Retry erfolgreich sein kann (z.B. transiente Network Issues, temporäre Overload, Rate Limiting).
Return on Investment (ROI)
Kennzahl zur Messung der Rendite einer Investition.
Reward Hacking
Reward Hacking tritt auf, wenn ein Model/Agent Wege findet, Reward zu maximieren, ohne tatsächlich das beabsichtigte Real-World-Ziel zu erreichen.
Reward Model
Ein Reward Model bewertet Modell-Outputs nach einem Preference-Objective (Helpfulness, Safety, Format Compliance), oft verwendet in Alignment-Style-Training oder Evaluation.
RFM-Analyse
Kundensegmentierung basierend auf Recency, Frequency und Monetary Value.
RFP (Request for Proposal)
Ein RFP ist ein formelles Dokument, das Organisationen nutzen, um Vendor-Proposals für ein Projekt anzufordern, oft mit Anforderungen für Security, Compliance, Delivery und Pricing.
Ring Attention
Eine verteilte Attention-Technik, die lange Sequenzen über mehrere GPUs verteilt, indem KV-Blöcke ringförmig zwischen Devices weitergereicht werden.
Risikoklassifizierung (AI Act)
Einordnung eines KI-Systems in eine der vier AI-Act-Risikoklassen als Grundlage für die jeweils anwendbaren Pflichten.
Risk Register
Ein Risk Register ist eine strukturierte Liste von Risiken, deren Wahrscheinlichkeit/Impact, Mitigierungen, Owners und Review-Kadenz.
RLAIF (Reinforcement Learning from AI Feedback)
RLAIF nutzt AI-generierte Kritiken oder Präferenzen (oft von einem Judge Model) als Feedback-Signale, um Modellverhalten zu verbessern und die Abhängigkeit von Human Labeling zu reduzieren.
RLEF (Reinforcement Learning from Execution Feedback)
Trainings-Paradigma, bei dem ein Modell aus dem tatsächlichen Ergebnis seiner Tool-Aufrufe (Code-Ausführung, API-Response, Test-Bestehen) lernt – nicht aus menschlichem Feedback.
RLHF (Reinforcement Learning from Human Feedback)
Eine Trainingsmethode, die LLMs durch menschliches Feedback zu nützlicheren, sichereren und besser ausgerichteten Antworten bringt – der Schlüssel zur "Alignment" moderner ChatGPT-artiger Modelle.
RMSE (Root Mean Squared Error)
Die Quadratwurzel des MSE – hat dieselbe Einheit wie die Zielvariable.
RMSNorm
Eine vereinfachte Variante von Layer Normalization, die nur Root Mean Square nutzt und auf Mean-Zentrierung verzichtet – schneller und in LLaMA/Mistral Standard.
RMSprop
Adaptiver Optimizer, der AdaGrads Problem löst, indem er einen exponentiell gewichteten Durchschnitt der quadrierten Gradienten nutzt statt deren Summe.
RNN (Recurrent Neural Network)
Ein Recurrent Neural Network (RNN) ist eine neuronale Netz-Architektur für sequenzielle Daten, bei der Neuronen ihren eigenen Output als zusätzlichen Input für den nächsten Zeitschritt nutzen — wodurch Kontext über Sequenzen hinweg erhalten bleibt.
ROAS (Return on Ad Spend)
ROAS ist der dem Advertising zugeschriebene Umsatz geteilt durch Ad Spend.
Robotik (KI)
Das Feld der Entwicklung intelligenter Roboter, die mithilfe von KI autonom Aufgaben in der physischen Welt wahrnehmen, planen und ausführen.
Robustheitstests
Robustheitstests evaluieren, wie zuverlässig ein Modell oder System unter Perturbationen, Edge Cases, Rauschen oder Distribution Shifts performt.
ROC-Kurve
Ein Diagramm, das die True Positive Rate gegen die False Positive Rate über alle Klassifikations-Schwellenwerte zeigt.
Rollback
Ein Rollback revertiert ein Deployment/Change zu einer vorherigen bekannt-guten Version (Code, Model, Prompt, Index, Policy).
RoPE
Eine Methode zur Kodierung von Positionsinformationen in Transformers durch Rotation der Query- und Key-Vektoren, die relative Positionen natürlich erfasst.
RoPE (Rotary Positional Embeddings)
RoPE ist eine Positionskodierungsmethode, die Rotationen auf Query/Key-Vektoren anwendet und Modellen ermöglicht, Token-Positionen so darzustellen, dass relatives Positionsverhalten unterstützt wird.
ROUGE Score
Metriken zur Bewertung automatischer Textzusammenfassungen.
Routing Policy
Eine Routing Policy ist das Regelset, das entscheidet, welches Model/Workflow/Tools für einen Request basierend auf Intent, Risk, Confidence und Budgets verwendet werden.
Row Store
Eine Row Store Datenbank speichert Daten zeilenweise und optimiert für transaktionale Workloads (OLTP) und effizientes Abrufen vollständiger Datensätze.
RPO (Recovery Point Objective)
RPO ist die maximal akzeptable Menge an Datenverlust, gemessen in Zeit (z.B. "nicht mehr als 15 Minuten Daten").
RTO (Recovery Time Objective)
RTO ist die maximal akzeptable Zeit zur Wiederherstellung eines Services nach einem Ausfall.
Rückwärtsverkettung
Eine Inferenzstrategie, die vom Ziel ausgeht und rückwärts arbeitet, um die Fakten und Regeln zu finden, die das Ziel beweisen würden.
Runbook
Ein Runbook ist ein operationeller Guide zum Diagnostizieren und Lösen spezifischer Incidents, mit Schritten, Decision Points und Eskalationspfaden.
Runway
Eine führende AI-Video-Plattform mit Text-zu-Video, Bild-zu-Video und fortschrittlichen Editing-Tools für kreative Profis.
RWKV
Eine Open-Source-Architektur, die RNN-Effizienz (O(1) Inferenz pro Token) mit Transformer-ähnlicher Parallelisierbarkeit beim Training kombiniert.
S
S4 (Structured State Spaces for Sequences)
Die bahnbrechende State-Space-Architektur, die HiPPO-Initialisierung mit effizienter Convolution-Berechnung kombiniert und die SSM-Revolution auslöste.
SaaS-pocalypse
Begriff für die These, dass viele klassische SaaS-Tools durch agentische KI-Workflows obsolet werden.
Safety
Safety in KI-Systemen ist die Gesamtheit der Maßnahmen, die schädliche, unsichere oder richtlinienwidrige Ausgaben und Aktionen verhindern – insbesondere bei gegnerischen oder mehrdeutigen Eingaben.
Safety Alignment
Safety Alignment ist die Formung von Modell-/Systemverhalten, sodass es zuverlässig Safety-Constraints folgt (Refusals, sichere Defaults, Richtlinieneinhaltung) bei normalen und gegnerischen Eingaben.
Safety Case
Ein Safety Case ist ein strukturiertes Argument – gestützt durch Evidenz – dass ein System für einen spezifischen Kontext und Risikoprofil akzeptabel sicher ist.
Safety Classifier
Ein Safety Classifier ist ein Modell-/Regelsystem, das unsichere Inhalte oder riskante Absichten erkennt (z.B. Selbstschädigung, Hass, Datenexfiltrations-Versuche, Richtlinienverletzungen).
Safety Evaluation
Safety Evaluation ist das systematische Testen eines KI-Systems auf schädliches, richtlinienwidriges, unsicheres oder privacy-riskantes Verhalten – über normale und gegnerische Inputs.
Safety Filters
Safety Filters erkennen und blockieren oder transformieren unsichere Outputs (oder unsichere Inputs) basierend auf Policy (z.B. sexuelle Inhalte, Gewalt, Hass, Selbstverletzung, illegale Anweisungen).
Safety Guardrails
Safety Guardrails sind Mechanismen, die das Verhalten eines KI-Systems einschränken, um Schaden zu reduzieren (Policies, Validatoren, Permission-Boundaries, Rate-Limits, Refusals).
Safety Incident Taxonomy
Eine Safety Incident Taxonomy ist ein strukturiertes Klassifikationssystem für KI-Safety-Incidents (was passiert ist, Severity, Impact, Root Cause, Mitigation).
Safety Training
Der Prozess, LLMs durch spezialisiertes Training sicherer zu machen – umfasst RLHF, DPO, Constitutional AI und Red-Teaming-basiertes Training.
Saisonalität
Regelmäßig wiederkehrende Muster in Zeitreihen, die sich in festen Intervallen wiederholen.
Sales Qualified Lead
Ein Sales Qualified Lead (SQL) ist ein Lead, der als bereit für direktes Sales-Engagement eingestuft wird, basierend auf Qualifikationskriterien (Fit + Intent + Readiness).
Saliency Map
Visualisierung, die zeigt, welche Eingabe-Pixel oder -Token den größten Einfluss auf die Modell-Ausgabe haben, basierend auf Gradienten.
SAM (Segment Anything Model)
Ein Foundation Model von Meta für universelle Bildsegmentierung, das jedes Objekt in einem Bild mit Zero-Shot-Fähigkeit segmentieren kann.
SAML
SAML (Security Assertion Markup Language) ist ein Standard für Single Sign-On (SSO), der Authentication und Authorization-Daten zwischen einem Identity-Provider und einem Service-Provider austauscht.
Sampling
Sampling ist die Auswahl einer Teilmenge von Daten (oder Ergebnissen) aus einer größeren Population/Prozess, um Eigenschaften zu schätzen, Kosten zu reduzieren oder Exploration zu ermöglichen.
Sampling Steps
Sampling Steps sind die Anzahl iterativer Denoising-Iterationen, die während der Diffusions-Inferenz zur Generierung eines Outputs verwendet werden.
Sampling Temperature
Sampling Temperature skaliert die Output-Verteilung des Modells: niedrigere Temperaturen machen Outputs deterministischer; höhere Temperaturen erhöhen die Zufälligkeit.
Sandbox Environment
Eine Sandbox Environment ist eine isolierte, Non-Production-Umgebung, die verwendet wird, um Workflows, Integrationen, Prompts und Tool-Actions sicher zu testen.
SARSA
SARSA ist ein on-policy RL-Algorithmus, der Q-Werte basierend auf der tatsächlich ausgeführten Aktion aktualisiert – im Gegensatz zu Q-Learnings off-policy Maximum.
Satisficing
Satisficing bedeutet, eine Lösung zu wählen, die 'gut genug' ist um Constraints zu erfüllen, anstatt für das absolut Beste zu optimieren.
Scalable Oversight
Methoden, um AI-Systeme zu überwachen und zu korrigieren, die menschliche Fähigkeiten übersteigen – wie kann man etwas beaufsichtigen, das klüger ist als man selbst?
Scaled Dot-Product Attention
Die Basis-Attention-Berechnung: Attention(Q,K,V) = softmax(QK^T / √d_k) · V – die mathematische Grundlage aller Transformer.
Scaling Laws
Scaling Laws sind empirische Beziehungen, die zeigen, wie Modell-Performance tendenziell vorhersagbar verbessert wird, wenn Sie Daten, Compute und Parameter skalieren.
Scene Understanding
AI-Fähigkeit, komplexe visuelle Szenen ganzheitlich zu verstehen – Objekte, deren Beziehungen, Kontext und implizite Bedeutung.
Schema
Ein Schema definiert die Struktur, Organisation und Constraints von Daten – sei es in Datenbanken, APIs oder strukturierten Datenformaten.
Schema Drift
Schema Drift ist, wenn sich die erwartete Struktur von Daten über Zeit ändert (Felder hinzugefügt/entfernt/umbenannt, Typen ändern sich, Enums erweitern), oft Pipelines brechend.
Schema Validation
Der Prozess der Überprüfung, ob Daten (typischerweise JSON) einem definierten Schema entsprechen – essentiell für zuverlässige AI-Outputs und API-Integrationen.
Schema-on-Read
Schema-on-Read ist ein Datenmanagement-Ansatz, bei dem die Struktur der Daten erst bei der Abfrage angewendet wird, nicht beim Speichern.
Schema.org DefinedTerm
Schema.org DefinedTerm ist strukturiertes Daten-Markup zur Darstellung eines Begriffs und seiner Definition in maschinenlesbarer Weise.
Schlüsselverwaltung
Schlüsselverwaltung ist das Lifecycle-Management kryptografischer Schlüssel: Generierung, Speicherung, Zugriffskontrolle, Rotation, Widerruf und Auditierung.
Score Matching
Score Matching lernt den Gradienten der Log-Wahrscheinlichkeitsdichte (Score Function) einer Datenverteilung, um Samples durch Langevin-Dynamik zu generieren.
SCORM/xAPI
SCORM und xAPI (Experience API, "Tin Can") sind Standards für das Paketieren, Bereitstellen und Tracken von Lernerfahrungen in Lernplattformen.
SDK
Ein SDK (Software Development Kit) ist ein Set von Tools, Libraries und Dokumentation, das Entwicklern hilft, mit einer Plattform oder API zu integrieren.
SDLC ist tot
These, dass der klassische Software-Development-Lifecycle (Analyse, Design, Code, Test, Deploy) durch agentische Entwicklungsschleifen abgelöst wird.
Search AI Answers
Search AI Answers sind KI-generierte Antworten, die direkt in einem Such-Interface präsentiert werden, oft Informationen aus mehreren Quellen synthesierend anstatt nur eine Liste von Links zurückzugeben.
Search Console
Search Console (oft bezogen auf Google Search Console) ist ein Tool zur Überwachung, wie eine Site in der organischen Suche performt: Indexierung, Sichtbarkeit, Clicks, Queries und technische Issues.
Search Intent
Search Intent ist das zugrunde liegende Ziel hinter einer Anfrage – was der User tatsächlich versucht zu erreichen (lernen, vergleichen, kaufen, troubleshooten, validieren).
SearchGPT
OpenAIs Echtzeit-Web-Suchfunktion, integriert in ChatGPT – kombiniert Konversation mit aktuellen Web-Informationen.
Secrets Management
Secrets Management ist das sichere Speichern, Zugreifen, Rotieren und Auditieren von Secrets wie API-Keys, Tokens und Credentials.
Secure Aggregation
Ein kryptografisches Protokoll, das es einem Server ermöglicht, aggregierte Werte aus individuellen Beiträgen zu berechnen, ohne die einzelnen Werte zu sehen.
Secure by Design
Secure by Design bedeutet, dass Sicherheit von Anfang an in die Systemarchitektur eingebaut wird via sichere Defaults, Least Privilege und Defense-in-Depth – statt später gepatcht.
Secure Egress Control
Secure Egress Control beschränkt und überwacht ausgehenden Netzwerkzugriff von Systemen, um Data-Exfiltration-Risiko zu reduzieren (Allowlists, Proxies, DNS-Controls).
Secure Enclave
Eine Secure Enclave ist eine hardware-gestützte isolierte Ausführungsumgebung, die Daten und Code während der Nutzung schützt.
Secure Multi-Party Computation
Ein kryptografisches Protokoll, bei dem mehrere Parteien gemeinsam eine Funktion berechnen, ohne ihre jeweiligen Eingabedaten den anderen preiszugeben.
Secure Tool Calling
Secure Tool Calling ist die Ausführung von Aktionen über Tools/APIs auf eine Weise, die Autorisierung, Validierung und Sicherheit durchsetzt – ohne sich auf das gute Verhalten des LLM zu verlassen.
Security Posture
Security Posture ist der Gesamt-Sicherheitszustand eines Systems, gemessen an Controls, Konfiguration, Monitoring-Coverage und Incident-Readiness.
Seedance
KI-Videogenerator von ByteDance mit kontroverser Trainingsdaten-Herkunft und photorealistischen Ergebnissen.
Segmentanalyse
Segmentanalyse bricht Metriken nach aussagekräftigen Gruppen (Segmenten) auf wie Channel, Device, Region, Kundentier oder Intent.
Segmentierung
Die Aufteilung einer Population in homogene Gruppen basierend auf gemeinsamen Merkmalen.
Selbstoptimierende Systeme
Selbstoptimierende Systeme passen interne Parameter automatisch an, um Leistung unter wechselnden Bedingungen zu erhalten oder zu verbessern.
Seldon Core
Kubernetes-native Open-Source-Plattform für das Deployment, Scaling und Monitoring von ML-Modellen in Produktion.
Selective Prediction
Ein Ansatz, bei dem ein Modell unsichere Vorhersagen verweigert und an Menschen oder andere Systeme delegiert.
Self-Attention
Attention-Mechanismus, bei dem Eingabe-Elemente aufeinander bezogen werden.
Self-Consistency
Self-Consistency ist eine Technik, bei der Sie mehrere Reasoning-Pfade/Antworten samplen und diese aggregieren (z.B. Mehrheitsvotum), um die Zuverlässigkeit zu verbessern.
Self-Distillation
Eine Variante der Knowledge Distillation, bei der ein Modell sich selbst als Teacher nutzt – das gleiche oder ein identisches Modell wird als Lehrer für ein neues Training verwendet.
Self-Play
Self-Play ist eine RL-Trainingsmethode, bei der ein Agent gegen Kopien seiner selbst spielt, um durch Wettbewerb stetig besser zu werden.
Self-Supervised Learning
Lernparadigma, bei dem das Modell Labels aus den Daten selbst generiert.
SELU (Scaled Exponential Linear Unit)
Eine selbst-normalisierende Aktivierungsfunktion, die Outputs automatisch auf Mittelwert 0 und Varianz 1 zentriert – braucht keine Batch/Layer Norm.
Semantic Caching
Semantic Caching verwendet frühere Antworten/Ergebnisse wieder, wenn eine neue Anfrage semantisch ähnlich zu einer vorherigen ist, nicht notwendigerweise identisch.
Semantic Chunking
Semantic Chunking teilt Dokumente in Chunks basierend auf Bedeutungsgrenzen (Themen/Abschnitte) statt nur fester Token-Anzahlen.
Semantic Router
Ein Semantic Router routet Anfragen zum richtigen Workflow, Toolset oder Modell unter Verwendung semantischer Signale (Embeddings, Intent-Klassifikation, Ähnlichkeit zu bekannten Kategorien).
Semantic Search
Eine Suchmethode, die die Bedeutung und den Kontext von Anfragen versteht, statt nur nach exakten Keyword-Matches zu suchen – ermöglicht natürlichere und intelligentere Suchergebnisse.
Semantic Segmentation
Pixel-genaue Klassifikation von Bildregionen nach Objektkategorien.
Semantic Versioning
Semantic Versioning (SemVer) ist eine Versionierungskonvention: MAJOR.MINOR.PATCH, wobei MAJOR Breaking Changes anzeigt, MINOR backward-kompatible Features und PATCH backward-kompatible Fixes.
Semantic Web
Das Semantic Web ist eine Erweiterung des World Wide Web, die Daten maschinenlesbar strukturiert, sodass Computer deren Bedeutung verstehen und verarbeiten können.
Sensitivitätsanalyse
Sensitivitätsanalyse evaluiert, wie Änderungen in Inputs die Outputs beeinflussen, um Robustheit und Schlüsselfaktoren zu verstehen.
Sensorfusion
Die Kombination von Daten mehrerer Sensoren (Kamera, LiDAR, Radar, IMU) zu einem konsistenten Umgebungsmodell für robustere Wahrnehmung.
Sentence Transformers
Eine Python-Library und Sammlung von Modellen, die semantisch bedeutungsvolle Sentence Embeddings erzeugen – optimiert für Ähnlichkeitssuche und Clustering.
SentencePiece
Sprachunabhängiges Open-Source-Tokenizer-Framework von Google, das direkt auf Rohtext arbeitet ohne vorherige Wort-Segmentierung.
Sentiment-Analyse
Die Erkennung und Klassifikation von emotionalem Ton (positiv, negativ, neutral) in Texten.
Sentiment-Score
Numerischer Wert, der die emotionale Polarität eines Textes quantifiziert.
Seq2Seq
Eine Modellarchitektur, die eine Eingabe-Sequenz in eine Ausgabe-Sequenz variabler Länge transformiert.
SERP Features
SERP Features sind nicht-traditionelle Suchergebnis-Elemente jenseits der Standard "10 blauen Links", wie Featured Snippets, Knowledge Panels, FAQs und andere angereicherte Module.
Server-Sent Events
Server-Sent Events (SSE) ist eine Web-Technologie, die Real-Time-Updates vom Server zum Client über eine einzelne HTTP-Verbindung streamt.
Server-Side Rendering
Server-Side Rendering (SSR) generiert Seiten-HTML auf dem Server pro Request (oder pro Route) anstatt sich vollständig auf Client-seitiges JavaScript zu verlassen.
Service Account
Ein Service Account ist eine Non-Human-Identity, die von Applications/Services verwendet wird, um sich bei anderen Systemen zu authentifizieren und Actions programmatisch auszuführen.
Service Level Agreement (SLA)
Ein Service Level Agreement (SLA) ist ein Vertrag zwischen Dienstleister und Kunde, der messbare Qualitätsstandards wie Verfügbarkeit, Reaktionszeiten und Support-Level definiert.
Service Mesh
Ein Service Mesh ist eine Infrastruktur-Ebene (oft via Sidecars oder Proxies), die Service-to-Service-Kommunikation mit konsistenter Sicherheit, Observability und Traffic-Policies verwaltet.
Session
Zeitraum der Nutzerinteraktion mit einer Website oder App.
Session-basierte Empfehlung
Empfehlungen basierend auf der aktuellen Nutzer-Session statt auf historischen Profilen – ideal für anonyme Besucher.
Sessionization
Sessionization gruppiert User-Events in Sessions, um Verhalten über Zeit zu analysieren (Page Flows, Such-Sequenzen, Conversions).
SFT (Supervised Fine-Tuning)
Supervised Fine-Tuning (SFT) passt ein vortrainiertes Modell unter Verwendung gelabelter Input→Output-Beispiele an, um Verhalten zu formen (Format, Stil, Task-Performance).
SFT (Supervised Fine-Tuning)
Das Training eines Pre-trained Models auf kuratierten (Input, Output)-Paaren, um es auf spezifische Aufgaben oder Formate anzupassen.
Shadow Deployment
Ein Shadow Deployment führt eine neue Modell-/Systemversion auf echtem Traffic aus, ohne User-Outputs zu beeinflussen, um Verhalten sicher zu evaluieren.
SHAP
SHAP ist eine Model-Explainability-Methode basierend auf Shapley-Werten aus der kooperativen Spieltheorie, die eine Vorhersage auf einzelne Features attribuiert.
Sharding
Sharding partitioniert ein Dataset über mehrere Datenbanken oder Nodes (Shards), um Storage und Throughput zu skalieren.
Share of Model
Share of Model (SoM) ist eine 2025/26 etablierte Marketing-Kennzahl, die misst, wie häufig eine Marke in den Antworten generativer KI-Modelle (ChatGPT, Claude, Gemini, Perplexity) als Quelle, Beispiel oder Empfehlung erscheint — relativ zum Wettbewerb in einem definierten Themenset.
Share of Search
Share of Search schätzt Brand-Demand, indem der Anteil der Suchanfragen für Ihre Marke vs Wettbewerber (oder vs Kategorie) gemessen wird.
Sharpness-Aware Minimization (SAM)
Optimierungsmethode, die nicht nur den Loss minimiert, sondern auch die "Schärfe" der Loss-Landscape – findet flachere Minima für bessere Generalisierung.
Siamesisches Netzwerk
Ein Siamesisches Netzwerk ist eine neuronale Architektur mit zwei (oder mehr) identischen Teilnetzwerken, die lernen, Eingaben durch Erzeugen von Embeddings und Messen von Ähnlichkeit zu vergleichen.
Sicherheit
Sicherheit ist der Schutz von Systemen und Daten gegen Bedrohungen durch Gewährleistung von Vertraulichkeit, Integrität und Verfügbarkeit (CIA), plus Rechenschaftspflicht und Resilienz.
SIEM
SIEM (Security Information and Event Management) ist ein System, das Security-Logs/Events für Detection, Investigation und Compliance-Reporting aggregiert.
Sigmoid-Funktion
Die Sigmoid-Funktion σ(x) = 1/(1+e^(-x)) mappt beliebige Werte auf den Bereich (0, 1) – historisch wichtig als Aktivierungsfunktion, heute primär für binäre Klassifikation.
Signal-to-Noise Ratio
Signal-to-Noise Ratio (SNR) ist das Verhältnis von bedeutungsvollen Informationen ("Signal") zu irrelevanten oder irreführenden Informationen ("Noise").
Signed Webhook
Ein Signed Webhook enthält eine kryptografische Signatur, sodass der Empfänger verifizieren kann, dass der Request wirklich vom Sender kam und nicht manipuliert wurde.
SiLU / Swish
SiLU/Swish = x · σ(x) – eine glatte, selbst-gated Aktivierungsfunktion, die ReLU in vielen Benchmarks übertrifft und Grundlage von SwiGLU ist.
Sim-to-Real Transfer
Der Transfer von in Simulation trainierten KI-Modellen auf reale physische Systeme – trainiere in der virtuellen Welt, deploye in der echten.
SimCLR
SimCLR (Simple Contrastive Learning of Visual Representations) ist ein Framework für selbstüberwachtes Lernen, das visuelle Repräsentationen durch Vergleich augmentierter Bildversionen lernt.
SimHash
SimHash ist eine Fingerprinting-Methode, die einen kompakten Hash erzeugt, bei dem ähnliche Dokumente dazu neigen, ähnliche Hashes zu haben (kleine Hamming-Distanz).
Similarity Score Calibration
Similarity Score Calibration mappt rohe Similarity-Scores (von Embeddings/Rerankern) auf zuverlässigere Confidence-Signale (z.B. Wahrscheinlichkeiten oder Risiko-Bänder).
Similarity Search
Similarity Search findet Items, die einer Anfrage unter einer Ähnlichkeitsmetrik am ähnlichsten sind (Cosine Similarity, Dot Product etc.), häufig mit Embeddings verwendet.
Similarity Thresholding
Similarity Thresholding setzt Cutoff-Werte auf Similarity-Scores (Embedding-Similarity, Reranker-Scores), um Actions zu entscheiden wie "Use Cache", "Retrieve More" oder "Ask Clarifying Question".
SimPO
Eine vereinfachte Version von DPO, die ohne Reference Model auskommt und einen Length-Normalized Reward verwendet.
Simpsons Paradoxon
Simpsons Paradoxon ist, wenn ein Trend in mehreren Gruppen erscheint, sich aber umkehrt oder verschwindet, wenn die Gruppen kombiniert werden, aufgrund von Konfundierung und Aggregation.
Simulation
Die Nachahmung eines realen oder hypothetischen Systems oder Prozesses in einer kontrollierten virtuellen Umgebung.
Single Sign-On
Single Sign-On (SSO) lässt User sich einmal via Identity-Provider authentifizieren und auf mehrere Services ohne separate Logins zugreifen (oft via SAML oder OIDC).
Single Sign-On (SSO)
Single Sign-On (SSO) ermöglicht Benutzern, sich einmal bei einem Identity Provider (IdP) zu authentifizieren und auf mehrere Anwendungen zuzugreifen ohne sich erneut anzumelden.
Sinusoidal Positional Encoding
Die ursprüngliche Positionskodierung aus dem Transformer-Paper, die Sinus- und Cosinus-Funktionen verschiedener Frequenzen nutzt.
Site Architecture
Site Architecture ist, wie Seiten strukturiert und verlinkt sind (Hierarchie, Hubs, Navigation, interne Verlinkung), um Auffindbarkeit und User-Journeys zu unterstützen.
Sitemap
Eine Sitemap (oft XML) ist eine maschinenlesbare Datei, die Suchmaschinen hilft, URLs zu entdecken und Update-Muster zu verstehen.
Skip Connection
Skip Connections leiten den Input einer Schicht direkt zur Ausgabe späterer Schichten weiter – der Kernmechanismus, der 100+ Layer tiefe Netze trainierbar macht.
SLA (Service Level Agreement)
Ein SLA ist eine vertragliche Verpflichtung zu Service-Performance (z.B. Uptime), oft mit Remedies/Credits bei Nichteinhaltung.
SLAM
Ein Algorithmus, der es einem Roboter oder Fahrzeug ermöglicht, gleichzeitig seine Position zu bestimmen und eine Karte der Umgebung zu erstellen.
SLI (Service Level Indicator)
Ein SLI ist die messbare Metrik, die verwendet wird, um zu evaluieren, ob ein SLO erfüllt wird (Latenz, Fehlerrate, Correctness-Proxy, Kosten pro Antwort).
Sliding Window Attention
Eine Attention-Variante, bei der jedes Token nur auf eine begrenzte Anzahl vorheriger Tokens (Fenster) attended, statt auf die gesamte Sequenz.
SLO (Service Level Objective)
Ein SLO ist ein Ziel-Level für Service-Performance/Zuverlässigkeit (z.B. 99,9% Verfügbarkeit, p95 Latenz < 2s).
Slot Filling
Extraktion spezifischer Parameter aus Nutzeräußerungen für Conversational AI.
Small Language Model
Ein Small Language Model (SLM) ist ein vergleichsweise kleineres LLM, das für niedrigere Latenz, niedrigere Kosten und einfacheres Deployment entwickelt wurde – oft für enge Tasks oder als Teil eines gerouteten Systems.
Small Language Models
Sprachmodelle mit deutlich weniger Parametern als große LLMs (typisch 1-7B statt 100B+), die für spezifische Aufgaben optimiert sind und lokal oder auf Edge-Geräten laufen können.
SMOTE
Algorithmus, der synthetische Beispiele für die Minderheitsklasse erzeugt, indem er zwischen existierenden Datenpunkten interpoliert.
Snorkel
Snorkel ist ein Framework für programmatisches Data Labeling, das Labeling-Funktionen statt manueller Annotation verwendet, um große Trainingsdatensätze effizient zu erstellen.
Snowflake
Snowflake ist eine cloudnative Data-Warehouse-Plattform, die Speicher und Compute trennt und skalierbare Datenanalyse mit SQL ermöglicht.
SOC 2
SOC 2 ist ein Attestierungs-Framework, das sich auf Controls bezüglich Sicherheit, Verfügbarkeit, Verarbeitungsintegrität, Vertraulichkeit und Privacy fokussiert.
Social Proof
Psychologisches Prinzip, bei dem Menschen dem Verhalten anderer folgen.
Soft Prompt
Ein Soft Prompt ist eine gelernte Vektor-Repräsentation (anstatt menschlich geschriebener Text), die verwendet wird, um das Verhalten eines Modells zu steuern – oft trainiert als kleine Menge von Prompt-Embeddings.
Softmax
Funktion, die Logits in Wahrscheinlichkeitsverteilung umwandelt.
Software Bill of Materials (SBOM)
Ein Software Bill of Materials (SBOM) ist ein Inventar von Software-Komponenten und Dependencies, die in einem System verwendet werden (Libraries, Versions, Suppliers).
Solomonoff Induktion
Solomonoff Induktion ist ein theoretisches Framework für optimale Vorhersage, das Bayessche Inferenz mit algorithmischer Komplexität kombiniert und Hypothesen nach ihrer Einfachheit bei der Datenbeschreibung gewichtet.
Sora
OpenAIs revolutionäres Text-zu-Video-Modell, das fotorealistische Videos bis zu einer Minute aus Textbeschreibungen generiert.
Sora 2
Die zweite Generation von OpenAI's Text-zu-Video-Modell mit verbesserter Qualität, längeren Clips und realistischerer Physik-Simulation.
Source Attribution
Source Attribution zeigt explizit an, woher Informationen stammen (Dokumente, URLs, interne Systeme), oft via Zitate oder Links.
Source Grounding
Source Grounding ist das Einschränken eines KI-Systems, seine Antworten auf bereitgestellten Quellen zu basieren (abgerufene Dokumente, Tools oder genehmigte Referenzen) anstatt auf unverifiziertem Modellwissen.
Source Separation
Source Separation trennt ein gemischtes Audio-Signal in einzelne Quellen – z. B. Gesang, Drums, Bass und Instrumente aus einem Song.
spaCy
Industrietaugliche Open-Source-NLP-Library in Python für Tokenization, NER, POS-Tagging, Dependency Parsing und mehr.
SPARQL
SPARQL ist die W3C-Standard-Abfragesprache für RDF-Graphen, die strukturierte Abfragen über Knowledge Graphs und Linked Data ermöglicht.
Sparse Attention
Sparse Attention reduziert Attention-Berechnung, indem Tokens nur auf eine Teilmenge anderer Tokens achten dürfen (gemusterte oder gelernte Sparsity).
Sparse Autoencoder
Ein Sparse Autoencoder (SAE) ist ein Autoencoder, der mit einem Sparsity-Constraint trainiert wird, sodass nur eine kleine Teilmenge von Features für jeden gegebenen Input aktiviert.
Sparse Mixture of Experts
Eine Architektur, bei der nur ein kleiner Teil aller "Experten-Subnetze" pro Input aktiviert wird – ermöglicht riesige Modellkapazität bei effizienter Inferenz.
Sparse Modell
Ein neuronales Netz, bei dem nur ein kleiner Teil der Gewichte oder Aktivierungen für jede Berechnung verwendet wird, was Effizienz deutlich steigert.
Sparse Retrieval
Sparse Retrieval verwendet Sparse-Repräsentationen (oft term-frequency-basiert) wie BM25, um Dokumente per lexikalischem Match abzurufen.
Sparse Training
Training mit Sparsity von Anfang an – im Gegensatz zu "erst dicht trainieren, dann prunen" wird das Modell von Beginn an spärlich gehalten und Verbindungen werden dynamisch hinzugefügt/entfernt.
Speaker Diarization
Speaker Diarization identifiziert "wer wann sprach" in einer Audio-Aufnahme, indem Audio in speaker-gelabelte Turns segmentiert wird.
Spectral Normalization
Spectral Normalization beschränkt die Lipschitz-Konstante von Netzwerk-Schichten durch Normalisierung mit dem größten Singulärwert – Standard-Stabilisierung in GANs.
Speculative Decoding
Eine Inferenz-Beschleunigungstechnik, bei der ein kleines "Draft-Modell" schnell mehrere Tokens vorschlägt und ein großes "Verifier-Modell" diese parallel verifiziert – bis zu 3x schnellere Generierung.
Speech Enhancement
Speech Enhancement verbessert die Qualität von Sprachaufnahmen durch Entfernung von Rauschen, Hall und Störgeräuschen – oft als Vorverarbeitung für ASR.
Speech-to-Text (STT)
Technologie zur Umwandlung von gesprochener Sprache in geschriebenen Text – die Basis für Sprachassistenten und Transkription.
Speech-to-Text (STT)
Speech-to-Text (STT) konvertiert gesprochenes Audio in geschriebenen Text unter Verwendung von Automatic Speech Recognition (ASR) Modellen.
Speicherkomplexität
Speicherkomplexität beschreibt, wie der Speicherverbrauch eines Algorithmus mit der Eingabegröße wächst (oft in Big-O-Notation).
Spezifität
Der Anteil der korrekt als negativ klassifizierten Fälle an allen tatsächlich negativen Fällen.
Split Testing
Synonym für A/B Testing - Vergleich von Varianten zur Optimierung.
Sprachsuche
Suche mittels gesprochener Sprache über Assistenten und Geräte.
Sprachsynthese
Künstliche Erzeugung menschlicher Sprache aus Text (Text-to-Speech).
SRE
Site Reliability Engineering (SRE) wendet Software-Engineering-Praktiken auf Operations an, um zuverlässige, skalierbare Systeme zu erreichen, unter Verwendung von SLOs, Automation und Incident-Discipline.
Stability AI
Das Unternehmen hinter Stable Diffusion, einem der meistgenutzten Open-Source-Modelle für KI-Bildgenerierung.
Stable Diffusion
Das führende Open-Source-Modell für Text-zu-Bild-Generierung, das lokale Ausführung und Fine-Tuning auf Consumer-Hardware ermöglicht.
Stack
Ein Stack ist eine grundlegende Datenstruktur nach dem LIFO-Prinzip (Last In, First Out), bei der das zuletzt hinzugefügte Element als erstes entfernt wird.
Staging Environment
Eine Staging Environment ist eine Pre-Production-Umgebung, die so designed ist, dass sie Production so nah wie möglich spiegelt für finale Validierung.
Stanza (Stanford NLP)
Stanfords Python-NLP-Library mit State-of-the-Art neuronalen Modellen für Tokenization, POS, NER und Parsing in 70+ Sprachen.
State Space Model (SSM)
Eine Klasse von Sequenzmodellen basierend auf kontinuierlicher Zustandsraum-Theorie, die lineare Skalierung O(N) statt quadratischer Attention O(N²) bieten.
State Space Models (SSMs)
State Space Models (SSMs) sind Sequenz-Modelle, die einen latenten "State" aufrechterhalten, der sich über Zeit entwickelt, um sequentielle Daten effizient zu verarbeiten.
State Transition System
Ein State Transition System modelliert ein System als Zustände und Übergänge, die es von einem Zustand in einen anderen bewegen.
Statefulness
Statefulness beschreibt, ob ein System Informationen über Interaktionen hinweg behält (stateful) oder jeden Request unabhängig behandelt (stateless).
Static Site Generation
Static Site Generation (SSG) baut Seiten vorab in statisches HTML (oft auf einem CDN deployed) für sehr schnelle Lieferung und hohe Zuverlässigkeit.
Stationarität
Eine Zeitreihe ist stationär, wenn ihre statistischen Eigenschaften über die Zeit konstant bleiben.
Statistische Signifikanz (Statistical Significance)
Statistische Signifikanz beschreibt die Wahrscheinlichkeit, dass ein beobachteter Effekt nicht durch Zufall entstanden ist — gemessen über den p-Wert gegenüber einem festgelegten Schwellenwert (meist 0,05).
Steering Vector
Ein Steering Vector ist eine Richtung im internen Repräsentationsraum eines Modells, die, wenn zu Aktivierungen addiert oder angewendet, Outputs zu oder weg von bestimmten Verhaltensweisen oder Attributen verzerren kann.
Stemming
Regelbasierte Reduktion von Wörtern auf ihren Wortstamm durch Abschneiden von Suffixen.
Step Decay
Einfachste Learning-Rate-Schedule-Strategie, die die LR nach festen Intervallen (Epochen oder Steps) um einen Faktor reduziert.
Stochastic Parrot
Stochastic Parrot ist ein Kritik-Framing, das hervorhebt, wie LLMs flüssigen Text durch Pattern-Matching aus Training-Daten generieren können ohne echtes Verständnis – Bedenken über Bias, Misinformation und Misuse aufwerfend.
Stochastic Weight Averaging (SWA)
Trainingstechnik, die Modellgewichte über mehrere Checkpoints mittelt, um flachere Minima und bessere Generalisierung zu finden.
Stochastischer Gradientenabstieg
Variante des Gradientenabstiegs, die pro Update nur einen Mini-Batch statt aller Daten nutzt – schneller und oft besser generalisierend.
Stop Sequence
Eine Stop Sequence ist ein Token-/String-Muster, das einem Modell sagt, die Generierung zu stoppen, wenn es auftritt.
Stoppwort-Entfernung
Die Entfernung hochfrequenter Wörter ohne semantischen Gehalt (der, die, das, und, ist) aus Text vor der Verarbeitung.
Stratifizierte Stichprobe
Sampling-Methode, die sicherstellt, dass die Proportionen der Klassen/Gruppen im Sample der Gesamtverteilung entsprechen.
Streaming (Token Streaming)
Ausgabe von LLM-Tokens sobald sie generiert werden, statt auf die vollständige Antwort zu warten.
Streaming ASR
Streaming ASR transkribiert Sprache in Near-Real-Time, während Audio ankommt, anstatt nach Abschluss der vollständigen Aufnahme.
Streaming Data
Kontinuierlicher Datenfluss, der in Echtzeit verarbeitet wird.
Streaming Responses
Eine Technik, bei der LLM-Antworten Token für Token übertragen werden, statt auf die komplette Generierung zu warten – verbessert wahrgenommene Latenz dramatisch.
STRIPS
STRIPS ist ein klassischer Planungsformalismus, bei dem Aktionen durch Vorbedingungen und Effekte (Add/Delete-Listen) über symbolische Zustandsprädikate definiert werden.
Structured Data
Structured Data sind maschinenlesbare Metadaten (oft JSON-LD), die in Seiten eingebettet werden, um Systemen zu helfen, Content-Entities und Beziehungen zu verstehen.
Structured Logging
Structured Logging zeichnet Logs in einem konsistenten, maschinen-parsbaren Format auf (Felder wie request_id, tenant_id, route, model_version, latency_ms) anstatt free-form Strings.
Structured Output
Structured Output ist das Erzwingen, dass das Modell Outputs in einer vordefinierten Struktur produziert (JSON, YAML, Abschnitte mit strikten Überschriften), oft mit Validierung durchgesetzt.
Structured Outputs
Techniken und API-Features, die LLMs zwingen, Antworten in exakt definierten Formaten wie JSON-Schemas zurückzugeben – essentiell für zuverlässige AI-Integrationen.
Structured Pruning
Eine Pruning-Variante, die ganze Strukturen (Neuronen, Filter, Attention Heads, Layer) entfernt statt einzelner Gewichte – liefert echte Speedups ohne spezielle Sparse-Hardware.
Style Transfer
Style Transfer modifiziert ein Bild (oder Text), um einem Zielstil zu entsprechen, während der Kerninhalt erhalten bleibt.
StyleGAN
StyleGAN ist NVIDIAs bahnbrechende GAN-Architektur, die fotorealistische Gesichter und Bilder mit beispielloser Kontrolle über Stil und Details generiert.
Subject Consistency
Die Fähigkeit eines KI-Bildgenerators, Charaktere und Objekte über mehrere Bilder hinweg konsistent darzustellen.
Suchalgorithmus
Ein Verfahren zum systematischen Durchsuchen eines Datenraums, um ein bestimmtes Element zu finden oder eine Lösung für ein Problem zu identifizieren.
Suchmaschinenoptimierung
Optimierung von Webseiten für bessere Rankings in organischen Suchergebnissen.
Summarization
Summarization ist das Generieren einer kürzeren Repräsentation von Content bei Beibehaltung der Schlüsselbedeutung – extraktiv (Teile auswählen) oder abstraktiv (neu schreiben).
Super Resolution
Super Resolution erhöht die Auflösung von Bildern oder Videos mittels KI – rekonstruiert Details, die im Original nicht vorhanden sind.
Superalignment
Das Forschungsproblem, wie man AI-Systeme, die intelligenter als Menschen sind (Superintelligenz), sicher und kontrollierbar macht.
Superposition
Superposition in neuronalen Netzwerken beschreibt, wie mehrere Features in überlappenden Richtungen innerhalb eines limitiert-dimensionalen Raums repräsentiert werden können, anstatt ein Feature pro Neuron.
Superwise
Eine AI-Observability- und Monitoring-Plattform, die Performance mit über 100 Metriken trackt und Echtzeit-Incident-Reports generiert.
Supply Chain Security
Supply Chain Security schützt Software- und KI-Dependencies (Libraries, Container, Build-Pipelines, Models, Datasets) vor Manipulation und Kompromittierung.
Supply-Side Platform (SSP)
Eine Supply-Side Platform (SSP) ist eine Technologie, die Publisher nutzen, um ihr Werbeinventar automatisiert an Ad Exchanges und DSPs zu verkaufen.
Surrogatmodell
Ein einfaches, interpretierbares Modell, das ein komplexes Black-Box-Modell approximiert um dessen Entscheidungen zu erklären.
SWE-Bench
Ein Benchmark, der LLMs testet, indem sie echte Bug-Reports aus GitHub-Repositories lösen müssen – der realistischste Test für AI-Coding-Fähigkeiten.
SwiGLU
Eine Aktivierungsfunktion für Transformer-FFN-Blöcke, die Swish-Gating mit linearer Projektion kombiniert und in modernen LLMs wie LLaMA Standard ist.
Sycophancy
Sycophancy ist ein LLM-Verhalten, bei dem das Modell den geäußerten Überzeugungen oder falschen Prämissen des Users übermäßig zustimmt, anstatt sie zu korrigieren.
Synthetic Data
Künstlich generierte Daten, die statistische Eigenschaften realer Daten nachbilden – verwendet für Training, Testing und Privacy-Schutz, wenn echte Daten knapp, sensibel oder teuer sind.
Synthetic Monitoring
Synthetic Monitoring führt automatisierte, geskriptete Checks aus, um User-Actions zu simulieren und Failures zu erkennen, bevor User sie melden.
Synthetische Medien
Sammelbegriff für alle Medieninhalte (Text, Bild, Audio, Video), die ganz oder teilweise durch KI erstellt oder manipuliert wurden.
SynthID
Googles Technologie für unsichtbare digitale Wasserzeichen in KI-generierten Bildern, Videos und Audio zur Herkunftskennzeichnung.
System Prompt
Eine spezielle Prompt-Kategorie, die das Grundverhalten, die Persona und die Regeln für eine AI-Session definiert.
Szenario-Analyse
Szenario-Analyse evaluiert Outcomes unter einer Menge kohärenter, plausibler zukünftiger Bedingungen (Szenarien), anstatt eine Variable nach der anderen zu ändern.
T
Talking Head Generation
KI-Technologie, die aus einem einzelnen Portraitfoto und Audio-Input ein realistisches Video eines sprechenden Menschen generiert.
Tanh (Hyperbolischer Tangens)
Eine Aktivierungsfunktion, die Werte auf den Bereich [-1, 1] abbildet – zero-centered und glatter als Sigmoid.
Taxonomie
Eine Taxonomie ist ein hierarchisches Klassifikationssystem, das Konzepte, Inhalte oder Entitäten in geordnete Kategorien und Unterkategorien einteilt.
Technical SEO
Technical SEO ist die Optimierung des technischen Fundaments einer Website, damit Suchmaschinen Inhalte effizient crawlen, indexieren und rendern können (und Benutzer schnelle, stabile UX erhalten).
Technologische Singularität
Ein hypothetischer Punkt, an dem technologischer Fortschritt (insbesondere KI) so schnell und tiefgreifend wird, dass er die menschliche Zivilisation grundlegend und unvorhersehbar verändert.
Temperature
Ein Parameter, der die Zufälligkeit in der LLM-Ausgabe kontrolliert.
Temperature (Sampling)
Ein Parameter, der die "Kreativität" von LLM-Outputs steuert: Niedrige Werte (0-0.3) erzeugen fokussierte, deterministische Antworten; hohe Werte (0.7-1.0) bringen Variation und Überraschungen.
Temperature Scaling
Eine Post-hoc-Kalibrierungsmethode, die einen einzigen Parameter (Temperatur) nutzt, um Modell-Konfidenzwerte zu adjustieren.
Temporal Difference Learning
TD-Learning aktualisiert Wertschätzungen basierend auf der Differenz zwischen aufeinanderfolgenden Vorhersagen – lernt aus unvollständigen Episoden durch Bootstrapping.
Temporal Graph Network
Ein GNN für zeitlich veränderliche Graphen, das die Evolution von Knoten und Kanten über die Zeit modelliert.
Tensor Parallelism
Eine Parallelisierungsstrategie, die einzelne Tensor-Operationen (Matrixmultiplikationen) über mehrere GPUs aufteilt – notwendig für Schichten, die zu groß für eine GPU sind.
TensorRT-LLM
NVIDIAs optimierte Inference-Engine für LLMs, die maximale Performance auf NVIDIA-GPUs durch Kernel-Fusion, Quantisierung und Tensor-Parallelismus erreicht.
Test-Time Compute
Rechenleistung, die ein LLM zur Inferenz-Zeit für längeres Nachdenken (Reasoning) statt nur für eine direkte Antwort einsetzt.
Test-Time Training (TTT)
Ein Paradigma, bei dem ein Modell sich während der Inferenz an jeden neuen Input anpasst, indem es einen Self-Supervised-Loss auf der Test-Instanz optimiert – "Lernen beim Vorhersagen".
Text-to-3D
Text-to-3D generiert dreidimensionale Objekte und Szenen aus natürlichsprachigen Textbeschreibungen mittels KI.
Text-to-Image
AI-Generierung von Bildern aus Textbeschreibungen – der Durchbruch, der Kreativarbeit demokratisiert hat.
Text-to-Speech (TTS)
Technologie zur Umwandlung von geschriebenem Text in natürlich klingende Sprache – heute meist mit neuronalen Modellen.
Text-to-Video
KI-Technologie, die aus Textbeschreibungen vollständige Videos mit bewegten Bildern, Personen und Szenen generiert.
Textgenerierung
Text Generation ist die automatische Erstellung von Text durch KI-Modelle, typischerweise basierend auf einem Prompt oder Kontext.
Textklassifikation
Die automatische Zuordnung von Texten zu vordefinierten Kategorien durch ein ML-Modell.
Textnormalisierung
Die Standardisierung von Textdaten durch Umwandlung in eine einheitliche Form – Lowercasing, Unicode-Normalisierung, Zeichenersetzung und mehr.
Textual Inversion
Textual Inversion lernt ein neues Wort-Embedding für ein Konzept aus wenigen Bildern, ohne das Diffusionsmodell selbst zu verändern.
Textzusammenfassung
Die automatische Erzeugung einer kürzeren Version eines Textes, die die wichtigsten Informationen beibehält.
TF-IDF
Statistisches Maß zur Bewertung der Relevanz eines Worts in einem Dokument relativ zu einer Dokumentensammlung.
TFX (TensorFlow Extended)
Googles End-to-End-Plattform für das Deployment produktionsreifer ML-Pipelines auf Basis von TensorFlow.
Thompson Sampling
Bayesianischer Bandit-Algorithmus, der Aktionen proportional zur Wahrscheinlichkeit wählt, dass sie optimal sind.
Threat Modeling
Threat Modeling ist ein strukturierter Prozess zur Identifizierung von Assets, Angriffsflächen, Bedrohungen und Mitigationen zur Reduzierung von Sicherheitsrisiken.
Tiefenschätzung
Die Vorhersage von Tiefenwerten (Entfernungen) für jeden Pixel eines 2D-Bildes zur Erzeugung einer 3D-Tiefenkarte.
Tiefensuche
Ein Graph-Traversierungsalgorithmus, der so weit wie möglich entlang eines Pfades geht, bevor er zurückverfolgt und alternative Pfade erkundet.
Tiefensuche (DFS)
Tiefensuche (DFS) durchläuft einen Graphen, indem sie einem Pfad so tief wie möglich folgt, bevor sie zurückgeht.
tiktoken
OpenAIs schnelle BPE-Tokenizer-Bibliothek für GPT-Modelle, geschrieben in Rust mit Python-Bindings.
Time Series Foundation Model
Vortrainierte Transformer-Modelle für Zeitreihen, die Zero-Shot-Forecasting ohne spezifisches Training ermöglichen.
Time-to-First-Token (TTFT)
Die Zeit von der Anfrage bis zum ersten generierten Token – kritisch für die wahrgenommene Responsivität von AI-Anwendungen.
TinyML
Machine Learning auf Mikrocontrollern und Ultra-Low-Power-Geräten mit wenigen Kilobyte RAM – KI auf einem Chip kleiner als eine Münze.
TLS (Transport Layer Security)
TLS (Transport Layer Security) ist ein kryptografisches Protokoll, das Netzwerkkommunikation durch Verschlüsselung, Integrität und Endpunkt-Authentifizierung sichert.
Together AI
Cloud-Plattform für Training und Inferenz von Open-Source KI-Modellen mit optimierter GPU-Infrastruktur.
Tokenization
Der Prozess, Text in kleinere Einheiten (Tokens) zu zerlegen, die von Sprachmodellen verarbeitet werden können – von ganzen Wörtern über Silben bis zu einzelnen Zeichen.
Tool Use
Die Fähigkeit von LLMs, externe Tools und APIs aufzurufen – vom Taschenrechner über Websuche bis zu Datenbanken und benutzerdefinierten Funktionen.
Top-k Sampling
Ein Sampling-Parameter, der die Auswahl auf die k wahrscheinlichsten Tokens beschränkt, unabhängig von deren absoluten Wahrscheinlichkeiten.
Top-p (Nucleus Sampling)
Ein Sampling-Parameter, der nur aus den wahrscheinlichsten Tokens auswählt, deren kumulative Wahrscheinlichkeit p nicht überschreitet.
Topic Modeling
Unüberwachte ML-Methode zur Entdeckung abstrakter Themen in Dokumentensammlungen.
TorchServe
PyTorchs offizielles Model-Serving-Framework für das Deployment von PyTorch-Modellen in Produktion.
Touchpoint
Jeder Kontaktpunkt zwischen Kunde und Marke auf der Customer Journey.
Toxicity Detection
ML-Systeme, die toxische, beleidigende oder hasserfüllte Inhalte automatisch erkennen und klassifizieren.
TPU (Tensor Processing Unit)
Ein von Google entwickelter, spezialisierter KI-Chip, der für Matrix-Multiplikationen in neuronalen Netzen optimiert ist und deutlich effizienter als GPUs für bestimmte KI-Workloads arbeitet.
Transfer Learning
Die Nutzung von Wissen, das bei einer Aufgabe gelernt wurde, um die Leistung bei einer verwandten Aufgabe zu verbessern.
Transformer
Eine neuronale Netzwerkarchitektur, die Self-Attention nutzt, um Beziehungen zwischen allen Positionen in einer Sequenz zu modellieren.
Transformer-Architektur
Die revolutionäre neuronale Netzwerk-Architektur von 2017 ("Attention Is All You Need"), die RNNs ablöste und die Grundlage aller modernen LLMs wie GPT, Claude, Gemini bildet.
Transparenz
Die Offenlegung, wie KI-Systeme funktionieren, welche Daten sie nutzen und wie Entscheidungen getroffen werden.
Treatment-Effekt
Der kausale Effekt einer Intervention (Treatment) auf ein Outcome. ATE ist der Durchschnitt, CATE der bedingte Effekt für Subgruppen.
Tree of Thoughts (ToT)
Prompting-Strategie, bei der das LLM mehrere Reasoning-Pfade parallel verfolgt, bewertet und den besten auswählt – wie ein Entscheidungsbaum für Gedankenketten.
Triplet Loss
Eine Loss-Funktion für Metric Learning, die Anchor, Positive und Negative nutzt, um Embeddings so zu trainieren, dass Ähnliche näher und Verschiedene weiter entfernt sind.
Triton Inference Server
NVIDIAs Open-Source-Inference-Server für das Serving multipler ML-Modelle auf GPU- und CPU-Infrastruktur mit maximaler Performance.
Truncation
Truncation ist das Abschneiden von Daten, die eine maximale Länge überschreiten – sei es Text für LLMs, Sequenzen für Modelle oder Dezimalstellen.
Trust & Safety
Trust & Safety ist die Praxis des Schutzes von Benutzern, Plattformen und Marken vor schädlichen Inhalten, Missbrauch und unsicheren Outcomes – durch Policy, Enforcement und Product Design.
Trusted Execution Environment
Eine hardwarebasierte isolierte Umgebung, die Code und Daten während der Ausführung vor dem Host-System und anderen Prozessen schützt.
TruthfulQA
Ein Benchmark, der testet, ob LLMs populäre Falschinformationen und Verschwörungstheorien vermeiden.
Two-Tower-Modell
Eine Architektur mit zwei separaten Encodern (User-Tower, Item-Tower), deren Embeddings per Ähnlichkeitssuche effizient gematcht werden.
U
U-Net
U-Net ist eine Netzwerkarchitektur für Image Segmentation mit Encoder-Decoder-Struktur und Skip Connections.
UAT (User Acceptance Testing)
User Acceptance Testing (UAT) ist die finale Validierungsphase, in der echte Nutzer bestätigen, dass ein System die Business-Anforderungen erfüllt.
Ubiquitous Language
Ubiquitous Language ist eine DDD-Praxis, bei der Teams ein gemeinsames, präzises Vokabular für Kernkonzepte verwenden.
UDF (User-Defined Function)
Eine UDF ist eine benutzerdefinierte Funktion zur Erweiterung einer Plattform (SQL-Engines, Data Warehouses).
UGC (User-Generated Content)
UGC sind Inhalte, die von Nutzern statt von der Marke erstellt werden (Reviews, Kommentare, Community-Posts).
Ultra-Long Context Window
Ein ultra-langes Context Window ist die Fähigkeit, sehr große Input-Kontexte zu akzeptieren (zehn- oder hunderttausende Tokens).
Unbounded Fan-Out
Unbounded Fan-Out: Workflow spawnt unkontrolliert viele Downstream-Calls (Tools, Retrieval, Model-Calls).
Uncertainty Quantification (UQ)
UQ schätzt, wie unsicher ein Modell über einen Output ist.
Uncertainty-Aware Routing
Uncertainty-Aware Routing wählt Workflows basierend auf Unsicherheitssignalen (Low-Confidence → tieferes Retrieval).
Underfitting
Underfitting passiert, wenn ein Modell zu einfach ist, um Muster zu erfassen – schlechte Performance auf Training und Test.
Unicode Normalization
Unicode-Normalisierung konvertiert Text in kanonische Form für konsistente Behandlung.
Unified Search
Unified Search: eine Sucherfahrung über multiple Content-Quellen (Docs, Tickets, Wiki, CRM).
Uniform Information Density
Prompt-Prinzip: "Importance per Token" konsistent halten, Low-Value-Text vermeiden.
Unigram-Modell (Tokenization)
Subword-Tokenisierungsalgorithmus, der mit einem großen Vokabular startet und iterativ wenig nützliche Tokens entfernt.
Unintended Memorization
Unintended Memorization: Modelle behalten spezifische Training-Beispiele und können sie reproduzieren.
Unit Economics
Unit Economics misst Profitabilität pro Unit (Kunde, Query, Workflow) vs variable Kosten.
Unit Test
Ein Unit Test verifiziert das Verhalten eines isolierten Code-Stücks automatisch in CI.
Universal Embeddings
Universal Embeddings: General-Purpose-Repräsentationen für viele Domains ohne domain-spezifisches Training.
Unlearning (Machine Unlearning)
Machine Unlearning entfernt den Einfluss spezifischer Training-Daten aus einem Modell (Privacy, Compliance).
Unstructured Data
Unstrukturierte Daten sind nicht in vordefiniertem Schema gespeichert (PDFs, E-Mails, Chats, Wikis, Tickets).
Untrusted Input Handling
Controls, die externe/user-provided Content als potenziell malicious behandeln.
Unüberwachtes Lernen
ML-Paradigma, bei dem das Modell Muster in ungelabelten Daten findet.
Update Cadence
Update Cadence ist die geplante Frequenz für Content/System-Aktualisierungen.
Update vs Upgrade
Update: kleine, rückwärtskompatible Änderung. Upgrade: größere Änderung mit möglichen Behavior-Changes.
Uplift Modeling
Uplift Modeling prognostiziert den inkrementellen Impact einer Intervention (Anzeige, E-Mail, CTA).
Upsert
Ein Upsert aktualisiert einen Record wenn er existiert, oder fügt ihn ein wenn nicht.
URL (Uniform Resource Locator)
Eine URL ist die Adresse einer Web-Ressource (Schema, Domain, Path, Query-Parameter).
URL Canonicalization
URL Canonicalization: multiple URL-Varianten lösen zu einer kanonischen URL auf.
Usability Testing
Usability Testing evaluiert, wie leicht Nutzer Tasks abschließen können.
Usage Anomaly Detection
Identifiziert ungewöhnliche Muster im User/Tenant-Verhalten (Spikes, Errors).
Usage Telemetry
Usage Telemetry erfasst, wie ein Produkt genutzt wird (Events, Funnels, Intent Patterns).
Usage-Based Pricing
Usage-Based Pricing berechnet basierend auf Verbrauch (Tokens, Requests, Tool Calls).
Usage-Based Routing
Passt Model/Workflow-Selection an Cost- und Consumption-Signals an.
User Experience (UX)
UX ist die Gesamtqualität der Nutzer-Interaktion mit einem Produkt.
User Intent
User Intent ist, was ein Nutzer mit einer Query erreichen will.
User Journey
Eine User Journey ist die Abfolge von Schritten zum Erreichen eines Ziels.
User Onboarding
User Onboarding hilft neuen Nutzern, ihr erstes erfolgreiches Outcome schnell zu erreichen.
User Persona
Eine User Persona ist ein repräsentatives Profil eines Ziel-User-Segments.
User-Generated Content (UGC)
Von Nutzern erstellte Inhalte wie Reviews, Posts und Videos.
UTM Parameters
UTM-Parameter sind Query-String-Tags für Marketing-Campaign-Attribution (utm_source, utm_medium).
UX Writing for Uncertainty
Produktsprache, die Confidence, Limitations und Next Steps bei Unsicherheit kommuniziert.
UXR (User Research)
User Research ist systematische Untersuchung von Nutzerbedürfnissen und -verhalten.
Ü
Überlebensanalyse
Statistische Methode zur Analyse der Zeit bis zum Eintreten eines Ereignisses (z.B. Churn, Conversion, Ausfall), unter Berücksichtigung zensierter Daten.
Überwachtes Lernen
ML-Paradigma, bei dem das Modell aus gelabelten Beispielen (Input-Output-Paare) lernt.
V
VAE (Variational Autoencoder)
VAE steht für Variational Autoencoder, ein generatives Modell, das einen probabilistischen latenten Raum für Sampling und Generierung lernt.
Validation Set
Ein Validation Set ist ein zurückgehaltener Datensatz, der während der Modellentwicklung verwendet wird, um Hyperparameter zu tunen und Modellversionen auszuwählen, ohne das finale Testset zu berühren.
Validator
Ein Validator ist eine Komponente, die prüft, ob ein Input/Output erforderliche Constraints erfüllt (Schema, Safety Policy, Semantik, Berechtigungen).
Value Alignment
Value Alignment stellt sicher, dass das Verhalten eines KI-Systems zuverlässig mit beabsichtigten menschlichen/organisatorischen Werten und Constraints übereinstimmt (Sicherheit, Fairness, Wahrheitssuche, Datenschutz).
Value of Information (VoI)
Value of Information (VoI) quantifiziert, wie viel Nutzen man durch das Einholen zusätzlicher Informationen vor einer Entscheidung gewinnt.
Value-Based Pricing
Value-Based Pricing setzt Preise basierend auf dem an Kunden gelieferten Wert (Ergebnisse), nicht rein auf Anbieterkosten (Tokens, Compute).
Vanishing Gradient
Vanishing Gradient ist ein Trainingsproblem, bei dem Gradienten extrem klein werden während sie rückwärts durch ein Netzwerk propagieren, was das Lernen in frühen Schichten verlangsamt oder verhindert.
Varianz
Varianz ist der Grad, zu dem die Leistung eines Modells über verschiedene Datensätze/Samples variiert; hohe Varianz deutet oft auf Sensitivität gegenüber Trainingsdaten hin (Overfitting-Risiko).
Variational Autoencoder (VAE)
Ein Variational Autoencoder (VAE) ist ein generatives Modell, das einen probabilistischen latenten Raum lernt, der Sampling und Generierung neuer Daten ermöglicht.
Vector Database
Eine Vektor-Datenbank speichert Embeddings und unterstützt schnelle Ähnlichkeitssuche (Nearest Neighbors), oft mit Metadaten-Filterung und Indexierung für Skalierung.
Vector Embedding
Ein Vector Embedding ist eine numerische Repräsentation (Array von Floats) von Text, Bildern oder anderen Daten, die semantische Bedeutung in einem hochdimensionalen Raum kodiert.
Vector Index
Ein Vector Index ist die Datenstruktur/der Algorithmus, der verwendet wird, um Nearest-Neighbor-Suche über Embeddings im großen Maßstab zu beschleunigen.
Vector Quantization
Vector Quantization (VQ) komprimiert kontinuierliche Vektoren, indem sie auf eine endliche Menge repräsentativer Vektoren (ein Codebook) abgebildet werden.
Vector Similarity
Vector Similarity ist ein Maß dafür, wie nah zwei Embeddings sind (üblicherweise Cosine Similarity oder Dot Product).
Vector Store
Ein Vector Store ist die Storage-Schicht (Datenbank oder Service), die Embeddings plus Metadaten für Retrieval und Ähnlichkeitssuche hält.
Vector Store Hygiene
Vector Store Hygiene ist die operationelle Disziplin, einen Vector Store akkurat, sicher, performant und aktuell zu halten (Dedupe, Versionierung, ACL-Korrektheit, Drift-Monitoring, Purge-Workflows).
Vektordatenbank
Spezialisierte Datenbanken für die Speicherung und blitzschnelle Ähnlichkeitssuche von hochdimensionalen Vektoren (Embeddings) mittels Approximate Nearest Neighbor (ANN) Algorithmen.
Vektorindex
Eine Datenstruktur, die effiziente Ähnlichkeitssuche in hochdimensionalen Vektorräumen ermöglicht.
Vektorsuche
Vektorsuche ruft Items nach Ähnlichkeit in einem Embedding-Raum ab, anstatt exakter Keyword-Matches.
Vendor Risk Management (VRM)
Vendor Risk Management (VRM) ist das Bewerten und Managen von Risiken, die durch Drittanbieter eingeführt werden (Sicherheit, Privacy, Compliance, Kontinuität und operative Abhängigkeiten).
Veo 3
Googles Video-Generierungsmodell der dritten Generation mit nativem Audio, längeren Clips und verbesserter Physik.
Verification
Prüfung, ob LLM-Outputs korrekt, faktisch und quellengestützt sind.
Verification-Centric Agents
Agentische Systeme, deren Architektur jeden Reasoning-Schritt aktiv mit externen Quellen verifiziert, bevor er in den nächsten Schritt einfließt.
Verification-First Policy
Eine Verification-First Policy erfordert, dass KI-Outputs und High-Impact-Actions definierte Verification-Checks passieren bevor sie Nutzern gezeigt oder ausgeführt werden.
Verifikationsschicht
Eine Verifikationsschicht ist eine Systemkomponente, die prüft, ob ein KI-Output oder eine Aktion die erforderlichen Korrektheit-, Sicherheits-, Policy- und Formatierungsanforderungen erfüllt, bevor sie geliefert oder ausgeführt wird.
Verifizierbarkeit
Verifizierbarkeit ist die Eigenschaft, dass Behauptungen gegen zuverlässige Quellen, Logs oder messbare Evidenz geprüft werden können.
Verlustfunktion
Eine mathematische Funktion, die misst, wie gut oder schlecht die Vorhersagen eines Modells sind.
Verschlüsselung
Verschlüsselung transformiert Klartext in Chiffretext mittels eines Schlüssels, sodass nur autorisierte Parteien die ursprünglichen Informationen wiederherstellen können.
Verschlüsselung bei der Übertragung
Verschlüsselung bei der Übertragung schützt Daten während der Bewegung über Netzwerke, üblicherweise implementiert mittels TLS (z.B. HTTPS).
Verschlüsselung im Ruhezustand
Verschlüsselung im Ruhezustand schützt gespeicherte Daten (Datenbanken, Festplatten, Backups, Objektspeicher), indem sie verschlüsselt werden, wenn sie nicht aktiv übertragen oder verarbeitet werden.
Versioned Prompt
Ein Versioned Prompt ist ein Prompt-Template, das wie ein Software-Artifact verwaltet wird: Änderungen werden getrackt, getestet, reviewed und mit Rollback deploybar.
Versionskontrolle
Versionskontrolle trackt Änderungen an Code, Configs, Prompts, Schemas und Content über Zeit und ermöglicht Zusammenarbeit, Rollbacks und Auditierbarkeit.
Verteiltes Training
Distributed Training verteilt das ML-Training auf mehrere GPUs oder Maschinen – notwendig für Modelle, die nicht auf eine einzelne GPU passen.
Vertrauensgrenze
Eine Vertrauensgrenze ist ein Punkt in einem System, an dem sich das Vertrauensniveau ändert (z.B. von nicht vertrauenswürdigem Benutzerinput zu internen Services).
Vertrauenskette
Eine Vertrauenskette ist die geordnete Menge von Zertifikaten von einem Leaf-Zertifikat über Intermediates bis zu einer vertrauenswürdigen Root-CA.
Vertrauensmodelle
Ein Vertrauensmodell definiert, wer/was vertraut wird, Aussagen zu machen (Identität, Integrität, Autorisierung) und wie dieses Vertrauen etabliert, delegiert und verifiziert wird.
Vibe Coding
Ein Programmieransatz, bei dem Entwickler ihre Absichten in natürlicher Sprache beschreiben und KI-Tools den Code generieren, während der Entwickler die Richtung vorgibt und das Ergebnis verfeinert.
Video AI
Video AI umfasst KI-Technologien zur automatischen Analyse, Generierung, Bearbeitung und Optimierung von Videoinhalten.
Viewability
Metrik, die misst, ob eine Anzeige tatsächlich sichtbar war.
Virtual Try-On
KI-Technologie, die es Kunden ermöglicht, Mode-, Beauty- oder Brillen-Produkte virtuell auf dem eigenen Körper auszuprobieren.
Vision APIs
API-Schnittstellen, die AI-gestützte Bildanalyse ermöglichen – von einfacher Objekterkennung bis zu komplexem Szenenverständnis und multimodalem Reasoning.
Vision Language Models
KI-Modelle, die sowohl Bilder als auch Text verstehen und verarbeiten können – sie "sehen" und "lesen" gleichzeitig und können über visuelle Inhalte kommunizieren.
Vision Transformer (ViT)
Ein Vision Transformer (ViT) wendet Transformer-Architekturen auf Bilder an, indem er sie als Sequenzen von Patch-Embeddings repräsentiert.
Vision-Language Model (VLM)
Ein Vision-Language Model (VLM) verarbeitet sowohl Bilder als auch Text, um Aufgaben wie Bildverständnis, Captioning, Dokument-Q&A und multimodales Reasoning durchzuführen.
Visual Question Answering (VQA)
AI-Systeme, die Fragen zu Bildern in natürlicher Sprache beantworten können – "Wie viele Personen sind auf dem Foto?"
vLLM
Ein hochperformanter Open-Source-Inference-Server für LLMs, der PagedAttention für effizientes KV-Cache-Management und maximalen Durchsatz nutzt.
Vocoder
Ein Vocoder konvertiert Mel-Spektrogramme oder andere akustische Features in hörbare Audio-Wellenformen – der letzte Schritt in TTS-Pipelines.
Voice Activity Detection (VAD)
Voice Activity Detection erkennt automatisch, ob ein Audio-Signal menschliche Sprache enthält oder nicht – die Grundlage für effiziente Sprachverarbeitung.
Voice Agent
Voice Agents sind KI-gesteuerte Sprachsysteme, die natürliche Telefon- oder Voice-Gespräche autonom führen – von Outbound-Calls bis zu Kundenservice-Hotlines.
Voice Cloning
KI-Technologie, die eine menschliche Stimme aus wenigen Sekunden Audio analysiert und synthetisch reproduziert, um beliebige Texte in dieser Stimme zu sprechen.
Vokabular (NLP)
Die Gesamtmenge aller Tokens, die ein Sprachmodell kennt und verarbeiten kann.
Vorwärtsverkettung
Eine Inferenzstrategie, die von bekannten Fakten ausgeht und Regeln anwendet, um neue Fakten abzuleiten, bis das Ziel erreicht ist.
VQ-VAE
VQ-VAE ist eine Variante von VAE, die Vector Quantization verwendet, um diskrete latente Repräsentationen über ein gelerntes Codebook zu lernen.
W
WAF (Web Application Firewall)
Eine Web Application Firewall (WAF) filtert und überwacht HTTP-Traffic um Web-Apps vor Angriffen zu schützen (z.B. Injection, Missbrauch, Bot-Traffic).
Walled Garden
Ein Walled Garden ist ein geschlossenes Ökosystem, in dem eine Plattform den Zugang zu Daten, Distribution und Measurement kontrolliert (häufig in Werbung und Analytics).
Warm Start
Ein Warm Start initialisiert Training oder Optimierung von einem zuvor gelernten Zustand (Gewichte, Embeddings oder Parameter) anstatt von Null zu starten.
Warmup
Trainingstechnik, die die Learning Rate in den ersten Steps/Epochen langsam von nahe Null auf den Zielwert hochfährt.
WASM (WebAssembly)
WebAssembly (WASM) ist ein binäres Befehlsformat, das nahezu native Code-Performance im Browser (und anderen Laufzeiten) ermöglicht.
Watermarking
Watermarking ist das Hinzufügen eines erkennbaren Signals zu Inhalten (Text, Bild, Audio, Video), um Herkunft, Authentizität oder Provenienz anzuzeigen – oft verwendet um KI-generierte Ausgaben zu kennzeichnen.
Wav2Vec
Wav2Vec ist ein Self-Supervised-Learning-Framework von Meta für Speech Representations, das aus rohem Audio lernt und mit wenigen gelabelten Daten State-of-the-Art-ASR erreicht.
Weak Supervision
Weak Supervision nutzt imperfekte, verrauschte oder indirekte Signale (Heuristiken, Regeln, entfernte Labels) um Trainingslabels zu erstellen statt manueller Annotation.
Weakly Supervised Learning
Weakly Supervised Learning trainiert Modelle mit Weak-Supervision-Signalen (verrauschte Labels, partielle Labels, aggregierte Labels) statt vollständig zuverlässiger Labels.
Weavy
KI-Video-Plattform mit node-basiertem Editor für komplexe Generative-Video-Workflows und Multi-Model-Pipelines.
Web Browsing Tool
Ein Web-Browsing-Tool ist eine KI-Tool-Integration, die Live-Webseiten oder Suchergebnisse abruft, um Fragen mit aktuellen Informationen zu beantworten.
Web Grounding
Die Fähigkeit eines KI-Modells, in Echtzeit auf Websuche-Ergebnisse zuzugreifen, um aktuelle und faktisch korrekte Inhalte zu generieren.
Web Scraping
Web Scraping ist das programmatische Extrahieren von Daten aus Websites für Analyse, Indexierung oder Monitoring.
Webhook
Ein Webhook ist ein ereignisgesteuerter HTTP-Callback, bei dem ein System einem anderen System Daten sendet wenn etwas passiert (z.B. "Ticket erstellt", "Zahlung erfolgreich").
Webhook Verification
Webhook-Verifizierung stellt sicher, dass eingehende Webhook-Anfragen authentisch und unverändert sind, typischerweise durch HMAC-Signaturen, Zeitstempel und Replay-Schutz.
Weight Decay
Weight Decay ist eine Regularisierungstechnik, die große Gewichte während des Trainings entmutigt, oft als L2-Regularisierung oder entkoppelter Weight Decay (z.B. in AdamW) implementiert.
Weight Normalization
Weight Normalization reparametrisiert Gewichtsvektoren in Richtung und Magnitude – eine Alternative zu Batch Norm ohne Batch-Abhängigkeit.
Weight Sharing
Eine Technik, bei der mehrere Teile eines neuronalen Netzes dieselben Gewichte verwenden – reduziert Parameteranzahl und Speicherverbrauch erheblich.
Weights & Biases (W&B)
SaaS-Plattform für Experiment Tracking, Modell-Evaluation, Dataset-Versionierung und kollaborative ML-Entwicklung.
Weltmodell
Eine interne Repräsentation der Umwelt in einem KI-System, die es ermöglicht, Vorhersagen über zukünftige Zustände und die Auswirkungen von Aktionen zu machen.
WER (Word Error Rate)
Word Error Rate (WER) misst die Spracherkennungsgenauigkeit als Anteil von Substitutionen, Löschungen und Einfügungen um ein Transkript in die Ground Truth zu transformieren.
Wettbewerbsvorteil
Ein Attribut oder eine Fähigkeit, die einem Unternehmen ermöglicht, besser als seine Wettbewerber zu performen und nachhaltigen wirtschaftlichen Wert zu schaffen.
What-If-Analyse
What-If-Analyse exploriert, wie sich Ergebnisse ändern, wenn Inputs, Annahmen oder Entscheidungen variiert werden.
Whisper
Ein Open-Source-Spracherkennungsmodell von OpenAI, das auf 680.000 Stunden multilingualen Audio trainiert wurde.
Windowed Attention
Windowed Attention beschränkt Attention auf ein lokales Token-Fenster statt der vollen Sequenz, reduziert Rechenaufwand und ermöglicht längere Kontexte.
Windsurf
Ein KI-gestützter Code-Editor von Codeium, der Deep Context Awareness und agentenbasierte Programmierunterstützung bietet.
WinoGrande
Ein Benchmark für pronominale Referenzauflösung, bei dem kleine Wortänderungen die korrekte Antwort ändern.
Wissensgraph
Eine strukturierte Darstellung von Wissen als Graph mit Entitäten (Knoten) und Beziehungen (Kanten).
Wissensverfolgung
Wissensverfolgung modelliert die sich entwickelnde Beherrschung von Fähigkeiten eines Lernenden über die Zeit anhand seiner Interaktionen (Antworten, Versuche, Zeit, Hinweise).
Word Error Rate (WER)
Die Standard-Metrik für Spracherkennung – misst Substitutionen, Löschungen und Einfügungen relativ zur Referenz.
Word2Vec
Word2Vec ist eine Technik zur Erzeugung von Worteinbettungen (Word Embeddings), die Wörter als dichte Vektoren darstellt, wobei semantisch ähnliche Wörter ähnliche Vektoren haben.
WordPiece
Von Google entwickelter Subword-Tokenisierungsalgorithmus, der die Likelihood des Trainingskorpus maximiert.
Workflow Automation
Workflow-Automatisierung nutzt Software (oft mit KI) um repetitive Aufgaben oder Geschäftsprozesse mit minimaler manueller Intervention auszuführen.
Workflow Orchestration
Workflow-Orchestrierung koordiniert mehrstufige Prozesse über Services/Tools hinweg, verwaltet State, Retries, Timeouts und Error-Handling.
Workload Isolation
Workload-Isolation trennt Workloads, damit einer die Performance, Sicherheit oder Kosten eines anderen nicht degradieren kann (z.B. interaktiv vs. Batch).
Wort-Embedding
Eine dichte Vektorrepräsentation eines Wortes, die seine semantische Bedeutung kodiert.
Write Amplification
Write Amplification tritt auf wenn ein System viel mehr internes Schreiben durchführt als die Größe der Write-Request des Nutzers (häufig in Storage-Engines und log-strukturierten Systemen).
Write-Back Cache
Ein Write-Back Cache schreibt Änderungen zuerst in den Cache und flusht sie später asynchron in den Backing Store.
Write-Through Cache
Ein Write-Through Cache schreibt Daten bei jedem Write synchron sowohl in den Cache als auch in den Backing Store.
X
X-Content-Type-Options
X-Content-Type-Options: nosniff ist ein HTTP-Header, der Browser anweist, eine Response nicht zu "MIME sniffen" und deklarierte Content-Types zu respektieren.
X-Forwarded-For
X-Forwarded-For ist ein HTTP-Header zur Identifizierung der ursprünglichen Client-IP wenn eine Anfrage durch Proxies oder Load Balancer läuft.
X-Frame-Options
X-Frame-Options ist ein HTTP-Response-Header, der Clickjacking verhindert, indem er kontrolliert ob eine Seite in einem iframe eingebettet werden kann.
X-Robots-Tag
X-Robots-Tag ist ein HTTP-Header, der Robots Direktiven gibt (wie noindex, nofollow) ähnlich wie Meta-Robots-Tags – nützlich für Nicht-HTML-Ressourcen.
x-Vector
Ein x-Vector ist eine Art von Speaker-Embedding, das in der Sprachverarbeitung verwendet wird, um Sprecher-Identitätsmerkmale in einem Vektor fester Länge darzustellen.
X.509 Zertifikat
Ein X.509-Zertifikat ist ein digitaler Zertifikatsstandard für Public-Key-Infrastruktur (PKI), der TLS und Identitätsverifizierung ermöglicht.
X.509-Zertifikat
Ein X.509-Zertifikat ist ein digitaler Zertifikatsstandard in PKI, der einen öffentlichen Schlüssel an eine Identität bindet und sichere Authentifizierung und verschlüsselte Kommunikation ermöglicht (z.B. TLS).
xAI
Elon Musks KI-Unternehmen, das Grok entwickelt – einen LLM mit Echtzeit-Zugang zu X (Twitter) und einem unzensierten, humorvollen Stil.
XAI (Explainable AI)
Explainable AI (XAI) ist die Menge von Methoden und Praktiken, um die Ausgaben eines KI-Systems verständlicher zu machen – zu zeigen, warum eine Vorhersage, Empfehlung oder Entscheidung getroffen wurde.
Xavier Initialization (Glorot Initialization)
Xavier (Glorot) Initialization ist eine Gewichts-Initialisierungsmethode, die entwickelt wurde, um Aktivierungen und Gradienten in einem gesunden Bereich zu halten.
XDR (Extended Detection and Response)
XDR ist ein Sicherheitsansatz, der Erkennung und Reaktion über Endpoints, Netzwerke, Identitäten und Cloud-Workloads vereint.
XGBoost
XGBoost (Extreme Gradient Boosting) ist ein hochperformanter Ensemble-Learning-Algorithmus, der Gradient Boosting mit Entscheidungsbäumen für überlegene Vorhersagegenauigkeit kombiniert.
XLA
XLA (Accelerated Linear Algebra) ist ein Compiler für Machine-Learning-Berechnungen, der Operationen optimiert und für verschiedene Hardwareplatformen (CPU, GPU, TPU) kompiliert.
XLA (Accelerated Linear Algebra)
XLA ist ein Compiler für lineare Algebra-Berechnungen (häufig mit TensorFlow und JAX assoziiert), der Ausführung durch Operation-Fusion und Hardware-Auslastung optimiert.
XLM (Cross-lingual Language Model)
XLM bezeichnet Cross-lingual Language Modeling-Ansätze und Modell-Familien, die entwickelt wurden, um mehrere Sprachen in einem gemeinsamen Embedding-Raum darzustellen.
XLM-R (Cross-lingual RoBERTa)
XLM-R ist eine mehrsprachige Transformer-Modell-Familie, die oft für cross-linguale Verständnis-Aufgaben verwendet wird (Classification, NER, Semantic Similarity).
XLNet
XLNet ist ein Transformer-basierter Language Model-Ansatz, der permutationsbasiertes Training verwendet um bidirektionalen Kontext bei Beibehaltung autoregressiver Eigenschaften zu erfassen.
xLSTM (Extended Long Short-Term Memory)
Eine modernisierte LSTM-Variante von Sepp Hochreiter, die exponentielles Gating und Matrix-Memory nutzt, um mit Transformern zu konkurrieren.
XML (Extensible Markup Language)
XML ist eine Markup-Sprache zur Darstellung strukturierter Daten mit verschachtelten Tags.
XML Sitemap
Eine XML Sitemap ist eine maschinenlesbare Liste von URLs (mit optionalen Metadaten wie lastmod), die Suchmaschinen hilft, Content effizient zu entdecken und zu crawlen.
XOR Cipher
Ein XOR Cipher ist eine einfache Verschlüsselungsmethode, die Plaintext mit einem Key mittels XOR kombiniert; allein ist sie generell nicht sicher.
XOR-Problem
Das XOR-Problem ist ein klassisches Beispiel, das zeigt, dass ein einzelner linearer Klassifizierer Daten, die nicht linear separierbar sind, nicht trennen kann.
XPath
XPath ist eine Sprache zur Auswahl von Knoten in einem XML/HTML-Dokument mittels Pfadausdrücken.
XQuery
XQuery ist eine Abfragesprache zum Extrahieren und Transformieren von Daten, die in XML-Dokumenten gespeichert sind.
XSLT
XSLT ist eine Sprache zur Transformation von XML-Dokumenten in andere Formate (XML, HTML, Plain Text).
XSRF Token
Ein XSRF-Token (oft synonym mit CSRF-Token) ist ein geheimer Wert, der Cross-Site Request Forgery-Angriffe verhindert.
XSS (Cross-Site Scripting)
Cross-Site Scripting (XSS) ist eine Web-Schwachstelle, bei der Angreifer bösartige Scripts in Inhalte injizieren, die später anderen Nutzern serviert werden.
XSS in KI-generiertem Markdown
XSS in KI-generiertem Markdown ist das Risiko, dass von einem KI-System produziertes Markdown beim Rendern ausführbaren Content enthalten kann.
XSS Payload
Ein XSS Payload ist das injizierte Script oder Markup, das ein Angreifer verwendet, um eine Cross-Site Scripting-Schwachstelle auszunutzen.
XSS Prevention Patterns
XSS Prevention Patterns sind Design- und Engineering-Praktiken, die Cross-Site Scripting verhindern, indem sie sicherstellen, dass untrusted Content nicht als Code im Browser ausgeführt werden kann.
xUnit
xUnit bezeichnet eine Familie von Unit-Testing-Frameworks (z.B. JUnit, NUnit, pytest, xUnit.net), die standardisieren wie automatisierte Tests geschrieben und ausgeführt werden.
XXE (XML External Entity)
XXE ist eine Schwachstelle, bei der ein XML-Parser externe Entities so verarbeitet, dass sensible Daten exponiert werden können, SSRF-ähnliches Verhalten ausgelöst oder Denial of Service verursacht wird.
Y
Y-Achsen-Kompression
Y-Achsen-Kompression ist ein Visualisierungsproblem, bei dem Skalierungsentscheidungen Unterschiede abflachen und Änderungen kleiner (oder größer) aussehen lassen, als sie sind.
Y-Combinator
Der Y-Combinator ist ein Konzept aus dem Lambda-Kalkül, das Rekursion in Sprachen ermöglicht, die keine benannten Selbstreferenzen haben.
YAML
YAML ("YAML Ain't Markup Language") ist ein menschenlesbares Datenserialisierungsformat, das häufig für Konfigurationsdateien verwendet wird.
YAML Anchors und Aliases
YAML-Anchors und Aliases ermöglichen die Definition wiederverwendbarer Blöcke (Anchors) und deren Referenzierung anderswo (Aliases), um Wiederholungen zu vermeiden.
YAML Front Matter
YAML Front Matter ist ein YAML-Block am Anfang einer Content-Datei (oft Markdown), der Metadaten (Titel, Tags, Canonical URL, Update-Datum) speichert.
YAML Injection
YAML Injection tritt auf, wenn nicht vertrauenswürdige Eingaben als YAML interpretiert werden und unbeabsichtigtes Verhalten verursachen – oft durch unsichere Deserialisierung oder Config-Templating.
YAML-Schema-Validierung
YAML-Schema-Validierung prüft, ob eine YAML-Datei einer erwarteten Struktur und Constraints entspricht (Felder, Typen, erforderliche Keys, Enums).
YARA-Regel
Eine YARA-Regel ist eine Pattern-Matching-Regel, die in der Cybersecurity verwendet wird, um Malware oder verdächtige Artefakte in Dateien und Speicher zu identifizieren.
YARN
YARN (Yet Another Resource Negotiator) ist eine Ressourcenmanagement-Schicht im Hadoop-Ökosystem für Scheduling und Ausführung verteilter Anwendungen.
Yield
Yield ist der Anteil der Eingaben, die erfolgreich akzeptable Ausgaben produzieren (z.B. erfolgreiche Läufe, gültige Datensätze, bestandene Artefakte).
Yield Management
Yield Management (oft Revenue Management genannt) ist Preis- und Bestandskontrolle zur Umsatzmaximierung unter Kapazitätsbeschränkungen.
Yield-Optimierung
Maximierung des Ertrags aus begrenzten Ressourcen durch datengesteuerte Entscheidungen.
Yield-Rate
Yield-Rate ist Yield ausgedrückt als Prozentsatz über eine definierte Population und Zeitfenster.
YOLO
YOLO ("You Only Look Once") ist eine Familie von Echtzeit-Objekterkennungsmodellen, die Bounding Boxes und Klassenwahrscheinlichkeiten in einem Durchgang vorhersagen.
Yottabyte
Ein Yottabyte (YB) ist eine Dateneinheit gleich 10²⁴ Bytes (eine Septillion Bytes).
YoY (Year-over-Year)
Year-over-Year (YoY) vergleicht eine Metrik mit dem gleichen Zeitraum im Vorjahr (z.B. Jan 2026 vs Jan 2025).
YTD (Year-to-Date)
Year-to-Date (YTD) misst Performance vom Beginn des aktuellen Jahres bis heute.
Yule-Simpson-Paradoxon
Das Yule-Simpson-Paradoxon (oft Simpson's Paradoxon genannt) tritt auf, wenn ein Trend in mehreren Gruppen erscheint, aber sich umkehrt oder verschwindet, wenn die Gruppen kombiniert werden.
Z
Z-Index
z-index ist eine CSS-Property, die die Stacking-Reihenfolge überlappender Elemente auf einer Webseite kontrolliert (welche Ebene oben erscheint).
Z-Layer Architecture
Z-Layer Architecture ist ein informeller Begriff, den Teams verwenden, um geschichtete Stacks zu beschreiben, bei denen jede Schicht eine spezifische Verantwortung hat (UI → API Gateway → Policy → Orchestration → Tools/Data).
Z-Order Curve
Eine Z-Order Curve (Morton Order) ist eine raumfüllende Kurve, die multidimensionale Daten in eine eindimensionale Ordnung abbildet und dabei Lokalität bewahrt.
Z-Ordering
Z-Ordering ist die Praxis, gespeicherte Daten physisch mit Z-Order-Curves zu organisieren, sodass verwandte Werte auf der Disk kolokiert sind.
Z-Score
Ein Z-Score ist die Anzahl der Standardabweichungen, die ein Datenpunkt vom Mittelwert entfernt ist.
Z-Test
Ein Z-Test ist ein statistischer Hypothesentest, um zu bestimmen, ob ein Stichproben-Mittelwert von einem bekannten Populations-Mittelwert abweicht (oder ob zwei Mittelwerte unterschiedlich sind) unter bestimmten Annahmen.
Zeitkomplexität
Zeitkomplexität beschreibt, wie die Laufzeit eines Algorithmus mit wachsender Eingabegröße zunimmt, oft ausgedrückt mit Big-O-Notation (z.B. O(log n), O(n), O(n²)).
Zeitreihe
Sequenz von Datenpunkten, die in zeitlicher Reihenfolge geordnet sind.
Zeitreihenanalyse
Analyse von Datenpunkten, die über Zeit gesammelt wurden, um Muster zu erkennen.
ZeRO (Zero Redundancy Optimizer)
ZeRO ist eine Reihe von Techniken zum effizienten Training sehr großer Modelle durch Partitionierung von Optimizer-States, Gradienten und Parametern über Geräte – Reduzierung von Memory-Redundanz.
ZeRO (Zero Redundancy Optimizer)
Eine Memory-Optimierung für verteiltes Training, die Optimizer-States, Gradienten und Parameter über GPUs sharded statt repliziert – ermöglicht Training von Billionen-Parameter-Modellen.
Zero Trust
Zero Trust ist ein Sicherheitsmodell, das kein implizites Vertrauen annimmt – jede Anfrage muss authentifiziert, autorisiert und kontinuierlich evaluiert werden, unabhängig vom Netzwerk-Standort.
Zero-Click Content
Inhalte, die ihre Kernbotschaft direkt in der Suchergebnis- oder KI-Antwort vermitteln, ohne dass ein Klick auf die Quelle nötig ist.
Zero-Click Search
Suchanfragen, bei denen der Nutzer die Antwort direkt in den Suchergebnissen erhält – ohne auf eine Website zu klicken.
Zero-Day Vulnerability
Eine Zero-Day Vulnerability ist eine Sicherheitslücke, die dem Vendor unbekannt ist oder für die zum Zeitpunkt der Ausnutzung kein Patch verfügbar ist.
Zero-ETL
Zero-ETL bezieht sich auf Architekturen, die traditionelle ETL-Pipelines minimieren oder eliminieren, indem sie Near-Direct-Data-Access/Replication zwischen Systemen mit niedrigem operationellem Overhead ermöglichen.
Zero-Knowledge Proof (ZKP)
Ein Zero-Knowledge Proof (ZKP) ist eine kryptographische Methode, die einer Partei erlaubt zu beweisen, dass eine Aussage wahr ist, ohne die zugrundeliegenden Daten preiszugeben.
Zero-Party Data
Zero-Party Data sind Daten, die ein Kunde absichtlich und proaktiv mit einer Marke teilt (Präferenzen, Absichten, Ziele), anstatt inferiert oder getrackt zu werden.
Zero-Shot Classification
Zero-Shot Classification weist Text Labels zu, ohne einen aufgabenspezifischen Klassifikator zu trainieren, meist durch natürlichsprachige Label-Beschreibungen.
Zero-Shot Learning
Die Fähigkeit eines KI-Modells, Aufgaben auszuführen oder Klassen zu erkennen, für die es während des Trainings keine expliziten Beispiele gesehen hat.
Zero-Shot Prompting
Zero-Shot Prompting ist das Prompting eines Modells mit Anweisungen und Einschränkungen ohne explizite Beispiele.
Zero-Shot vs Few-Shot
Zero-Shot verwendet keine Beispiele; Few-Shot inkludiert eine kleine Anzahl von Beispielen im Prompt, um das Verhalten zu steuern.
Zettabyte
Ein Zettabyte (ZB) ist eine Dateneinheit gleich 10²¹ Bytes.
Zettelkasten
Zettelkasten ist eine Wissensmanagement-Methode basierend auf atomaren Notizen und dichter Verlinkung zwischen Ideen, um einen skalierbaren "Wissensgraph" von Konzepten aufzubauen.
Zipf's Law
Zipf's Law beschreibt, wie in vielen natürlichen Datensätzen (Sprache, Queries) einige wenige Items extrem häufig sind, während die meisten selten sind (Long-Tail-Verteilung).
Zipping Artifacts
Zipping Artifacts bündelt Dateien (Models, Configs, Logs, Datasets, Build-Outputs) in ein komprimiertes Archiv für Storage, Transport oder Deployment.
ZK-SNARK
ZK-SNARK ist ein Typ von Zero-Knowledge Proof, der darauf ausgelegt ist, prägnant und effizient verifizierbar zu sein.
ZK-STARK
ZK-STARK ist ein Typ von Zero-Knowledge Proof, der darauf ausgelegt ist, transparent (kein Trusted Setup) und skalierbar zu sein, oft mit anderen Performance-Tradeoffs als SNARKs.
ZKML (Zero-Knowledge Machine Learning)
ZKML bezieht sich auf die Anwendung von Zero-Knowledge Proof-Techniken auf Machine Learning, sodass Eigenschaften über ML-Inferenz/Training bewiesen werden können, ohne sensitive Inputs oder Model-Interna preiszugeben.
Zod
Zod ist eine TypeScript-first Schema-Validierungsbibliothek zur Definition und Validierung von Datenstrukturen zur Runtime.
Zombie Process
Ein Zombie Process ist ein Prozess, der die Ausführung beendet hat, aber noch einen Eintrag in der Prozesstabelle hat, weil sein Parent seinen Exit-Status nicht gereapt hat.
Zonal vs Regional Services
Zonale Services operieren innerhalb einer einzelnen Availability Zone; regionale Services spannen mehrere Zones innerhalb einer Region.
Zone Redundancy
Zone Redundancy ist das Deployen von Services über mehrere Availability Zones, um resilient zu bleiben, wenn eine Zone ausfällt oder degradiert.
ZooKeeper (Apache ZooKeeper)
Apache ZooKeeper ist ein Distributed-Coordination-Service für Configuration-Management, Leader-Election und Distributed Locks.
Zstandard (zstd)
Zstandard (zstd) ist ein schneller Kompressionsalgorithmus, der hohe Kompressionsraten mit niedrigem CPU-Overhead bietet.
ZTNA (Zero Trust Network Access)
ZTNA ist ein Zero-Trust-Ansatz zur Gewährung von Netzwerkzugang basierend auf Identität und Kontext, oft als Ersatz für Legacy-VPN-Muster mit App-Level-Zugriffskontrollen.