Skip to main content
    Zum Hauptinhalt springenZur Navigation springenZur Fußzeile springen
    Künstliche Intelligenz

    KI-Begriffe A-Z

    Entdecken Sie die wichtigsten Begriffe der Künstlichen Intelligenz – von Machine Learning über Deep Learning bis hin zu Large Language Models. Jeder Begriff wird verständlich erklärt und mit praktischen Beispielen aus dem Marketing illustriert.

    Machine Learning
    Deep Learning
    Large Language Models
    Neural Networks
    Prompt Engineering
    Computer Vision
    1020 Begriffe in Künstliche Intelligenz

    A

    A*-Suche (A-Star Search)

    A* (sprich: "A-Stern") ist ein klassischer Suchalgorithmus, der den kürzesten Pfad zwischen einem Start- und Zielknoten in einem Graphen findet, indem er pro Knoten die Gesamtkosten f(n) = g(n) + h(n) minimiert — die Summe aus tatsächlichen Pfadkosten und einer geschätzten Restdistanz (Heuristik).

    Abductive Logic Programming (ALP)

    Ein Framework in der logischen Programmierung, das bestimmte Prämissen unspezifiziert lässt und plausible Erklärungen für Beobachtungen ableitet.

    Abduktives Schlussfolgern

    Eine Form der logischen Schlussfolgerung, die von einer Beobachtung ausgeht und die einfachste und wahrscheinlichste Erklärung dafür sucht.

    Ablation

    In der KI-Forschung bezeichnet Ablation das Entfernen oder Deaktivieren einer Komponente eines Systems, um deren Auswirkung auf die Gesamtleistung zu bewerten.

    Accountability

    Die Verpflichtung, Verantwortung für KI-Entscheidungen zu übernehmen und deren Auswirkungen erklären zu können.

    Active Learning

    ML-Strategie, bei der das Modell die informativsten Samples zum Labeln auswählt.

    Actor-Critic

    RL-Architektur mit zwei Komponenten: ein Actor (Policy) wählt Aktionen, ein Critic (Value Function) bewertet sie – kombiniert Stärken von Policy Gradient und Value-Based Methods.

    Adafactor

    Memory-effizienter Optimizer, der Adams zweiten Moment durch eine faktorisierte Approximation ersetzt – spart bis zu 50% Optimizer-Memory.

    AdaGrad

    Optimizer, der die Lernrate pro Parameter adaptiv anpasst – häufig aktualisierte Parameter erhalten kleinere Raten, seltene größere.

    Adam Optimizer

    Adaptiver Optimierungsalgorithmus mit Momentum und adaptiven Lernraten.

    AdamW

    Korrigierte Variante des Adam-Optimizers, die Weight Decay vom Gradientenupdate entkoppelt – der De-facto-Standard für LLM- und Transformer-Training.

    Adaptiver Algorithmus

    Ein Algorithmus, der sein Verhalten oder seine Parameter als Reaktion auf die Probleminstanz oder Umgebung während der Ausführung ändert.

    Adaptives Lernen

    Eine Bildungsmethodik (oft mit KI implementiert), die Lerninhalte und -tempo an die individuellen Bedürfnisse und Leistungen jedes Lernenden anpasst.

    Adaptives Neuro-Fuzzy-Inferenzsystem (ANFIS)

    Ein hybrides System, das neuronale Netze und Fuzzy-Logik kombiniert, um aus Daten zu lernen und dabei menschenähnliches Reasoning anzuwenden.

    Admissible Heuristik (Admissible Heuristic)

    Eine Heuristik h(n) heißt admissible (zulässig), wenn sie die tatsächlichen Restkosten vom Knoten n bis zum Ziel niemals überschätzt — sie liefert also stets eine optimistische untere Schranke. Diese Eigenschaft garantiert, dass Suchalgorithmen wie A* einen optimalen Pfad finden.

    Adversarial Attacks

    Gezielte Manipulationen von Inputs, die KI-Systeme zu Fehlklassifikationen oder falschem Verhalten bringen.

    Adversarielle Robustheit

    Die Fähigkeit eines ML-Modells, korrekte Vorhersagen zu liefern, auch wenn Eingaben gezielt manipuliert werden.

    Agent Handoff

    Der Prozess, bei dem ein KI-Agent eine Aufgabe an einen anderen spezialisierten Agenten oder an einen Menschen weitergibt.

    Agent Loop

    Der iterative Zyklus eines KI-Agenten: Beobachten → Denken → Handeln → Ergebnis bewerten → Wiederholen, bis das Ziel erreicht ist.

    Agent Memory

    Systeme zur Speicherung von Informationen, die KI-Agenten über das Kontextfenster hinaus nutzen können – von Kurzzeit-Scratchpads bis zu persistenten Wissensspeichern.

    Agent Swarms

    Ein System aus mehreren spezialisierten KI-Agenten, die autonom zusammenarbeiten, Aufgaben untereinander verteilen und koordiniert komplexe Ziele erreichen – inspiriert von Schwarmverhalten in der Natur.

    AgentBench

    Ein Benchmark zur Bewertung von LLM-Agenten in 8 verschiedenen interaktiven Umgebungen wie Webseiten, Datenbanken, Spielen und Operating Systems.

    Agenten-Architektur

    Die zugrunde liegende Struktur und Komponenten eines intelligenten Agentensystems, die beschreibt, wie der Agent intern organisiert ist.

    Agentic AI

    KI-Systeme, die autonom Ziele verfolgen, Entscheidungen treffen, Tools nutzen und mehrstufige Aufgaben ohne kontinuierliche menschliche Anleitung ausführen können.

    Agentic Coding

    Ein Paradigma, bei dem KI-Agenten autonom Code schreiben, testen, debuggen und iterieren – mit minimaler menschlicher Intervention.

    Agentic RAG

    Agentic RAG ist eine Weiterentwicklung von Retrieval-Augmented Generation, bei der ein KI-Agent dynamisch entscheidet, wann, welche und wie viele Quellen er abfragt — anstatt einer starren Retrieval-Pipeline mit fester Top-k-Vektorsuche zu folgen.

    AI Agent (KI-Agent)

    Ein autonomes Software-System, das KI nutzt, um Aufgaben selbstständig zu planen und auszuführen.

    AI Agents

    Autonome AI-Systeme, die selbstständig Ziele verfolgen, Pläne erstellen, Tools nutzen und mit der Umgebung interagieren – über einfache Prompt-Response hinaus.

    AI Agents für Search

    Autonome AI-Systeme, die komplexe Recherchen durchführen – mehrere Quellen durchsuchen, synthetisieren, Schlüsse ziehen.

    AI Alignment

    Das Forschungsfeld und die Praxis, KI-Systeme so zu entwickeln, dass sie menschliche Werte, Absichten und Ziele verstehen und zuverlässig verfolgen.

    AI Art

    Visuelle Kunst, die ganz oder teilweise durch KI-Systeme erstellt wird – von Prompt-basierter Bildgenerierung bis zu interaktiven Installationen.

    AI Avatare

    Computergenerierte, fotorealistische digitale Menschen, die per KI animiert werden und beliebige Inhalte präsentieren können.

    AI Code Review

    KI-gestützte automatische Überprüfung von Code-Änderungen auf Bugs, Sicherheitslücken, Best Practices und Stil.

    AI Coding Assistants

    KI-gestützte Tools, die Entwickler bei der Programmierung unterstützen – von Autocomplete über Code-Generierung bis hin zu kompletten Feature-Implementierungen.

    AI Debugging

    Die Nutzung von KI zur automatischen Identifikation, Analyse und Behebung von Software-Fehlern.

    AI Discovery

    AI-Systeme, die proaktiv relevante Inhalte, Produkte oder Informationen empfehlen – ohne explizite Suchanfrage.

    AI Ethics

    Das interdisziplinäre Feld, das moralische Prinzipien, Werte und Richtlinien für die Entwicklung, den Einsatz und die Auswirkungen von KI-Systemen auf Gesellschaft und Individuen untersucht.

    AI Safety

    Das Forschungsfeld, das sich damit beschäftigt, KI-Systeme sicher, kontrollierbar und im Einklang mit menschlichen Werten zu gestalten.

    AI Search

    Suchmaschinen, die LLMs nutzen, um Anfragen zu verstehen und direkte Antworten statt Link-Listen zu liefern.

    AI Slop

    Abwertender Begriff für minderwertige, massenhaft produzierte KI-generierte Inhalte, die das Internet überschwemmen und keinen echten Mehrwert bieten.

    AI Watermarking

    Techniken zum Einbetten unsichtbarer Markierungen in KI-generierte Inhalte, um deren Herkunft nachweisen und Deepfakes erkennen zu können.

    AI-Audit

    Die unabhängige Prüfung von KI-Systemen auf Fairness, Bias, Sicherheit, Compliance und Performance durch externe oder interne Auditoren.

    AI-Copyright

    Die rechtliche Frage, wem Urheberrechte an KI-generierten Inhalten zustehen und wie Trainingsdaten-Nutzung legal einzuordnen ist.

    AI-Haftung

    Die rechtliche Verantwortung für Schäden, die durch KI-Systeme verursacht werden, und die Frage, wer haftet: Entwickler, Betreiber oder Nutzer.

    AI-Regulierung

    Die Gesamtheit gesetzlicher Vorschriften und Richtlinien, die Entwicklung, Einsatz und Auswirkungen von KI-Systemen regeln.

    AI-Risikomanagement

    Die systematische Identifikation, Bewertung und Steuerung von Risiken, die durch KI-Systeme entstehen können.

    AI-Transparenz

    Die Offenlegung, wie KI-Systeme funktionieren, trainiert wurden und Entscheidungen treffen, sowie die Kennzeichnung KI-generierter Inhalte.

    Aider Polyglot Benchmark

    Coding-Benchmark, der LLMs auf realen Multi-File-Edits in mehreren Programmiersprachen testet.

    Aktionsauswahl

    Der Prozess, durch den ein intelligenter Agent entscheidet, welche Aktion als nächstes ausgeführt werden soll.

    Aktionsmodell-Lernen

    Ein Machine-Learning-Ansatz, der einem KI-Agenten ermöglicht, die Ergebnisse und Anforderungen seiner Aktionen in einer Umgebung zu lernen.

    Aktionssprache

    Eine formale Sprache zur Beschreibung von Zustandsänderungen in einem System – wie Aktionen den Zustand der Welt über die Zeit beeinflussen.

    Aktivierungsfunktion

    Eine mathematische Funktion in neuronalen Netzen, die den Output eines Neurons basierend auf seinen Inputs bestimmt.

    Algorithmic Impact Assessment

    Systematische Bewertung der potenziellen Auswirkungen eines algorithmischen Systems auf Individuen, Gruppen und die Gesellschaft vor und während des Einsatzes.

    Algorithmische Effizienz (Algorithmic Efficiency)

    Algorithmische Effizienz misst, wie sparsam ein Algorithmus mit Rechenzeit, Speicher und Energie umgeht – typischerweise ausgedrückt in Big-O-Notation für Skalierungsverhalten.

    Algorithmische Wahrscheinlichkeit

    Ein theoretisches Maß, das einer Beobachtung eine Wahrscheinlichkeit zuweist, basierend auf allen möglichen Algorithmen, die diese Beobachtung erzeugen könnten.

    ALiBi (Attention with Linear Biases)

    Eine Methode zur Positionskodierung, die lineare Biases direkt auf Attention-Scores addiert, statt Position-Embeddings zu lernen.

    Alignment

    Das Problem sicherzustellen, dass KI-Systeme die beabsichtigten Ziele und Werte ihrer Entwickler und der Gesellschaft verfolgen.

    Alignment Tax

    Die Performance-Einbußen, die durch Alignment- und Safety-Training entstehen – ein Modell wird sicherer, aber möglicherweise weniger fähig.

    Alpha-Beta Pruning

    Eine Optimierungstechnik für den Minimax-Algorithmus, die Teile des Spielbaums abschneidet, ohne das Ergebnis zu ändern.

    Ameisenkolonie-Optimierung

    Eine probabilistische Optimierungstechnik, inspiriert vom Verhalten von Ameisen bei der Futtersuche und ihrer Nutzung von Pheromonspuren.

    Anchor Box

    Vordefinierte Bounding Boxes verschiedener Größen und Seitenverhältnisse, die als Startpunkte für Objekterkennung dienen.

    Anthropic

    Ein KI-Sicherheitsunternehmen, gegründet von ehemaligen OpenAI-Forschern, bekannt für Claude – einen der fortschrittlichsten LLMs mit Fokus auf Sicherheit und Ehrlichkeit.

    Anytime-Algorithmus (Anytime Algorithm)

    Ein Anytime-Algorithmus ist ein Algorithmus, der nach jeder Zwischenstufe eine valide, wenn auch noch nicht optimale, Lösung zurückliefern kann — und mit zusätzlicher Rechenzeit die Lösungsqualität monoton verbessert.

    Approximationsfehler

    Die Differenz zwischen einem exakten, wahren Wert und einem approximativen Wert, der von einem Algorithmus oder Modell verwendet oder erhalten wird.

    ARC (AI2 Reasoning Challenge)

    Ein Multiple-Choice-Benchmark mit Naturwissenschafts-Fragen auf Grundschul- und Mittelstufenniveau in Easy und Challenge Sets.

    ARC-AGI-2

    Benchmark der ARC Prize Foundation, der die generelle Reasoning-Fähigkeit von KI-Systemen anhand abstrakter Muster misst.

    Assessment

    Assessment ist die Messung von Wissen, Skills oder Performance – verwendet um aktuelle Fähigkeiten zu diagnostizieren, Feedback zu geben und Lernergebnisse zu zertifizieren.

    Attention Mechanism

    Ein neuronaler Netzwerk-Mechanismus, der es Modellen ermöglicht, sich dynamisch auf relevante Teile der Eingabe zu "konzentrieren" – die Schlüsselinnovation hinter modernen LLMs.

    Attention Pooling

    Attention Pooling aggregiert eine Sequenz von Vektoren zu einem einzigen Repräsentationsvektor, indem gelernten Attention-Gewichten den wichtigsten Elementen mehr Bedeutung gegeben wird.

    Attention Sink

    Ein Phänomen in LLMs, bei dem das erste Token (BOS) unverhältnismäßig hohe Attention erhält, auch wenn es semantisch irrelevant ist.

    Attributioneller Kalkül

    Ein logisches Framework, das Prädikatenlogik mit mehrwertiger (Fuzzy-)Logik kombiniert, um Attribute von Entitäten lesbar darzustellen.

    Audio Deepfake

    KI-generierte Audioaufnahmen, die eine echte Person täuschend echt imitieren und für Betrug, Fehlinformation oder Manipulation genutzt werden können.

    Audio Generation

    Die Erzeugung von Audio-Inhalten durch KI-Modelle – von Musik über Soundeffekte bis hin zu Sprache und Ambient-Sounds.

    Audio Language Models

    KI-Modelle, die Audio direkt verstehen und generieren können – von Spracherkennung über Musik-Analyse bis hin zu natürlicher Sprachgenerierung mit Emotionen und Intonation.

    Autoencoder

    Ein neuronales Netzwerk, das eine komprimierte Repräsentation (Encoding) von Eingabedaten lernt und die Originaldaten daraus rekonstruiert.

    AutoGPT

    Ein experimentelles Open-Source-Projekt, das GPT-4 autonom Ziele verfolgen lässt – Pionier der Agentic AI-Bewegung.

    Automatisiertes Machine Learning (AutoML)

    Der Prozess der Automatisierung des End-to-End-Prozesses der Anwendung von Machine Learning, einschließlich Datenvorverarbeitung, Modellauswahl und Hyperparameter-Tuning.

    Automatisiertes Planen (Automated Planning)

    Automatisiertes Planen ist das KI-Teilgebiet, das Algorithmen entwickelt, um aus einem Startzustand, einem Zielzustand und einer Menge möglicher Aktionen automatisch eine Sequenz von Aktionen (einen Plan) zu finden, die das Ziel erreicht.

    AutoML

    AutoML automatisiert Teile des Machine-Learning-Lifecycles wie Modellselektion, Feature-Preprocessing, Hyperparameter-Tuning und Validierung.

    Autonomes Fahren

    Der Einsatz von KI-Systemen zur vollständigen oder teilweisen Steuerung von Fahrzeugen ohne menschliches Eingreifen, klassifiziert in SAE Level 0-5.

    Autonomous Agent

    Ein KI-Agent, der ohne menschliche Eingriffe Ziele verfolgt, Entscheidungen trifft und Aktionen ausführt – der höchste Autonomie-Level.

    Autoregressives Modell

    Ein autoregressives Modell generiert Sequenzen Token für Token, wobei jeder neue Token von allen vorherigen abhängt – die Architektur hinter GPT, LLaMA und allen modernen LLMs.

    B

    Backpropagation

    Ein Algorithmus zur Berechnung von Gradienten in neuronalen Netzen, der die Fehler rückwärts durch das Netz propagiert, um Gewichte anzupassen.

    Backtracking

    Eine algorithmische Technik, die systematisch alle möglichen Lösungen durchsucht und bei Sackgassen zum letzten Entscheidungspunkt zurückkehrt.

    Bag of Words (BoW)

    Einfachste Textrepräsentation, die einen Text als ungeordnete Menge von Wörtern mit Häufigkeiten darstellt.

    Bagging

    Ein Ensemble-Lernverfahren, das mehrere Modelle auf Bootstrap-Samples trainiert und deren Vorhersagen aggregiert.

    Bandit-basierte Empfehlung

    Empfehlungssysteme, die Multi-Armed Bandits nutzen, um Exploration neuer Items mit Exploitation bekannter Präferenzen zu balancieren.

    Batch Normalization

    Eine Normalisierungstechnik, die Aktivierungen in neuronalen Netzen über Mini-Batches normalisiert – stabilisiert Training und ermöglicht höhere Learning Rates.

    Batch Size

    Anzahl der Trainingsbeispiele pro Gradient-Update.

    Bayessche Optimierung

    Bayessche Optimierung ist ein Ansatz zur Optimierung teurer Black-Box-Funktionen (z.B. Modell-Hyperparameter) mittels eines probabilistischen Surrogatmodells und einer Acquisition-Funktion.

    Beam Search

    Beam Search ist ein heuristischer Suchalgorithmus, der pro Suchschritt nur die k besten Teil-Lösungen ("Beam Width") weiterverfolgt — ein Kompromiss zwischen erschöpfender Breitensuche (hohe Qualität, hoher Aufwand) und Greedy-Suche (niedrige Qualität, niedriger Aufwand).

    Behavioral AI

    AI-Systeme, die Nutzerverhalten analysieren, Muster erkennen und zukünftige Aktionen prognostizieren.

    BERT

    BERT (Bidirectional Encoder Representations from Transformers) ist ein von Google entwickeltes Sprachmodell, das Text bidirektional verarbeitet und tiefes Kontextverständnis ermöglicht.

    BERT (Google)

    Googles Transformer-Modell für bidirektionales Sprachverständnis.

    BERTScore

    Eine semantische Evaluationsmetrik, die BERT-Embeddings nutzt, um Ähnlichkeit zwischen generiertem und Referenztext zu messen.

    BGE Embedding

    BGE (BAAI General Embedding) ist eine Familie von Open-Source-Embedding-Modellen der Beijing Academy of AI, die Top-Ergebnisse auf MTEB erreichen.

    Bi-Encoder

    Eine Encoder-Architektur, die Query und Dokument unabhängig voneinander in Embeddings transformiert – ermöglicht schnelle Ähnlichkeitssuche über vorberechnete Vektoren.

    Bias (KI)

    Systematische Verzerrungen in KI-Systemen, die zu unfairen oder diskriminierenden Ergebnissen für bestimmte Personengruppen führen, oft verursacht durch unausgewogene Trainingsdaten oder fehlerhafte Annahmen.

    Bias-Varianz-Tradeoff

    Fundamentaler Tradeoff: einfache Modelle haben hohen Bias (Underfitting), komplexe hohe Varianz (Overfitting).

    BIG-Bench

    Ein kollaborativer Benchmark mit 200+ Tasks, erstellt von 400+ Forschern, um LLM-Fähigkeiten jenseits existierender Benchmarks zu testen.

    Bildgenerierung

    Image Generation ist die automatische Erstellung von Bildern durch KI-Modelle basierend auf Text-Prompts, anderen Bildern oder anderen Inputs.

    Bildklassifikation

    Die Zuordnung eines gesamten Bildes zu einer oder mehreren vordefinierten Kategorien durch ein ML-Modell.

    Bildsegmentierung

    Die Aufteilung eines Bildes in bedeutungsvolle Regionen oder Objekte auf Pixelebene.

    Bing Copilot

    Microsofts AI-gestützte Suchmaschine, die GPT-4 mit Bing-Suche kombiniert – integriert in Windows, Edge, Office.

    BLEU Score

    Metrik zur automatischen Bewertung von Übersetzungsqualität.

    Boosting

    Ein Ensemble-Lernverfahren, das schwache Lerner sequenziell kombiniert, um einen starken Klassifikator zu erstellen.

    Bootstrapping

    Statistische Resampling-Methode, die wiederholt Stichproben mit Zurücklegen aus dem Datensatz zieht.

    BPE (Byte Pair Encoding)

    Subword-Tokenisierungsalgorithmus, der häufige Zeichenpaare iterativ zusammenfasst, um ein optimales Vokabular zu erstellen.

    Breitensuche (BFS)

    Breitensuche (BFS) durchläuft einen Graphen Ebene für Ebene und erkundet alle Nachbarn eines Knotens, bevor sie tiefer geht.

    C

    Causal Masking (Kausale Maskierung)

    Causal Masking verhindert, dass Tokens auf zukünftige Positionen zugreifen – die Technik, die autoregressive Generierung in Decodern wie GPT ermöglicht.

    CER (Character Error Rate)

    Metrik für Spracherkennung und OCR auf Zeichenebene.

    Certified Defense

    Verteidigungsmethoden gegen adversariale Angriffe, die mathematisch beweisbare Robustheitsgarantien bieten.

    Chain of Thought

    Prompting-Technik und Modell-Fähigkeit, bei der das Modell seinen Denkprozess explizit in Zwischenschritten ausformuliert, bevor es zur finalen Antwort kommt.

    Chain-of-Thought Prompting

    Eine Prompting-Technik, die LLMs dazu bringt, ihre Gedanken schrittweise darzulegen, bevor sie eine finale Antwort geben – was zu deutlich besseren Ergebnissen bei komplexen Aufgaben führt.

    Chatbot

    Ein Softwareprogramm, das Konversationen mit Menschen simuliert, typischerweise über Text- oder Sprachschnittstellen.

    Chatbot Arena

    Ein öffentliches Elo-basiertes Leaderboard, bei dem User blind zwischen zwei LLMs wählen – der wichtigste Benchmark für LLM-Ranking.

    ChatGPT

    Ein konversationelles KI-System, das auf großen Sprachmodellen basiert und menschenähnliche Antworten auf Benutzeranfragen generiert.

    ChatGPT Agent

    Autonomer Modus von ChatGPT, der mehrstufige Aufgaben im Browser, in Apps und in Dateien selbstständig ausführt.

    Chinchilla Optimal

    Die Erkenntnis, dass für compute-optimales LLM-Training die Anzahl der Trainings-Tokens proportional zur Parameterzahl skalieren sollte.

    Chunking

    Die Aufteilung großer Dokumente in kleinere, semantisch kohärente Textabschnitte für effizientes Embedding und Retrieval in RAG-Systemen.

    CIDEr

    Eine Metrik für Image Captioning, die TF-IDF-gewichtete N-Gram-Ähnlichkeit misst.

    Classifier-Free Guidance (CFG)

    Classifier-Free Guidance steuert, wie stark ein Diffusionsmodell dem Text-Prompt folgt – höhere Werte erzeugen prompttreuere, aber potenziell überzeichnete Bilder.

    Claude

    Anthropics Familie von LLMs, bekannt für lange Kontextfenster, nuancierte Antworten und einen Fokus auf Sicherheit und Ehrlichkeit.

    Claude Computer Use

    Fähigkeit von Claude, einen Desktop-Computer zu bedienen: Maus, Tastatur, Screenshots und Anwendungen wie ein menschlicher Nutzer.

    Claude Cowork

    Kollaborativer Multi-User-Modus von Claude für gemeinsame Projektarbeit mit geteiltem Kontext und Rollenverteilung.

    Claude Design

    Visueller Design-Modus von Claude für UI-Mockups, Brand-Asset-Generierung und Layout-Iteration über natürliche Sprache.

    Claude Haiku

    Anthropics schnellstes und kostengünstigstes KI-Modell, optimiert für Geschwindigkeit und Volumen bei Aufgaben wie Klassifikation, Chatbots und Echtzeit-Verarbeitung.

    Claude Opus

    Anthropics leistungsstärkstes und teuerstes KI-Modell, konzipiert für komplexe Analyse, strategische Planung und Aufgaben, die höchste kognitive Tiefe erfordern.

    Claude Opus 4.6

    Anthropics Flaggschiff-LLM 2026 mit erweitertem Reasoning, 1M-Token-Kontext und nativen Computer-Use-Fähigkeiten.

    Claude Skills

    Modulares System von Anthropic, das wiederverwendbare Fähigkeiten (Prompt + Tools + Daten) für Claude bündelt.

    Claude Sonnet

    Anthropics ausgewogenes KI-Modell, das optimale Balance zwischen Qualität, Geschwindigkeit und Kosten bietet – der Allrounder der Claude-Familie.

    CLIP (Contrastive Language–Image Pretraining)

    Ein multimodaler Modellansatz, der abgestimmte Repräsentationen von Bildern und Text lernt durch Training auf passenden Bild-Text-Paaren.

    Clustering

    Eine unüberwachte Lerntechnik, die Datenpunkte so in Gruppen (Cluster) einteilt, dass Elemente im selben Cluster ähnlicher zueinander sind.

    Code-Generierung

    Die automatische Erstellung von Programmcode durch KI-Modelle basierend auf natürlichsprachlichen Beschreibungen, Beispielen oder partiellen Code-Snippets.

    Codex 5.3

    OpenAIs spezialisiertes Coding-Modell 2026 für agentische Software-Entwicklung und Long-Running-Tasks in Repositories.

    Cohere

    Ein Enterprise-fokussiertes KI-Unternehmen, das auf RAG, Embeddings und mehrsprachige LLMs spezialisiert ist.

    Cohere Embed

    Coheres kommerzielle Embedding-API mit spezieller Optimierung für Retrieval und Unterscheidung zwischen Query- und Document-Embeddings.

    ColBERT

    ColBERT ist eine Late-Interaction-Retrieval-Architektur, die Token-Level-Embeddings für Query und Dokument erstellt und erst bei der Suche durch MaxSim aggregiert.

    Cold-Start-Problem

    Das Problem, wenn ein System unzureichende Daten über einen neuen Nutzer, ein neues Item oder einen neuen Kontext hat.

    ComfyUI

    ComfyUI ist ein visueller, node-basierter Workflow-Editor für Stable Diffusion und andere Diffusionsmodelle – der professionelle Standard für komplexe Bildgenerierungs-Pipelines.

    Command R

    Coheres RAG-optimiertes Sprachmodell, speziell für Enterprise-Retrieval, mehrsprachige Anwendungen und Tool-Use entwickelt.

    Computer Vision

    Das KI-Teilgebiet, das Computern das Verstehen und Interpretieren visueller Informationen ermöglicht.

    Conditional Generation

    Conditional Generation erzeugt Outputs basierend auf Bedingungen wie Text, Klasse, Bild oder anderen Steuerungssignalen.

    Conformal Prediction

    Ein framework-agnostisches Verfahren, das Vorhersagen mit garantierten Konfidenzintervallen liefert, ohne Annahmen über die Modellverteilung.

    Consistency Model

    Consistency Models generieren Bilder in einem oder wenigen Schritten, indem sie lernen, von jedem Punkt auf der Diffusionsbahn direkt zum Ergebnis zu springen.

    Constitutional AI

    Ein von Anthropic entwickelter Ansatz, bei dem KI-Systeme anhand einer Reihe von ethischen Prinzipien ("Verfassung") trainiert werden, um sich selbst zu korrigieren und schädliche Outputs zu vermeiden.

    Content Filter

    Systeme, die KI-Inputs und -Outputs auf unerwünschte Inhalte prüfen und blockieren.

    Content-Based Filtering

    Empfehlungen basierend auf Eigenschaften von Items, die ein Nutzer mochte.

    Context Engineering

    Die Praxis des Designs, der Auswahl und Strukturierung der Informationen, die ein LLM erhält, um zuverlässigere und relevantere Outputs zu erzeugen.

    Context Window

    Die maximale Menge an Text (gemessen in Tokens), die ein KI-Sprachmodell gleichzeitig verarbeiten und "im Gedächtnis" behalten kann – je größer, desto mehr Kontext kann berücksichtigt werden.

    Contextual Bandit

    Ein Entscheidungsalgorithmus, der unter Nutzung aktueller Kontextmerkmale zwischen Aktionen wählt, während er aus Feedback lernt.

    Continual Learning

    Die Fähigkeit eines ML-Modells, kontinuierlich aus neuen Daten zu lernen, ohne zuvor gelerntes Wissen zu vergessen – das "Lifelong Learning"-Problem der KI.

    Continuous Batching

    Eine Serving-Technik, die neue Requests in laufende Batches einfügt, sobald andere Requests abgeschlossen sind, statt auf Batch-Completion zu warten.

    Contrastive Learning

    Ein Ansatz zum Repräsentationslernen, der Modelle trainiert, ähnliche Paare näher zusammen und unähnliche Paare weiter auseinander im Embedding-Raum zu platzieren.

    ControlNet

    ControlNet ist eine neuronale Netzwerkarchitektur, die zusätzliche Bedingungen (Kanten, Pose, Tiefe) zu Diffusionsmodellen hinzufügt, um präzise Kontrolle über die Bildgenerierung zu ermöglichen.

    Conversational AI

    Conversational AI bezeichnet KI-Systeme, die natürliche, menschenähnliche Gespräche über Text oder Sprache führen können – von Chatbots bis zu Voice Agents.

    Conversational Search

    Conversational Search ermöglicht die Informationssuche durch natürliche Dialoge statt starrer Keywords – die Zukunft von Suchmaschinen und Enterprise Search.

    Convolutional Neural Network (CNN)

    Eine neuronale Netzwerkarchitektur, die Faltungsoperationen nutzt, um hierarchische Feature-Repräsentationen aus Bildern zu lernen.

    Cosine Annealing

    Eine Learning-Rate-Schedule-Strategie, die die Lernrate gemäß einer Kosinuskurve von einem Maximalwert sanft auf nahe Null absenkt.

    Cross-Attention

    Cross-Attention berechnet Attention zwischen zwei verschiedenen Sequenzen – z.B. zwischen Text-Conditioning und Bildgenerierung in Diffusionsmodellen.

    Cross-Encoder

    Eine Encoder-Architektur, die Query und Dokument gemeinsam verarbeitet und einen Relevanz-Score ausgibt – präziser als Bi-Encoder, aber langsamer.

    Cross-Entropy Loss

    Verlustfunktion für Klassifikationsaufgaben basierend auf Informationstheorie.

    CTC (Connectionist Temporal Classification)

    CTC ist ein Training-Algorithmus für Sequenz-zu-Sequenz-Probleme, bei denen Input und Output unterschiedliche Längen haben – der Schlüssel zu modernem ASR.

    Curriculum Learning

    Trainingsstrategie, bei der Samples in einer sinnvollen Reihenfolge präsentiert werden – von einfach zu schwer, ähnlich wie ein Lehrplan.

    Cursor

    Ein AI-nativer Code-Editor (Fork von VS Code), der tiefe KI-Integration für Code-Generierung, Refactoring und natürlichsprachliche Programmierung bietet.

    Custom GPT

    Auf einen spezifischen Use Case zugeschnittener GPT mit eigenem Prompt, Wissensbasis und Tool-Set, gehostet bei OpenAI.

    CutMix

    Data-Augmentation-Technik, die einen rechteckigen Bereich eines Bildes ausschneidet und durch einen Bereich eines anderen Bildes ersetzt.

    Cyclical Learning Rate (CLR)

    Learning-Rate-Schedule, der die LR zyklisch zwischen einem Minimum und Maximum variiert – verhindert Stagnation und hilft, Sattelpunkte zu überwinden.

    D

    DALL-E 3

    OpenAIs neueste Text-zu-Bild-Generation, integriert in ChatGPT, bekannt für präzise Prompt-Befolgung und Text-Rendering.

    Data Leakage

    Situation, in der Informationen aus dem Testset oder der Zukunft ins Training gelangen und unrealistisch gute Ergebnisse erzeugen.

    Data Parallelism

    Die einfachste Form verteilten Trainings: Jede GPU hält eine vollständige Modellkopie und verarbeitet verschiedene Daten-Batches – Gradienten werden synchronisiert.

    Data Poisoning

    Ein Angriff, bei dem manipulierte Daten in den Trainingsprozess eingeschleust werden, um das Modellverhalten gezielt zu beeinflussen.

    Datasheets for Datasets

    Standardisierte Dokumentation für ML-Datensätze, die Herkunft, Zusammensetzung, Erhebungsmethoden, empfohlene Verwendung und bekannte Limitierungen beschreibt.

    Datenerweiterung

    Techniken zur künstlichen Erweiterung von Trainingsdaten durch Transformationen.

    DDIM (Denoising Diffusion Implicit Model)

    DDIM ist ein beschleunigter Sampling-Algorithmus für Diffusionsmodelle, der deterministische Generierung mit deutlich weniger Schritten ermöglicht.

    DDPM (Denoising Diffusion Probabilistic Model)

    DDPM ist das grundlegende Framework für Diffusionsmodelle, das Bilder durch schrittweises Entrauschen aus reinem Rauschen generiert.

    Decoder

    Der Teil eines Modells, der eine komprimierte Repräsentation zurück in das ursprüngliche Format transformiert.

    Decoding-Strategie

    Die Methode, die verwendet wird, um die Token-Wahrscheinlichkeitsverteilung eines Modells in eine tatsächliche Ausgabesequenz umzuwandeln.

    Deduktives Schlussfolgern

    Eine Form der logischen Schlussfolgerung, bei der aus allgemeinen Prämissen spezifische Schlüsse gezogen werden – wenn die Prämissen wahr sind, ist die Konklusion garantiert wahr.

    Deep Compression

    Eine dreistufige Kompressionspipeline (Pruning → Quantization → Huffman Coding), die neuronale Netze um 35-49x komprimieren kann – das Grundlagenwerk der Modellkompression.

    Deep Learning

    Ein Teilgebiet des maschinellen Lernens, das tiefe neuronale Netze mit vielen Schichten nutzt, um komplexe Muster aus Daten zu lernen.

    Deep Reinforcement Learning

    Reinforcement Learning, das tiefe neuronale Netze verwendet, um Policies zu lernen, die Aktionen zur Maximierung langfristiger Belohnungen wählen.

    Deepfake

    Deepfakes sind KI-generierte oder -manipulierte Medien (Video, Audio, Bilder), die Personen zeigen, die etwas tun oder sagen, was nie passiert ist.

    Deepfake-Erkennung

    Technologien und Methoden zur Identifizierung von KI-generierten oder manipulierten Medieninhalten wie Videos, Audios und Bildern.

    DeepSeek

    Chinesisches KI-Startup, das leistungsstarke Open-Source Sprachmodelle entwickelt und mit deutlich geringeren Kosten mit westlichen Anbietern konkurriert.

    DeepSeek R1

    Ein Open-Source Reasoning-Modell von DeepSeek, das bei komplexen Denk- und Coding-Aufgaben mit GPT-4 und Claude konkurriert.

    DeepSeek V4

    Open-Weight-Flaggschiff von DeepSeek, das mit 1/10 der Trainingskosten westlicher Modelle vergleichbare Benchmarks erreicht.

    DeepWalk

    Ein Graph-Embedding-Algorithmus, der Random Walks auf Graphen mit Word2Vec kombiniert, um Knotenrepräsentationen zu lernen.

    Default Reasoning

    Default Reasoning zieht Schlüsse unter Verwendung von 'Defaults', die in typischen Fällen gelten, während Ausnahmen bei neuen Informationen erlaubt sind.

    Dekodierung

    Der Prozess der Umwandlung kodierter Daten oder Signale zurück in ihre ursprüngliche oder nutzbare Form, in ML speziell die Token-für-Token-Generierung von Ausgaben.

    Demographic Parity

    Fairness-Kriterium: Ein Modell erfüllt Demographic Parity, wenn die Vorhersage-Raten (z.B. Approval-Rate) über alle geschützten Gruppen gleich sind.

    Denoising

    Denoising ist der Prozess der Rauschentfernung aus einem Signal; in Diffusions-Modellen ist es die iterative Transformation von verrauschten Latents zu einem sauberen Sample.

    Dense Passage Retrieval (DPR)

    Ein Retrieval-Ansatz, der Bi-Encoder-Embeddings für Query und Passagen nutzt – die Grundlage moderner semantischer Suche.

    Dense Retrieval

    Retrieval-Methode, die dichte Vektorrepräsentationen (Embeddings) nutzt, um semantisch ähnliche Dokumente zu finden.

    Dependency Parsing

    Die Analyse der grammatischen Struktur eines Satzes, indem Abhängigkeitsbeziehungen zwischen Wörtern identifiziert werden.

    Depthwise Separable Convolution

    Eine effiziente Convolution-Variante, die eine Standard-Faltung in zwei Schritte zerlegt – Depthwise (pro Kanal) und Pointwise (1x1 Faltung) – für 8-9x weniger Berechnungen.

    Destillation

    Eine Technik, bei der ein kleineres "Schüler"-Modell trainiert wird, das Verhalten eines größeren "Lehrer"-Modells zu imitieren, um Wissen zu transferieren.

    Detokenisierung

    Der Prozess, Tokens zurück in lesbaren Text umzuwandeln – die Umkehrung der Tokenization.

    DETR

    Ein Transformer-basiertes Modell für Object Detection, das Bounding Boxes als Set-Prediction ohne Anchor Boxes vorhersagt.

    Devin

    Der erste "AI Software Engineer" von Cognition Labs, der komplexe Programmieraufgaben autonom über längere Zeit bearbeiten kann.

    Dialogue Management

    Komponente eines Conversational AI-Systems, die den Gesprächsfluss steuert.

    Diffusion Model

    Diffusion Models sind generative KI-Modelle, die lernen, Rauschen schrittweise aus Daten zu entfernen, um hochwertige Samples (Bilder, Audio, Video) zu erzeugen.

    Dilated Convolution

    Dilated Convolution erweitert das rezeptive Feld eines Filters durch Einfügen von Lücken zwischen Filterwerten – größerer Kontext ohne mehr Parameter.

    Disclosure UX

    Disclosure UX ist die Menge an Interface-Patterns, die wichtige Systemfakten transparent an Benutzer kommunizieren (z.B. KI-Beteiligung, Limitationen, Datennutzung, Konfidenz und Provenance).

    Diskriminierung in KI (Algorithmic Discrimination)

    Diskriminierung in KI bezeichnet die systematische Benachteiligung bestimmter Personengruppen durch algorithmische Entscheidungssysteme – häufig als Folge verzerrter Trainingsdaten oder unausgewogener Modellarchitekturen.

    Disparate Impact

    Ein rechtliches Konzept: Eine scheinbar neutrale Regel oder Praxis, die eine geschützte Gruppe unverhältnismäßig negativ betrifft.

    Distribution Shift

    Eine Veränderung der statistischen Verteilung zwischen Trainings- und Produktionsdaten, die Modell-Performance degradiert.

    Diversität in Empfehlungen

    Strategien zur Erhöhung der Vielfalt in Empfehlungslisten, um Filter Bubbles zu vermeiden und Nutzerzufriedenheit zu steigern.

    DP-SGD

    Ein Trainingsalgorithmus, der Differential Privacy in Stochastic Gradient Descent integriert – durch Gradient Clipping und kalibrierten Noise.

    DPO (Direct Preference Optimization)

    Eine vereinfachte Alternative zu RLHF, die Modelle direkt auf Präferenz-Daten optimiert, ohne separates Reward Model oder RL-Training.

    DPO (Direct Preference Optimization)

    Eine vereinfachte Alternative zu RLHF, die menschliche Präferenzen direkt in die Modellgewichte einbettet, ohne ein separates Reward-Modell zu trainieren – einfacher, stabiler und günstiger.

    DreamBooth

    Eine Fine-Tuning-Methode, die Diffusionsmodelle mit wenigen Bildern (3-5) eines Subjekts personalisiert, um es in beliebigen Kontexten zu generieren.

    DROP

    Ein Reading-Comprehension-Benchmark, der numerisches Reasoning über Textpassagen erfordert (Zählen, Sortieren, Arithmetik).

    Dropout

    Eine Regularisierungstechnik, die zufällig Neuronen während des Trainings deaktiviert.

    DSGVO & KI

    Die Anwendung der DSGVO-Prinzipien auf KI-Systeme, insbesondere bei automatisierter Entscheidungsfindung und Profiling.

    Durchsatz

    Die Anzahl der Tokens oder Requests, die ein System pro Zeiteinheit verarbeiten kann – ein Schlüsselmaß für ML-Inference-Effizienz.

    E

    E5 Embedding

    E5 ist eine Familie von Embedding-Modellen von Microsoft Research, die durch Text-to-Text-Contrastive-Training erstellt werden.

    Early Stopping

    Regularisierungstechnik, die Training beendet wenn Validation-Loss steigt.

    ELBO (Evidence Lower Bound)

    ELBO ist die untere Schranke der Log-Likelihood in Variational Inference – die zentrale Zielfunktion für VAEs und Diffusionsmodelle.

    Elo Rating

    Ein Bewertungssystem zur Messung relativer Fähigkeiten, ursprünglich aus dem Schach – jetzt Standard für LLM-Leaderboards.

    ELU (Exponential Linear Unit)

    Eine Aktivierungsfunktion, die negative Werte exponentiell gegen einen negativen Sättigungswert dämpft – glatter als ReLU mit zero-mean Outputs.

    Embedding

    Ein Embedding ist eine dichte Vektor-Repräsentation diskreter Daten (Wörter, Bilder, Nutzer, Produkte), bei der semantisch ähnliche Objekte im Vektorraum nahe beieinander liegen.

    Embedding Models

    Spezialisierte Modelle, die Text, Bilder oder andere Daten in dichte Vektoren umwandeln, die semantische Bedeutung erfassen und Ähnlichkeitssuche ermöglichen.

    Embeddings

    Vektorrepräsentationen von Daten (Wörter, Sätze, Bilder) in einem niedrigdimensionalen Raum, die semantische Ähnlichkeit erfassen.

    Emergent Abilities

    Fähigkeiten, die bei LLMs erst ab einer bestimmten Modellgröße plötzlich erscheinen, ohne bei kleineren Modellen beobachtbar zu sein.

    Emotion Recognition

    Emotion Recognition erkennt emotionale Zustände (Freude, Wut, Trauer) aus Sprache, Gesichtsausdrücken oder Text – mit Fokus auf Audio-basierte Analyse.

    Encoder

    Der Teil eines Modells, der Eingabedaten in eine komprimierte Repräsentation transformiert.

    Encoder-Decoder

    Architektur, die Eingabe in eine Repräsentation kodiert und daraus Ausgabe dekodiert.

    Energy-Based Model (EBM)

    Energy-Based Models ordnen Datenpunkten Energiewerte zu – niedrige Energie für wahrscheinliche Daten, hohe für unwahrscheinliche – und generieren durch Energieminimierung.

    Ensemble Learning

    Die Kombination mehrerer Modelle, um bessere Vorhersagen zu erzielen als jedes einzelne Modell allein.

    Entity Extraction

    Die automatische Identifizierung und Klassifizierung benannter Entitäten in Text.

    Entity Linking

    Entity Linking ist der Prozess, Texterwähnungen von Entitäten mit eindeutigen Einträgen in einer Wissensbasis (z. B. Wikidata) zu verknüpfen.

    Entscheidungsbaum

    Ein ML-Modell, das Entscheidungen als Baumstruktur mit Verzweigungen basierend auf Feature-Werten darstellt.

    Entscheidungsfindung

    Entscheidungsfindung ist der Prozess der Auswahl einer Aktion (oder Nicht-Aktion) unter Alternativen basierend auf Zielen, Evidenz, Einschränkungen und Unsicherheit.

    Entscheidungstheorie

    Die Entscheidungstheorie untersucht, wie Agenten unter Unsicherheit Entscheidungen treffen sollten, oft durch Maximierung des erwarteten Nutzens unter Constraints.

    Epistemische vs. Aleatorische Unsicherheit

    Epistemische Unsicherheit entsteht aus fehlendem Wissen (reduzierbar durch mehr Daten); aleatorische Unsicherheit ist inhärentes Rauschen in den Daten (nicht reduzierbar).

    Epoche (Epoch) im Machine Learning

    Eine Epoche bezeichnet im Machine Learning einen vollständigen Durchlauf eines Lernalgorithmus durch den gesamten Trainingsdatensatz — also die Situation, in der jedes Trainingsbeispiel genau einmal verwendet wurde, um die Modellgewichte zu aktualisieren.

    Equalized Odds

    Fairness-Kriterium: Ein Modell erfüllt Equalized Odds, wenn True Positive Rate und False Positive Rate über alle geschützten Gruppen gleich sind.

    Erklärbare KI (XAI)

    Erklärbare KI (XAI) umfasst Methoden und Produktpraktiken, die KI-Outputs verständlich, nachvollziehbar und auditierbar machen.

    Erklärbarkeit

    Die Fähigkeit, die Entscheidungen oder Vorhersagen eines KI-Modells für Menschen verständlich zu machen.

    EU AI Act

    Die erste umfassende gesetzliche Regulierung für Künstliche Intelligenz weltweit, die 2024 vom EU-Parlament verabschiedet wurde und risikobasierte Anforderungen für KI-Systeme festlegt.

    Evaluation Harness

    Ein Framework zur systematischen Bewertung von Modell-Performance über verschiedene Metriken und Testfälle.

    Expected Calibration Error (ECE)

    Die Standard-Metrik zur Messung der Kalibrierungsqualität eines Klassifikators – der gewichtete Durchschnitt der Differenz zwischen Konfidenz und Accuracy über Bins.

    Explainability UX Patterns

    Explainability UX Patterns sind Interface-Muster, die Benutzern helfen zu verstehen, warum ein KI-System ein Ergebnis erzeugt hat, welche Evidenz es verwendet hat und welche Aktionen es durchgeführt (oder verweigert) hat.

    Exploration vs. Exploitation

    Das fundamentale RL-Dilemma: Soll der Agent bekannte gute Aktionen ausnutzen (Exploitation) oder neue Optionen erkunden (Exploration)?

    Exponential Moving Average (EMA)

    Technik, die einen exponentiell gewichteten Durchschnitt der Modellgewichte über den Trainingsverlauf pflegt – das EMA-Modell generalisiert oft besser als das finale Modell.

    F

    Fairness

    Das Ziel, dass KI-Systeme alle Gruppen gleichberechtigt behandeln und keine systematische Diskriminierung verursachen.

    Faithfulness

    Wie genau ein LLM-Output den bereitgestellten Quellen und Instruktionen entspricht.

    FastText

    Facebooks Open-Source-Library für effiziente Textklassifikation und Wort-Embeddings mit Sub-Word-Informationen.

    Feature Extraction

    Der Prozess der automatischen Ableitung relevanter Merkmale aus Rohdaten.

    Federated Learning

    Ein dezentraler Trainingsansatz, bei dem Modelle auf vielen Geräten lokal trainiert werden und nur Modell-Updates (nicht Rohdaten) an einen zentralen Server gesendet werden – Training ohne Datenzentralisierung.

    Feed-Forward Network (FFN)

    Im Transformer-Kontext: ein zweischichtiges MLP, das nach der Attention-Schicht auf jede Position unabhängig angewandt wird.

    Feedback-Loop

    Ein System, in dem Outputs zurückgeführt werden, um zukünftige Inputs oder Entscheidungen zu beeinflussen.

    Fehleranalyse

    Systematische Untersuchung von Modellfehlern zur Identifizierung von Mustern und Verbesserungsmöglichkeiten.

    Few-Shot Learning

    Eine Technik, bei der dem Modell wenige Beispiele im Prompt gegeben werden, um das gewünschte Output-Format oder die Aufgabe zu demonstrieren.

    Fine-Tuning

    Das Anpassen eines vortrainierten Modells an eine spezifische Aufgabe durch weiteres Training auf aufgabenspezifischen Daten.

    Flash Attention

    Eine optimierte Implementierung des Attention-Mechanismus, die Speicherzugriffe reduziert und GPU-Effizienz maximiert durch Tiling und Kernel-Fusion.

    Flow Matching

    Flow Matching ist eine generative Modellierungstechnik, die gerade Transportpfade zwischen Rausch- und Datenverteilung lernt – schneller und stabiler als klassische Diffusion.

    Flux

    Ein neues Open-Source-Bildgenerierungsmodell von Black Forest Labs (ex-Stability AI), das in Qualität mit Midjourney konkurriert.

    Focal Loss

    Modifizierte Cross-Entropy-Loss, die schwer klassifizierbare Beispiele stärker gewichtet und leichte Beispiele herunterskaliert.

    Forward Pass

    Die Berechnung des Modell-Outputs durch Vorwärtspropagation durch alle Schichten.

    Foundation Model

    Ein großes, auf breiten Daten vortrainiertes Modell, das für viele nachgelagerte Aufgaben angepasst werden kann.

    FSDP (Fully Sharded Data Parallel)

    PyTorchs native Implementierung von Parameter-Sharding – verteilt Modell-Parameter, Gradienten und Optimizer-States über GPUs für memory-effizientes Training.

    Function Calling

    Die Fähigkeit von LLMs, strukturiert externe Funktionen aufzurufen – das Modell entscheidet welche Funktion mit welchen Parametern, die Ausführung erfolgt extern.

    Function Calling (LLM)

    Function Calling ermöglicht LLMs, strukturierte Funktionsaufrufe zu generieren – die Brücke zwischen natürlicher Sprache und APIs, Datenbanken oder externen Tools.

    Fuzzy Inferenz System

    Ein Fuzzy Inferenz System verwendet Fuzzy-Logik-Regeln, um Eingaben auf Ausgaben abzubilden, wenn Konzepte unscharf sind (z.B. "hohes Risiko", "mittlere Nachfrage").

    G

    G-Eval

    Ein LLM-Evaluation-Framework, das Chain-of-Thought-Reasoning und gewichtete Wahrscheinlichkeiten für nuanciertere Bewertungen nutzt.

    Gaussian Mixture Model (GMM)

    Ein probabilistisches Modell, das Daten als Mischung von Gauß-Verteilungen darstellt.

    GELU (Gaussian Error Linear Unit)

    Eine glatte Aktivierungsfunktion, die Inputs mit ihrer kumulativen Normalverteilungs-Wahrscheinlichkeit gewichtet – Standard in BERT, GPT-2 und vielen Transformern.

    Gemeinsame Verteilung

    Die Wahrscheinlichkeitsverteilung, die die Wahrscheinlichkeit von Kombinationen mehrerer Zufallsvariablen beschreibt.

    Gemini

    Googles multimodales AI-Modell – nativ für Text, Bild, Audio, Video und Code gebaut, nicht nachträglich zusammengesetzt.

    Gemini 3.1 Pro

    Googles Flaggschiff-LLM 2026 mit nativ multimodaler Architektur und 2M-Token-Kontext.

    Gemma 4

    Open-Weight-Modellfamilie von Google für On-Device- und Edge-Inferenz mit Größen von 2B bis 27B Parametern.

    Generalisierung

    Die Fähigkeit eines Modells, auf neuen, ungesehenen Daten gut zu performen.

    Generative Adversarial Network (GAN)

    Architektur mit zwei konkurrierenden Netzwerken zur Generierung realistischer Daten.

    Generative AI

    KI-Modelle, die neue Inhalte erstellen – Text, Bilder, Audio, Code oder strukturierte Daten.

    Gewichts-Initialisierung

    Gewichts-Initialisierung bestimmt die Startwerte der Netzwerk-Parameter – kritisch für stabiles Training und schnelle Konvergenz.

    GitHub Copilot

    Ein AI Coding Assistant von GitHub/Microsoft, der auf Basis von OpenAI-Modellen Code-Vorschläge in Echtzeit direkt im Editor liefert.

    GloVe

    GloVe (Global Vectors for Word Representation) ist ein Worteinbettungsverfahren, das globale Kookkurrenz-Statistiken eines Textkorpus nutzt, um semantische Wortvektoren zu erzeugen.

    Google AI Overviews

    Googles AI-generierte Zusammenfassungen am Anfang der Suchergebnisse – synthetisiert aus mehreren Quellen.

    Google DeepMind

    Googles fusionierte KI-Forschungsabteilung, entstanden aus DeepMind und Google Brain, verantwortlich für Gemini und bahnbrechende AI-Forschung.

    Governance

    Governance ist die Menge an Rollen, Regeln, Prozessen und Kontrollen, die sicherstellen, dass ein System verantwortungsvoll und vorhersehbar genutzt wird – ausgerichtet auf Risiko, Compliance und Geschäftsziele.

    GPQA

    Ein Benchmark mit 448 Experten-Level-Fragen aus Physik, Biologie und Chemie, die so schwer sind, dass auch PhDs ohne Expertise nur 30% erreichen.

    GPQA Diamond

    Hochanspruchsvoller Wissenschafts-Benchmark mit Fragen auf Promotionsniveau in Biologie, Physik und Chemie.

    GPT (Generative Pre-trained Transformer)

    Eine Familie von großen Sprachmodellen von OpenAI, die auf der Transformer-Architektur basieren.

    GPT-4

    OpenAIs fortschrittlichstes multimodales Sprachmodell, das Text, Bilder und Code verarbeiten kann und als Maßstab für LLM-Leistung gilt.

    GPT-4V (Vision)

    OpenAIs GPT-4 Erweiterung mit Bildverständnis – der Durchbruch, der ChatGPT das "Sehen" beibrachte.

    GPT-5

    OpenAIs fortschrittlichstes Sprachmodell (2026), das multimodale Verarbeitung, erweitertes Reasoning und natives Tool-Use in einem Modell vereint.

    GPT-5.4

    OpenAIs Flaggschiff-LLM 2026 mit Thinking-Mode, multimodaler Verarbeitung und Agent-Native-Architektur.

    GQA

    Eine Attention-Variante, bei der mehrere Query-Heads sich ein Key-Value-Paar teilen, um KV-Cache-Größe und Speicherverbrauch zu reduzieren.

    Grad-CAM

    XAI-Methode, die Heatmaps generiert, um zu zeigen, welche Bildbereiche ein CNN für seine Entscheidung am wichtigsten findet.

    Gradient Accumulation

    Gradient Accumulation summiert Gradienten über mehrere Mini-Batches auf, bevor ein Optimierungsschritt erfolgt – simuliert größere Batch-Sizes ohne mehr GPU-Memory.

    Gradient Centralization

    Einfache Technik, die den Mittelwert der Gradienten subtrahiert, bevor sie auf die Gewichte angewendet werden – verbessert Generalisierung ohne Kosten.

    Gradient Checkpointing

    Gradient Checkpointing spart GPU-Memory, indem Zwischen-Aktivierungen verworfen und beim Backward-Pass neu berechnet werden – tauscht Compute gegen Memory.

    Gradient Clipping

    Gradient Clipping begrenzt die Norm oder den Wert von Gradienten während des Trainings, um Exploding Gradients zu verhindern.

    Gradient Noise

    Das natürliche Rauschen in Gradientenschätzungen durch Mini-Batch-Sampling – wirkt als implizite Regularisierung und hilft, bessere Minima zu finden.

    Gradientenabstieg

    Ein Optimierungsalgorithmus, der iterativ Parameter in Richtung des steilsten Abstiegs der Verlustfunktion anpasst.

    Graph Attention Network (GAT)

    Graph Attention Networks nutzen Aufmerksamkeitsmechanismen, um beim Message Passing automatisch zu lernen, welche Nachbar-Knoten wichtiger sind.

    Graph Classification

    Die Aufgabe, einen gesamten Graphen einer Klasse zuzuordnen, basierend auf seiner Struktur und Knoteneigenschaften.

    Graph Convolutional Network

    Eine GNN-Variante, die Faltungsoperationen auf Graphen verallgemeinert, um Knotenrepräsentationen zu lernen.

    Graph Isomorphism Network

    Ein GNN mit maximaler Diskriminierungskraft unter Message-Passing-Architekturen, theoretisch fundiert durch den Weisfeiler-Leman-Test.

    Graph Neural Network

    Eine Klasse neuronaler Netze, die direkt auf Graphstrukturen operieren und Knoten-, Kanten- und Grapheigenschaften lernen.

    Graph Transformer

    Graph Transformers kombinieren Transformer-Architekturen mit Graph-Strukturen und nutzen Self-Attention direkt auf Graph-Knoten.

    GraphSAGE

    Ein induktives GNN-Framework, das durch Sampling und Aggregation von Nachbarschaften skalierbare Knotenrepräsentationen lernt.

    Graphsuche

    Graphsuche ist der Prozess des Erkundens eines Graphen, um einen Zielknoten, einen Pfad oder eine optimale Lösung unter einem definierten Ziel (z.B. kürzester Pfad, niedrigste Kosten) zu finden.

    Greedy Best-First Search

    Eine Suchstrategie, die den Knoten erweitert, der dem Ziel am nächsten erscheint, basierend nur auf einem heuristischen Score h(n), ohne die bisherigen Kosten zu berücksichtigen.

    Greedy Decoding

    Eine Decoding-Strategie, die immer das Token mit der höchsten Wahrscheinlichkeit wählt – deterministisch, aber oft repetitiv.

    Greedy-Algorithmus

    Ein Algorithmus, der in jedem Schritt die lokal optimale Wahl trifft.

    Grid Search

    Hyperparameter-Tuning-Methode, die systematisch alle Kombinationen eines vordefinierten Parameterraums durchprobiert.

    Griffin

    Googles Hybrid-Architektur, die lineare Recurrences (Gated RNN) mit lokaler Attention kombiniert und in RecurrentGemma produktionalisiert wurde.

    Grok

    xAIs LLM mit Echtzeit-Zugang zu X (Twitter), bekannt für humorvollen, unzensierten Stil und aktuelle Informationen.

    Ground Truth

    Die tatsächlichen, korrekten Daten oder Labels, die als Referenz für Modelltraining und -evaluation dienen.

    Grounding

    Techniken zur Verankerung von LLM-Outputs in verifizierbaren Quellen – das Modell bezieht sich explizit auf Dokumente, Daten oder Fakten statt frei zu generieren.

    Group Normalization

    Group Normalization teilt Channels in Gruppen und normalisiert innerhalb jeder Gruppe – funktioniert batch-unabhängig und ist ideal für kleine Batch-Größen.

    GRPO (Group Relative Policy Optimization)

    GRPO ist eine RL-Alignment-Methode, die ohne separates Reward Model auskommt – stattdessen werden Gruppen von Antworten relativ zueinander bewertet.

    GRU (Gated Recurrent Unit)

    Eine vereinfachte RNN-Architektur mit Gates zur Kontrolle des Informationsflusses.

    GRU (Gated Recurrent Unit)

    GRU ist eine vereinfachte RNN-Architektur mit Update- und Reset-Gate – weniger Parameter als LSTM bei vergleichbarer Leistung.

    GSM8K

    Ein Benchmark mit 8.500 Grundschul-Matheaufgaben, die mehrstufiges Reasoning erfordern.

    Guardrails

    Mechanismen und Systeme, die KI-Outputs überwachen, filtern und korrigieren, um sicherzustellen, dass sie innerhalb definierter Grenzen für Sicherheit, Ethik und Markenrichtlinien bleiben.

    Guardrails

    Mechanismen zur Einschränkung und Validierung von AI-Outputs – verhindert toxische, falsche oder off-brand Inhalte und unkontrollierte Agenten-Aktionen.

    Guidance Scale

    Guidance Scale ist ein Parameter (häufig in Classifier-Free Guidance), der kontrolliert, wie stark ein Diffusions-Modell dem Text-Prompt folgt versus diversere Outputs generiert.

    H

    Hallucination Detection

    Methoden und Tools zur Erkennung von "Halluzinationen" – falschen oder erfundenen Informationen, die LLMs mit hoher Zuversicht als Fakten präsentieren.

    Halluzination (KI)

    Das Phänomen, bei dem KI-Modelle plausibel klingende, aber faktisch falsche oder erfundene Informationen generieren, die nicht in den Trainingsdaten enthalten waren.

    Halluzinationsrate

    Der Prozentsatz der KI-generierten Ausgaben, die nicht durch Fakten oder Quellen gestützte Informationen enthalten.

    HellaSwag

    Ein Benchmark für Common-Sense-Reasoning, bei dem LLMs die plausibelste Fortsetzung eines Szenarios wählen müssen.

    HELM

    Ein umfassendes Evaluations-Framework von Stanford, das LLMs auf Dutzenden von Dimensionen wie Accuracy, Fairness, Robustness und Efficiency gleichzeitig bewertet.

    Heterogener Graph

    Ein Graph mit verschiedenen Typen von Knoten und/oder Kanten, der unterschiedliche Entitätsarten und Beziehungen modelliert.

    Heuristik

    Eine praktische Bewertungsregel oder Schätzung, die Suche oder Entscheidungsfindung zu vielversprechenden Optionen leitet, ohne Optimalität zu garantieren.

    Heuristische Suche

    Heuristische Suche ist eine Familie von Suchalgorithmen, die eine Heuristik (eine leitende Schätzung) nutzen, um einen Problemraum effizienter zu erkunden als uninformierte Suche.

    High-Level Representation

    Eine High-Level Representation abstrahiert Rohdaten in bedeutungsvollere Strukturen (Symbole, Konzepte, latente Variablen oder Zusammenfassungen).

    HNSW

    Hierarchical Navigable Small World – ein Graph-basierter Algorithmus für effiziente Approximate Nearest Neighbor Search.

    Hold-Out Validierung

    Einfachste Evaluationsmethode: Datensatz wird einmalig in Training und Testset aufgeteilt (z.B. 80/20).

    HuBERT

    HuBERT (Hidden-Unit BERT) ist ein Self-Supervised-Speech-Modell von Meta, das durch Vorhersage von diskretisierten Audio-Clustern hochwertige Speech-Representations lernt.

    Hugging Face

    Die führende Open-Source-Plattform für Machine Learning, die als "GitHub für AI" fungiert und über 500.000 Modelle hostet.

    Human Evaluation

    Die Bewertung von KI-Outputs durch menschliche Annotatoren – der Gold-Standard für Qualitätsmessung, aber teuer und langsam.

    HumanEval

    Ein Benchmark für Code-Generierung mit 164 Python-Programmieraufgaben, evaluiert durch Pass@k (Code muss Tests bestehen).

    Hybrid Search

    Eine Suchmethode, die lexikalische Suche (BM25/Keyword) mit semantischer Suche (Embeddings) kombiniert, um die Stärken beider Ansätze zu nutzen.

    Hybrides Empfehlungssystem

    Ein Empfehlungssystem, das mehrere Ansätze (Collaborative Filtering, Content-Based, Knowledge-Based) kombiniert für bessere Empfehlungsqualität.

    Hybrides KI-System

    Ein hybrides KI-System kombiniert mehrere KI-Paradigmen—typischerweise symbolische/regelbasierte Methoden mit statistischen/ML-Modellen (einschließlich LLMs).

    Hyena

    Ein subquadratischer Attention-Ersatz basierend auf langen Convolutions und datengesteuerten Gates, der O(N log N) statt O(N²) skaliert.

    Hyperparameter

    Konfigurationseinstellungen, die vor dem Training gewählt werden und beeinflussen, wie ein Modell lernt.

    Hyperparameter-Optimierung

    Der systematische Prozess der Suche nach den besten Hyperparameter-Einstellungen für ein ML-Modell.

    Hypothesengenerierung

    Hypothesengenerierung ist das Produzieren von Kandidaten-Erklärungen (oder Kandidaten-Lösungen), die beobachtete Evidenz plausibel erklären könnten.

    I

    Ideogram

    Ein Text-zu-Bild-Modell, das sich durch herausragende Text-Rendering-Fähigkeiten in generierten Bildern auszeichnet.

    IFEval

    Ein Benchmark, der testet, wie gut LLMs explizite Format-Anweisungen befolgen (z.B. "Antworte in genau 3 Absätzen", "Beginne jeden Satz mit einem Großbuchstaben").

    Image Captioning

    Automatische Generierung von Textbeschreibungen für Bilder.

    Image Understanding

    Die Fähigkeit von AI, nicht nur Objekte zu erkennen, sondern den semantischen Kontext und die Bedeutung von Bildern zu verstehen.

    Image-to-Image

    Modelle, die ein Eingabebild in ein modifiziertes oder transformiertes Ausgabebild umwandeln.

    Image-to-Image (img2img)

    Image-to-Image transformiert ein Eingabebild basierend auf einem Text-Prompt und einem Denoise-Stärke-Parameter – von subtilen Änderungen bis zur kompletten Neugestaltung.

    Image-to-Text

    AI-Generierung von natürlichsprachigen Beschreibungen für Bilder – von einfachen Captions bis zu detaillierten Analysen.

    Image-to-Video

    KI-Technologie, die statische Bilder in bewegte Videos verwandelt, indem sie realistische Animation, Kamerabewegung und Szenenentwicklung hinzufügt.

    ImageBind

    Metas multimodales Embedding-Modell, das sechs Modalitäten (Bild, Text, Audio, Video, Tiefe, Thermal) in einem gemeinsamen Vektorraum vereint.

    Imitationslernen

    Ein ML-Ansatz, bei dem ein Agent lernt, indem er Expertenverhalten beobachtet und nachahmt.

    Implizites Feedback

    Nutzersignale, die aus Verhalten abgeleitet werden (Klicks, Verweildauer, Käufe) statt aus expliziten Bewertungen.

    In-Context Learning

    Die Fähigkeit von LLMs, aus dem Kontext des Prompts zu lernen, ohne Modellgewichte zu ändern – das Fundament moderner Prompt-Techniken.

    Induktives Schlussfolgern

    Eine Form der logischen Schlussfolgerung, bei der aus spezifischen Beobachtungen allgemeine Regeln oder Muster abgeleitet werden – die Konklusion ist wahrscheinlich, aber nicht garantiert.

    Inference

    Der Prozess, bei dem ein trainiertes KI-Modell auf neue Eingaben angewendet wird, um Vorhersagen oder Outputs zu generieren.

    Inference-Optimierung

    Die Gesamtheit aller Techniken zur Beschleunigung und Effizienzsteigerung der LLM-Inference, einschließlich Quantisierung, Batching, Caching und Hardware-Optimierung.

    Inference-Time Compute

    Eine Technik, bei der KI-Modelle bei der Antwortgenerierung (Inferenz) zusätzliche Rechenzeit nutzen, um durch längeres "Nachdenken" bessere Ergebnisse zu erzielen.

    Inferenzmaschine

    Die Kernkomponente eines Expertensystems, die logische Regeln auf eine Wissensbasis anwendet, um neue Fakten abzuleiten oder Entscheidungen zu treffen.

    Information Retrieval

    Das Finden relevanter Dokumente oder Informationen aus einer großen Sammlung.

    Informationsextraktion

    Die automatische Extraktion strukturierter Informationen (Entitäten, Relationen, Fakten) aus unstrukturiertem Text.

    Inpainting

    Das Auffüllen fehlender oder maskierter Bereiche in einem Bild mit plausiblem Inhalt.

    Instance Normalization

    Instance Normalization normalisiert jede Feature-Map (Channel) jedes Samples einzeln – Standard in Style Transfer und Bildgenerierung.

    Instruction Tuning

    Eine Fine-Tuning-Methode, bei der Modelle auf (Instruktion, Antwort)-Paaren trainiert werden, um Anweisungen in natürlicher Sprache zu befolgen – der Schritt, der Base Models zu hilfreichen Assistenten macht.

    Instructor Embedding

    Ein Embedding-Modell, das task-spezifische Instruktionen im Prompt nutzt, um Embeddings für verschiedene Aufgaben zu optimieren.

    Integrated Gradients

    XAI-Methode, die Feature-Attributionen berechnet, indem Gradienten entlang eines Pfads von einer Baseline zum tatsächlichen Input integriert werden.

    Intelligentes Tutorsystem

    Ein Intelligentes Tutorsystem (ITS) ist ein KI-gesteuertes Lernsystem, das Unterricht, Feedback und Übungen auf die Bedürfnisse des Lernenden personalisiert.

    Intent Recognition

    KI-Fähigkeit, die Absicht hinter einer Nutzeräußerung zu erkennen.

    Intent-Klassifikation

    Die Bestimmung der Absicht oder des Ziels hinter einer Benutzeranfrage.

    Interpretable ML

    ML-Modelle, die von Natur aus verständlich sind – ihre Entscheidungslogik kann direkt inspiziert werden, ohne zusätzliche Erklärungsmethoden.

    Interpretierbarkeit

    Der Grad, zu dem Menschen verstehen können, wie ein Modell zu seinen Entscheidungen kommt.

    Inverse Reinforcement Learning

    IRL lernt die Reward-Funktion aus beobachtetem Experten-Verhalten – anstatt eine Reward-Funktion vorzugeben, wird sie aus Demonstrationen abgeleitet.

    IoU (Intersection over Union)

    Eine Metrik, die die Überlappung zwischen einer vorhergesagten und einer Ground-Truth-Region misst, berechnet als Schnittmenge geteilt durch Vereinigung.

    IP-Adapter

    IP-Adapter ermöglicht Bildprompts für Diffusionsmodelle – ein Referenzbild steuert Stil, Komposition oder Gesichtsidentität der Generierung.

    IPO

    Eine Alignment-Methode, die DPO erweitert, um stabileres Training zu ermöglichen.

    Iterative Vertiefung

    Iterative Vertiefung ist eine Suchstrategie, die wiederholt tiefenbeschränkte Suche mit steigenden Tiefenlimits ausführt, bis eine Lösung gefunden oder ein Budget erschöpft ist.

    Iteratives Prompting

    Ein Prompt-Ansatz, bei dem Ergebnisse verfeinert werden durch mehrere aufeinanderfolgende Prompts.

    K

    K-Armed Bandit

    Das K-Armed Bandit Problem modelliert die Auswahl zwischen k Optionen, um Reward zu maximieren und Exploration vs Exploitation zu balancieren.

    K-Fold

    Kreuzvalidierungs-Variante, die den Datensatz in k gleich große Teile aufteilt und k Modelle trainiert.

    K-Fold Cross-Validation

    K-Fold Cross-Validation ist eine Evaluationsmethode, bei der Daten in k Teile geteilt werden; das Modell trainiert auf k−1 Folds und wird auf dem verbleibenden getestet.

    K-Means Clustering

    K-Means ist ein unüberwachter Algorithmus, der Daten in k Cluster partitioniert, indem Within-Cluster-Distanz zu Zentroiden minimiert wird.

    K-Means++

    K-Means++ ist eine Initialisierungsmethode für K-Means, die Startcentroide wählt, um Konvergenz und Cluster-Qualität zu verbessern.

    K-Shot Prompting

    K-Shot Prompting stellt k Beispiele im Prompt bereit, um das Modellverhalten zu steuern (Format, Reasoning-Pattern, Ton).

    Kalibrierung

    Der Prozess, die Vorhersagewahrscheinlichkeiten eines Modells so anzupassen, dass sie tatsächliche Ereigniswahrscheinlichkeiten widerspiegeln.

    Kernel (ML)

    In ML ist ein Kernel eine Funktion, die Ähnlichkeit zwischen Datenpunkten misst und Algorithmen in implizit hochdimensionalen Feature-Räumen operieren lässt.

    Kernel Trick

    Der Kernel-Trick erlaubt Algorithmen, Dot-Products in einem implizit höherdimensionalen Raum zu berechnen, ohne die Daten explizit zu transformieren.

    KI-Governance

    Der Rahmen aus Richtlinien, Prozessen und Verantwortlichkeiten für die verantwortungsvolle Entwicklung, Bereitstellung und Nutzung von KI-Systemen in Organisationen.

    KI-Musikgenerierung

    KI-Musikgenerierung erzeugt Musikstücke aus Text-Prompts, Melodien oder Stilvorgaben – von Hintergrundmusik bis zu vollständigen Songs.

    KI-vollständig

    Ein Problem wird als KI-vollständig bezeichnet, wenn dessen maschinelle Lösung im Wesentlichen allgemeine menschliche Intelligenz erfordern würde.

    Klassenungleichgewicht

    Situation, in der eine Klasse im Trainingsdatensatz deutlich häufiger vorkommt als andere.

    Klassifikation

    Ein überwachter ML-Algorithmus, der Daten in vordefinierte Kategorien oder Klassen einteilt.

    Kling AI

    Kuaishous chinesisches Text-zu-Video-Modell, das mit Sora konkurriert und realistische Videos bis zu 2 Minuten generiert.

    KNN (k-Nearest Neighbors)

    KNN ist eine Methode, die Outcomes basierend auf den k ähnlichsten Beispielen in einem Datensatz vorhersagt.

    KNN Search

    KNN Search retrievet die k nächsten Vektoren zu einem Query-Vektor unter einer Distanz-Metrik.

    Knowledge Base (KB)

    Eine Knowledge Base ist ein kuratiertes Repository von Informationen (Artikel, FAQs, Policies), designed für Retrieval und Wiederverwendung.

    Knowledge Cutoff

    Knowledge Cutoff ist der Zeitpunkt, nach dem die Trainingsdaten eines Modells keine neuen Informationen mehr enthalten.

    Knowledge Distillation

    Eine Technik zum Übertragen von Wissen aus einem großen, komplexen "Lehrer"-Modell auf ein kleineres, effizienteres "Schüler"-Modell, das ähnliche Leistung bei geringerem Ressourcenverbrauch erreicht.

    Knowledge Graph Embedding

    Knowledge Graph Embeddings lernen niedrig-dimensionale Vektorrepräsentationen für Entitäten und Relationen eines Knowledge Graphs.

    Kollaboratives Filtern

    Ein Empfehlungsansatz, der die Präferenzen eines Nutzers basierend auf dem Verhalten ähnlicher Nutzer oder Ähnlichkeiten zwischen Items vorhersagt.

    Kontrafaktische Erklärung

    Erklärungsmethode, die zeigt, welche minimale Eingabe-Änderung zu einem anderen Modell-Ergebnis geführt hätte.

    Konvergenz

    Der Punkt, an dem ein Modell aufhört, signifikant besser zu werden – der Loss stabilisiert sich und weitere Epochen bringen keinen Fortschritt.

    Koreferenzauflösung

    Die Identifikation aller Textstellen, die auf dieselbe Entität verweisen (z.B. "Angela Merkel" → "sie" → "die Kanzlerin").

    Kreuzvalidierung

    Eine Technik zur Bewertung der Modell-Performance durch Training und Test auf verschiedenen Datenteilmengen.

    KTO (Kahneman-Tversky Optimization)

    Eine Alignment-Methode, die nur binäres Feedback (gut/schlecht) statt paarweiser Präferenzen benötigt, inspiriert von Prospect Theory.

    Künstliche Allgemeine Intelligenz

    Eine hypothetische Form von KI, die menschenähnliche kognitive Fähigkeiten über alle Domänen hinweg besitzt und selbstständig lernen und sich anpassen kann.

    Künstliches Neuronales Netz (Artificial Neural Network)

    Ein Künstliches Neuronales Netz (ANN) ist ein vom biologischen Gehirn inspiriertes Rechenmodell aus Schichten verbundener Neuronen, das durch Anpassung von Gewichten lernen kann, komplexe Muster aus Daten zu extrahieren.

    KV-Cache

    Ein Speichermechanismus, der die Key- und Value-Tensoren der Attention-Layer zwischenspeichert, um redundante Berechnungen bei autoregenerativer Generierung zu vermeiden.

    L

    L1 Regularization (Lasso)

    L1-Regularisierung fügt eine Strafe hinzu, die proportional zum absoluten Wert der Modellgewichte ist und Sparsität fördert (viele Gewichte werden genau null).

    L2 Regularization (Ridge)

    L2-Regularisierung fügt eine Strafe hinzu, die proportional zum Quadrat der Modellgewichte ist und kleinere Gewichte fördert.

    Label Leakage (Datenleck der Zielvariable)

    Label Leakage beschreibt den Fall, dass im Trainingsdatensatz eines Machine-Learning-Modells Features enthalten sind, die direkte oder indirekte Information über die zu vorhersagende Zielvariable (das Label) enthalten — und in der Produktion zum Vorhersagezeitpunkt gar nicht verfügbar wären.

    Label Smoothing

    Label Smoothing ist eine Trainingstechnik, die harte Labels (0 oder 1) durch leicht abgeschwächte Ziele ersetzt (z.B. 0.9 und 0.1).

    LAMB

    Optimizer für extrem große Batch Sizes (bis 64K+), der Lernraten pro Layer adaptiert und so stabiles Training bei massiver Parallelisierung ermöglicht.

    Längenstrafe

    Eine Decoding-Anpassung, die verhindert, dass Generierungsalgorithmen (insbesondere Beam Search) übermäßig kurze Sequenzen unfair bevorzugen.

    Language Model (LM)

    Ein Language Model ist ein Modell, das die Wahrscheinlichkeit von Token-Sequenzen schätzt und Tasks wie Prediction, Generation und Classification ermöglicht.

    Large Language Model (LLM)

    Ein großes neuronales Netzwerk, das auf riesigen Textmengen trainiert wurde, um menschenähnlichen Text zu verstehen und zu generieren.

    Large Language Model (LLM)

    Ein großes neuronales Netzwerk, das auf massiven Textmengen trainiert wurde und menschenähnlichen Text verstehen und generieren kann.

    LARS

    Optimizer, der SGD mit Layer-weiser Lernratenanpassung kombiniert – ermöglicht stabiles Training mit großen Batch Sizes für Computer Vision.

    Late Interaction

    Ein Retrieval-Paradigma, bei dem Query- und Dokument-Tokens unabhängig encodiert werden, aber erst bei der Suche über Token-Level-Ähnlichkeit interagieren.

    Latent Diffusion

    Latent Diffusion führt den Diffusionsprozess im komprimierten Latent Space statt im Pixel-Space durch – 10-100x schneller bei vergleichbarer Qualität.

    Latent Variable

    Eine latente Variable ist eine unbeobachtete Variable, die aus beobachteten Daten abgeleitet wird, um verborgene Strukturen zu erklären.

    Latenter Raum

    Ein komprimierter, niedrigdimensionaler Raum, in dem ein Modell interne Repräsentationen von Daten speichert.

    Layer Dropping

    Eine Komprimierungstechnik, die ganze Transformer-Layer aus einem trainierten Modell entfernt – der einfachste Weg, ein LLM kleiner und schneller zu machen.

    Layer Normalization

    Layer Normalization ist eine Technik, die Aktivierungen innerhalb eines Layers normalisiert, um Training in tiefen Netzwerken zu stabilisieren.

    Leaky ReLU

    Eine Variante von ReLU, die negative Werte mit kleinem Faktor (z.B. 0.01) durchlässt statt sie auf 0 zu setzen – verhindert das Dead-Neuron-Problem.

    Learning Rate Finder

    Diagnostische Methode, die die Learning Rate exponentiell erhöht und den Loss beobachtet – findet den optimalen LR-Bereich in einem einzigen Training-Run.

    Learning Rate Schedule

    Ein Learning Rate Schedule ändert die Lernrate während des Trainings (Warmup, Decay, Cosine, Step, Exponential).

    Learning to Rank

    ML-Ansätze zum Lernen optimaler Ranking-Funktionen für Suchergebnisse, Empfehlungen oder Feeds.

    Lemmatisierung

    Linguistisch fundierte Reduktion von Wörtern auf ihre Grundform (Lemma) unter Berücksichtigung von Wortart und Kontext.

    Leonardo AI

    Eine AI-Bildgenerierungs-Plattform mit Fokus auf Gaming, Concept Art und professionelle kreative Workflows.

    Lernrate

    Ein Hyperparameter, der bestimmt, wie stark die Modellgewichte bei jedem Trainingsschritt angepasst werden.

    Lernziele

    Lernziele sind klare, messbare Aussagen darüber, was ein Lernender nach der Instruktion können sollte.

    LIME

    LIME (Local Interpretable Model-agnostic Explanations) erklärt eine einzelne Modellvorhersage, indem ein einfaches, interpretierbares Surrogat-Modell um diesen spezifischen Input herum angepasst wird.

    Linear Attention

    Attention-Varianten, die die quadratische Komplexität O(N²) auf lineare O(N) reduzieren durch Kernel-Approximation oder alternative Berechnungsreihenfolge.

    Link Prediction

    Link Prediction sagt vorher, welche Verbindungen zwischen Knoten in einem Graphen wahrscheinlich existieren oder entstehen werden.

    Lion Optimizer

    Von Google Brain durch AutoML-Suche entdeckter Optimizer, der nur das Vorzeichen der Gradienten nutzt – einfacher als Adam, oft vergleichbare Ergebnisse.

    Lip Sync AI

    KI-Technologie, die Lippenbewegungen in Videos automatisch an neue Audio-Spuren anpasst, sodass gesprochene Worte natürlich aussehen.

    LiveCodeBench

    Kontaminationsfreier Coding-Benchmark, der laufend neue Programmieraufgaben aus Wettbewerben einbindet.

    Llama

    Metas Open-Weight-LLM-Familie, die als Grundlage für tausende Fine-Tuned-Modelle dient und Open-Source-AI demokratisiert hat.

    LLM Security

    Das Feld der Sicherheitsforschung und -praktiken speziell für Large Language Models und generative KI.

    LLM-as-a-Judge

    LLM-as-a-Judge nutzt ein Modell, um andere Modell-Outputs gegen Rubrics wie Correctness, Groundedness, Style und Safety zu evaluieren.

    LLM-as-Judge

    Eine Evaluationsmethode, bei der ein LLM die Qualität von Outputs eines anderen (oder desselben) Modells bewertet.

    LMSYS

    LMSYS (Large Model Systems Organization) ist eine Forschungsorganisation, die das bekannte Chatbot Arena Benchmark betreibt und LLM-Leistungsvergleiche durch menschliche Bewertungen ermöglicht.

    Log-Likelihood

    Log-Likelihood ist der Logarithmus der Likelihood, die ein probabilistisches Modell beobachteten Daten zuweist.

    Log-Sum-Exp

    Log-Sum-Exp ist ein numerischer Trick, um log(∑ᵢ eˣⁱ) stabil ohne Overflow/Underflow zu berechnen.

    Logit

    Ein Logit ist der rohe, unnormalisierte Score, den ein Modell vor der Konvertierung zu Wahrscheinlichkeiten (z.B. via Softmax) ausgibt.

    Logit Bias

    Logit Bias ist eine Technik, um die Wahrscheinlichkeit bestimmter Tokens während der Generierung zu erhöhen oder zu verringern.

    Long Context

    Long Context bezieht sich auf die Fähigkeit eines LLM, eine große Anzahl von Input-Tokens (längeres Context Window) in einer einzelnen Anfrage zu akzeptieren und zu nutzen.

    Lookahead Optimizer

    Meta-Optimizer, der zwei Gewichtssätze pflegt: "schnelle" Gewichte (normaler Optimizer) und "langsame" Gewichte, die periodisch in Richtung der schnellen interpoliert werden.

    LoRA (Low-Rank Adaptation)

    Eine effiziente Fine-Tuning-Methode, die nur kleine Adapter-Matrizen trainiert statt das gesamte Modell, wodurch Speicher und Trainingskosten drastisch sinken.

    LoRA Fine-Tuning

    Eine effiziente Fine-Tuning-Methode, die nur kleine "Adapter"-Matrizen trainiert statt aller Modellgewichte – typischerweise <1% der Parameter bei vergleichbarer Leistung.

    LoRA vs Full Fine-Tuning

    Ein Vergleich zwischen der Anpassung eines Modells via LoRA-Adapter versus dem Update aller Parameter (Full Fine-Tuning).

    Loss Landscape

    Die mehrdimensionale Oberfläche, die den Loss als Funktion der Modellparameter darstellt – der "Berg", den Gradient Descent hinabsteigt.

    Lottery Ticket Hypothesis

    Die Hypothese, dass jedes große neuronale Netz ein kleines Subnetz ("Winning Ticket") enthält, das bei gleicher Initialisierung allein trainiert die volle Leistung des großen Netzes erreichen kann.

    Lovable

    Eine AI-Plattform, die komplette Web-Anwendungen aus natürlichsprachlichen Beschreibungen generiert – inklusive Frontend, Backend und Deployment.

    LSTM (Long Short-Term Memory)

    LSTM ist eine RNN-Variante mit Gate-Mechanismen (Forget, Input, Output Gate), die das Lernen von Langzeitabhängigkeiten in Sequenzen ermöglicht.

    Luma AI

    Ein AI-Unternehmen spezialisiert auf 3D-Capture und Video-Generierung, bekannt für Dream Machine und NeRF-Technologie.

    M

    Machine Unlearning

    Techniken, um den Einfluss spezifischer Trainingsdaten aus einem ML-Modell zu entfernen, ohne das gesamte Modell neu zu trainieren.

    Mamba

    Mamba ist eine neuronale Netzwerkarchitektur, die auf selektiven State Space Models (SSMs) basiert und für effizientes Modellieren langer Sequenzen mit linearer Skalierung konzipiert ist.

    Manus AI

    Ein autonomer General-Purpose AI-Agent, der komplexe Aufgaben wie Recherche, Coding und Datenanalyse selbstständig ausführen kann.

    Maschinelle Übersetzung

    Die automatische Übersetzung von Text oder Sprache von einer natürlichen Sprache in eine andere durch ein KI-System.

    Maschinelles Lernen

    Ein Teilgebiet der KI, bei dem Systeme aus Daten lernen, um Vorhersagen oder Entscheidungen zu treffen, ohne explizit programmiert zu werden.

    Masked Language Modeling (MLM)

    MLM ist ein Trainings-Objective, bei dem ein Modell maskierte Tokens in einer Textsequenz vorhersagt (z.B. Wörter durch ein spezielles [MASK]-Token ersetzen).

    Mastery Learning

    Mastery Learning ist ein Instruktionsansatz, bei dem Lernende erst fortschreiten, nachdem sie Beherrschung eines Skills oder Objectives demonstriert haben, mit gezielter Remediation bei Bedarf.

    MATH Benchmark

    Ein Benchmark mit 12.500 Wettbewerbs-Mathematikproblemen (von Algebra bis Zahlentheorie), der fortgeschrittenes mathematisches Reasoning testet.

    Matrixfaktorisierung

    Eine Technik zur Zerlegung einer Matrix in das Produkt kleinerer Matrizen.

    Matryoshka Embedding

    Ein Embedding-Training-Ansatz, bei dem die ersten N Dimensionen eines Vektors bereits nutzbar sind – ermöglicht flexible Kompression ohne Qualitätsverlust.

    Matryoshka Representation Learning (MRL)

    Matryoshka Representation Learning (MRL) ist ein Embedding-Ansatz, der Informationen auf mehreren Granularitäten kodiert, sodass ein einzelnes Embedding auf kleinere Dimensionen gekürzt werden kann, während es für nachgelagerte Aufgaben nützlich bleibt.

    Max Tokens

    Ein API-Parameter, der die maximale Anzahl der Tokens begrenzt, die ein LLM in einer Antwort generieren kann.

    MBPP

    Ein Benchmark mit 974 einfachen Python-Programmieraufgaben, die grundlegende Programmierfähigkeiten von LLMs testen.

    Mechanistic Interpretability

    Mechanistic Interpretability ist der Versuch, neuronale Netzwerke durch Identifizierung interner Mechanismen (Features, Circuits, Algorithmen) zu reverse-engineeren, die Outputs produzieren.

    Mel-Spektrogramm

    Ein Mel-Spektrogramm ist eine visuelle Darstellung von Audio-Frequenzen auf der Mel-Skala – die Standard-Eingabe für moderne Speech- und Audio-KI-Modelle.

    Membership Inference Attack

    Ein Angriff, der bestimmt, ob ein bestimmter Datenpunkt im Training-Datensatz eines ML-Modells enthalten war.

    Memory Augmentation

    Techniken zur Erweiterung des effektiven Kontexts von LLMs über das Token-Limit hinaus – ermöglicht Erinnerung an frühere Gespräche, Fakten und Nutzerpräferenzen.

    Message Passing

    Message Passing ist das grundlegende Berechnungsparadigma von Graph Neural Networks, bei dem Knoten Informationen mit ihren Nachbarn austauschen.

    Message Passing Neural Network

    Ein vereinheitlichendes Framework für GNNs, bei dem Knoten Nachrichten von Nachbarn empfangen, aggregieren und ihre Repräsentation aktualisieren.

    Meta AI

    Die KI-Forschungsabteilung von Meta (Facebook), bekannt für die Open-Source-Veröffentlichung von Llama und führende Forschung in Multimodalität.

    Meta-Learning

    Meta-Learning ("Lernen zu lernen") zielt darauf ab, Modelle oder Systeme zu trainieren, die sich schnell an neue Tasks mit begrenzten Daten oder wenigen Beispielen anpassen.

    Metaprompt

    Ein Metaprompt ist ein höherstufiger Prompt, der die Regeln, Struktur und Constraints für die Generierung anderer Prompts oder einer ganzen Klasse von Outputs definiert.

    METEOR

    Eine Evaluationsmetrik für maschinelle Übersetzung, die unigram-Matching mit Stemming, Synonymen und Wortstellung kombiniert.

    Metric Learning

    Metric Learning trainiert Modelle, eine Distanzfunktion (Embedding-Raum) zu erlernen, bei der "ähnliche Elemente nah beieinander" und "unähnliche Elemente weit voneinander entfernt" sind.

    Midjourney

    Das führende kommerzielle Text-zu-Bild-Modell, bekannt für hochästhetische, künstlerische Bildgenerierung über Discord.

    Minimale Beschreibungslänge

    Minimale Beschreibungslänge (MDL) ist ein Prinzip für Modellauswahl, das das Modell bevorzugt, das die kürzeste Gesamtbeschreibung von Modell plus den unter ihm kodierten Daten liefert.

    Mish

    Mish = x · tanh(softplus(x)) – eine glatte, selbst-regularisierende Aktivierungsfunktion, die in YOLOv4 und einigen CNNs eingesetzt wird.

    Mistral AI

    Ein französisches KI-Startup, das Open-Weight-Modelle entwickelt und als europäische Alternative zu US-KI-Unternehmen gilt.

    Mixed Precision Training

    Mixed Precision Training verwendet eine Mischung aus niedrigerer Präzision (z.B. FP16/BF16) und Single-Precision (FP32) Repräsentationen, um das Training zu beschleunigen und dabei Genauigkeit zu erhalten.

    Mixtral

    Mistral AIs Mixture-of-Experts-Modell, das durch Aktivierung nur eines Teils der Parameter effiziente Performance auf GPT-4-Niveau erreicht.

    Mixture of Experts

    Eine KI-Architektur, bei der ein großes Modell aus spezialisierten "Experten"-Subnetzen besteht, von denen nur die relevantesten für jede Anfrage aktiviert werden – was Effizienz bei hoher Leistung ermöglicht.

    Mixup

    Data-Augmentation-Technik, die neue Trainingsbeispiele durch lineare Interpolation zwischen zwei existierenden Beispielen erzeugt.

    MLCommons

    Industrie-Konsortium, das offene Benchmarks (MLPerf), Datensätze und Best Practices für ML-Performance entwickelt.

    MMLU (Massive Multitask Language Understanding)

    Ein Multi-Choice-Benchmark mit 57 Fachgebieten (STEM, Humanities, Social Sciences) zur Messung von LLM-Weltwissen.

    MMLU-Pro

    Erweiterter MMLU-Benchmark mit anspruchsvolleren Multiple-Choice-Fragen und reduziertem Rate-Vorteil.

    MMR (Maximal Marginal Relevance)

    MMR ist eine Retrieval-Diversifizierungsmethode, die Items auswählt, die sowohl relevant zur Query als auch nicht-redundant zueinander sind.

    Mode Collapse

    Mode Collapse tritt auf, wenn ein generatives Modell nur eine begrenzte Vielfalt an Outputs produziert und große Teile der Datenverteilung ignoriert.

    Model Card

    Eine Model Card ist ein standardisiertes Dokumentationsartefakt, das die beabsichtigte Verwendung, Limitierungen, Training Data Context, Evaluationsergebnisse und ethische/Safety-Erwägungen eines Modells beschreibt.

    Model Cards

    Standardisierte Dokumentation für ML-Modelle, die Training, Fähigkeiten, Limitationen, Bias-Analysen und empfohlene Anwendungsfälle beschreibt.

    Model Collapse

    Model Collapse ist ein Degradations-Phänomen, bei dem Training auf synthetischen/modell-generierten Daten (besonders wiederholt) Diversity und Qualität reduzieren kann, wodurch das Modell zu engeren Outputs "kollabiert".

    Model Compression

    Techniken zur Reduzierung der Größe von ML-Modellen bei erhaltener Leistung.

    Model Drift

    Model Drift ist Performance-Degradation über die Zeit durch Änderungen in Datenverteilungen, Nutzerverhalten, Umgebung oder Upstream-Systemen.

    Model Extraction

    Angriffe, die versuchen, ein proprietäres ML-Modell durch systematische Queries zu rekonstruieren oder zu klonen.

    Model Extraction Attack

    Ein Angriff, bei dem ein Gegner durch systematische API-Abfragen eine funktional äquivalente Kopie eines ML-Modells erstellt.

    Model Governance

    Prozesse und Controls für den gesamten Lebenszyklus von ML-Modellen: Entwicklung, Validierung, Deployment, Monitoring und Retirement.

    Model Merging

    Techniken zum Kombinieren mehrerer trainierter Modelle zu einem einzigen Modell, das die Stärken aller Quellmodelle vereint – ohne zusätzliches Training.

    Model Monitoring

    Kontinuierliche Überwachung von ML-Modellen in Produktion hinsichtlich Performance-Degradation, Drift, Fairness und Anomalien.

    Model Serving

    Die Infrastruktur und Prozesse zum Bereitstellen trainierter ML-Modelle als API-Endpunkte für Echtzeit- oder Batch-Inferenz in Produktionsumgebungen.

    Model Simplification

    Model Simplification reduziert Komplexität um Interpretierbarkeit, Effizienz, Robustheit oder Deployment-Machbarkeit zu verbessern.

    Model Spec

    Ein Model Spec ist eine schriftliche Spezifikation, die beschreibt, wie sich ein Modell verhalten soll – einschließlich beabsichtigtem Verhalten, Constraints und Prinzipien – oft zur Steuerung von Training, Alignment und Deployment-Policy verwendet.

    Model Watermarking

    Techniken zum Einbetten unsichtbarer Kennzeichnungen in ML-Modelle oder deren Outputs, um Urheberschaft nachzuweisen oder unauthorisierte Nutzung zu erkennen.

    Model-Based Learning

    Model-Based Learning lernt ein Modell der Umgebung (Dynamiken) und nutzt es für Planung, Vorhersage oder Kontrolle.

    Model-Based Reinforcement Learning

    Model-Based RL lernt ein Modell der Umgebung (Dynamics Model) und plant mit diesem Modell, statt nur aus direkter Erfahrung zu lernen.

    Modell-Destillation

    Eine Technik, bei der ein großes "Lehrer"-Modell sein Wissen an ein kleineres, effizienteres "Schüler"-Modell überträgt.

    Momentum

    Beschleunigungstechnik für Gradient Descent, die vergangene Gradientenrichtungen akkumuliert, um schneller zu konvergieren und über lokale Minima hinwegzukommen.

    Monte Carlo Dropout (MC Dropout)

    Monte Carlo Dropout schätzt Modell-Unsicherheit, indem Dropout zur Inferenz-Zeit aktiv gehalten und mehrere stochastische Forward Passes durchgeführt werden, deren Ergebnisse dann aggregiert werden.

    Monte Carlo Tree Search (MCTS)

    MCTS ist ein Planungsalgorithmus, der durch zufällige Simulationen einen Entscheidungsbaum aufbaut und die vielversprechendsten Aktionen identifiziert.

    MT-Bench

    Ein Multi-Turn-Konversations-Benchmark für LLMs mit 80 Fragen in 8 Kategorien, bewertet durch GPT-4-as-Judge.

    MTEB

    Der Massive Text Embedding Benchmark – ein umfassender Benchmark für Text-Embedding-Modelle über 56+ Datensätze in 8 Aufgaben.

    Multi-Agent System

    System aus mehreren spezialisierten KI-Agenten, die zusammenarbeiten, um komplexe Aufgaben zu lösen, die ein einzelner Agent nicht bewältigen könnte.

    Multi-Agent Systems

    Systeme aus mehreren spezialisierten AI-Agenten, die zusammenarbeiten – jeder Agent hat eine Rolle (Researcher, Writer, Critic) und sie kommunizieren, um komplexe Tasks zu lösen.

    Multi-Armed Bandit

    Ein Algorithmus für sequenzielle Entscheidungsfindung, der Exploration und Exploitation balanciert.

    Multi-Head Attention

    Multi-Head Attention führt mehrere Attention-Berechnungen parallel mit verschiedenen gelernten Projektionen durch und kombiniert die Ergebnisse.

    Multi-Objective Optimization

    Multi-Objective Optimization (Pareto Optimization) ist Optimierung mit mehreren Zielen, die oft konfligieren, wobei Sie typischerweise Pareto-optimale Lösungen statt eines einzelnen Optimums suchen.

    Multi-Query Attention (MQA)

    Multi-Query Attention teilt sich einen einzigen Key-Value-Kopf über alle Query-Köpfe – reduziert KV-Cache um bis zu 8x bei minimalem Qualitätsverlust.

    Multi-Teacher Distillation

    Eine Distillationsmethode, bei der ein Student-Modell von mehreren spezialisierten Teacher-Modellen gleichzeitig lernt – kombiniert Expertise verschiedener Domains.

    Multi-Turn Conversation

    Eine Multi-Turn Conversation ist eine Interaktion, bei der Kontext und Intent sich über mehrere Austausche entwickeln statt einer einzelnen Query-Response.

    Multimodal

    KI-Systeme, die mehrere Datentypen (Text, Bild, Audio, Video) gleichzeitig verarbeiten und verstehen können.

    Multimodal Embeddings

    Vektorrepräsentationen, die verschiedene Datentypen (Text, Bilder, Audio) in denselben semantischen Raum projizieren – ermöglicht modalitätsübergreifendes Suchen und Verstehen.

    Multimodal Model

    Ein Multimodal Model kann über mehrere Datentypen (z.B. Text, Bilder, Audio, Video) hinweg verarbeiten und/oder generieren.

    Multimodale KI

    KI-Systeme, die mehrere Datentypen wie Text, Bilder, Audio und Video gleichzeitig verarbeiten, verstehen und generieren können.

    Multimodale KI

    KI-Systeme, die Text, Bild, Audio und Video gemeinsam verarbeiten und in beliebigen Modalitäten antworten können.

    N

    N-gram Blocking

    N-gram Blocking ist ein Decoding Constraint, der verhindert, dass ein Modell ein N-gram (Sequenz von N Tokens) generiert, das bereits im generierten Text erschienen ist.

    N-Gramm

    Zusammenhängende Sequenz von N Elementen (Zeichen oder Wörtern) aus einem Text.

    N-Shot Prompting

    N-Shot Prompting stellt N Beispiele im Prompt bereit, um dem Modell das gewünschte Muster beizubringen (0-shot = nur Anweisungen; few-shot = kleines N).

    N+1 Tool Call Problem

    Das N+1 Tool Call Problem tritt auf, wenn ein KI-Workflow einen initialen Tool Call macht und dann N zusätzliche Tool Calls (oft einen pro Retrieved Item), was unnötige Latenz und Kosten verursacht.

    NAdam

    Optimizer, der Nesterov Momentum in Adam integriert – kombiniert die Look-Ahead-Korrektur von NAG mit Adams adaptiven Lernraten.

    Named Entity Canonicalization

    Entity Canonicalization ist die Standardisierung verschiedener Surface Forms derselben Entity in eine kanonische Repräsentation (z.B. "OpenAI Inc.", "OpenAI", "Open AI").

    Named Entity Linking (NEL)

    Named Entity Linking verbindet eine Entity-Mention in Text (z.B. "OpenAI", "Apple", "Paris") mit einer spezifischen kanonischen Entity ID in einer Knowledge Base.

    Named Entity Recognition (NER)

    Die Identifikation und Klassifikation von benannten Entitäten in Text (Personen, Orte, Organisationen).

    Named Entity Recognition (NER)

    NLP-Aufgabe zur Identifikation und Klassifikation benannter Entitäten in Text.

    Nano Banana

    Codename für Googles Bildbearbeitungs-Modell (Gemini 2.5 Flash Image), das pixelgenaue Edits per Prompt ermöglicht.

    Nano Banana 2

    Googles KI-Bildgenerierungsmodell der zweiten Generation, basierend auf Gemini 3.1 Flash Image, das Pro-Qualität mit Flash-Geschwindigkeit kombiniert.

    Narrow AI

    Narrow AI (auch "Weak AI") ist KI, die entwickelt wurde, um eine spezifische Aufgabe oder einen begrenzten Satz von Aufgaben auszuführen, anstatt allgemeines Reasoning über Domains.

    Natural Gradient

    Natural Gradient ist ein Optimierungsansatz, der die Geometrie des Parameterraums berücksichtigt und oft zu effizienteren Schritten als Standard Gradient Descent in einigen probabilistischen Modellen führt.

    Natural Language Generation

    Natural Language Generation (NLG) ist der Prozess, menschlich lesbaren Text aus Daten, Intention oder internen Repräsentationen (Regeln, Templates oder neuronale Modelle) zu produzieren.

    Natural Language Processing (NLP)

    Der Bereich der KI, der sich mit der Interaktion zwischen Computern und menschlicher Sprache befasst.

    Natural Language Understanding (NLU)

    NLU ist die KI-Fähigkeit, die Bedeutung, Absicht und Struktur natürlicher Sprache zu verstehen – nicht nur Wörter zu erkennen, sondern ihren Sinn zu erfassen.

    Natural Questions

    Ein Question-Answering-Benchmark von Google mit echten Suchanfragen und Wikipedia-Artikeln als Antwortquellen.

    Negative Gewichte

    Negative Gewichte sind negative Kantenkosten in einem gewichteten Graphen (d.h. eine Aktion/Transition reduziert die Gesamtkosten).

    Negative Prompt

    Ein Negative Prompt beschreibt, was in einem generierten Bild NICHT erscheinen soll – steuert Diffusionsmodelle durch Ausschluss unerwünschter Elemente.

    Negative Prompting

    Negative Prompting ist das explizite Sagen an ein generatives Modell, was vermieden werden soll (Content, Stil, Formatierung, Claims) während der Generierung.

    Negative Transfer

    Negative Transfer tritt auf, wenn Wissenstransfer von einem vortrainierten Modell oder Source Task die Performance auf dem Target Task verschlechtert.

    Negativer Zyklus

    Ein negativer Zyklus ist ein Zyklus in einem gewichteten Graphen, dessen Gesamtgewicht negativ ist, was es ermöglicht, Pfadkosten durch Schleifen unbegrenzt zu reduzieren.

    NeRF (Neural Radiance Fields)

    NeRFs sind neuronale Methoden zur Repräsentation von 3D-Szenen, die eine Funktion lernen, die räumliche Koordinaten und Blickrichtung auf Farbe und Dichte mappt, um Novel View Synthesis zu ermöglichen.

    Nesterov Momentum

    Verbesserte Momentum-Variante, die den Gradienten am "vorausgeblickten" Punkt berechnet statt am aktuellen – schnellere und stabilere Konvergenz.

    Neural Architecture Search (NAS)

    Ein AutoML-Ansatz, bei dem Algorithmen automatisch die optimale Architektur neuronaler Netze für eine gegebene Aufgabe entdecken – der "KI designt KI"-Ansatz.

    Neural Audio Codec

    Neural Audio Codecs komprimieren Audio in diskrete Tokens – die Brücke zwischen Audio und Language Models, die Musik- und Sprachgenerierung ermöglicht.

    Neural Code Search

    Neural Code Search ruft relevante Code-Snippets oder Files mithilfe von Embeddings und semantischem Matching ab, anstatt exakter Keyword-Suche.

    Neural Collaborative Filtering

    Ein Deep-Learning-Ansatz, der neuronale Netze statt klassischer Matrixfaktorisierung für Collaborative Filtering einsetzt.

    Neural Collapse

    Neural Collapse ist ein Phänomen in deep Classifiers gegen Ende des Trainings, bei dem gelernte Representations und Classifier Weights eine hochstrukturierte Geometry aufweisen (Klassen werden eng geclustert und symmetrisch angeordnet).

    Neural Embeddings

    Neural Embeddings sind gelernte Vektor-Repräsentationen von Items (Text, User, Produkte, Dokumente), sodass Distanz im Vektorraum Ähnlichkeit widerspiegelt.

    Neural Index Rebuild

    Ein Neural Index Rebuild ist das Re-Generieren von Embeddings und Neuaufbauen von Vector (oder Hybrid) Indexes nach Änderungen an Content, Chunking oder dem Embedding Model.

    Neural Indexing

    Neural Indexing verwendet gelernte Repräsentationen und neuronale Methoden, um einen Index für Retrieval zu bauen oder zu optimieren.

    Neural IR (Neural Information Retrieval)

    Neural IR ist die Verwendung neuronaler Modelle (Embeddings, Cross-Encoder, Reranker) zum Abrufen und Ranken von Dokumenten basierend auf semantischer Relevanz.

    Neural Ordinary Differential Equation (Neural ODE)

    Neural ODEs modellieren Transformationen als kontinuierliche Zeitdynamiken, definiert durch ein neuronales Netzwerk, was bestimmte Effizienz- und Modellierungseigenschaften ermöglicht.

    Neural Pruning

    Neural Pruning entfernt Gewichte, Neuronen, Attention Heads oder ganze Strukturen aus einem Modell, um Compute/Memory zu reduzieren während Performance erhalten bleibt.

    Neural Rendering

    Neural Rendering kombiniert neuronale Netze mit Computergrafik, um fotorealistische Bilder und Videos zu erzeugen – von 3D-Szenen-Rendering bis Style-Manipulation.

    Neural Reranking

    Neural Reranking verwendet ein Modell (oft einen Cross-Encoder), um einen ersten Satz abgerufener Kandidaten basierend auf tieferem Query-Kandidat-Verständnis neu zu bewerten und zu ordnen.

    Neural Retrieval

    Neural Retrieval ist das Abrufen relevanter Elemente mithilfe gelernter Repräsentationen (dense Embeddings und Ähnlichkeitssuche) anstatt rein auf Keyword-Matching zu basieren.

    Neural Scaling Laws

    Scaling Laws beschreiben empirische Beziehungen, die zeigen wie Model-Performance vorhersagbar besser wird, wenn Compute, Daten und/oder Model-Parameter erhöht werden—oft Power-Law-artigen Trends folgend.

    Neural Style Transfer (NST)

    Neural Style Transfer ist eine Technik, die den "Style" eines Bildes (Textures, Patterns) auf den "Content" eines anderen anwendet, unter Verwendung von Neural Representations.

    Neural Topic Routing

    Neural Topic Routing verwendet ML/Embeddings, um einen Input (Query, Pageview, Conversation) in ein Topic, Workflow oder Handler basierend auf semantischer Bedeutung zu klassifizieren oder zu routen.

    Neural Voice Transfer

    KI-Technologie, die die Stimmcharakteristiken einer Aufnahme in Echtzeit auf eine andere Stimme überträgt, während der Inhalt erhalten bleibt.

    Neuro-Symbolic "Verification Layer"

    Eine Neuro-Symbolic Verification Layer ist eine Systemkomponente, die neuronale Outputs gegen symbolische Constraints (Regeln, Schemas, Policies) prüft, bevor gehandelt oder publiziert wird.

    Neuro-Symbolic AI

    Neuro-Symbolic AI kombiniert neuronale Methoden (LLMs, Embeddings) mit symbolischen Methoden (Regeln, Logik, Knowledge Graphs) zur Verbesserung von Zuverlässigkeit, Interpretierbarkeit und Constraint-Erfüllung.

    Neuronales Netzwerk

    Ein Berechnungsmodell, das von der Struktur biologischer Neuronen inspiriert ist und aus miteinander verbundenen Knoten (Neuronen) in Schichten besteht.

    Next Best Question (NBQ)

    Next Best Question ist ein Conversational Design und Decisioning Pattern, bei dem ein System die single most valuable klärende Frage stellt, um zu einem korrekten Outcome zu gelangen.

    Next Sentence Prediction (NSP)

    Next Sentence Prediction ist ein Training Objective, bei dem ein Modell vorhersagt, ob ein Satz wahrscheinlich auf einen anderen im Originaltext folgt.

    Nicht-monotone Logik

    Ein logisches System, in dem Schlussfolgerungen zurückgenommen werden können, wenn neue Informationen eintreffen, die bisherige Annahmen widerlegen.

    NL2SQL (Natural Language to SQL)

    NL2SQL konvertiert natürlichsprachliche Fragen in SQL-Queries, die gegen eine Datenbank ausgeführt werden können.

    NLP (Natural Language Processing)

    Natural Language Processing (NLP) ist das Teilgebiet der KI, das sich mit der maschinellen Verarbeitung, Interpretation und Generierung natürlicher Sprache beschäftigt.

    No Free Lunch Theorem

    Das No Free Lunch Theorem (in Optimization/Learning) besagt, dass gemittelt über alle möglichen Probleme kein Algorithmus besser performt als alle anderen—Performance hängt von der Problem-Distribution ab.

    Node2Vec

    Node2Vec ist ein Algorithmus, der Knoten eines Graphen als niedrig-dimensionale Vektoren repräsentiert, basierend auf Random Walks über die Graph-Struktur.

    Noise Injection

    Noise Injection ist das absichtliche Hinzufügen von Rauschen während Training oder Processing, um Robustheit, Generalisierung oder Privacy zu verbessern.

    Noise Schedule

    Ein Noise Schedule definiert, wie viel Rauschen in jedem Schritt der Forward- und Reverse-Prozesse eines Diffusion-Modells hinzugefügt (und später entfernt) wird.

    Noisy Student Training

    Noisy Student Training ist ein Semi-Supervised Learning Ansatz, bei dem ein "Teacher"-Modell unlabeled Data labelt, und ein "Student"-Modell auf einem Mix aus labeled + pseudo-labeled Data mit Noise/Augmentation trainiert wird.

    Nomic Embed

    Open-Source-Embedding-Modelle von Nomic AI mit voller Reproduzierbarkeit – alle Trainingsdaten und Code sind öffentlich.

    Non-Maximum Suppression (NMS)

    Non-Maximum Suppression ist ein Post-Processing-Schritt in Object Detection, der redundante überlappende Bounding Boxes entfernt und nur die konfidentesten behält.

    Nonlinear Activation Function

    Eine Nonlinear Activation Function führt Nonlinearity in neurale Networks ein (z.B. ReLU, GELU, tanh), was es ihnen ermöglicht, komplexe Beziehungen jenseits linearer Transformations zu modellieren.

    Normalisierung (Normalization)

    Normalisierung ist die Transformation numerischer Daten auf einen einheitlichen Wertebereich (oft 0–1 oder Mittelwert 0 / Standardabweichung 1), um die Trainingsstabilität von Machine-Learning-Modellen zu verbessern.

    Normalization Layer

    Eine Normalization Layer ist eine neuronale Netzwerkkomponente, die Aktivierungen normalisiert, um Training Stability und Convergence zu verbessern (z.B. LayerNorm, RMSNorm).

    Normalizing Flow

    Ein Normalizing Flow ist ein generativer Modellierungsansatz, der eine einfache Verteilung (z.B. Gaussian) über eine Sequenz invertierbarer Transformationen mit tractierbaren Likelihoods in eine komplexe transformiert.

    Novel Class Discovery (NCD)

    Novel Class Discovery findet previously unbekannte Kategorien in unlabeled Data, während Knowledge von bekannten Classes genutzt wird.

    NT-Xent Loss (Normalized Temperature-Scaled Cross-Entropy)

    NT-Xent ist eine Contrastive Learning Loss, verwendet um Embeddings zu trainieren, indem Positive Pairs zusammengezogen und Negatives auseinandergedrückt werden, mit einem Temperature Term, der Distribution Sharpness kontrolliert.

    Nutzenfunktion

    Eine Nutzenfunktion bildet Ergebnisse auf numerische Werte ab, die Präferenzen repräsentieren, und ermöglicht Tradeoffs zwischen konkurrierenden Zielen.

    O

    Object Detection

    Identifikation und Lokalisierung von Objekten in Bildern oder Videos.

    Observability für LLM-Apps

    LLM-Observability erweitert klassische Observability um KI-spezifische Signale: Prompt/Version-Tracking, Retrieval-Evidence, Tool-Traces, Token-Nutzung und Qualitäts-/Sicherheitsmetriken.

    Off-Policy Evaluation (OPE)

    Schätzt, wie eine neue Entscheidungs-Policy performen würde, unter Verwendung von Daten, die von einer anderen (bestehenden) Policy gesammelt wurden – ohne die neue Policy zu deployen.

    Offline-Evaluation

    Messung der Modell-/Systemleistung anhand vordefinierter Datensätze und Metriken vor dem Produktions-Rollout.

    On-Device Inference

    Ausführung eines Modells lokal auf dem Gerät des Nutzers (Smartphone, Laptop, Edge-Hardware) statt über eine Cloud-API.

    Once-for-All (OFA)

    Eine Trainingsmethode, die ein einziges "Supernet" trainiert, aus dem viele spezialisierte Subnetzwerke für verschiedene Hardware-Constraints extrahiert werden können – trainiere einmal, deploye überall.

    One-Cycle Policy

    Learning-Rate-Schedule, der die LR erst hochfährt (Warmup) und dann auf einen sehr niedrigen Wert absenkt – ermöglicht Training in einem Bruchteil der üblichen Epochen.

    One-Shot Learning

    Fähigkeit, aus einem einzigen Beispiel zu lernen und zu generalisieren.

    One-Shot Prompting

    Bereitstellung eines einzelnen Beispiels im Prompt, um das gewünschte Output-Muster zu demonstrieren.

    Online Distillation

    Eine Distillationsvariante, bei der mehrere Modelle gleichzeitig trainiert werden und sich gegenseitig als Teacher dienen – kein vortrainierter Teacher nötig.

    Online Learning

    Aktualisiert ein Modell inkrementell, wenn neue Daten eintreffen, anstatt von Grund auf in großen Batches neu zu trainieren.

    Online-Evaluation

    Messung der Performance auf echtem Nutzer-Traffic (A/B-Tests, Canaries, Interleaving, Holdouts) nach dem Deployment.

    ONNX (Open Neural Network Exchange)

    Ein offenes Format für den Austausch von ML-Modellen zwischen verschiedenen Frameworks – trainiere in PyTorch, deploye mit TensorRT oder CoreML.

    Ontologie (Formal)

    Eine formale Repräsentation von Konzepten und Beziehungen in einer Domäne (Entitäten, Klassen, Eigenschaften, Constraints).

    Open-Domain Dialogue

    Open-Domain Dialogue bezeichnet KI-Systeme, die über beliebige Themen frei konversieren können – ohne auf vordefinierte Intents oder Domains beschränkt zu sein.

    Open-Weight-Modell

    Ein Modell, dessen trainierte Gewichte öffentlich verfügbar sind (oder unter bestimmten Bedingungen), was Self-Hosting und tiefere Anpassung ermöglicht.

    OpenAI

    Ein führendes KI-Forschungsunternehmen und Entwickler von ChatGPT, GPT-4, DALL-E und der weltweit meistgenutzten KI-Anwendungen.

    OpenAI Codex

    OpenAIs spezialisiertes AI-Modell für Programmierung – die Technologie hinter GitHub Copilot und Basis für Code-LLMs.

    OpenAI Embeddings

    OpenAIs kommerzielle Embedding-API mit text-embedding-3-small und text-embedding-3-large – der einfachste Weg zu hochwertigen Embeddings.

    OpenAI o1

    OpenAI's erstes Modell der o-Serie, das explizites Reasoning mit Chain-of-Thought für komplexe Problemlösungen verwendet.

    OpenAI o3

    Weiterentwickeltes Reasoning-Modell von OpenAI mit verbesserter Leistung bei Mathematik, Coding und wissenschaftlichem Denken.

    OpenLLM Leaderboard

    Ein öffentliches Leaderboard von Hugging Face, das Open-Source-LLMs auf standardisierten Benchmarks (MMLU, HellaSwag, etc.) vergleicht.

    Operationalisierung

    Das Umwandeln eines Konzepts, Modells oder Prototyps in eine wiederholbare, zuverlässige, governierte Produktionsfähigkeit mit klarem Ownership, Monitoring und Change Control.

    Operator Fusion

    Eine Compiler-Optimierung, die mehrere aufeinanderfolgende Operationen in neuronalen Netzen zu einem einzigen Kernel verschmilzt – reduziert Memory-Zugriffe und beschleunigt Inferenz.

    Optimierung

    Der Prozess, Parameterwerte zu finden, die eine Loss-Funktion minimieren oder ein Ziel unter Constraints maximieren.

    Optimizer

    Der Algorithmus, der Modellparameter während des Trainings aktualisiert (z.B. SGD, Adam), basierend auf Gradienten und Konfiguration.

    Optischer Fluss

    Die Berechnung von Bewegungsvektoren zwischen aufeinanderfolgenden Video-Frames, die zeigen wohin sich jedes Pixel bewegt.

    Orchestration

    Koordiniert mehrere Schritte, Services und Tools in einen zuverlässigen Workflow – oft mit State, Retries und Observability.

    Orchestrator

    Die Systemkomponente, die Orchestration-Logik implementiert – den nächsten Schritt entscheiden, Tools aufrufen, State verwalten, Budgets/Guardrails durchsetzen.

    ORPO

    Eine Weiterentwicklung von DPO, die SFT und Preference-Alignment in einem einzigen Trainingsschritt kombiniert.

    Out-of-Distribution (OOD) Detection

    Identifizierung von Eingaben, die sich signifikant von dem unterscheiden, worauf ein Modell trainiert wurde.

    Outpainting

    Outpainting erweitert ein Bild über seine ursprünglichen Grenzen hinaus, indem KI kontextbewussten Inhalt generiert.

    Output Guardrails

    Kontrollen, die auf Modell-Outputs angewandt werden, um Sicherheits-, Policy-, Formatierungs- und Korrektheitsbeschränkungen durchzusetzen.

    Output Length Control

    Die Menge an Techniken zur Formung von Antwortlänge und -struktur (Token-Limits, Section-Caps, Templates, Validators).

    Output Parsing

    Extraktion strukturierter Felder aus Modell-Output (JSON, YAML, XML oder Muster), damit nachgelagerte Systeme es zuverlässig nutzen können.

    Output Token

    Ein Token, das von einem Sprachmodell als Teil seiner Antwort generiert wird.

    Over-Generation

    Mehr Output produzieren als nötig (zu lang, zu verbose, zu viele Schritte), was Kosten erhöht und Nutzer-Klarheit reduziert.

    Over-Retrieval

    Zu viele Dokumente/Chunks für eine Anfrage abrufen, was Kosten erhöht und oft Antwortqualität durch Rauschen und Kontext-Verdünnung senkt.

    Overfitting

    Wenn ein Modell die Trainingsdaten zu gut lernt und auf neuen Daten schlecht generalisiert.

    Overlapping Chunks

    Eine Chunking-Strategie, bei der aufeinanderfolgende Text-Chunks etwas wiederholten Inhalt (Overlap) teilen, um Kontext über Chunk-Grenzen zu erhalten.

    OWASP LLM Top 10

    Eine standardisierte Liste der kritischsten Sicherheitsrisiken für LLM-Anwendungen, veröffentlicht von OWASP.

    P

    PagedAttention

    Eine Memory-Management-Technik inspiriert von OS Virtual Memory, die KV-Cache in Blöcken verwaltet und so GPU-Memory-Fragmentierung eliminiert.

    Parallel Tool Calls

    Ausführung mehrerer Tool-/API-Calls gleichzeitig statt sequentiell, um End-to-End-Latenz zu reduzieren.

    Parameter Count

    Die Anzahl der gelernten Gewichte in einem Modell, oft als grober Proxy für Kapazität und Compute-Anforderungen verwendet.

    Parameter Sharing

    Eine Modellierungstechnik, bei der mehrere Teile eines neuronalen Netzes dieselben Gewichte wiederverwenden statt separate Parameter zu haben.

    Passage Reranking

    Reordnung abgerufener Passagen mit einem stärkeren Relevanz-Modell (oft Cross-Encoder), um Präzision vor Generation zu verbessern.

    Passage Retrieval

    Findet relevante Textpassagen (Chunks) statt ganzer Dokumente, um Präzision für Question Answering und RAG zu verbessern.

    PDDL

    Eine standardisierte Sprache zur Beschreibung von Planungsproblemen in der Künstlichen Intelligenz, die Zustände, Aktionen und Ziele formal definiert.

    PEFT

    Eine Familie von Techniken, die LLMs anpassen, indem nur ein kleiner Teil der Parameter trainiert wird, anstatt das gesamte Modell zu aktualisieren.

    Perceptron

    Das Perceptron ist die einfachste Form eines künstlichen Neurons und die Grundlage moderner neuronaler Netze – ein linearer Klassifikator, der Eingaben gewichtet summiert und durch eine Aktivierungsfunktion leitet.

    Perplexity

    Eine Sprachmodell-Metrik, abgeleitet von der durchschnittlichen negativen Log-Likelihood; misst, wie "überrascht" ein Modell von Text ist.

    Perplexity

    Eine AI-First Suchmaschine, die Fragen mit zitierten, zusammengefassten Antworten beantwortet – der führende Google-Herausforderer.

    Pfadfindung

    Der Prozess, eine Route zwischen Knoten in einem Graphen zu finden, die ein Ziel optimiert (kürzeste, günstigste, sicherste, schnellste).

    Phi

    Microsofts Small Language Models (SLMs), die trotz geringer Größe überraschend starke Performance zeigen und On-Device-AI ermöglichen.

    Pika Labs

    Ein AI-Video-Startup mit benutzerfreundlicher Text-zu-Video- und Bild-zu-Video-Generierung, beliebt für kurze Clips.

    Pipeline Parallelism

    Eine Parallelisierungsstrategie, die verschiedene Modell-Schichten auf verschiedene GPUs verteilt – Daten fließen wie in einer Pipeline durch die GPU-Kette.

    Planning

    Die Fähigkeit von KI-Agenten, komplexe Ziele in ausführbare Schritte zu zerlegen und eine Strategie zur Zielerreichung zu entwickeln.

    Poisoning Attack

    Ein Angriff, bei dem ein Gegner Trainingsdaten, Retrieval-Korpora oder Feedback-Signale manipuliert, um Modellverhalten zu degradieren.

    Policy

    Eine Policy ist eine Regel oder Strategie, die bestimmt, welche Aktionen unter welchen Bedingungen ausgeführt werden.

    Policy Engine

    Eine Komponente, die Regeln und Constraints zur Laufzeit durchsetzt (wer was darf, welche Tools erlaubt sind, welche Outputs erlaubt sind).

    Policy Gradient

    Methoden, die eine Policy direkt optimieren, indem Parameter in die Richtung angepasst werden, die den erwarteten Reward verbessert.

    Popularitäts-Bias

    Die systematische Überrepräsentation populärer Items in Empfehlungen, die Nischen-Items benachteiligt und Filter Bubbles verstärkt.

    POS-Tagging

    Die automatische Zuordnung von Wortarten (Nomen, Verb, Adjektiv etc.) zu jedem Wort in einem Satz.

    Pose Estimation

    Die Erkennung und Lokalisierung von Körpergelenken und Skelett-Keypoints in Bildern oder Videos.

    Positional Encoding

    Eine Methode, die Transformer-Modellen Informationen über die Position von Tokens in einer Sequenz gibt, da sie keine inhärente Ordnungsinformation haben.

    Positional Interpolation

    Eine Technik zur Erweiterung der nutzbaren Kontextlänge eines Modells durch Reskalierung der Positions-Repräsentation.

    Post-Training

    Jede Trainingsphase nach dem Pretraining, um ein Modell für gewünschte Verhaltensweisen zu formen – Hilfsbereitschaft, Sicherheit, Instruction-Following.

    Post-Training Quantization (PTQ)

    Reduziert Modell-Präzision (z.B. FP16 → INT8/INT4) nach dem Training, um Speichernutzung zu senken und Inferenz zu beschleunigen.

    Posterior Collapse

    Posterior Collapse tritt bei VAEs auf, wenn der Encoder lernt, den Prior zu kopieren statt informative latente Repräsentationen zu erzeugen.

    Pre-LN vs. Post-LN

    Bezeichnet die Position der Layer Normalization in Transformer-Blöcken: Pre-LN normalisiert vor Attention/FFN, Post-LN danach.

    Pre-Training

    Die erste Trainingsphase eines LLMs, in der das Modell auf riesigen Textmengen (oft Billionen Tokens) lernt, Sprache zu verstehen und zu generieren – bevor spezialisiertes Fine-Tuning folgt.

    Predictive Maintenance

    KI-gestütztes Vorhersagen von Maschinenausfällen, bevor sie eintreten, um ungeplante Stillstände zu vermeiden.

    Preference Data

    Datensätze, in denen Menschen (oder AI-Judges) angeben, welche von zwei Modell-Antworten besser ist – das Trainingsmaterial für RLHF, DPO und ähnliche Alignment-Methoden.

    Preference Optimization

    Training oder Anpassung von Modellen mit Preference-Signalen (A bevorzugt über B), um Alignment mit gewünschten Outputs zu verbessern.

    Prefill

    Die Inferenz-Phase, in der das Modell den Prompt verarbeitet, um den initialen internen State aufzubauen, bevor Output-Tokens generiert werden.

    Prefill Latency

    Die Zeit, die für die Verarbeitung des Input-Prompts aufgewandt wird, bevor das Modell Token generieren kann.

    Prefix Cache

    Wiederverwendung von berechnetem Modell-State (oft KV-Cache) für wiederholte Prompt-Prefixes, um wiederholte Prefill-Berechnung zu vermeiden.

    Prefix Caching

    Prefix Caching speichert KV-Cache-Berechnungen für häufig wiederverwendete Prompt-Prefixe (z.B. System Prompts) und teilt sie zwischen Requests.

    Prefix Tuning

    Eine parameter-effiziente Adaptationstechnik, bei der Sie kleine "Prefix"-Vektoren lernen, die Attention Layers steuern, statt alle Modell-Gewichte zu fine-tunen.

    PReLU (Parametric ReLU)

    Eine ReLU-Variante mit lernbarem negativem Steigungsparameter – der Leak-Faktor wird während des Trainings optimiert.

    Pretraining

    Training eines Modells auf großen Datenmengen (oft selbstüberwacht), um allgemeine Repräsentationen zu lernen, bevor aufgabenspezifische Anpassung erfolgt.

    Privacy-Preserving Machine Learning

    Ein Set von Techniken, die Datenschutzrisiken beim Training oder Serving von Modellen reduzieren.

    Product Quantization (PQ)

    Eine Vektor-Kompressionstechnik, die hochdimensionale Vektoren mit kompakten Codes approximiert für schnellere ANN-Suche.

    Progressive Shrinking

    Eine Trainingstechnik, bei der ein großes Netzwerk schrittweise verkleinert wird – erst Kernel, dann Tiefe, dann Breite – um ein Supernet zu trainieren, das viele Subnetze unterstützt.

    Prompt

    Die Eingabe (Anweisungen + Kontext + Beispiele + Constraints), die einem Sprachmodell bereitgestellt wird, um eine gewünschte Ausgabe zu erhalten.

    Prompt A/B Testing

    Vergleich zweier Prompt-Versionen auf realem Traffic, um Unterschiede in Outcomes und Guardrails zu messen.

    Prompt Budget

    Eine explizite Allokation von Tokens für Anweisungen, Kontext, abgerufene Evidence und Beispiele.

    Prompt Caching

    Eine Optimierungstechnik, bei der häufig verwendete Prompt-Präfixe zwischengespeichert werden, um API-Kosten und Latenz zu reduzieren.

    Prompt Chaining

    Das Verbinden mehrerer Prompts, wobei der Output eines Prompts als Input für den nächsten dient, um komplexe Aufgaben zu lösen.

    Prompt Compression

    Reduzierung der Prompt-Länge bei Erhalt wesentlicher Constraints und Kontext.

    Prompt Engineering

    Die Kunst und Wissenschaft der Gestaltung von Eingabeaufforderungen (Prompts), um gewünschte Outputs von LLMs zu erhalten.

    Prompt Hardening

    Stärkung von Prompts und umgebenden Controls gegen Missbrauch, Injection und unsichere Outputs.

    Prompt Leakage

    Unbeabsichtigte Offenlegung von System-Prompts, versteckten Anweisungen oder sensitivem Kontext – durch Modell-Outputs, Logs oder UI/Debug-Tools.

    Prompt Leaking

    Techniken, um versteckte System-Prompts aus LLM-Anwendungen zu extrahieren.

    Prompt Linting

    Automatisierte statische Analyse von Prompts, um Probleme vor dem Deployment zu erkennen (Konflikte, fehlende Constraints, unsichere Formulierungen).

    Prompt Registry

    Ein System zum Speichern, Versionieren, Testen und Governer von Prompts als Produktions-Artefakte.

    Prompt Regression Testing

    Ausführung einer stabilen Evaluations-Suite gegen Prompt-Änderungen, um Qualitäts-, Sicherheits-, Format- und Kosten-Regressionen zu erkennen.

    Prompt Router

    Wählt das beste Prompt-Template (oder Workflow) für einen Request basierend auf Intent, Schwierigkeit, Risiko und Kontext.

    Prompt Sandbox

    Eine sichere Umgebung zum Testen von Prompts mit kontrollierten Daten, Tools und Logs vor Produktion.

    Prompt Template

    Eine wiederverwendbare Prompt-Struktur mit Variablen (Platzhaltern), die dynamisch gefüllt werden können.

    Prompt Tokens

    Die vom Modell-Input verbrauchten Tokens (System-Anweisungen, Nutzer-Nachricht, abgerufener Kontext, Tool-Schemas, Beispiele).

    Prompt Tuning

    Parameter-effiziente Methode, bei der nur lernbare Token-Embeddings am Input trainiert werden, während das gesamte Modell eingefroren bleibt.

    Proximal Policy Optimization (PPO)

    Ein Reinforcement-Learning-Algorithmus, der Policies auf eingeschränkte Weise aktualisiert, um übermäßig große, instabile Änderungen zu vermeiden.

    Pruning

    Eine Technik zur Modellkompression, die unwichtige Gewichte oder Neuronen aus einem neuronalen Netzwerk entfernt, um Größe zu reduzieren und Inferenz zu beschleunigen.

    Q

    Q-Former

    Ein Q-Former ist ein abfragebasiertes Transformer-Modul, das in manchen multimodalen Systemen verwendet wird, um Informationen aus einer Modalität zu extrahieren und zu komprimieren.

    Q-Funktion

    Die Q-Funktion (Action-Value-Funktion) ordnet einem Zustand-Aktions-Paar den erwarteten Return zu: Q(s, a).

    Q-Learning

    Q-Learning ist eine Reinforcement-Learning-Methode, die eine Wertefunktion Q(s, a) lernt, um die erwartete Belohnung einer Aktion in einem Zustand zu schätzen.

    QAT (Quantization-Aware Training)

    Quantization-Aware Training trainiert ein Modell unter Simulation von Quantisierungseffekten, was die Genauigkeit nach Quantisierung im Vergleich zu PTQ verbessert.

    QKV (Query–Key–Value)

    QKV bezieht sich auf die Query (Q), Key (K) und Value (V) Matrizen, die in Transformer-Attention-Mechanismen verwendet werden.

    QLoRA

    Eine Kombination aus Quantisierung und LoRA, die Fine-Tuning von LLMs mit stark reduziertem Speicherbedarf ermöglicht, indem das Basismodell quantisiert und nur LoRA-Adapter in voller Präzision trainiert werden.

    Quadratische Attention-Kosten

    Quadratische Attention-Kosten beziehen sich auf die klassische Skalierung von Full Self-Attention, die etwa mit dem Quadrat der Sequenzlänge wächst (O(n²)).

    Quality-of-Answer Score

    Ein Quality-of-Answer Score ist eine zusammengesetzte Metrik, die schätzt, wie gut eine AI-Antwort ist (Nützlichkeit, Korrektheit, Klarheit, Groundedness, Sicherheit).

    Quantization-Aware Training (QAT)

    Eine Trainingsmethode, die Quantisierungsfehler während des Trainings simuliert, damit das Modell lernt, mit niedrigerer Präzision umzugehen – höhere Qualität als Post-Training Quantization.

    Quantum Machine Learning (QML)

    Quantum Machine Learning erforscht die Nutzung von Quantencomputing-Konzepten (Qubits, Superposition, Verschränkung), um bestimmte ML-Berechnungen zu beschleunigen.

    Quarantine (Quarantäne)

    Quarantäne isoliert Content, Inputs oder Events, die verdächtig, unsicher oder von geringem Vertrauen sind, damit sie Produktions-Outputs nicht beeinflussen können.

    Query Embeddings

    Query Embeddings sind Vektor-Repräsentationen von Suchanfragen, die für semantisches Similarity-Matching gegen eingebettete Dokumente/Passagen verwendet werden.

    Query Fan-Out

    Query Fan-Out ist, wenn eine Anfrage viele nachgelagerte Queries/Tool-Calls auslöst, um Kontext oder Ergebnisse zu sammeln.

    Query Federation

    Query Federation führt eine Anfrage über mehrere Systeme/Quellen (Datenbanken, Services, Indizes) aus und kombiniert die Ergebnisse.

    Query Likelihood Model

    Ein Query Likelihood Model ist ein Information-Retrieval-Ansatz, bei dem Dokumente nach der Wahrscheinlichkeit gerankt werden, dass ihr Sprachmodell die Query generieren würde.

    Query Reranking

    Query Reranking ordnet Such-/Retrieval-Ergebnisse mit einer stärkeren Scoring-Funktion (oft Cross-Encoder oder LLM-basierter Scorer) neu, um Relevanz an der Spitze zu verbessern.

    Query Rewrite

    Query Rewrite ist das Modifizieren einer Suchanfrage, um die Retrieval-Qualität (Recall/Precision) zu verbessern, oft durch Klärung der Intention, Term-Erweiterung oder Vokabular-Normalisierung.

    Query Rewriting

    Transformation einer Benutzeranfrage in eine Form, die bessere Retrieval-Ergebnisse liefert.

    Query Understanding Evaluation

    Query Understanding Evaluation misst, wie gut Ihr System User-Intent, Entities, Constraints und Risikolevel aus Queries interpretiert.

    Query-Expansion

    Query-Expansion ergänzt eine Anfrage mit zusätzlichen Begriffen oder semantischen Signalen, um den Retrieval-Recall zu verbessern.

    Query-Routing

    Query-Routing sendet eine Anfrage an die am besten geeignete Engine, Modell, Index oder Workflow basierend auf Intent, Konfidenz und Constraints.

    Query-Time-Filtering

    Query-Time-Filtering wendet Einschränkungen während des Retrievals an – wie Berechtigungen, Tenant-Grenzen, Aktualitätsfenster, Sprache oder Dokumenttyp.

    Question Answering (QA)

    Question Answering ist eine Aufgabe, bei der ein System Fragen basierend auf einem Korpus, einer Wissensbasis oder Modellwissen beantwortet.

    Question Decomposition

    Question Decomposition zerlegt eine komplexe Frage in kleinere Teilfragen, die zuverlässiger beantwortet werden können.

    Quota-Aware Routing

    Quota-Aware Routing wählt Modelle/Workflows basierend auf verbleibendem Quota und Cost Budgets (z.B. einfache Queries zu günstigeren Modi routen wenn Budget niedrig).

    Qwen

    Alibabas Open-Weight-LLM-Familie, die in vielen Benchmarks mit Llama und Mistral konkurriert und starke mehrsprachige Fähigkeiten bietet.

    R

    RAG (Retrieval-Augmented Generation)

    Retrieval-Augmented Generation (RAG) ist eine Architektur, bei der ein LLM eine Antwort unter Verwendung abgerufener externer Informationen (Dokumente/Chunks) als Evidenz generiert, anstatt sich nur auf seine internen Parameter zu verlassen.

    RAG Chunking Strategie

    Eine RAG Chunking Strategie definiert, wie Quelldokumente in abrufbare Einheiten aufgeteilt werden (Chunk-Größe, Overlap, Struktur-Erhaltung, Metadaten).

    RAG Evaluation

    Die systematische Bewertung von RAG-Systemen über Retrieval-Qualität, Antwort-Relevanz, Groundedness und Faithfulness.

    RAG Poisoning

    RAG Poisoning ist ein Angriff oder Fehlermodus, bei dem der Retrieval-Korpus manipuliert wird, sodass bösartiger oder irreführender Content als "Evidenz" abgerufen wird und Outputs verschlechtert oder das System beeinflusst.

    Ragas

    Ragas ist ein populärer Evaluations-Ansatz/Library für RAG-Systeme, der praktische Metriken und Workflows zur Bewertung von Retrieval + Generation-Qualität bietet.

    Random Search

    Hyperparameter-Tuning durch zufälliges Sampling aus dem Parameterraum – effizienter als Grid Search bei gleichem Rechenbudget.

    Re-Embedding

    Re-Embedding regeneriert Embeddings für einen Korpus (Dokumente/Chunks) mit demselben oder einem neuen Embedding Model und aktualisiert dann den Vector Index entsprechend.

    ReAct (Reason + Act)

    ReAct ist ein agentisches Pattern, bei dem ein Modell zwischen Reasoning und Aktionen (Tool Calls) alterniert und Beobachtungen einbezieht, bevor es fortfährt.

    ReAct Prompting

    Ein Prompting-Paradigma, das Reasoning (Denken) und Acting (Handeln) in einer Schleife verbindet – das LLM denkt laut nach, führt Aktionen aus und reflektiert die Ergebnisse.

    Reasoning Model

    KI-Modelle, die explizite Denkschritte durchführen und zeigen, bevor sie eine finale Antwort generieren – optimiert für komplexes Schlussfolgern.

    Reasoning Models

    Eine neue Klasse von LLMs (OpenAI o1, o3, DeepSeek R1), die explizites Schritt-für-Schritt-Reasoning vor der Antwort durchführen – "Denken" wird sichtbar und verbessert komplexe Problemlösung.

    Recall@k

    Recall@k misst, wie oft die benötigten relevanten Items innerhalb der top-k abgerufenen Ergebnisse erscheinen.

    Recency Bias

    Recency Bias ist die Tendenz, neuere Informationen überzubewerten – entweder in menschlicher Beurteilung oder im Systemverhalten (Ranking, Context Usage).

    Recht auf Erklärung

    Das rechtliche oder ethische Recht von Betroffenen, eine verständliche Erklärung für automatisierte Entscheidungen zu erhalten.

    Reciprocal Rank Fusion (RRF)

    RRF kombiniert mehrere gerankte Ergebnislisten zu einer, indem es reziproke Ränge summiert – verbessert Robustheit, wenn verschiedene Retrieval-Methoden bei verschiedenen Queries excellieren.

    Recommendation Engine

    System, das personalisierte Empfehlungen basierend auf Nutzerverhalten generiert.

    Red Teaming

    Der systematische Versuch, Schwachstellen und gefährliche Verhaltensweisen in KI-Systemen zu finden, bevor sie von böswilligen Akteuren ausgenutzt werden.

    Reflection Agent

    Ein Agenten-Pattern, bei dem das LLM seine eigenen Outputs kritisch bewertet und iterativ verbessert – wie ein internes Code-Review.

    Regression

    ML-Methode zur Vorhersage kontinuierlicher numerischer Werte.

    Regression Testing

    Regression Testing stellt sicher, dass Änderungen (Code, Prompts, Retrieval Config, Model Versions) bestehendes Verhalten oder Qualität nicht brechen.

    Regularisierung

    Techniken, die Overfitting verhindern, indem sie die Komplexität des Modells einschränken.

    Reinforcement Learning

    Ein Lernparadigma, bei dem ein Agent durch Interaktion mit einer Umgebung lernt, Belohnungen zu maximieren.

    Reinforcement Learning (RL)

    Reinforcement Learning ist ein Paradigma, bei dem ein Agent lernt, Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und kumulativen Reward optimiert.

    Rekurrentes Neuronales Netz (RNN)

    RNNs verarbeiten Sequenzen, indem sie einen Hidden State über Zeitschritte weitergeben – die ursprüngliche Architektur für Sprache und Zeitreihen, heute größtenteils durch Transformer ersetzt.

    Relation Extraction

    Relation Extraction identifiziert und klassifiziert semantische Beziehungen zwischen Entitäten in unstrukturiertem Text.

    ReLU (Rectified Linear Unit)

    ReLU ist die meistgenutzte Aktivierungsfunktion im Deep Learning: f(x) = max(0, x) – einfach, schnell und effektiv gegen Vanishing Gradients.

    Reparameterization Trick

    Der Reparameterization Trick ermöglicht Backpropagation durch stochastische Sampling-Operationen, indem Zufälligkeit als externe Variable behandelt wird.

    Reproducibility

    Reproducibility ist die Fähigkeit, dieselben (oder äquivalente) Outputs und Verhalten bei gleichen Inputs, Versionen und Konfiguration zu reproduzieren.

    Reranker

    Ein Reranker ist ein Modell, das abgerufene Kandidaten (Dokumente/Chunks) neu bewertet und neu ordnet, um Relevanz an der Spitze zu verbessern.

    Reranking

    Neuordnung von Retrieval-Ergebnissen mit einem leistungsfähigeren Modell für bessere Relevanz.

    Residual Connection (Skip Connection)

    Residual Connections addieren den Input einer Schicht zu ihrem Output, sodass Gradienten direkt durch tiefe Netzwerke fließen können.

    ResNet

    Eine CNN-Architektur mit Skip Connections (Residualverbindungen), die das Training sehr tiefer Netzwerke ermöglicht.

    Response Generation

    KI-Prozess zur Generierung natürlichsprachlicher Antworten.

    Responsible AI

    Ein ganzheitlicher Ansatz zur Entwicklung und Nutzung von KI-Systemen, der ethische Prinzipien wie Fairness, Transparenz, Datenschutz und menschliche Kontrolle in den Mittelpunkt stellt.

    RetNet (Retentive Network)

    Eine Architektur von Microsoft, die Transformer-Qualität mit linearer Inferenz-Komplexität kombiniert durch einen "Retention"-Mechanismus.

    Retrieval Confidence

    Retrieval Confidence ist ein Signal, das schätzt, ob abgerufene Ergebnisse ausreichende, relevante Evidenz enthalten, um die Query zuverlässig zu beantworten.

    Retrieval Drift

    Retrieval Drift ist eine Änderung im Retrieval-Verhalten/Qualität über Zeit durch Korpus-Updates, Embedding-Model-Änderungen, Indexing-Settings, Query-Distributions-Shifts oder Metadaten-Änderungen.

    Retrieval-Augmented Generation

    Eine KI-Architektur, die Large Language Models mit externen Wissensquellen verbindet, indem relevante Dokumente abgerufen und als Kontext für die Antwortgenerierung verwendet werden.

    Retrieval-Augmented Generation (RAG)

    Eine Technik, die LLM-Generierung mit externem Wissensabruf kombiniert, um fundiertere und aktuellere Antworten zu liefern.

    Retrieval-First Policy

    Eine Retrieval-First Policy zwingt das System, Evidenz abzurufen, bevor es substantive Antworten generiert, besonders für faktische oder High-Risk Queries.

    Retriever

    Ein Retriever ist die Komponente, die Kandidaten-Dokumente/Chunks relevant zu einer Query auswählt (Keyword, Vector, Hybrid oder federated).

    Retriever-Reranker Cascade

    Eine Retriever-Reranker Cascade ist ein zweistufiger Retrieval-Ansatz: ein schneller Retriever generiert Kandidaten, dann selektiert ein langsamerer, genauerer Reranker die besten top-k.

    Reward Hacking

    Reward Hacking tritt auf, wenn ein Model/Agent Wege findet, Reward zu maximieren, ohne tatsächlich das beabsichtigte Real-World-Ziel zu erreichen.

    Reward Model

    Ein Reward Model bewertet Modell-Outputs nach einem Preference-Objective (Helpfulness, Safety, Format Compliance), oft verwendet in Alignment-Style-Training oder Evaluation.

    Ring Attention

    Eine verteilte Attention-Technik, die lange Sequenzen über mehrere GPUs verteilt, indem KV-Blöcke ringförmig zwischen Devices weitergereicht werden.

    RLAIF (Reinforcement Learning from AI Feedback)

    RLAIF nutzt AI-generierte Kritiken oder Präferenzen (oft von einem Judge Model) als Feedback-Signale, um Modellverhalten zu verbessern und die Abhängigkeit von Human Labeling zu reduzieren.

    RLHF (Reinforcement Learning from Human Feedback)

    Eine Trainingsmethode, die LLMs durch menschliches Feedback zu nützlicheren, sichereren und besser ausgerichteten Antworten bringt – der Schlüssel zur "Alignment" moderner ChatGPT-artiger Modelle.

    RMSNorm

    Eine vereinfachte Variante von Layer Normalization, die nur Root Mean Square nutzt und auf Mean-Zentrierung verzichtet – schneller und in LLaMA/Mistral Standard.

    RMSprop

    Adaptiver Optimizer, der AdaGrads Problem löst, indem er einen exponentiell gewichteten Durchschnitt der quadrierten Gradienten nutzt statt deren Summe.

    RNN (Recurrent Neural Network)

    Ein Recurrent Neural Network (RNN) ist eine neuronale Netz-Architektur für sequenzielle Daten, bei der Neuronen ihren eigenen Output als zusätzlichen Input für den nächsten Zeitschritt nutzen — wodurch Kontext über Sequenzen hinweg erhalten bleibt.

    Robotik (KI)

    Das Feld der Entwicklung intelligenter Roboter, die mithilfe von KI autonom Aufgaben in der physischen Welt wahrnehmen, planen und ausführen.

    Robustheitstests

    Robustheitstests evaluieren, wie zuverlässig ein Modell oder System unter Perturbationen, Edge Cases, Rauschen oder Distribution Shifts performt.

    RoPE

    Eine Methode zur Kodierung von Positionsinformationen in Transformers durch Rotation der Query- und Key-Vektoren, die relative Positionen natürlich erfasst.

    RoPE (Rotary Positional Embeddings)

    RoPE ist eine Positionskodierungsmethode, die Rotationen auf Query/Key-Vektoren anwendet und Modellen ermöglicht, Token-Positionen so darzustellen, dass relatives Positionsverhalten unterstützt wird.

    ROUGE Score

    Metriken zur Bewertung automatischer Textzusammenfassungen.

    Routing Policy

    Eine Routing Policy ist das Regelset, das entscheidet, welches Model/Workflow/Tools für einen Request basierend auf Intent, Risk, Confidence und Budgets verwendet werden.

    Rückwärtsverkettung

    Eine Inferenzstrategie, die vom Ziel ausgeht und rückwärts arbeitet, um die Fakten und Regeln zu finden, die das Ziel beweisen würden.

    Runway

    Eine führende AI-Video-Plattform mit Text-zu-Video, Bild-zu-Video und fortschrittlichen Editing-Tools für kreative Profis.

    RWKV

    Eine Open-Source-Architektur, die RNN-Effizienz (O(1) Inferenz pro Token) mit Transformer-ähnlicher Parallelisierbarkeit beim Training kombiniert.

    S

    S4 (Structured State Spaces for Sequences)

    Die bahnbrechende State-Space-Architektur, die HiPPO-Initialisierung mit effizienter Convolution-Berechnung kombiniert und die SSM-Revolution auslöste.

    Safety

    Safety in KI-Systemen ist die Gesamtheit der Maßnahmen, die schädliche, unsichere oder richtlinienwidrige Ausgaben und Aktionen verhindern – insbesondere bei gegnerischen oder mehrdeutigen Eingaben.

    Safety Alignment

    Safety Alignment ist die Formung von Modell-/Systemverhalten, sodass es zuverlässig Safety-Constraints folgt (Refusals, sichere Defaults, Richtlinieneinhaltung) bei normalen und gegnerischen Eingaben.

    Safety Case

    Ein Safety Case ist ein strukturiertes Argument – gestützt durch Evidenz – dass ein System für einen spezifischen Kontext und Risikoprofil akzeptabel sicher ist.

    Safety Classifier

    Ein Safety Classifier ist ein Modell-/Regelsystem, das unsichere Inhalte oder riskante Absichten erkennt (z.B. Selbstschädigung, Hass, Datenexfiltrations-Versuche, Richtlinienverletzungen).

    Safety Evaluation

    Safety Evaluation ist das systematische Testen eines KI-Systems auf schädliches, richtlinienwidriges, unsicheres oder privacy-riskantes Verhalten – über normale und gegnerische Inputs.

    Safety Filters

    Safety Filters erkennen und blockieren oder transformieren unsichere Outputs (oder unsichere Inputs) basierend auf Policy (z.B. sexuelle Inhalte, Gewalt, Hass, Selbstverletzung, illegale Anweisungen).

    Safety Guardrails

    Safety Guardrails sind Mechanismen, die das Verhalten eines KI-Systems einschränken, um Schaden zu reduzieren (Policies, Validatoren, Permission-Boundaries, Rate-Limits, Refusals).

    Safety Incident Taxonomy

    Eine Safety Incident Taxonomy ist ein strukturiertes Klassifikationssystem für KI-Safety-Incidents (was passiert ist, Severity, Impact, Root Cause, Mitigation).

    Safety Training

    Der Prozess, LLMs durch spezialisiertes Training sicherer zu machen – umfasst RLHF, DPO, Constitutional AI und Red-Teaming-basiertes Training.

    Saliency Map

    Visualisierung, die zeigt, welche Eingabe-Pixel oder -Token den größten Einfluss auf die Modell-Ausgabe haben, basierend auf Gradienten.

    SAM (Segment Anything Model)

    Ein Foundation Model von Meta für universelle Bildsegmentierung, das jedes Objekt in einem Bild mit Zero-Shot-Fähigkeit segmentieren kann.

    Sampling Steps

    Sampling Steps sind die Anzahl iterativer Denoising-Iterationen, die während der Diffusions-Inferenz zur Generierung eines Outputs verwendet werden.

    Sampling Temperature

    Sampling Temperature skaliert die Output-Verteilung des Modells: niedrigere Temperaturen machen Outputs deterministischer; höhere Temperaturen erhöhen die Zufälligkeit.

    SARSA

    SARSA ist ein on-policy RL-Algorithmus, der Q-Werte basierend auf der tatsächlich ausgeführten Aktion aktualisiert – im Gegensatz zu Q-Learnings off-policy Maximum.

    Satisficing

    Satisficing bedeutet, eine Lösung zu wählen, die 'gut genug' ist um Constraints zu erfüllen, anstatt für das absolut Beste zu optimieren.

    Scalable Oversight

    Methoden, um AI-Systeme zu überwachen und zu korrigieren, die menschliche Fähigkeiten übersteigen – wie kann man etwas beaufsichtigen, das klüger ist als man selbst?

    Scaled Dot-Product Attention

    Die Basis-Attention-Berechnung: Attention(Q,K,V) = softmax(QK^T / √d_k) · V – die mathematische Grundlage aller Transformer.

    Scaling Laws

    Scaling Laws sind empirische Beziehungen, die zeigen, wie Modell-Performance tendenziell vorhersagbar verbessert wird, wenn Sie Daten, Compute und Parameter skalieren.

    Scene Understanding

    AI-Fähigkeit, komplexe visuelle Szenen ganzheitlich zu verstehen – Objekte, deren Beziehungen, Kontext und implizite Bedeutung.

    Schema Drift

    Schema Drift ist, wenn sich die erwartete Struktur von Daten über Zeit ändert (Felder hinzugefügt/entfernt/umbenannt, Typen ändern sich, Enums erweitern), oft Pipelines brechend.

    Score Matching

    Score Matching lernt den Gradienten der Log-Wahrscheinlichkeitsdichte (Score Function) einer Datenverteilung, um Samples durch Langevin-Dynamik zu generieren.

    SearchGPT

    OpenAIs Echtzeit-Web-Suchfunktion, integriert in ChatGPT – kombiniert Konversation mit aktuellen Web-Informationen.

    Secure Aggregation

    Ein kryptografisches Protokoll, das es einem Server ermöglicht, aggregierte Werte aus individuellen Beiträgen zu berechnen, ohne die einzelnen Werte zu sehen.

    Seedance

    KI-Videogenerator von ByteDance mit kontroverser Trainingsdaten-Herkunft und photorealistischen Ergebnissen.

    Selective Prediction

    Ein Ansatz, bei dem ein Modell unsichere Vorhersagen verweigert und an Menschen oder andere Systeme delegiert.

    Self-Attention

    Attention-Mechanismus, bei dem Eingabe-Elemente aufeinander bezogen werden.

    Self-Consistency

    Self-Consistency ist eine Technik, bei der Sie mehrere Reasoning-Pfade/Antworten samplen und diese aggregieren (z.B. Mehrheitsvotum), um die Zuverlässigkeit zu verbessern.

    Self-Distillation

    Eine Variante der Knowledge Distillation, bei der ein Modell sich selbst als Teacher nutzt – das gleiche oder ein identisches Modell wird als Lehrer für ein neues Training verwendet.

    Self-Play

    Self-Play ist eine RL-Trainingsmethode, bei der ein Agent gegen Kopien seiner selbst spielt, um durch Wettbewerb stetig besser zu werden.

    Self-Supervised Learning

    Lernparadigma, bei dem das Modell Labels aus den Daten selbst generiert.

    SELU (Scaled Exponential Linear Unit)

    Eine selbst-normalisierende Aktivierungsfunktion, die Outputs automatisch auf Mittelwert 0 und Varianz 1 zentriert – braucht keine Batch/Layer Norm.

    Semantic Caching

    Semantic Caching verwendet frühere Antworten/Ergebnisse wieder, wenn eine neue Anfrage semantisch ähnlich zu einer vorherigen ist, nicht notwendigerweise identisch.

    Semantic Chunking

    Semantic Chunking teilt Dokumente in Chunks basierend auf Bedeutungsgrenzen (Themen/Abschnitte) statt nur fester Token-Anzahlen.

    Semantic Router

    Ein Semantic Router routet Anfragen zum richtigen Workflow, Toolset oder Modell unter Verwendung semantischer Signale (Embeddings, Intent-Klassifikation, Ähnlichkeit zu bekannten Kategorien).

    Semantic Search

    Eine Suchmethode, die die Bedeutung und den Kontext von Anfragen versteht, statt nur nach exakten Keyword-Matches zu suchen – ermöglicht natürlichere und intelligentere Suchergebnisse.

    Semantic Segmentation

    Pixel-genaue Klassifikation von Bildregionen nach Objektkategorien.

    Sentence Transformers

    Eine Python-Library und Sammlung von Modellen, die semantisch bedeutungsvolle Sentence Embeddings erzeugen – optimiert für Ähnlichkeitssuche und Clustering.

    SentencePiece

    Sprachunabhängiges Open-Source-Tokenizer-Framework von Google, das direkt auf Rohtext arbeitet ohne vorherige Wort-Segmentierung.

    Seq2Seq

    Eine Modellarchitektur, die eine Eingabe-Sequenz in eine Ausgabe-Sequenz variabler Länge transformiert.

    Session-basierte Empfehlung

    Empfehlungen basierend auf der aktuellen Nutzer-Session statt auf historischen Profilen – ideal für anonyme Besucher.

    SFT (Supervised Fine-Tuning)

    Supervised Fine-Tuning (SFT) passt ein vortrainiertes Modell unter Verwendung gelabelter Input→Output-Beispiele an, um Verhalten zu formen (Format, Stil, Task-Performance).

    SFT (Supervised Fine-Tuning)

    Das Training eines Pre-trained Models auf kuratierten (Input, Output)-Paaren, um es auf spezifische Aufgaben oder Formate anzupassen.

    SHAP

    SHAP ist eine Model-Explainability-Methode basierend auf Shapley-Werten aus der kooperativen Spieltheorie, die eine Vorhersage auf einzelne Features attribuiert.

    Sharpness-Aware Minimization (SAM)

    Optimierungsmethode, die nicht nur den Loss minimiert, sondern auch die "Schärfe" der Loss-Landscape – findet flachere Minima für bessere Generalisierung.

    Siamesisches Netzwerk

    Ein Siamesisches Netzwerk ist eine neuronale Architektur mit zwei (oder mehr) identischen Teilnetzwerken, die lernen, Eingaben durch Erzeugen von Embeddings und Messen von Ähnlichkeit zu vergleichen.

    Sigmoid-Funktion

    Die Sigmoid-Funktion σ(x) = 1/(1+e^(-x)) mappt beliebige Werte auf den Bereich (0, 1) – historisch wichtig als Aktivierungsfunktion, heute primär für binäre Klassifikation.

    Signal-to-Noise Ratio

    Signal-to-Noise Ratio (SNR) ist das Verhältnis von bedeutungsvollen Informationen ("Signal") zu irrelevanten oder irreführenden Informationen ("Noise").

    SiLU / Swish

    SiLU/Swish = x · σ(x) – eine glatte, selbst-gated Aktivierungsfunktion, die ReLU in vielen Benchmarks übertrifft und Grundlage von SwiGLU ist.

    Sim-to-Real Transfer

    Der Transfer von in Simulation trainierten KI-Modellen auf reale physische Systeme – trainiere in der virtuellen Welt, deploye in der echten.

    SimCLR

    SimCLR (Simple Contrastive Learning of Visual Representations) ist ein Framework für selbstüberwachtes Lernen, das visuelle Repräsentationen durch Vergleich augmentierter Bildversionen lernt.

    Similarity Score Calibration

    Similarity Score Calibration mappt rohe Similarity-Scores (von Embeddings/Rerankern) auf zuverlässigere Confidence-Signale (z.B. Wahrscheinlichkeiten oder Risiko-Bänder).

    Similarity Search

    Similarity Search findet Items, die einer Anfrage unter einer Ähnlichkeitsmetrik am ähnlichsten sind (Cosine Similarity, Dot Product etc.), häufig mit Embeddings verwendet.

    Similarity Thresholding

    Similarity Thresholding setzt Cutoff-Werte auf Similarity-Scores (Embedding-Similarity, Reranker-Scores), um Actions zu entscheiden wie "Use Cache", "Retrieve More" oder "Ask Clarifying Question".

    SimPO

    Eine vereinfachte Version von DPO, die ohne Reference Model auskommt und einen Length-Normalized Reward verwendet.

    Simulation

    Die Nachahmung eines realen oder hypothetischen Systems oder Prozesses in einer kontrollierten virtuellen Umgebung.

    Sinusoidal Positional Encoding

    Die ursprüngliche Positionskodierung aus dem Transformer-Paper, die Sinus- und Cosinus-Funktionen verschiedener Frequenzen nutzt.

    Skip Connection

    Skip Connections leiten den Input einer Schicht direkt zur Ausgabe späterer Schichten weiter – der Kernmechanismus, der 100+ Layer tiefe Netze trainierbar macht.

    Sliding Window Attention

    Eine Attention-Variante, bei der jedes Token nur auf eine begrenzte Anzahl vorheriger Tokens (Fenster) attended, statt auf die gesamte Sequenz.

    Slot Filling

    Extraktion spezifischer Parameter aus Nutzeräußerungen für Conversational AI.

    Small Language Model

    Ein Small Language Model (SLM) ist ein vergleichsweise kleineres LLM, das für niedrigere Latenz, niedrigere Kosten und einfacheres Deployment entwickelt wurde – oft für enge Tasks oder als Teil eines gerouteten Systems.

    Small Language Models

    Sprachmodelle mit deutlich weniger Parametern als große LLMs (typisch 1-7B statt 100B+), die für spezifische Aufgaben optimiert sind und lokal oder auf Edge-Geräten laufen können.

    SMOTE

    Algorithmus, der synthetische Beispiele für die Minderheitsklasse erzeugt, indem er zwischen existierenden Datenpunkten interpoliert.

    Soft Prompt

    Ein Soft Prompt ist eine gelernte Vektor-Repräsentation (anstatt menschlich geschriebener Text), die verwendet wird, um das Verhalten eines Modells zu steuern – oft trainiert als kleine Menge von Prompt-Embeddings.

    Softmax

    Funktion, die Logits in Wahrscheinlichkeitsverteilung umwandelt.

    Solomonoff Induktion

    Solomonoff Induktion ist ein theoretisches Framework für optimale Vorhersage, das Bayessche Inferenz mit algorithmischer Komplexität kombiniert und Hypothesen nach ihrer Einfachheit bei der Datenbeschreibung gewichtet.

    Sora

    OpenAIs revolutionäres Text-zu-Video-Modell, das fotorealistische Videos bis zu einer Minute aus Textbeschreibungen generiert.

    Sora 2

    Die zweite Generation von OpenAI's Text-zu-Video-Modell mit verbesserter Qualität, längeren Clips und realistischerer Physik-Simulation.

    Source Attribution

    Source Attribution zeigt explizit an, woher Informationen stammen (Dokumente, URLs, interne Systeme), oft via Zitate oder Links.

    Source Grounding

    Source Grounding ist das Einschränken eines KI-Systems, seine Antworten auf bereitgestellten Quellen zu basieren (abgerufene Dokumente, Tools oder genehmigte Referenzen) anstatt auf unverifiziertem Modellwissen.

    Source Separation

    Source Separation trennt ein gemischtes Audio-Signal in einzelne Quellen – z. B. Gesang, Drums, Bass und Instrumente aus einem Song.

    Sparse Attention

    Sparse Attention reduziert Attention-Berechnung, indem Tokens nur auf eine Teilmenge anderer Tokens achten dürfen (gemusterte oder gelernte Sparsity).

    Sparse Autoencoder

    Ein Sparse Autoencoder (SAE) ist ein Autoencoder, der mit einem Sparsity-Constraint trainiert wird, sodass nur eine kleine Teilmenge von Features für jeden gegebenen Input aktiviert.

    Sparse Mixture of Experts

    Eine Architektur, bei der nur ein kleiner Teil aller "Experten-Subnetze" pro Input aktiviert wird – ermöglicht riesige Modellkapazität bei effizienter Inferenz.

    Sparse Modell

    Ein neuronales Netz, bei dem nur ein kleiner Teil der Gewichte oder Aktivierungen für jede Berechnung verwendet wird, was Effizienz deutlich steigert.

    Sparse Retrieval

    Sparse Retrieval verwendet Sparse-Repräsentationen (oft term-frequency-basiert) wie BM25, um Dokumente per lexikalischem Match abzurufen.

    Sparse Training

    Training mit Sparsity von Anfang an – im Gegensatz zu "erst dicht trainieren, dann prunen" wird das Modell von Beginn an spärlich gehalten und Verbindungen werden dynamisch hinzugefügt/entfernt.

    Speaker Diarization

    Speaker Diarization identifiziert "wer wann sprach" in einer Audio-Aufnahme, indem Audio in speaker-gelabelte Turns segmentiert wird.

    Spectral Normalization

    Spectral Normalization beschränkt die Lipschitz-Konstante von Netzwerk-Schichten durch Normalisierung mit dem größten Singulärwert – Standard-Stabilisierung in GANs.

    Speculative Decoding

    Eine Inferenz-Beschleunigungstechnik, bei der ein kleines "Draft-Modell" schnell mehrere Tokens vorschlägt und ein großes "Verifier-Modell" diese parallel verifiziert – bis zu 3x schnellere Generierung.

    Speech Enhancement

    Speech Enhancement verbessert die Qualität von Sprachaufnahmen durch Entfernung von Rauschen, Hall und Störgeräuschen – oft als Vorverarbeitung für ASR.

    Speech-to-Text (STT)

    Technologie zur Umwandlung von gesprochener Sprache in geschriebenen Text – die Basis für Sprachassistenten und Transkription.

    Speech-to-Text (STT)

    Speech-to-Text (STT) konvertiert gesprochenes Audio in geschriebenen Text unter Verwendung von Automatic Speech Recognition (ASR) Modellen.

    Stability AI

    Das Unternehmen hinter Stable Diffusion, einem der meistgenutzten Open-Source-Modelle für KI-Bildgenerierung.

    Stable Diffusion

    Das führende Open-Source-Modell für Text-zu-Bild-Generierung, das lokale Ausführung und Fine-Tuning auf Consumer-Hardware ermöglicht.

    State Space Model (SSM)

    Eine Klasse von Sequenzmodellen basierend auf kontinuierlicher Zustandsraum-Theorie, die lineare Skalierung O(N) statt quadratischer Attention O(N²) bieten.

    State Space Models (SSMs)

    State Space Models (SSMs) sind Sequenz-Modelle, die einen latenten "State" aufrechterhalten, der sich über Zeit entwickelt, um sequentielle Daten effizient zu verarbeiten.

    Statefulness

    Statefulness beschreibt, ob ein System Informationen über Interaktionen hinweg behält (stateful) oder jeden Request unabhängig behandelt (stateless).

    Steering Vector

    Ein Steering Vector ist eine Richtung im internen Repräsentationsraum eines Modells, die, wenn zu Aktivierungen addiert oder angewendet, Outputs zu oder weg von bestimmten Verhaltensweisen oder Attributen verzerren kann.

    Stemming

    Regelbasierte Reduktion von Wörtern auf ihren Wortstamm durch Abschneiden von Suffixen.

    Step Decay

    Einfachste Learning-Rate-Schedule-Strategie, die die LR nach festen Intervallen (Epochen oder Steps) um einen Faktor reduziert.

    Stochastic Parrot

    Stochastic Parrot ist ein Kritik-Framing, das hervorhebt, wie LLMs flüssigen Text durch Pattern-Matching aus Training-Daten generieren können ohne echtes Verständnis – Bedenken über Bias, Misinformation und Misuse aufwerfend.

    Stochastic Weight Averaging (SWA)

    Trainingstechnik, die Modellgewichte über mehrere Checkpoints mittelt, um flachere Minima und bessere Generalisierung zu finden.

    Stochastischer Gradientenabstieg

    Variante des Gradientenabstiegs, die pro Update nur einen Mini-Batch statt aller Daten nutzt – schneller und oft besser generalisierend.

    Stop Sequence

    Eine Stop Sequence ist ein Token-/String-Muster, das einem Modell sagt, die Generierung zu stoppen, wenn es auftritt.

    Stoppwort-Entfernung

    Die Entfernung hochfrequenter Wörter ohne semantischen Gehalt (der, die, das, und, ist) aus Text vor der Verarbeitung.

    Stratifizierte Stichprobe

    Sampling-Methode, die sicherstellt, dass die Proportionen der Klassen/Gruppen im Sample der Gesamtverteilung entsprechen.

    Streaming ASR

    Streaming ASR transkribiert Sprache in Near-Real-Time, während Audio ankommt, anstatt nach Abschluss der vollständigen Aufnahme.

    STRIPS

    STRIPS ist ein klassischer Planungsformalismus, bei dem Aktionen durch Vorbedingungen und Effekte (Add/Delete-Listen) über symbolische Zustandsprädikate definiert werden.

    Structured Output

    Structured Output ist das Erzwingen, dass das Modell Outputs in einer vordefinierten Struktur produziert (JSON, YAML, Abschnitte mit strikten Überschriften), oft mit Validierung durchgesetzt.

    Structured Pruning

    Eine Pruning-Variante, die ganze Strukturen (Neuronen, Filter, Attention Heads, Layer) entfernt statt einzelner Gewichte – liefert echte Speedups ohne spezielle Sparse-Hardware.

    Style Transfer

    Style Transfer modifiziert ein Bild (oder Text), um einem Zielstil zu entsprechen, während der Kerninhalt erhalten bleibt.

    StyleGAN

    StyleGAN ist NVIDIAs bahnbrechende GAN-Architektur, die fotorealistische Gesichter und Bilder mit beispielloser Kontrolle über Stil und Details generiert.

    Subject Consistency

    Die Fähigkeit eines KI-Bildgenerators, Charaktere und Objekte über mehrere Bilder hinweg konsistent darzustellen.

    Summarization

    Summarization ist das Generieren einer kürzeren Repräsentation von Content bei Beibehaltung der Schlüsselbedeutung – extraktiv (Teile auswählen) oder abstraktiv (neu schreiben).

    Super Resolution

    Super Resolution erhöht die Auflösung von Bildern oder Videos mittels KI – rekonstruiert Details, die im Original nicht vorhanden sind.

    Superalignment

    Das Forschungsproblem, wie man AI-Systeme, die intelligenter als Menschen sind (Superintelligenz), sicher und kontrollierbar macht.

    Superposition

    Superposition in neuronalen Netzwerken beschreibt, wie mehrere Features in überlappenden Richtungen innerhalb eines limitiert-dimensionalen Raums repräsentiert werden können, anstatt ein Feature pro Neuron.

    Surrogatmodell

    Ein einfaches, interpretierbares Modell, das ein komplexes Black-Box-Modell approximiert um dessen Entscheidungen zu erklären.

    SWE-Bench

    Ein Benchmark, der LLMs testet, indem sie echte Bug-Reports aus GitHub-Repositories lösen müssen – der realistischste Test für AI-Coding-Fähigkeiten.

    SwiGLU

    Eine Aktivierungsfunktion für Transformer-FFN-Blöcke, die Swish-Gating mit linearer Projektion kombiniert und in modernen LLMs wie LLaMA Standard ist.

    Sycophancy

    Sycophancy ist ein LLM-Verhalten, bei dem das Modell den geäußerten Überzeugungen oder falschen Prämissen des Users übermäßig zustimmt, anstatt sie zu korrigieren.

    Synthetische Medien

    Sammelbegriff für alle Medieninhalte (Text, Bild, Audio, Video), die ganz oder teilweise durch KI erstellt oder manipuliert wurden.

    System Prompt

    Eine spezielle Prompt-Kategorie, die das Grundverhalten, die Persona und die Regeln für eine AI-Session definiert.

    T

    Talking Head Generation

    KI-Technologie, die aus einem einzelnen Portraitfoto und Audio-Input ein realistisches Video eines sprechenden Menschen generiert.

    Tanh (Hyperbolischer Tangens)

    Eine Aktivierungsfunktion, die Werte auf den Bereich [-1, 1] abbildet – zero-centered und glatter als Sigmoid.

    Technologische Singularität

    Ein hypothetischer Punkt, an dem technologischer Fortschritt (insbesondere KI) so schnell und tiefgreifend wird, dass er die menschliche Zivilisation grundlegend und unvorhersehbar verändert.

    Temperature

    Ein Parameter, der die Zufälligkeit in der LLM-Ausgabe kontrolliert.

    Temperature (Sampling)

    Ein Parameter, der die "Kreativität" von LLM-Outputs steuert: Niedrige Werte (0-0.3) erzeugen fokussierte, deterministische Antworten; hohe Werte (0.7-1.0) bringen Variation und Überraschungen.

    Temperature Scaling

    Eine Post-hoc-Kalibrierungsmethode, die einen einzigen Parameter (Temperatur) nutzt, um Modell-Konfidenzwerte zu adjustieren.

    Temporal Difference Learning

    TD-Learning aktualisiert Wertschätzungen basierend auf der Differenz zwischen aufeinanderfolgenden Vorhersagen – lernt aus unvollständigen Episoden durch Bootstrapping.

    Temporal Graph Network

    Ein GNN für zeitlich veränderliche Graphen, das die Evolution von Knoten und Kanten über die Zeit modelliert.

    Tensor Parallelism

    Eine Parallelisierungsstrategie, die einzelne Tensor-Operationen (Matrixmultiplikationen) über mehrere GPUs aufteilt – notwendig für Schichten, die zu groß für eine GPU sind.

    Test-Time Training (TTT)

    Ein Paradigma, bei dem ein Modell sich während der Inferenz an jeden neuen Input anpasst, indem es einen Self-Supervised-Loss auf der Test-Instanz optimiert – "Lernen beim Vorhersagen".

    Text-to-3D

    Text-to-3D generiert dreidimensionale Objekte und Szenen aus natürlichsprachigen Textbeschreibungen mittels KI.

    Text-to-Image

    AI-Generierung von Bildern aus Textbeschreibungen – der Durchbruch, der Kreativarbeit demokratisiert hat.

    Text-to-Speech (TTS)

    Technologie zur Umwandlung von geschriebenem Text in natürlich klingende Sprache – heute meist mit neuronalen Modellen.

    Text-to-Video

    KI-Technologie, die aus Textbeschreibungen vollständige Videos mit bewegten Bildern, Personen und Szenen generiert.

    Textgenerierung

    Text Generation ist die automatische Erstellung von Text durch KI-Modelle, typischerweise basierend auf einem Prompt oder Kontext.

    Textklassifikation

    Die automatische Zuordnung von Texten zu vordefinierten Kategorien durch ein ML-Modell.

    Textnormalisierung

    Die Standardisierung von Textdaten durch Umwandlung in eine einheitliche Form – Lowercasing, Unicode-Normalisierung, Zeichenersetzung und mehr.

    Textual Inversion

    Textual Inversion lernt ein neues Wort-Embedding für ein Konzept aus wenigen Bildern, ohne das Diffusionsmodell selbst zu verändern.

    Textzusammenfassung

    Die automatische Erzeugung einer kürzeren Version eines Textes, die die wichtigsten Informationen beibehält.

    TF-IDF

    Statistisches Maß zur Bewertung der Relevanz eines Worts in einem Dokument relativ zu einer Dokumentensammlung.

    Thompson Sampling

    Bayesianischer Bandit-Algorithmus, der Aktionen proportional zur Wahrscheinlichkeit wählt, dass sie optimal sind.

    Tiefenschätzung

    Die Vorhersage von Tiefenwerten (Entfernungen) für jeden Pixel eines 2D-Bildes zur Erzeugung einer 3D-Tiefenkarte.

    Tiefensuche (DFS)

    Tiefensuche (DFS) durchläuft einen Graphen, indem sie einem Pfad so tief wie möglich folgt, bevor sie zurückgeht.

    Time Series Foundation Model

    Vortrainierte Transformer-Modelle für Zeitreihen, die Zero-Shot-Forecasting ohne spezifisches Training ermöglichen.

    Time-to-First-Token (TTFT)

    Die Zeit von der Anfrage bis zum ersten generierten Token – kritisch für die wahrgenommene Responsivität von AI-Anwendungen.

    Tokenization

    Der Prozess, Text in kleinere Einheiten (Tokens) zu zerlegen, die von Sprachmodellen verarbeitet werden können – von ganzen Wörtern über Silben bis zu einzelnen Zeichen.

    Tool Use

    Die Fähigkeit von LLMs, externe Tools und APIs aufzurufen – vom Taschenrechner über Websuche bis zu Datenbanken und benutzerdefinierten Funktionen.

    Top-k Sampling

    Ein Sampling-Parameter, der die Auswahl auf die k wahrscheinlichsten Tokens beschränkt, unabhängig von deren absoluten Wahrscheinlichkeiten.

    Top-p (Nucleus Sampling)

    Ein Sampling-Parameter, der nur aus den wahrscheinlichsten Tokens auswählt, deren kumulative Wahrscheinlichkeit p nicht überschreitet.

    Toxicity Detection

    ML-Systeme, die toxische, beleidigende oder hasserfüllte Inhalte automatisch erkennen und klassifizieren.

    Transfer Learning

    Die Nutzung von Wissen, das bei einer Aufgabe gelernt wurde, um die Leistung bei einer verwandten Aufgabe zu verbessern.

    Transformer

    Eine neuronale Netzwerkarchitektur, die Self-Attention nutzt, um Beziehungen zwischen allen Positionen in einer Sequenz zu modellieren.

    Transformer-Architektur

    Die revolutionäre neuronale Netzwerk-Architektur von 2017 ("Attention Is All You Need"), die RNNs ablöste und die Grundlage aller modernen LLMs wie GPT, Claude, Gemini bildet.

    Transparenz

    Die Offenlegung, wie KI-Systeme funktionieren, welche Daten sie nutzen und wie Entscheidungen getroffen werden.

    Tree of Thoughts (ToT)

    Prompting-Strategie, bei der das LLM mehrere Reasoning-Pfade parallel verfolgt, bewertet und den besten auswählt – wie ein Entscheidungsbaum für Gedankenketten.

    Triplet Loss

    Eine Loss-Funktion für Metric Learning, die Anchor, Positive und Negative nutzt, um Embeddings so zu trainieren, dass Ähnliche näher und Verschiedene weiter entfernt sind.

    Trust & Safety

    Trust & Safety ist die Praxis des Schutzes von Benutzern, Plattformen und Marken vor schädlichen Inhalten, Missbrauch und unsicheren Outcomes – durch Policy, Enforcement und Product Design.

    TruthfulQA

    Ein Benchmark, der testet, ob LLMs populäre Falschinformationen und Verschwörungstheorien vermeiden.

    Two-Tower-Modell

    Eine Architektur mit zwei separaten Encodern (User-Tower, Item-Tower), deren Embeddings per Ähnlichkeitssuche effizient gematcht werden.

    V

    VAE (Variational Autoencoder)

    VAE steht für Variational Autoencoder, ein generatives Modell, das einen probabilistischen latenten Raum für Sampling und Generierung lernt.

    Value Alignment

    Value Alignment stellt sicher, dass das Verhalten eines KI-Systems zuverlässig mit beabsichtigten menschlichen/organisatorischen Werten und Constraints übereinstimmt (Sicherheit, Fairness, Wahrheitssuche, Datenschutz).

    Value of Information (VoI)

    Value of Information (VoI) quantifiziert, wie viel Nutzen man durch das Einholen zusätzlicher Informationen vor einer Entscheidung gewinnt.

    Vanishing Gradient

    Vanishing Gradient ist ein Trainingsproblem, bei dem Gradienten extrem klein werden während sie rückwärts durch ein Netzwerk propagieren, was das Lernen in frühen Schichten verlangsamt oder verhindert.

    Variational Autoencoder (VAE)

    Ein Variational Autoencoder (VAE) ist ein generatives Modell, das einen probabilistischen latenten Raum lernt, der Sampling und Generierung neuer Daten ermöglicht.

    Veo 3

    Googles Video-Generierungsmodell der dritten Generation mit nativem Audio, längeren Clips und verbesserter Physik.

    Verification

    Prüfung, ob LLM-Outputs korrekt, faktisch und quellengestützt sind.

    Verification-First Policy

    Eine Verification-First Policy erfordert, dass KI-Outputs und High-Impact-Actions definierte Verification-Checks passieren bevor sie Nutzern gezeigt oder ausgeführt werden.

    Verifikationsschicht

    Eine Verifikationsschicht ist eine Systemkomponente, die prüft, ob ein KI-Output oder eine Aktion die erforderlichen Korrektheit-, Sicherheits-, Policy- und Formatierungsanforderungen erfüllt, bevor sie geliefert oder ausgeführt wird.

    Verlustfunktion

    Eine mathematische Funktion, die misst, wie gut oder schlecht die Vorhersagen eines Modells sind.

    Verteiltes Training

    Distributed Training verteilt das ML-Training auf mehrere GPUs oder Maschinen – notwendig für Modelle, die nicht auf eine einzelne GPU passen.

    Video AI

    Video AI umfasst KI-Technologien zur automatischen Analyse, Generierung, Bearbeitung und Optimierung von Videoinhalten.

    Vision Language Models

    KI-Modelle, die sowohl Bilder als auch Text verstehen und verarbeiten können – sie "sehen" und "lesen" gleichzeitig und können über visuelle Inhalte kommunizieren.

    Vision Transformer (ViT)

    Ein Vision Transformer (ViT) wendet Transformer-Architekturen auf Bilder an, indem er sie als Sequenzen von Patch-Embeddings repräsentiert.

    Vision-Language Model (VLM)

    Ein Vision-Language Model (VLM) verarbeitet sowohl Bilder als auch Text, um Aufgaben wie Bildverständnis, Captioning, Dokument-Q&A und multimodales Reasoning durchzuführen.

    Visual Question Answering (VQA)

    AI-Systeme, die Fragen zu Bildern in natürlicher Sprache beantworten können – "Wie viele Personen sind auf dem Foto?"

    Vocoder

    Ein Vocoder konvertiert Mel-Spektrogramme oder andere akustische Features in hörbare Audio-Wellenformen – der letzte Schritt in TTS-Pipelines.

    Voice Activity Detection (VAD)

    Voice Activity Detection erkennt automatisch, ob ein Audio-Signal menschliche Sprache enthält oder nicht – die Grundlage für effiziente Sprachverarbeitung.

    Voice Agent

    Voice Agents sind KI-gesteuerte Sprachsysteme, die natürliche Telefon- oder Voice-Gespräche autonom führen – von Outbound-Calls bis zu Kundenservice-Hotlines.

    Voice Cloning

    KI-Technologie, die eine menschliche Stimme aus wenigen Sekunden Audio analysiert und synthetisch reproduziert, um beliebige Texte in dieser Stimme zu sprechen.

    Vokabular (NLP)

    Die Gesamtmenge aller Tokens, die ein Sprachmodell kennt und verarbeiten kann.

    Vorwärtsverkettung

    Eine Inferenzstrategie, die von bekannten Fakten ausgeht und Regeln anwendet, um neue Fakten abzuleiten, bis das Ziel erreicht ist.

    VQ-VAE

    VQ-VAE ist eine Variante von VAE, die Vector Quantization verwendet, um diskrete latente Repräsentationen über ein gelerntes Codebook zu lernen.

    W

    Warm Start

    Ein Warm Start initialisiert Training oder Optimierung von einem zuvor gelernten Zustand (Gewichte, Embeddings oder Parameter) anstatt von Null zu starten.

    Warmup

    Trainingstechnik, die die Learning Rate in den ersten Steps/Epochen langsam von nahe Null auf den Zielwert hochfährt.

    Watermarking

    Watermarking ist das Hinzufügen eines erkennbaren Signals zu Inhalten (Text, Bild, Audio, Video), um Herkunft, Authentizität oder Provenienz anzuzeigen – oft verwendet um KI-generierte Ausgaben zu kennzeichnen.

    Wav2Vec

    Wav2Vec ist ein Self-Supervised-Learning-Framework von Meta für Speech Representations, das aus rohem Audio lernt und mit wenigen gelabelten Daten State-of-the-Art-ASR erreicht.

    Weak Supervision

    Weak Supervision nutzt imperfekte, verrauschte oder indirekte Signale (Heuristiken, Regeln, entfernte Labels) um Trainingslabels zu erstellen statt manueller Annotation.

    Weakly Supervised Learning

    Weakly Supervised Learning trainiert Modelle mit Weak-Supervision-Signalen (verrauschte Labels, partielle Labels, aggregierte Labels) statt vollständig zuverlässiger Labels.

    Weavy

    KI-Video-Plattform mit node-basiertem Editor für komplexe Generative-Video-Workflows und Multi-Model-Pipelines.

    Web Browsing Tool

    Ein Web-Browsing-Tool ist eine KI-Tool-Integration, die Live-Webseiten oder Suchergebnisse abruft, um Fragen mit aktuellen Informationen zu beantworten.

    Web Grounding

    Die Fähigkeit eines KI-Modells, in Echtzeit auf Websuche-Ergebnisse zuzugreifen, um aktuelle und faktisch korrekte Inhalte zu generieren.

    Weight Decay

    Weight Decay ist eine Regularisierungstechnik, die große Gewichte während des Trainings entmutigt, oft als L2-Regularisierung oder entkoppelter Weight Decay (z.B. in AdamW) implementiert.

    Weight Normalization

    Weight Normalization reparametrisiert Gewichtsvektoren in Richtung und Magnitude – eine Alternative zu Batch Norm ohne Batch-Abhängigkeit.

    Weight Sharing

    Eine Technik, bei der mehrere Teile eines neuronalen Netzes dieselben Gewichte verwenden – reduziert Parameteranzahl und Speicherverbrauch erheblich.

    Weltmodell

    Eine interne Repräsentation der Umwelt in einem KI-System, die es ermöglicht, Vorhersagen über zukünftige Zustände und die Auswirkungen von Aktionen zu machen.

    WER (Word Error Rate)

    Word Error Rate (WER) misst die Spracherkennungsgenauigkeit als Anteil von Substitutionen, Löschungen und Einfügungen um ein Transkript in die Ground Truth zu transformieren.

    Whisper

    Ein Open-Source-Spracherkennungsmodell von OpenAI, das auf 680.000 Stunden multilingualen Audio trainiert wurde.

    Windowed Attention

    Windowed Attention beschränkt Attention auf ein lokales Token-Fenster statt der vollen Sequenz, reduziert Rechenaufwand und ermöglicht längere Kontexte.

    WinoGrande

    Ein Benchmark für pronominale Referenzauflösung, bei dem kleine Wortänderungen die korrekte Antwort ändern.

    Wissensverfolgung

    Wissensverfolgung modelliert die sich entwickelnde Beherrschung von Fähigkeiten eines Lernenden über die Zeit anhand seiner Interaktionen (Antworten, Versuche, Zeit, Hinweise).

    Word Error Rate (WER)

    Die Standard-Metrik für Spracherkennung – misst Substitutionen, Löschungen und Einfügungen relativ zur Referenz.

    Word2Vec

    Word2Vec ist eine Technik zur Erzeugung von Worteinbettungen (Word Embeddings), die Wörter als dichte Vektoren darstellt, wobei semantisch ähnliche Wörter ähnliche Vektoren haben.

    WordPiece

    Von Google entwickelter Subword-Tokenisierungsalgorithmus, der die Likelihood des Trainingskorpus maximiert.

    Wort-Embedding

    Eine dichte Vektorrepräsentation eines Wortes, die seine semantische Bedeutung kodiert.

    X

    x-Vector

    Ein x-Vector ist eine Art von Speaker-Embedding, das in der Sprachverarbeitung verwendet wird, um Sprecher-Identitätsmerkmale in einem Vektor fester Länge darzustellen.

    xAI

    Elon Musks KI-Unternehmen, das Grok entwickelt – einen LLM mit Echtzeit-Zugang zu X (Twitter) und einem unzensierten, humorvollen Stil.

    XAI (Explainable AI)

    Explainable AI (XAI) ist die Menge von Methoden und Praktiken, um die Ausgaben eines KI-Systems verständlicher zu machen – zu zeigen, warum eine Vorhersage, Empfehlung oder Entscheidung getroffen wurde.

    Xavier Initialization (Glorot Initialization)

    Xavier (Glorot) Initialization ist eine Gewichts-Initialisierungsmethode, die entwickelt wurde, um Aktivierungen und Gradienten in einem gesunden Bereich zu halten.

    XGBoost

    XGBoost (Extreme Gradient Boosting) ist ein hochperformanter Ensemble-Learning-Algorithmus, der Gradient Boosting mit Entscheidungsbäumen für überlegene Vorhersagegenauigkeit kombiniert.

    XLM (Cross-lingual Language Model)

    XLM bezeichnet Cross-lingual Language Modeling-Ansätze und Modell-Familien, die entwickelt wurden, um mehrere Sprachen in einem gemeinsamen Embedding-Raum darzustellen.

    XLM-R (Cross-lingual RoBERTa)

    XLM-R ist eine mehrsprachige Transformer-Modell-Familie, die oft für cross-linguale Verständnis-Aufgaben verwendet wird (Classification, NER, Semantic Similarity).

    XLNet

    XLNet ist ein Transformer-basierter Language Model-Ansatz, der permutationsbasiertes Training verwendet um bidirektionalen Kontext bei Beibehaltung autoregressiver Eigenschaften zu erfassen.

    xLSTM (Extended Long Short-Term Memory)

    Eine modernisierte LSTM-Variante von Sepp Hochreiter, die exponentielles Gating und Matrix-Memory nutzt, um mit Transformern zu konkurrieren.

    XOR-Problem

    Das XOR-Problem ist ein klassisches Beispiel, das zeigt, dass ein einzelner linearer Klassifizierer Daten, die nicht linear separierbar sind, nicht trennen kann.

    Begriff nicht gefunden?

    Durchsuchen Sie das gesamte Glossar mit über 1922 Begriffen aus allen Kategorien.

    Gesamtes Glossar ansehen
    👋Fragen? Chatte mit uns!