Classifier-Free Guidance (CFG)
Classifier-Free Guidance steuert, wie stark ein Diffusionsmodell dem Text-Prompt folgt – höhere Werte erzeugen prompttreuere, aber potenziell überzeichnete Bilder.
CFG Scale steuert die Prompttreue von Diffusionsmodellen – der wichtigste Parameter neben Sampling Steps für die Balance zwischen Kreativität und Genauigkeit.
Erklärung
CFG interpoliert zwischen konditioniertem und unkonditioniertem Denoising. CFG=1 ignoriert den Prompt quasi. CFG=7-12 ist typisch für gute Balance. CFG>15 erzeugt Artefakte. Stable Diffusion, DALL-E und Midjourney nutzen alle CFG.
Relevanz für Marketing
Kernparameter für Bildqualität: Die richtige CFG-Scale ist entscheidend für professionelle Ergebnisse in Marketing-Bildgenerierung.
Beispiel
Für Produktbilder: CFG 7-9 liefert realistische, prompttreue Ergebnisse. Für kreative Exploration: CFG 4-6 erlaubt mehr Variation.
Häufige Fallstricke
Zu hohe CFG erzeugt übersättigte, artifizielle Bilder. CFG interagiert mit Sampling Steps und Scheduler. Optimaler Wert variiert pro Modell.
Entstehung & Geschichte
Ho & Salimans (2022) führten Classifier-Free Guidance als elegante Alternative zu Classifier Guidance ein. Statt eines separaten Klassifikators nutzt CFG das Modell selbst für konditionierte und unkonditionierte Vorhersagen. Das Konzept wurde zum Standard in allen modernen Diffusionsmodellen.
Abgrenzung & Vergleiche
Classifier-Free Guidance (CFG) vs. Negative Prompt
CFG steuert die Stärke der Prompt-Befolgung; Negative Prompts spezifizieren was vermieden werden soll.
Classifier-Free Guidance (CFG) vs. Temperature (LLM)
CFG für Bilder: Prompttreue vs. Variation. Temperature für Text: Randomness der Token-Auswahl. Ähnliches Konzept, anderes Medium.