DreamBooth
Eine Fine-Tuning-Methode, die Diffusionsmodelle mit wenigen Bildern (3-5) eines Subjekts personalisiert, um es in beliebigen Kontexten zu generieren.
DreamBooth personalisiert Diffusionsmodelle mit 3-5 Bildern eines Subjekts – ermöglicht konsistente Produktbilder, Charaktere und Brand-Visuals in beliebigen Szenen.
Erklärung
DreamBooth trainiert das gesamte Modell oder LoRA-Adapter auf einem Subjekt (Person, Produkt, Haustier) mit einem speziellen Token ("sks"). Danach kann das Subjekt in beliebigen Szenen, Stilen und Posen generiert werden – mit konsistenter Identität.
Relevanz für Marketing
Game-Changer für Marketing: Produktbilder in beliebigen Szenarien ohne Fotoshooting. Brand-konsistente Visuals. Personalisierte Kampagnen mit konsistenten Charakteren.
Beispiel
Eine Marke trainiert DreamBooth auf 5 Produktfotos: Generiert das Produkt in 100 verschiedenen Lifestyle-Szenen für Social Media – konsistente Produktdarstellung ohne Studio.
Häufige Fallstricke
Overfitting bei zu wenigen oder zu ähnlichen Bildern. Training dauert 15-30 Minuten. Erfordert GPU. Gesichter erfordern besondere Sorgfalt.
Entstehung & Geschichte
Google Research veröffentlichte DreamBooth im August 2022. Das Paper "DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation" zeigte beeindruckende Personalisierung. Die Community kombinierte DreamBooth mit LoRA für effizienteres Training. Heute ist DreamBooth Standard für Custom-Modelle in der Bildgenerierung.
Abgrenzung & Vergleiche
DreamBooth vs. LoRA
DreamBooth personalisiert auf spezifische Subjekte; LoRA ist eine allgemeine effiziente Fine-Tuning-Methode – beide werden oft kombiniert.
DreamBooth vs. Textual Inversion
DreamBooth trainiert Modellgewichte; Textual Inversion lernt nur ein neues Token-Embedding – DreamBooth hat höhere Qualität.