Question 1

Was ist Self-Distillation?

Accepted Answer

Eine Variante der Knowledge Distillation, bei der ein Modell sich selbst als Teacher nutzt – das gleiche oder ein identisches Modell wird als Lehrer für ein neues Training verwendet. Born-Again Networks (Furlanello et al., 2018) zeigten: Ein Student mit identischer Architektur wie der Teacher kann den Teacher übertreffen. DINO (Caron et al., 2021) nutzt Self-Distillation mit einem Momentum-Teacher für Self-Supervised Vision Learning.

Question 2

Wie funktioniert Self-Distillation?

Accepted Answer

Born-Again Networks (Furlanello et al., 2018) zeigten: Ein Student mit identischer Architektur wie der Teacher kann den Teacher übertreffen. DINO (Caron et al., 2021) nutzt Self-Distillation mit einem Momentum-Teacher für Self-Supervised Vision Learning.

Question 3

Warum ist Self-Distillation wichtig für Marketing?

Accepted Answer

Self-Distillation verbessert Modelle ohne größere Teacher-Modelle – ideal wenn kein stärkeres Modell verfügbar ist. Basis für DINO, DINOv2 und moderne Vision Foundation Models.

Question 4

Wie wird Self-Distillation in der Praxis eingesetzt?

Accepted Answer

DINO trainiert einen Vision Transformer mit Self-Distillation: Der Student sieht kleine Bildausschnitte, der Teacher (exponentiell gleitender Durchschnitt) sieht das volle Bild. Ergebnis: State-of-the-Art Features ohne Labels.

Question 5

Was sind häufige Fehler bei Self-Distillation?

Accepted Answer

Verbesserungen sind kleiner als bei Teacher-Student mit größerem Teacher. Kann zu Overfitting auf eigene Fehler führen. Momentum-Hyperparameter kritisch für Stabilität.

Question 6

Woher kommt Self-Distillation?

Accepted Answer

Furlanello et al. (2018) zeigten mit "Born-Again Networks", dass Self-Distillation den Teacher übertreffen kann. Caron et al. (2021) revolutionierten Self-Supervised Learning mit DINO. DINOv2 (2023) skalierte den Ansatz zu einem der besten Vision Foundation Models.

Self-Distillation

Erklärung

Relevanz für Marketing

Beispiel

Häufige Fallstricke

Entstehung & Geschichte

Abgrenzung & Vergleiche

Self-Distillation vs. Knowledge Distillation

Weiterführende Ressourcen

Verwandte Services

Verwandte Begriffe