Question 1

Was ist Exponential Moving Average (EMA)?

Accepted Answer

Technik, die einen exponentiell gewichteten Durchschnitt der Modellgewichte über den Trainingsverlauf pflegt – das EMA-Modell generalisiert oft besser als das finale Modell. EMA-Gewichte: θ_ema = α × θ_ema + (1-α) × θ_aktuell. Typisch α=0.999 oder 0.9999. Das EMA-Modell wird nur für Evaluation/Inference genutzt, nicht fürs Training selbst.

Question 2

Wie funktioniert Exponential Moving Average (EMA)?

Accepted Answer

EMA-Gewichte: θ_ema = α × θ_ema + (1-α) × θ_aktuell. Typisch α=0.999 oder 0.9999. Das EMA-Modell wird nur für Evaluation/Inference genutzt, nicht fürs Training selbst.

Question 3

Warum ist Exponential Moving Average (EMA) wichtig für Marketing?

Accepted Answer

EMA ist Standard bei Diffusionsmodellen (Stable Diffusion), ViTs und zunehmend bei LLMs. DINO und BYOL nutzen EMA als "Teacher" in Self-Supervised Learning.

Question 4

Was sind häufige Fehler bei Exponential Moving Average (EMA)?

Accepted Answer

Zusätzlicher Speicher für EMA-Gewichte (2× Parameter). Decay Rate muss getuned werden. BN-Stats müssen separat berechnet werden.

Question 5

Woher kommt Exponential Moving Average (EMA)?

Accepted Answer

Polyak & Juditsky (1992) schlugen Gewichtsmittelung für schnellere Konvergenz vor. EMA wurde essentiell für Self-Supervised Learning (BYOL 2020, DINO 2021) und Diffusionsmodelle. Heute Standard in nahezu allen generativen Modellen.

Question 6

Was ist der Unterschied zwischen Exponential Moving Average (EMA) und Stochastic Weight Averaging (SWA)?

Accepted Answer

Exponential Moving Average (EMA) und Stochastic Weight Averaging (SWA) sind verwandte Konzepte im Bereich der KI und des Marketings. Technik, die einen exponentiell gewichteten Durchschnitt der Modellgewichte über den Trainingsverlau...

Exponential Moving Average (EMA)

Erklärung

Relevanz für Marketing

Häufige Fallstricke

Entstehung & Geschichte

Abgrenzung & Vergleiche

Exponential Moving Average (EMA) vs. SWA (Stochastic Weight Averaging)

Exponential Moving Average (EMA) vs. Checkpoint Ensemble

Weiterführende Ressourcen

Verwandte Services

Verwandte Begriffe