Question 1

Was ist GELU (Gaussian Error Linear Unit)?

Accepted Answer

Eine glatte Aktivierungsfunktion, die Inputs mit ihrer kumulativen Normalverteilungs-Wahrscheinlichkeit gewichtet – Standard in BERT, GPT-2 und vielen Transformern. GELU(x) ≈ x · Φ(x), wobei Φ die kumulative Normalverteilung ist. Anders als ReLU (hartes Thresholding) dämpft GELU Inputs sanft. Wird oft mit tanh-Approximation berechnet. In modernen LLMs von SwiGLU abgelöst.

Question 2

Wie funktioniert GELU (Gaussian Error Linear Unit)?

Accepted Answer

GELU(x) ≈ x · Φ(x), wobei Φ die kumulative Normalverteilung ist. Anders als ReLU (hartes Thresholding) dämpft GELU Inputs sanft. Wird oft mit tanh-Approximation berechnet. In modernen LLMs von SwiGLU abgelöst.

Question 3

Warum ist GELU (Gaussian Error Linear Unit) wichtig für Marketing?

Accepted Answer

GELU war die erste Aktivierungsfunktion, die ReLU in Transformern ersetzte – in BERT, GPT-2/3 und vielen Vision Transformern.

Question 4

Was sind häufige Fehler bei GELU (Gaussian Error Linear Unit)?

Accepted Answer

Rechenaufwändiger als ReLU. In neuesten LLMs von SwiGLU übertroffen. Verschiedene Approximationen (tanh vs. sigmoid) können Ergebnisse leicht verändern.

Question 5

Woher kommt GELU (Gaussian Error Linear Unit)?

Accepted Answer

Hendrycks und Gimpel (2016) führten GELU ein. BERT (2018) und GPT-2 (2019) machten GELU zum Standard. GPT-3 und Vision Transformers übernahmen GELU ebenfalls. Ab 2022 wurde GELU zunehmend durch SwiGLU ersetzt.

Question 6

Was ist der Unterschied zwischen GELU (Gaussian Error Linear Unit) und SwiGLU?

Accepted Answer

GELU (Gaussian Error Linear Unit) und SwiGLU sind verwandte Konzepte im Bereich der KI und des Marketings. Eine glatte Aktivierungsfunktion, die Inputs mit ihrer kumulativen Normalverteilungs-Wahrscheinlichk...

GELU (Gaussian Error Linear Unit)

Erklärung

Relevanz für Marketing

Häufige Fallstricke

Entstehung & Geschichte

Abgrenzung & Vergleiche

GELU (Gaussian Error Linear Unit) vs. ReLU

GELU (Gaussian Error Linear Unit) vs. SwiGLU

Weiterführende Ressourcen

Verwandte Services

Verwandte Begriffe