Question 1

Was ist ALiBi (Attention with Linear Biases)?

Accepted Answer

Eine Methode zur Positionskodierung, die lineare Biases direkt auf Attention-Scores addiert, statt Position-Embeddings zu lernen. ALiBi addiert einen negativen, linearen Bias proportional zur Distanz zwischen Query- und Key-Position. Je weiter entfernt, desto stärker wird die Attention gedämpft. Benötigt keine gelernten Parameter und extrapoliert natürlich zu längeren Kontexten als im Training gesehen.

Question 2

Wie funktioniert ALiBi (Attention with Linear Biases)?

Accepted Answer

ALiBi addiert einen negativen, linearen Bias proportional zur Distanz zwischen Query- und Key-Position. Je weiter entfernt, desto stärker wird die Attention gedämpft. Benötigt keine gelernten Parameter und extrapoliert natürlich zu längeren Kontexten als im Training gesehen.

Question 3

Warum ist ALiBi (Attention with Linear Biases) wichtig für Marketing?

Accepted Answer

ALiBi war eine der ersten effizienten Extrapolationsmethoden und wird in BLOOM und MPT verwendet.

Question 4

Was sind häufige Fehler bei ALiBi (Attention with Linear Biases)?

Accepted Answer

Weniger verbreitet als RoPE in neueren Modellen. Lineare Bias-Annahme kann bei sehr langen Kontexten suboptimal sein.

Question 5

Woher kommt ALiBi (Attention with Linear Biases)?

Accepted Answer

Press et al. (2021) führten ALiBi ein und zeigten starke Extrapolation ohne Training auf langen Kontexten. BLOOM (BigScience, 2022) und MPT (MosaicML, 2023) nutzten ALiBi. RoPE hat ALiBi bei neueren Modellen (Llama, Mistral) weitgehend abgelöst.

Question 6

Was ist der Unterschied zwischen ALiBi (Attention with Linear Biases) und RoPE?

Accepted Answer

ALiBi (Attention with Linear Biases) und RoPE sind verwandte Konzepte im Bereich der KI und des Marketings. Eine Methode zur Positionskodierung, die lineare Biases direkt auf Attention-Scores addiert, statt P...

ALiBi (Attention with Linear Biases)

Erklärung

Relevanz für Marketing

Häufige Fallstricke

Entstehung & Geschichte

Abgrenzung & Vergleiche

ALiBi (Attention with Linear Biases) vs. RoPE

ALiBi (Attention with Linear Biases) vs. Sinusoidal Positional Encoding

Weiterführende Ressourcen

Verwandte Services

Verwandte Begriffe