Question 1

Was ist Structured Pruning?

Accepted Answer

Eine Pruning-Variante, die ganze Strukturen (Neuronen, Filter, Attention Heads, Layer) entfernt statt einzelner Gewichte – liefert echte Speedups ohne spezielle Sparse-Hardware. Im Gegensatz zu Unstructured Pruning (einzelne Gewichte auf Null) entfernt Structured Pruning zusammenhängende Blöcke: ganze Convolutional Filter, Attention Heads oder sogar Layer. Das resultierende Modell ist ein echtes kleineres Modell ohne Sparse-Repräsentation.

Question 2

Wie funktioniert Structured Pruning?

Accepted Answer

Im Gegensatz zu Unstructured Pruning (einzelne Gewichte auf Null) entfernt Structured Pruning zusammenhängende Blöcke: ganze Convolutional Filter, Attention Heads oder sogar Layer. Das resultierende Modell ist ein echtes kleineres Modell ohne Sparse-Repräsentation.

Question 3

Warum ist Structured Pruning wichtig für Marketing?

Accepted Answer

Structured Pruning ist die praxisrelevanteste Pruning-Methode, da Standard-Hardware (GPUs, CPUs) direkt von kleineren Modellen profitiert – kein Sparse-Support nötig.

Question 4

Wie wird Structured Pruning in der Praxis eingesetzt?

Accepted Answer

LLM-Shearing (2023) entfernt gezielt Attention Heads und FFN-Dimensionen aus Llama-2 7B und erzeugt ein 1.3B-Modell, das besser performt als von Grund auf trainierte 1.3B-Modelle.

Question 5

Was sind häufige Fehler bei Structured Pruning?

Accepted Answer

Gröbere Granularität als Unstructured Pruning – kann weniger komprimieren. Schwieriger zu optimieren, welche Strukturen entfernbar sind. Erfordert Retraining/Fine-Tuning nach dem Pruning.

Question 6

Woher kommt Structured Pruning?

Accepted Answer

Li et al. (2016) führten Filter Pruning für CNNs ein. Für Transformer wurde Head Pruning von Michel et al. (2019) untersucht – sie zeigten, dass viele Attention Heads entfernbar sind. LLM-Shearing (2023) skalierte dies auf LLMs.

Structured Pruning

Erklärung

Relevanz für Marketing

Beispiel

Häufige Fallstricke

Entstehung & Geschichte

Abgrenzung & Vergleiche

Structured Pruning vs. Unstructured Pruning

Structured Pruning vs. Knowledge Distillation

Weiterführende Ressourcen

Verwandte Services

Verwandte Begriffe