Dilated Convolution
Dilated Convolution erweitert das rezeptive Feld eines Filters durch Einfügen von Lücken zwischen Filterwerten – größerer Kontext ohne mehr Parameter.
Dilated Convolution fügt Lücken in Filter ein für größere rezeptive Felder ohne Mehrkosten – Standard in Segmentation und WaveNet.
Erklärung
Ein 3×3 Filter mit Dilation Rate r=2 hat effektiv ein 5×5 rezeptives Feld, aber nur 9 Parameter. Durch Stapeln verschiedener Dilation Rates kann ein Netz exponentiell wachsende rezeptive Felder erreichen (WaveNet). Standard in semantischer Segmentation (DeepLab).
Relevanz für Marketing
Ermöglicht globalen Kontext in Dense Prediction (Segmentation, Detection) ohne das Bild zu verkleinern.
Entstehung & Geschichte
Yu & Koltun (2015) popularisierten Dilated Convolutions für Dense Prediction. DeepLab (Chen et al., 2017) machte Atrous Convolution zum Standard in Semantic Segmentation. WaveNet (2016) nutzte kausale dilated Convolutions für Audio-Generierung.
Abgrenzung & Vergleiche
Dilated Convolution vs. Standard Convolution
Standard-Conv: rezeptives Feld = Filtergröße; Dilated Conv: rezeptives Feld = (k-1)·r+1, gleiche Parameter-Anzahl.