Gauß-Laplace-Pyramide
aus Wikipedia, der freien Enzyklopädie
Die Gauß- bzw. Laplace-Pyramiden, auch Burt-Adelson-Pyramiden oder Gauß- und Laplacepyramide genannt, sind Algorithmen der digitalen Signalverarbeitung. Sie wurden 1981/83 von Peter J. Burt und Edward H. Adelson in die digitale Bildverarbeitung eingeführt, um einige bekannte Algorithmen systematisch zu vereinheitlichen. 1988 wurde der Grundgedanke dieser Datenstruktur von Stéphane Mallat und Yves Meyer in die Funktionalanalysis übertragen und ist dort als Multiskalenanalyse (MRA) der Wavelettheorie bekannt.
Unschärfe und Schärfe sind Charakteristika digitaler Bilder um bestimmte Strukturen zu erkennen oder Bilder bewusst zu manipulieren. Die einzelnen Frequenzbänder eines Bildes repräsentieren Schärfe und Unschärfe eines Bildes. Um die einzelnen Frequenzbänder zu ermitteln, können Filterkerne oder die Fouriertransformationen genutzt werden. Allerdings ist dies mit erheblichem Rechenaufwand verbunden und daher wird dies durch eine Gauß-Laplace-Pyramide gelöst.
Um eine Gauß-Laplace-Pyramide zu entwickeln muss zunächst eine Gaußpyramide konstruiert werden. Das Originalbild stellt zunächst die unterste Pyramidenstufe G0 dar. G1 wird über eine Tiefpassfilterung (fg=f/2) und Halbierung der Stützstellen von G0 errechnet. Dieser Prozess wird von Stufe zu Stufe fortgesetzt bis das Bild eine Größe von Pixel erreicht. Die Tiefpassfilterung wird über eine Faltung mit einer Gaußglocke realisiert. In der Praxis wird das Bild mit einem Binomialfilter gefaltet. Es ist anzumerken, dass das Originalbild G0 eine Seitenlänge von 2n Pixel aufweisen muss (Ein Bild kann in Bildblöcke unterteilt werden). Nach diesem Prozess liegen mehrere Bilder, die jeweils einen gewissen Frequenzanteil repräsentieren, vor. Jeder Nachfolger eines Bildes besitzt nur noch 1 / 4 der Pixel vom Vorgänger.
Nachdem eine Gaußpyramide konstruiert wurde, wird hieraus eine Laplacepyramide entwickelt. Eine Laplacepyramidenebene wird über die Bildung der Differenz von 2 benachbarten Gaußpyramidenebenen erzielt. Dies wird als DoG-Algorithmus bezeichnet. Dabei ist zu beachten, dass diese beiden Stufen die gleiche Größe aufweisen müssen. Der Farbwert der neu hinzugefügten Pixel wird durch Interpolation der beiden vorhandenen Nachbarpixel errechnet. Die einzelnen Laplacepyramidenebenen repräsentieren die Schärfeanteile eines Bildes. L0 beinhaltet die höchsten Frequenzanteile und die weiter unterliegenden Schichten den Rest.
Siehe hierzu: Beispiel
Nachdem die Gauß-Laplacepyramidenebene gebildet und eventuell die einzelnen Schichten bearbeitet wurden, muss die Gauß-Laplace-Pyramide rekonstruiert werden. Hierbei werden die gewünschten Laplacepyramdideebenen und die höchste Gaußpyramidenebene aufsummiert.
Die Gauß-Laplace-Pyramide wird zur Lösung zahlreicher Bildverarbeitungsprozesse genutzt. Ein beliebter Anwendungsbreich ist die Datenkompression. Bei der Datenkompression eines Bildes werden hohe Frequenzen gefiltert, da diese den geringsten Informationsanteil darstellen. Hierbei werden die höchsten Laplacepyramidenebenen weggelassen. Des Weiteren können die Stützstellen quantisiert und die einzelnen Ebenen mittels eines Quadtrees dargestellt werden. Ein Vorteil hierbei ist die intelligente Dekompression. Hierbei werden die unteren Ebenen der Bildpyramide zuerst dekomprimiert (Niedrige Frequenzen enthalten die meisten Informationen und benötigen den geringsten Rechenaufwand) und das Bild wird während der Dekompression aufgebaut.
Eine weitere Anwendungsmöglichkeit ist das Mosaicing. Bei Mosaicing werden verschiedene Bilder miteinander verschmolzen. Hierbei werden beide Bilder in Bildpyramiden zerlegt und mit Hilfe einer Maske gewichtet und aufsummiert. Anschließend wird das Bild rekonstruiert und eventuell nachbearbeitet. Man bearbeitet die Frequenzbänder separat um die Kantenbildung zu vermeiden.
Gauß-Laplace-Pyramiden werden ebenfalls zur Oberflächen- bzw. Strukturerkennung verwendet. Hierbei macht man sich die Schärfe und Unschärfe von Bildern zu Nutze. Bei diesem Verfahren werden bestimmte Frequenzbänder eines Bildes ermittelt um diese Informationen anschließend weiter zu verarbeiten.