Automatische Bildanalyse- und -Auswertung

In den Anfängen der Computertechnik löste die Perspektive, die Computer zur Erkennung der Bilder oder der menschlichen Sprache einzusetzen, eine wahre Euphorie aus. Aber von der menschlichen Fähigkeit, (farbige) Bilder zu erkennen und zu verstehen, sind die heutigen Computersysteme immer noch weit entfernt. Hingegen im Bereich der Bildanalyse und –Auswertung sind enorme Fortschritte gemacht worden. Dabei sind vor allem die Methoden der Echtzeitanalyse von praktischer Bedeutung, weil sie es erlauben, Ereignisse sofort zu bewerten und das Überwachungspersonal von der monotonen Tätigkeit des „Anstarren der Monitore“ zumindest teilweise zu befreien. Dieser Bericht von unserem Kollegen, Herrn Madjdi, gibt Ihnen einen Überblick über den aktuellen Stand dieser Technologie und deren Methoden und Möglichkeiten.

Durch die Auswertung der von konventionellen Überwachungskameras gelieferten Bilder wird heutzutage der Verkehr auf Verkehrsfluss (die Dichte des Verkehrs pro Fahrspur), Staubildungen, stehende Fahrzeuge und Falschfahrer (Geisterfahrer) überwacht.

Eine der bekanntesten Einsatzgebiete der Bildanalyse- und Detektionssysteme ist die „Section Control“, die eine kontinuierliche Überwachung der Geschwindigkeit der Fahrzeuge, wie sie zum Beispiel in Wien bei der Einfahrt in den Kaisermühlen-Tunnel der Donauufer-Autobahn im Einsatz ist, erlaubt. Der Unterschied zu den bisherigen Radarsystemen besteht darin, dass nicht die Momentangeschwindigkeit der Fahrzeuge am Aufstellort des Radargerätes gemessen wird, sondern die Durchschnittsgeschwindigkeit über einen prinzipiell beliebig langen Streckenabschnitt. Das Kennzeichen wird bei Einfahrt und Ausfahrt aus dem Tunnel gescannt, und der Einfahrts- wird mit dem Ausfahrts-Zeitpunkt verglichen. Befinden sich die Werte außerhalb einer vorgegebenen Grenze, wird die Fahrzeugnummer mit dem entsprechenden Bild dem Verkehrsleitrechner gesendet. Schon die ersten Erfahrungen zeigen, dass die Unfallzahlen auf solcherart überwachten Strecken um bis zu 20 Prozent gesenkt werden können.

Auch im Roppener Tunnel in Tirol wird nun eine „Section Control“ installiert. Im Gegensatz zur „Section Control“ im Kaisermühlen-Tunnel in Wien kann das Tiroler Modell auch noch den Abstand zwischen den Fahrzeugen feststellen. Die Anlage auf der Südautobahn (zwischen Kilometer 78 und 85 Richtung Wien), die noch heuer in Betrieb gehen soll, überwacht das Tempolimit abhängig von Wetterverhältnissen: bei Regen Tempo 80 statt 130.

Eine weitere Anwendung solcher Systeme ist die Detektion von Rauchentwicklung im Tunnel. Um Rauch in einem Kamerabild zu erkennen, wird das Bild mit einem feinen Gitter in einzelne Sensorfelder aufgeteilt. Jede Art von Sichttrübung ändert die Kontrastwerte in den betreffenden Feldern. Diese Änderungen lösen den Rauch-Alarm aus, welcher die Bediener der Verkehrsleitzentrale auf die Ereignisse aufmerksam macht.

Darüber hinaus kann das Alarmsignal auch als Auslöser zur automatischen Intensivierung der Belüftung, das Aufschalten der Adaptionsbeleuchtung oder zur Anzeige von Warnzeichen genutzt werden.

Ein etwas weniger bekanntes Einsatzgebiet solcher Bildanlayse- und -Detektionsysteme sind Banken, Museen und anderen öffentlichen Räumen: Dabei werden sie zur Erkennung von zurückgelassenen Koffern, Vandalismus, Entwendung von Objekten, abnormale Bewegungsabläufe und dergleichen eingesetzt.

Wie funktionieren solche Systeme?

Träger von audio- oder visuellen Informationen sind Signale, die durch diverse Sensoren, wie Mikrophone oder Videokameras in ein elektrisches Signal umgewandelt werden können. Ein einfaches Signal lässt sich als Funktion einer Variablen S = f(x) darstellen. Komplexe Signale sind Veränderungen einer physikalischen Größe in Raum und Zeit. Die mathematische Beschreibung ist formal und einfach: S = f(x,y,z,t).

Diese komplexen Signale kann man in Einzelsignale zerlegen. Z.B. dadurch, dass man – ähnlich wie im Beispiel der Rauchdetektion gezeigt – einzelne Bildpunkte oder Bildfelder betrachtet. Die Veränderung der Farbe, Helligkeit oder Kontrast eines kleinen Feldes ist ein Einzelsignal, das mit den bekannten Verfahren wie Frequenzanalyse analysiert werden kann. Die Einzelsignale haben aber einen räumlichen und zeitlichen Zusammenhang (Korrelation), der darauf beruht, dass sie Abbildungen der unterliegenden Ereignisse (z.B. Rauchentwicklung vor der Kamera) sind.

Um die Korrelation der Einzelsignale zu erkennen, werden verschiedene Verfahren wie Mittelung einer Vielzahl von Signalen, Kohärenz, Mapping, Fuzzy-Logic und Methoden der Künstlichen Intelligenz eingesetzt. Oft werden mehrere Methoden kombiniert. Da die Signale im Allgemeinen stark von Störungen und Fremdeinflüssen begleitet sind, werden spezifische Algorithmen verwendet, um das Rauschen zu unterdrücken. Hingegen die Methode der ereigniskorrelierten Potentiale (Event Related Potentials – ERP) interpretiert die Signale als Rauschen und mittelt 20 bis 5.000 Einzelsignale zeitsynchron zum gegebenen Ereignis. Um Fehldetektionen zu minimieren, werden mehrere ERP’s gemittelt. Dabei werden nicht nur die Einzelsignale in ihrem zeitlichen Verlauf sondern gleichzeitig der durch das unterliegende Ereignis gegebene räumliche Zusammenhang betrachtet. Daher ist die Erkennungszeit bei diesem Verfahren außerordentlich kurz gegenüber den konventionellen Methoden, die Aussagen nur über größere Zeitabschnitte eines Signals zulassen (1 bis 4 Sekunden).

Die heutigen Algorithmen sind so ausgereift, dass bis zu 20 Kamerabilder auf einem normalen PC (mit 1 GHz CPU) analysiert werden können. Sie verfügen darüber hinaus über Self-Learning Technologie, die eine einfache Systemkonfiguration erlaubt.

Mit Hilfe von ähnlichen Algorithmen und Verfahren werden neuerdings in der Medizin, EKG’s und EEG’s analysiert und dem Mediziner Hilfestellungen bei der Diagnose gegeben.

Konturbasierte Personenverfolgung

Wegen der Variabilität des menschlichen Körpers und seiner möglichen Eigenverdeckungen und der unterschiedlichen Kleidungsgewohnheiten ist die zuverlässige Erkennung von Personen immer noch eine Herausforderung. Um dennoch eine Person erkennen zu können, müssen invariante Körpermerkmale im Bild gefunden werden. Folgende charakteristische Eigenschaften haben sich als hilfreich erwiesen: eine Person bewegt sich, und die Silhouette einer Person unterliegt bestimmten Bewegungsmustern. Dabei wird die Kontur einer Person mit einer Ellipse angenähert.

Diese Systeme haben alle mehr oder weniger die Industriereife erreicht. Nichtsdestotrotz gibt es sehr viel Potential in deren Weiterentwicklung, die vor allem für die Informatik-StundentInnen als ein möglicher, interessanter Berufsweg in Frage kommt. Denn aufgrund sicherheitstechnischer Vorteile und des enormen wirtschaftlichen Potentials solcher oder ähnlicher Systeme, werden große Industrieunternehmen in den nächsten Jahren die Weiterentwicklung vorantreiben.

Scroll to Top