Logo der HdM
Veranstaltungsbeschreibung

143108a Object Recognition in Image and Video Data

Zuletzt geändert:14.10.2015 / von Carlsburg
EDV-Nr:143108a
Studiengänge: Computer Science and Media (Master), Prüfungsleistung im Modul Object Recognition in Image and Video Data in Semester 1 2 3
Häufigkeit: derzeit nicht im Angebot
Computer Science and Media (Master, Studienstart ab WS15/16), Prüfungsleistung im Modul Object Recognition in Image and Video Data in Semester 1 2 3
Häufigkeit: immer
Dozent: Prof. Dr. Johannes MaucherDetails zum Dozenten
Sprache: Deutsch
Art: -
Umfang: 4 SWS
ECTS-Punkte: 5
Prüfungsform:
Bemerkung zur Veranstaltung: Unterrichtssprache Englisch
Beschreibung:

Der erste Block der Vorlesung setzt sich mit der Frage auseinander, wie robuste Merkmale aus Bild- und Videodaten extrahiert werden können. Robuste Merkmale sollten möglichst invariant hinsichtlich Translation und Rotation, variierender Lichtverhältnisse, unterschiedlicher Skalierungen usw. sein. Unterschieden werden dabei globale und lokale Merkmale. Letztere beziehen sich nicht auf das Bild als ganzes, sondern auf im Bild vorkommende Objekte bzw. Objektteile.
Inhalte dieses ersten Blocks sind:
Globale Features:

  • Intensität, Gradienten
  • globale Histogramme (z.B. Farbhistogramme)
  • Principal Component Analysis (PCA)
Lokale Features:
  • Erkennung (Detection) von Keypoints wie Kanten und Ecken
  • Beschreibung (Description) von Keypoints durch z.B.
    • SIFT: Scale Invariant Feature Transform
    • SURF: Speeded Up Robust Features
    • HOG: Histogram of Oriented Gradients

Gegenstand des zweiten Blockes sind die verfahren für Detection, Recognition, Segmentation und Tracking.
Detection bezeichnet den Fall, dass nach einem vorgegebenen Objekttyp, z.B. einem Gesicht oder einem Fußgänger, in Bildern gesucht wird. Die entsprechenden Algorithmen stellen fest, ob der gesuchte Typ im Bild vorkommt und falls ja an welchen Stellen. Moderne Digitalkameras können mit derartigen Verfahren Gesichter im Bildausschnitt erkennen und auf diese fokusieren.
Recognition Verfahren müssen erkennen welche Objekte bzw. Objektkategorien in einem Bild vorkommen. Die entsprechenden Systeme müssen hierfür zunächst trainiert werden. Die maschinellen Lernverfahren, die sich hierfür in den vergangenen Jahren als besonders performant erwiesen haben, werden in dieser Vorlesung behandelt. Hierzu gehören u.a. SVM - Classifier, Ada-Boost oder tiefe neuronale Netze.
Segmentation zerlegt ein Bild in die in ihm vorkommenden Objekte und Szenen. Segmentierungsverfahren finden die Grenzen zwischen den Objekten. Dadurch kann z.B. der Hintergrund subtrahiert oder einzelne Objete extrahiert werden.
Beim Tracking werden Objekte in Videodaten erkannt und verfolgt. Damit kann die Objektbewegung über die Zeit aufgenommen werden. Eingesetzt werden Trackingalgorithmen z.B. in Überwachungskameras oder im Eyetracking.

Internet: http://www.hdm-stuttgart.de/~maucher/
© Hochschule der Medien 2017 | Impressum | Hinweise zum Datenschutz Login