Inhalt

Document Image Analysis

Organisatorisches

Wahlvorlesung für das 4. Semester (Sommer) des Studiengangs Bachelor Informatik.

Umfang: 2h Vorlesung + 2h Übung pro Woche

Inhalt

Document Image Analysis beschäftigt sich mit der automatischen Verarbeitung digitaler Dokumente mit Methoden der Bildverarbeitung und Mustererkennung. Die Vorlesung gibt eine Einführung in dieses Thema.

Begleitend dazu werden praktische Übungen mit dem an der Johns Hopkins University entwickelten Toolkit Gamera durchgeführt. Dies ist eine Python-Bibliothek, die speziell für die "Document Image Analysis" entwickelt wurde.

Vorkenntnisse in der Programmiersprache Python sind nicht erforderlich, wohl aber Grundkenntnisse in objektorientierter Programmierung, wie Sie sie in der Veranstaltung "Objektorientierte Anwendungsentwicklung" (OOA) erworben haben.

Literatur

Es gibt zwar ein paar Bücher über "Document Image Analysis", diese bestehen allerdings lediglich aus losen Sammlungen von Einzelartikeln. Die folgenden Referenzen können ergänzend zur Vorlesung hilfreich sein:

R. Kasturi, L. O'Gorman, V. Govindaraju: Document image analysis: A primer. Sadhana Vol. 27, Part 1, February 2002, pp. 3-22.
Ein Überblicksartikel über die verschiedenen Aspekte der DIA mit Verweisen auf weiterführende Literatur. Der Artikel ist als OpenAcces Publikation direkt über den obigen Link zugänglich.
Gamera Homepage: http://gamera.informatik.hsnr.de/
Dies ist die Python Bibliothek, mit der wir die praktischen Experimente durchführen. Wenn gcc, Python, wxPython, libpng-devel und libtiff-devel auf Ihrem System installiert sind, dann können Sie Gamera mit der folgenden Befehlsfolge installieren:
svn co https://gamera.svn.sourceforge.net/svnroot/gamera/trunk/gamera gamera
cd gamera
python setup.py build
sudo python setup.py install
Beazley: Python - Essential Reference. New Riders 2001
Gute Einführung in Python für Leser mit Kenntnissen einer anderen Programmiersprache. Wir benötigen keine tiefgehenden Python-Kenntnisse für unsere Experimente, aber wer sich näher mit Python beschäftigen möchte, findet in diesem Buch eine gute Referenz.

Download

Vorlesungen
Präsentationsfolien: intro-4up.pdf,
Einführung in Python: pythonintro-4up.pdf
Übungen
ueb01.pdf, ueb02.pdf, ueb03.pdf, ueb04.pdf, ueb05.pdf, ueb06.pdf, ueb07.pdf, ueb08.pdf, ueb09.pdf, ueb10.pdf, ueb11.pdf,