DIKU 2. dels kursus


Foråret 2001

Mønstergenkendelse og datamatsyn

Formål og Indhold

The objective is to give a basic knowledge of classical and modern methods and algorithms for recognition of patterns, shapes, and objects. Focus is both on theoretical and on practical aspects of the methods.

The course covers classical and modern methods for recognition of patterns, shapes and objects. Although most of the methods are applicable for any type of data, we will concentrate on data obtained from images. Such data might be intensity values or values extracted by previous analysis. A feature vector of data can be classified to one among a set of prototypes using either statistical techniques or non-parametric methods. In the first case the distribution of the observation vector for each prototype must be known/estimated in advance during a training period. In the latter case a typical approach will be to classify the vector to the nearest neighbour vector previously seen. This approach also is relevant if the number of objects and their typical characteristics are unknown. Here the goal is to group the set of vectors into prototypes.

After a brief introduction to some basic statistical terminology and methods the plan is to go through: Histogram analysis, Scatterplots, Cluster analysis, Kd-trees, Nearest neighbour classification, Classification trees, K-means algorithm, Principal component analysis (PCA), Independent component analyse (ICA), Mahalanobis distance, Discriminant analysis, Neural nets, Vector quantization, and Minimal description length (MDL).

An important part of the course will be to show the application of the methods. To accomplish this we will go through a number of papers describing real applications. Among these are a system for face recognition and a system for real-time recognition of hand alphabet gestures.

Kredit og forudsætninger

Der gives 3 "mundlige" punkter (7.5 ETCS) hvis 2 hjemmeopgaver besvares tilfredsstillende. Hvis interesse kan yderligere 3-4 rapportdokumenterede punkter kan erhverves ved besvarelse af en rapportopgave.

De formelle forudsætninger for at følge kurset er bestået førstedel i datalogi samt bestået første år i matematik, samt bestået "Introduktion til digital billedbehandling" eller tilsvarende. I praksis kræves betydelig matematisk modenhed. Således vil vi i stort omfang benytte os af lineær algebra, statistik, komplekse tal, samt integral- og differentialregning.

Det forventes at kursusdeltagerne selv vil kunne udvikle simple programmer (fx. i MATLAB) til mønstergenkendelse.

Kursusmateriale

Undervisningsmaterialet består af noterne: Noter i Mønstergenkendelse, samt et antal artikler, der udleveres undervejs. Nedenstående er planlagt (der kan se ændringer):

Beis and Lowe: Shape indexing using approximate nearest-neighbour search in high-dimensional spaces.
Murase and Nauar: Visual learning and recognition of 3D objects from appearance.
Birk, Moeslund and Madsen: Real-time recognition af hand alphabet gestures using principal component analysis.
Cootes, Taylor, Cooper and Graham: Active shape models - their training and application.
Nielsen: Ortogonal Transforms.
Hyvarinen and Oja: Independent Component analysis: A tutorial.
Moghaddam: Principal Manifolds and Baysian subspace for visual recognition.
Kohonen: Clustering, Taxonomy, and topological maps of patterns.
((Kohonen: The self-organizing map.))
Lipson and Siegelmann: Clustering Irregular shapes using high-order neurons.
tutorial: Support vector machines.
Burges: A tutorial on support vector machines for pattern recognition.
Rissanen: Stocastic complexity, Information and learning.
Li: Minimum Description length based 2D shape description

Der findes et hav af gode alternative lærebøger. Nogle eksempler kan findes i litteraturafsnittet af mine noter. Hvis en enkelt skal fremhæves kunne dette være: C.M. Bishop: Neural Networks for Pattern Recognition. Det kan bemærkes at bogen er betydelig mere generel end titlen lader antyde.

Programmel

Til eksemplificering af flere metoder vil Matlab blive benyttet som programmeringsværktøj. En kort introduktion til Matlab findes i: MATLAB-primer.

Det er håbet vi i løbet af kurset får samlet et antal matlab-programmer, til illustration af de gennemgåede metoder. Disse programmer kan placeres i /usr/local/image/INTRO/matlab/
Se også programmer i /usr/local/image/src/matlab

Gode web-steder

Der eksisterer et hav af gode websteder. Et udgangspunkt kan tages i billedgruppens side over eksterne links. Se: http://www.diku.dk/forskning/image/

Et andet udgangspunkt er "The Pattern Recognition Files". Se http://www.ph.tn.tudelft.nl/PRInfo/index.html

Andre links, herunder til forfattere til nogle af de læste artikler, er:
D. Lowe : http://www.cs.ubc.ca/spider/lowe/home.html
Nayar: http://www.cs.columbia.edu/~nayar/
ICA: http://www.cis.hut.fi/projects/ica/
Lipson: http://www.cs.brandeis.edu/~lipson/papers
SVM: http://svm.research.bell-labs.com/
SVM:http://www.research.microsoft.com/~jplatt/smo.html

Hvis du møder gode web-steder, så send adressen til mig, så vel jeg tilføje den til overstående liste.

Praktiske oplysninger

Kurset består af ca. 15 dobbelt-forelæsninger, torsdag kl. 9-11 i N034, og første gang tirsdag d. 1. februar 2001. Forelæsningerne afholdes på dansk. Lærer er Søren Olsen.

Hvis du ikke har 2.dels konto til UNIX, så få sådan ved at udfylde registreringsblanket på operatørkontoret. Samtidig vil du få et hjemmekatalog samt et antal laserprint udskriftssider. Du får ikke brug for adgang til billedlaboratoriet. Ved løsning af den frivillige rapportopgave kan det være en fordel at have nøgle til biblioteket.


Mange oplysninger om installation af nye programmer, afholdelse af foredrag mv. annonceres over E-mail, på mail-gruppen IMAGE. Du behøver naturligvis ikke at være på denne mail-gruppe. Hvis du ønsker at komme på listen skal du henvende dig på operatørkontoret. Alternativt kan du følge med under "events" på billedgruppens web-sider. Disse indeholder iøvrigt referencer til mange billedrelevante steder.