SZTAKI HLT | Írásfelismerés

Írásfelismerés

Budapesti Műszaki és Gazdaságtudományi Egyetem, 2011/2012 tavasz
  1. Áttekintés: Mitõl optikai az optikai karakterfelismerés? Az OCR alapvetõ fajtái: dinamikus vagy kép-alapú, nyomtatott vagy kézírásos. Szöveg és ábra-típusok, írások, betûtípusok. Zajszûrés, binarizálás, a dokumentum felbontása. Egy konkrét feladat: matematikakönyvbõl LaTeX kód. Mit lehet automatizálni, és mit nem?
  2. Az alacsonyszintû képfeldolgozás alapjai. Zajszûrés, határkeresés, szinredukció, binarizálás, csontvázépítés, vektorizáció, lánckódolás. Poligonok, kritikus pontok. Iránykeresés, dõlésbecslés, zónákra bontás.
  3. A szövegzóna elemzése: sorok, iniciálé. A latin alapú ábécék struktúrája. Alapvetõ font-osztályok. A binárisés az általános osztályozási feladat. Standard adatbázisok.
  4. A jegyszámítás (feature extraction). A legfontosabb jegyosztályok, geometriai momentumok, Zernike momentumok. Szegmentálás és osztályozás mint egymást követõ feladatok, típushibák. Adattömörítés, a legegyszerûbb nyelvmodellek.
  5. Az osztályozók fõbb típusai. Hasonlósági (nearest neighbor), ideghálózati (neural network), lineáris, határszélesítõ (max margin), maxent, és egyéb osztályozási módszerek.
  6. A szegmentálási, osztályozási, és nyelvmodellezési problémák közös megoldása rejtett Markov modellekkel. Szavazás, tényezõk integrálása, modellek integrálása.
Oktatók