Írásfelismerés
Budapesti Műszaki és Gazdaságtudományi Egyetem, 2011/2012 tavasz- Áttekintés: Mitõl optikai az optikai karakterfelismerés? Az OCR alapvetõ fajtái: dinamikus vagy kép-alapú, nyomtatott vagy kézírásos. Szöveg és ábra-típusok, írások, betûtípusok. Zajszûrés, binarizálás, a dokumentum felbontása. Egy konkrét feladat: matematikakönyvbõl LaTeX kód. Mit lehet automatizálni, és mit nem?
- Az alacsonyszintû képfeldolgozás alapjai. Zajszûrés, határkeresés, szinredukció, binarizálás, csontvázépítés, vektorizáció, lánckódolás. Poligonok, kritikus pontok. Iránykeresés, dõlésbecslés, zónákra bontás.
- A szövegzóna elemzése: sorok, iniciálé. A latin alapú ábécék struktúrája. Alapvetõ font-osztályok. A binárisés az általános osztályozási feladat. Standard adatbázisok.
- A jegyszámítás (feature extraction). A legfontosabb jegyosztályok, geometriai momentumok, Zernike momentumok. Szegmentálás és osztályozás mint egymást követõ feladatok, típushibák. Adattömörítés, a legegyszerûbb nyelvmodellek.
- Az osztályozók fõbb típusai. Hasonlósági (nearest neighbor), ideghálózati (neural network), lineáris, határszélesítõ (max margin), maxent, és egyéb osztályozási módszerek.
- A szegmentálási, osztályozási, és nyelvmodellezési problémák közös megoldása rejtett Markov modellekkel. Szavazás, tényezõk integrálása, modellek integrálása.