Rólunk
Csoportunk a gépi szövegértés (human language technology) terén végez kutatásokat, a tagok a Budapesti Műszaki és Gazdaságtudományi Egyetem és a Magyar Tudományos Akadémia különböző intézeteinél dolgoznak. Az adatorientált nyelvészet alapvető kérdéseivel és a nyelvtechnológia számos területével egyaránt foglalkozunk, köztük az alábbiakkal:
- számítógépes szemantika, különösen vektoros és algebrai szemantika (cikk)
- automatikus szótárépítés párhuzamos korpuszokból (eszköz), a Wikipédiából (online app, eszköz cikk) illetve egynyelvű korpuszokból (honlap),
- objektív mértékek kidolgozása nyelvek digitális életerejére (adatbázis, cikk)
- súlyozott véges automaták tanulása (cikk)
- beszédfeldolgozás (adatbázis, cikk)
- statisztikai nyelvmodellezés
- morfológia (cikk)