SZTAKI HLT | Makrai Márton

Makrai Márton

Makrai Márton számítógépes szemantikai kutatásokat végez az MTA Nyelvtudományi és Kognitív Idegtudományi és Pszichológiai Intézeteinek tudományos segédmunkatársaként.

Az oldal angol változata tömörebb.

Korai munkái Kornai András és csoportjának szemantikus hálójához, a 4lang-hez kötődnek: nagyrészt ő írta a definiáló szókincs gold jelentésreprezentációit és a diákok közül leginkább hozzá kötődik a mélyesetek elméleti kidolgozása. További 4lang-es publikációi az aktivációterjedésről szólnak illetve a definiáló szókincset jellemzik információkinyerési és lexikogárfiai eszközökkel.

2015-től 2018-ig az MTA NYI Nyelvtechnológiai Kutatócsoportja fiatal kutatójaként a szavak többértelműségét vizsgálta a gépi tanulás eszközeivel, első sorban a 2013 óta alapvetővé vált szóvektorokéval (word embedding). Kidolgozott két egymással csereviszonyban levő mértéket annak számszerűsítésére, hogy egy többjelentésű szóbeágyazás (multi-sense word embedding, MSE) mennyire jól ragadja meg a lexikai struktúrát: a jelentésvektoroknak elég specifikusnak kell lenniük, de nem szaporíthatják indokolatlanul a jelentéskészletet.

A kutatás egy másik ágában Berend Gáborral hipernimákat nyertek ki szóvektorokból. Ritka szóreprezentációkon alapuló módszerükkel megnyertek több kategóriát a szakma évente megrendezésre kerülő legrangosabb versenyének egyik feladatában.

A jelentéskészlet kutatása kapcsán már említett szófordítási feladatban ötvözte az úgynevezett háromszögelés módszerét a szóvektorok lineáris leképezésén alapulóval. A nyíltan közreadott, megbízhatósági pontszámokkal ellátott német-magyar erőforrás tudomásunk szerint a legnagyobb szabad elérésű szólista volt akkor (2016).

Elkészítette és nyíltan közreadta a szóvektorok kiértékelésének egyik legnépszerűbb módszerét adó analógiás kérdések teszthalmazának magyar megfelelőjét (pl. férfi : nő :: király : ?, a várt válasz a királynő). Ezt az erőforrást más kutatók is hasznosnak találták most is zajló kutatásukban. Bővebben a fiatal kutatói projektről

Jelenleg a disszertációja (MTA-ELTE elméleti nyelvészeti program) záróköveként a két nagy témát, az igei szerepeket és a lineáris algebrai modelleket igyekszik összekötni A diplomamunkáját a nyelvelsajátítás egy matematikai modelljéről írta (identification in the limit).

Elérhetőség:

makrai.hlt@gmail.com
MTA Nyelvtudományi Intézet
Budapest 1394 Pf. 360
1068 Budapest, Benczúr u. 33.,
320-as szoba
+36 1 342 9372, 6027-es mellék (lehet, hogy érdemes kicsit várni a mellék beütésével)
Teljes publikációs lista

Legfrissebb publikációk
2018
2017
2016
2015
2014
2013
2007