SZTAKI HLT | Háromváltozós normalizált PMI tárgyas szerkezetek hasonlóságára

Háromváltozós normalizált PMI tárgyas szerkezetek hasonlóságára

Makrai Márton
2020. május 4., 10:00
Zoom, ld. a levlistát és a slacket.

https://www.youtube.com/watch?v=7v1gfOuYbpc

A normalizált PMI-t (Bouman 2009) általánosítottam a három változós (van de Cruys 2011) esetre, és a megfelelő asszociációs mértékekkel népesítettem be egy alany-ige-tárgy tenzort. A alanyi, igei és tárgyi embeddingvektorok konkatenációját SVO hármasok hasonlóságára vonatkozó adaton (Kartsaklis és Sadrzadeh, 2014) teszteltem. Az eredmények jobbak, mint más asszociációs mértékekkel. A munka korábbi változatát lásd az idei MSZNY-poszteremen. A cikkben csak motiváció és irodalom van, a saját számításaimat lásd a poszter utolsó, Utólagos munka (LREC 2020?) szakaszában. Az LREC-ről elutasítottak egy olyan állapotot, amiben még mindig nem volt normalizált PMI.

Fun fact: az eredeti motiváció az volt, hogy a disszertációm kohéziója érdekében ez a projekt összekösse két korábbi témámat: igék és vektorok. Ha tetszik, ez megvalósult, de közben rájöttem, hogy máshogy is meg lehet ideologizálni, hogy miről szól a disszertációm: Lexikai relációkról.

github.com/makrai/verb-tensor