Háromváltozós normalizált PMI tárgyas szerkezetek hasonlóságára
Makrai Márton
Zoom, ld. a levlistát és a slacket.
https://www.youtube.com/watch?v=7v1gfOuYbpc
A normalizált PMI-t (Bouman 2009) általánosítottam a három változós (van de Cruys 2011) esetre, és a megfelelő asszociációs mértékekkel népesítettem be egy alany-ige-tárgy tenzort. A alanyi, igei és tárgyi embeddingvektorok konkatenációját SVO hármasok hasonlóságára vonatkozó adaton (Kartsaklis és Sadrzadeh, 2014) teszteltem. Az eredmények jobbak, mint más asszociációs mértékekkel. A munka korábbi változatát lásd az idei MSZNY-poszteremen. A cikkben csak motiváció és irodalom van, a saját számításaimat lásd a poszter utolsó, Utólagos munka (LREC 2020?) szakaszában. Az LREC-ről elutasítottak egy olyan állapotot, amiben még mindig nem volt normalizált PMI.
Fun fact: az eredeti motiváció az volt, hogy a disszertációm kohéziója érdekében ez a projekt összekösse két korábbi témámat: igék és vektorok. Ha tetszik, ez megvalósult, de közben rájöttem, hogy máshogy is meg lehet ideologizálni, hogy miről szól a disszertációm: Lexikai relációkról.