Vektoros szómodellek
Eötvös Loránd Tudományegyetem, 2017/2018 tavaszOlvasószeminárium az MTA--ELTE elméleti nyelvészet programon.
Időpont, helyszín és a referátumok beosztása
- Csütörtök 11--12:30
- A helyszín
- többnyire az MTA Nyelvtudományi Intézet 414-es termében (1068 Budapest Teréz körút 13., hátsó lépcsőház), de
- néha a Pázmány BTK-n (Mikszáth tér 1., 111-es terem).
Hogy melyik héten melyik, az az olvasmányokból való referátumok beosztásával együtt ebben a táblázatban olvasható.
A kurzus célja
A kurzus a szó(tári) jelentés vektoros modelljeit mutatja be a történeti előzményektől (szemantikus differenciál, Osgood et al 1975) napjainkig. Az utóbbi évek bemutatásakor a hangsúly az architektúrák alapötletén van, a kurzus nem kíván programozási és gépi tanulási előismereteket.
A tantárgy tartalma
Az első félidőben végigkövetjük a modellcsalád történetet az előzményektől a szóbeágyazások megjelenéséig (Mikolov 2013), majd egy-egy órában megismerjük az ideghálók alapvető architektúráit (rekurrens, rekurzív és konvolúciós, a hangsúlyokat a nyelvi alkalmazás szerint alakítjuk), végül a jelenről veszünk pillanatképet válogatott témákban (szószint alatt és fölött, ritka szavak, szavak többértelműsége, a szótári jelentés időbeli változása, feladatok és domének között általános modellek, többnyelvű feladatok, kapcsolat más modalitásokkal (pl. látás)).
Számonkérési és értékelési rendszer
Az osztályzatot a félévközi aktivitásra (referátumokra és az órai vitákban való részvételre) kapják a diákok.
Irodalom
Mátrixfelbontás ("count-based approaches")
- Szemantikus differenciál (Osgood, May, and Miron (1975) Cross Cultural Universals of Affective Meaning)
- Látens szemantikai elemzés (Salton et al., 1975; Deerwester et al., 1990; Landauer és Dumais, 1997)
- Kölcsönös információ (MI, Church 1990)
- egy további információelméleti VSM (Cilibrasi & Vitányi 2007)
- mxfelbontáson alapuló VSM-ek áttekintése (Turney és Pantel 2010)
- szintagmatikus és paradigmatikus viszonyok (Sahlgren 2006)
Ideghálók szóbeágyazásai ("prediction-based approaches")
- n-gramm nyelvmodell (Brown et al 1992)
- Neurális nyelvmodel (Bengio 2003)
- Szóbeágyazások
- Mikolov et al (2013 eredeti; negatív mintavétellel; jelentésfelbontás)
- kapcsolat az MI-vel (Levy and Goldberg 2014)
- VSM-ek pszichológiai realitása (Mitchell et al., 2008)
Idegháló-architektúrák
- rekurrencs hálók
- rekurzív hálók
- konvolúciós hálók (Kim 2014)