Kezdeti lépések a határon túli magyar alkorpusz terén

Nyomtatás

A határon túli magyar alkorpusz kialakítása körüli effektív munkálatok 2001-ben kezdődtek. A kutatóhálózat létrehozása után minden iroda kidolgozta saját tervezetét és a munka megvalósulásának ütemtervét. A munka gyakorlati részének elindításában az MTA Nyelvtudományi Intézetében működő Korpusznyelvészeti Osztály (az osztály tevékenyséégi köre kibővült, s ennek megfelelően neve is megváltozott Nyelvtechnológiai Osztályra) által szervezett korpusznyelvészeti tréningek jelentettek felbecsülhetetlen segítséget. A tréningek és a kezdeti munkatapasztalatok után az előzetes tervek módosultak: voltak feladatok, amelyek a munka szempontjából később feleslegesnek bizonyultak, és voltak teendők, amelyek csak az első tréning után merültek fel.

A Kárpát-medencei magyar nyelvi korpusz atáron túli alkorpusza egységes formátumú és szerkezetű szövegcsoportot alkot. Ennek feltétele azonban nem csak a közös munka volt, hanem a jó szervezés is. A munka természete úgy kívánta, hogy a kutatóhálózat korpusznyelvészeti teendőit több személy koordinálja. Az egyes irodák munkájához szükséges technológiai követelmények biztosítását, a budapesti szakmai összejövetelek szervezését, illetve a hálózat koordinálását Bartha Csilla végezte. Mivel Bartha Csilla nem számítógépes nyelvész, a szakmai feladatok ellenőrzéséért Oravecz Csaba, illetve Váradi Tamás feleltek.

A kutatóhálózat létrehozója és irányítója az MTA Etnikai-nemzeti Kisebbségkutató Intézete volt. A hálózat feladatai között előzőleg nem csak nyelvészeti, hanem egyéb társadalomtudományi kutatások végrehajtása és szervezése is helyet kapott. Az a kezdetektől fogva nyilvánvaló volt, hogy a korpusznyelvészeti tevékenységet egy társadalomtudományi kutatásokkal foglalkozó intézet (MTA EnKI) nem fogja tudni felügyelni. Bartha Csilla (MTA Nyelvtudományi Intézete), illetve Váradi Tamás (MTA Nyelvtudományi Intézete) személyében azonban ez a probléma megoldódott, hiszen így ezt a projektet szakmailag nyelvészek irányították. A gazdasági és szakmai felügyelet megoszlása 2005 tavaszáig működött ilyen formában, ekkor a kutatóhálózat irányítása átkerült az MTA Nyelvtudományi Intézetéhez.

Az előzetes megbeszélések és levelezések után a Kárpát-medencei magyar nyelvi korpusz határon túli alkorpuszának készítői az első elméleti és gyakorlati információkat 2003. január 30–31-én kapták meg, de mint később a gyakorlatból kiderült, a folyamatos, eredményes munka végzéséhez ez az egyszeri alkalom nem volt elegendő, további folyamatos egyeztetésekre, szakmai összejövetelekre volt szükség. Mivel a szövegtár szerkesztése javarészt mechanikus folyamatok elvégzése volt, ezért a számítógépes előképzettség nem volt feltétel. Ezt bizonyítja az is, hogy több irodában azok, akik kezdetben a korpusszal foglalkoztak, még nyelvészeti ismeretekkel sem rendelkeztek. A nyelvészeti beállítottság, a nyelvészeti alapismeretek hiánya természetesen nem jelenhetett problémát, hiszen a nyelvészeti tudást igénylő munkát a nyelvi irodák nyelvészei is elvégezhették[1].

A tréningeket (a második 2004. június 21–22-én volt) az MTA Nyelvtudományi Intézetének Nyelvtechnológiai Osztályát vezető Váradi Tamás és az osztály egyik munkatársa, Oravecz Csaba tartották. Mivel ezek az összejövetelek Budapesten zajlottak, kisebb-nagyobb számban mindig minden kutatóállomás képviseltette magát[2].

                A korpusznyelvészeti tréningek eredményeiről, illetve a kutatóhálózat korpusznyelvészeti tevékenységéről honlap is készült, erre a kódoláshoz, illetve a munka közben felmerült problémák megoldásához szükséges információk Oravecz Csaba révén folyamatosan felkerültek (http://corpus.nytud.hu/mnszworkshop/index.html).  

[1] A Kárpát-medencei magyar nyelvi korpusz határon túli anyagának előkódolását végzők: Szlovákia (Gramma Nyelvi Iroda): Pintér Tibor, Mészáros Tímea, illetve Simon Szabolcs; Erdély (Szabó T. Attila Nyelvi Intézet): Becze Orsolya, Sárosi Mardírosz Krisztína Mária; Kárpátalja (Hodinka Antal Intézet): Molnár D. István, Márku Anita, Hires Kornélia; Vajdaság (Vajdasági Magyar Korpusz): Varga Tünde, Darabán Piroska, Fodor Attila.

[2] A korpusznyelvészeti összejövetelek sajátos formái voltak a Szabó T. Attila Nyelvi Intézet által Illyefalván szervezett találkozók, ahol a kutatóhálózat tagjai egy héten keresztül részletesen megbeszélhették az egyes kutatásokat (nemcsak a korpusznyelvészeti teendőket, hanem a lexikográfiai, oktatásügyi, illetve szervezési kérdéseket is). Sajnos az illyefalvi találkozók nem váltották be a hozzájuk fűzött kezdeti reményeket, mivel a három alkalom közül a 2004-ben őrvidéki, muravidéki és horvátországi kutatóhelyekkel kiegészült kutatóhálózat egyiken sem tudott teljes létszámban részt venni. Így az első két találkozó után harmadik alkalommal a kutatóhálózatból már csak a szervezők voltak jelen. Ennek oka valószínűleg a találkozó „fakultatív” jellegéből adódott, mivel a részvétel egyik évben sem volt kötelező (ellenben a budapesti találkozókkal).