Hálózatkutatás a magyar irodalom titkaiért
A hálózatok és az adatbázisok csoportok közötti relációkat mutatnak, felfedve ezzel az irodalom olyan szürkeállományait, amelyekre másképp nem találnának rá.
A DH, azaz a Digitális Bölcsészet fiatal tudományos irányzat, a digitalizáció nagyjából mindössze harmincéves múltjára tekint vissza. Egy rendkívül kompetens, interdiszciplináris irányról van szó, amelyben bölcsészek és matematikusok, fizikusok és programozók mind együtt tevékenykednek, hogy egészen új megközelítési módokat kínáljanak a feldolgozásra és a megértésre.
Maróthy Szilvia és Minkó Mihály éppen ezen tevékenykednek. Kísérleti projektjük az egyik legújabb hazai próbálkozás, amely a XX. századi magyar nyelvű folyóiratkultúra vizualizációjára irányult.
Az irodalom adatolása első hangzásra talán furcsa lehet. Egy-egy korszak megítéléséhez és megnevezéséhez általában igénylünk valamiféle „jelzőbóját” – mondjuk egy zseniális költő személyében – vagy egy ideát, egységes korszellemet. A magyar népiesség például így vált gyakorlatilag egyenlővé Arany János és Petőfi Sándor nevével. Ez így azonban talán mégis túl egyszerűnek tűnik – és nem véletlenül, hiszen bármely időszak csúcsteljesítményéhez sok száz másik tényező járul hozzá. A költők és írók, a művészvilág és annak összes terei mind hatással vannak a gondolkodásra, egymás munkásságát befolyásolják, ezért logikus, hogy sokkal hitelesebb képet kaphatunk egy-egy korról, ha felrajzoljuk annak minden halmazát, minden egységével együtt.
Az információ, az adat önmagában nem közöl semmit. Nem mesél. Nem ad koncepciót, ideát vagy tartalmat. Nincs előre gyártott képlete sem. De sok információ és sok adat emberi ésszel szinte felfoghatatlan sorozata, a különféle listák hivatkozásként működnek: egyik elemről a másikra ugorhatunk, és a hálózatok segítségével könnyű belátni, hogy minden mindennel összefüggésben áll.
Egy ilyen projekt esetén az első lépés természetesen az adatgyűjtés. Maróthy Szilvia és Minkó Mihály munkájához a legnagyobb segítséget az Arcanum Digitális Tudománytár, a Petőfi Irodalmi Múzeum, A magyar irodalomtörténet bibliográfiája és a Névtér adatbázis nyújtották. Akadt azonban jó néhány felmerülő probléma. Először is: rendkívül sok volt a redundáns, felesleges információ és a párhuzamosság a különböző adattárak közt, ami megnehezítette az ábrázolást. Másodsorban pedig nem volt ritka az egyes adattárak következetlensége sem. Számos hiányos részre bukkantak, amelyek lyukakat eredményeztek az adatok hálózatában – ilyen például, amikor egy lap esetén nincs meg a teljes cikkjegyzék.
Az első hálózatos vizualizáció igazán furcsa eredményeket hozott, amelyek annyira azért mégsem meglepők. A korszak egyik leginkább ismert budapesti napilapja, a Pesti Hírlap példának okáért eltöpörödik a Protestáns Szemle adatai mellett. Ennek pusztán az lehet az oka, hogy egy hatalmas forgalmú lap óriási termelése mellett a kartotékolásra kevéssé jutott idő, valamint a közölt hírek aktualitása szinte naponta érvényét vesztette, így a lap értéke sem számíthatott megőrzésre érdemesnek.
Az első eredményekből tanulva a kutatók később szűkítették a vizsgálódás körét, és kiválasztottak két fő viszonyítási pontot: egyrészt az érthető módon megkerülhetetlen Nyugat folyóiratot, valamint a közel húsz évig működő, ellensúlyként funkcionáló Napkeletet. Ezen két sajtóorgánum összes adatát és viszonyrendszerét két külön és egy közös hálózatban ábrázolta a projekt – számtalan mellékábrával együtt.
1. A Nyugat íróinak fokszám nélküli hálózata
Ez a hálózatvizualizációs eljárás a folyóiratszámok és a szerzők képezte csomópontok kapcsolódásait mutatja meg. A módszer teljesen eltér az irodalomtörténet-írás eddigi elgondolásaitól, hiszen ahogyan korábban említettük, eddig javarészt individuumok teljesítményein, irodalmi csúcspontokon, azaz a zsenikultuszok segítségével keletkeztek a narratívák. A hálózatok és az adatbázisok azonban csoportok közötti relációkat mutatnak, felfedve ezzel az irodalom olyan szürkeállományait, amelyekre másképp, digitális és gépi kategorizálás nélkül nem találnának rá. Ez egy egészen új kutatási irány, amelynek segítségével eddig rejtett kincsekre bukkanhat a hazai irodalomtudomány – ez pedig kanonikus eltolódásokat is eredményezhet. Így került lassan előtérbe például Szabó Lőrinc, Nemes Nagy Ágnes költészete az addig kizárólagos József Attila–Ady Endre-tengellyel szemben (noha senki nem zuhant még le jól megérdemelt piedesztáljáról, és ettől nem is kell tartanunk).
Egy kis gyorstalpaló! A hálózatok strukturális szempontból két fő elemmel rendelkeznek: a csúcsokkal (node) és az azokat összekötő élekkel (edge). Ha egy hálózatban a csúcsok különböző típusúak, azaz más kategóriába tartoznak (például szerzők és folyóiratok, ahol az említett szerzők publikálnak), akkor azt a hálózatot bipartitnak nevezzük. A fokszám (a kapcsolódások száma egy-egy csúcs esetén) a szerzői hálózat esetében az azonos folyóiratba írt publikációt jelentette, tehát minél gyakrabban publikált egy szerző ugyanabban a folyóiratban, mint egy másik szerző, a közöttük lévő kapcsolat annál erősebb lett, az érték pedig nagyobb. Fény derült így például a top 20 író kapcsolatrendszereire, azaz hogy ki az a húsz szerző, akik a legtöbb alkalommal publikáltak mindkét lapban. Az ábrákon szépen kirajzolódott a Nyugat veleje-magva, az irodalmi élet krémje.
2. A top 20 író hálózatábrázolása
Hogy mit tanultunk ebből ma? Egy dolgot biztos: a homogén, egyöntetű irodalom képzetéről, úgy tűnik, hamarosan le kell mondanunk. Cserébe viszont képzeletben (és talán hamarosan virtuálisan is) lépjünk be egy körúti kávéházba, és üljünk le Ady asztalához, ahol még tíz másik fiatal művész kortyolja kávéját. Közülük legalább kettő ismer még két másik költőt a szomszédos asztalnál. Vitába bonyolódnak. A főpincér közvetít köztük. Az este végére nem marad más a szalonban, csak az üres csészék – amelyek fölött egy új barátság szövődött. Ez lesz a mi hálózatunkban az adat.