Ha azt gondolnánk, hogy az adatok és feldolgozásuk körül kialakult viták új keletűek, elfelejtjük, hogy az adatok az emberiség hajnala óta léteznek, és hogy minden korszaknak megvoltak a maga technológiai vívmányai azok hasznosítására. Az „adatok” kifejezés – ’tény’ értelemben – már az ókorban megjelenik, Eukleidész egyik művének címeként, aki e könyvében az ismert és bebizonyított tények alapján magyarázza a geometriát. A szó értelme fokozatosan alakul, s idővel egy jelenségnek egy bizonyos számú számjegyre történő átültetését jelenti, amelyeket azután rendszerezni és elemezni lehet. Itt tehát az „adatok” fogalma a valóság adaptációs és átírási folyamatát jelenti, ezt a folyamatot hol adatokkal való leírásnak, hol „adatosításnak” (angolul datafication, to datafy) nevezik (Mayer-Schönberger és Cukier, 2014).

A fent leírt folyamat pedig, amelynek során analóg információkat bináris kóddá alakítanak át, jóval megelőzi az adatok kortárs digitalizációját. Valójában az emberiség egész történetét felfoghatjuk úgy, mint az adatosítás területén elért technikai és technológiai előrehaladást. E vívmányoknak köszönhetően egyes társadalmak gazdasági és geopolitikai befolyásra tettek szert regionális környezetükkel szemben azáltal, hogy mind belső hatalmukat (az állam konszolidációja, a lakosság igazgatása), mind külső hatalmukat (regionális vagy globális gazdasági és politikai uralom) megerősítették. A Krisztus előtt 3000-ben készített mezopotámiai agyagtáblák, a Han birodalom népszámlálási jegyzékei, az arab számrendszer feltalálása a Krisztus előtti 1. században vagy éppen a könyvnyomtatás feltalálása a 15. században mind olyan eszközök voltak, amelyek segítettek megszilárdítani az ezeket birtokló társadalmak jólétét és befolyását. A könyvnyomtatás adott egyébként alkalmat az első „adatözönre”, s megfigyelhetjük, hogy az információs túlkínálat, amely látszólag oly jellemző sajátossága jelenünknek, valójában a reneszánsz óta újra meg újra felbukkan. Márpedig a nagy adatbázisok szisztematikus összegyűjtése és feldolgozása fokozatosan hatott a tudományos megközelítés egészére.

A 16. században a dán csillagász, Tycho Brahe aprólékos adatgyűjtő munkával tudott megbízható csillagtérképet alkotni, és ezáltal sokkal pontosabban megjósolhatta az égitestek mozgását. Ebben az esetben a nagyon széles körű rendszeres megfigyeléseken alapuló empirikus adatosításnak köszönhetően a csillagász meg tudta haladni kora elméleteit, és előrejelzésre képes tudást teremtett. Lassanként tehát felmerült a gondolat, hogy a nagyszámú adat a mennyiségének köszönhetően megbízhatóbb tudományos erővel bír, mint a spekulatív elméletek, a kvalitatív eljárások vagy akár a kisebb számú minta megfigyelése.

A 19. században tudományos területen, és különösen a humán tudományok terén a pozitivista áramlatok által elindított gyakorlatokat és tendenciákat követve általánossá válik az érvelés alátámasztására szolgáló adatok szisztematikus gyűjtése és felhasználása. Születőben lévő tudományágak, mint az antropológia vagy a szociológia és a régóta meglévők, mint a gazdaságpolitika és a földrajz adatgyűjtési módszertanok egész sorát vezették be, hogy megkíséreljék megfejteni a társadalmak mélyén húzódó dinamikákat, és törekedjenek a megfigyelt tárgyak osztályozására. Ekkor új kérdések merülnek fel e tudományos megállapítások státusza kapcsán, és különösen azzal kapcsolatban, hogy képesek-e egyetemes törvényeknek – köztük az okság elvének – az emberi társadalmakra való alkalmazásával előre látni társadalmi jelenségeket. A felvilágosodás korát követő pozitivista irányzat ekkor azért alkalmazza a tudományos módszertant a társadalomra, hogy meghaladja a hagyományon alapuló tudást. Ezáltal a társadalomtudományok építményét a pozitív, objektív tények felismerésére alapozták, amelyekre támaszkodva ellenőrizhető hipotéziseket lehetett alkotni.

E tudományos álláspontot azóta erősen kritizálták és relativizálták, a természettudományok területén éppúgy (többek között a kvantumfizika a valószínűségelméleti ismeretek felé tereli a gyakorlatot), mint a humán tudományok körében (strukturalista, posztpozitivista, konstruktivista megközelítés stb.). Ezek a kérdésfelvetések a jelenleg használatos tömeges adatfeldolgozási technikákra is alkalmazhatók. A Dialogues in Human Geography című folyóiratban megjelent cikkében Trevor J. Barnes földrajztudós bemutatta, hogy a big datának a földrajztudományban való jelenlegi alkalmazása az 1960-as és 70-es években elindult kvantitatív fordulat folyamatába illeszkedik (Barnes, 2013). A mennyiségi megközelítésnek a földrajztudományhoz adott értéke persze jelentős (a tudományos elmélet bevezetése, a humánföldrajz és a társadalomtudományok konvergenciája, a geográfiai diskurzus hitelességének megújulása és az iránta megjelent újfajta tisztelet).

Ugyanakkor bizonyos kritikák, amelyekkel akkor illették, most is időszerűek, köztük a számok fetisizálásának problémája (A szám önmagában való céllá változik-e a társadalmi és emberi aspektusok rovására?), vagy azé a hité, mely szerint „a számok magukért beszélnek”. (Vajon az emberi értelmezés nem szükséges ahhoz, hogy a számok megszólaljanak?), vagy akár az adatok célszerűsége (Azért generáljuk-e őket, hogy ismeretet és tudást teremtsünk, vagy csak azért, mert megvan hozzá a technikai kapacitásunk?). És a tegnap sok kérdését bizony ma is feltehetjük: Mit kezdjünk a nem számszerűsíthető információval? Mekkora bizalmat helyezhetünk a számokba? Vajon a számjegyek nem lehetnek-e hamisak vagy részrehajlóak? Végül hogyan értékeljük az új, még marginális folyamatokat? Vajon az adatok értelmezésére alapozott tanulmányok nem korlátozódnak-e természetükből adódóan arra, ami van, annak a rovására, ami lehetne, vagy aminek lennie kellene?

 

 

A szövegrészlet Amaël Cattaruzza: A digitális adatok geopolitikája című könyvéből származik.

A könyv megvásárolható a webshopunkban !