Már biztosan mindenki hallotta, hogy ami egyszer felkerül az internetre, az örökre ott is marad. Ez azonban nem teljesen igaz, hiszen még manapság is gondot okoz az online digitális megőrzés. Számos módon lehet elektronikus adatokat, dokumentumokat elveszíteni - pl. a tároló szerver meghibásodása, leállása miatt, ami biztonsági mentések nélkül nagy fejfájást okozhat. De néha elég az is, ha egy dokumentum nincs megfelelően leírva, metaadatolva - emiatt "előhalászhatatlan" lesz a dokumentumtengerből.
Ilyen és ehhez hasonló gondokra próbál rámutatni az a 2024-es tanulmány1, ami véletlenszerűen kiválasztott, körülbelül hétmillió, DOI-val, azaz digitális objektumazonosítóval ellátott és internetes adatbázisban elhelyezett tanulmány megtaláhatóságát, hozzáférhetőségét vizsgálja. A DOI-t kb. úgy kell elképzelnünk, mint a személyazonosítónkat. Egyedi és kizárólag egyetlen műhöz tartozik. Az ember azt gondolná, hogy ezzel bármelyik művet könnyedén vissza lehet keresni, ha szükség lenne rá, mivel a DOI az egyértelmű beazonosíthatóságot szolgálja. A tanulmány azonban a következőre jutott:
"A kutatás alapján a megvizsgált 7,438,037 publikációból az írások 58.38%-a (~4millió) volt elérhető legalább 1 adatbázisban, 27.64%-ot (~2millió) nem sikerült felkutatni és a maradék 13.98% kiesett a vizsgálatból, olyan indokokból kifolyólag, mint pl. túl friss megjelenés."
Ebből is jól látszik: hiába hisszük azt, hogy ha elhelyezték a művet valahol az interneten és van egyedi azonosítója is, akkor biztosan megtalálható, egyszerűen visszakereshető lesz bármikor. Ez sajnos nem biztos.
A sikeres visszakeresés érdekében érdemes figyelni rá, hogyan írjuk le az adott dokumentumot - pl. beszédes fájnév, valamint a fájl metaadatai között a cím, szerzőség és megfelelő kulcsszavak közlése. A megőrzéshez pedig biztos, ami biztos alapon ajánljuk Michael Cobb “3-2-1"-es szabályát, miszerint "mindig legyen legalább: 3 másolat, 2 különböző hordozón, ezek közül 1 pedig helyileg is elkülönítve".2 Ez a felhőszolgáltatásokra is igaz - célszerű több felhőt igénybe venni és emellett legfontosabb digitális anyagainkat saját birtoklású adathordozón is őrizni.
Felhasznált irodalom:
- Eve, M. P., (2024) “Digital Scholarly Journals Are Poorly Preserved: A Study of 7 Million Articles”, Journal of Librarianship and Scholarly Communication 12(1). doi: https://doi.org/10.31274/jlsc.16288
-
Perkel JM. 11 ways to avert a data-storage disaster. Nature. 2019 Apr;568(7750):131-132. doi: 10.1038/d41586-019-01040-w. PMID: 30932037.