WŁOCHY: Dlaczego musimy myśleć o archiwizacji web’u?

Włoski Centralny Instytut Archiwistyki (Istituto Centrale per gli Archivi – ICAR) podjął dyskusję pod znamiennym tytułem ” Dlaczego musimy myśleć o archiwizacji web’u?” (Perché dovremmo pensare al web archiving). Temat nie jest nowy i nigdzie nie jest kompleksowo rozwiązany. W większości europejskich państw realizowane są projekty archiwizacji internetu, ale we Włoszech problem ten nie jest rozwiązany. We Włoszech temat został wywołany za sprawą, opublikowanego 11 marca 2019 r., trzyletniego planu informatyzacji administracji publicznej. Rzecz w tym, że ów plan całkowicie pomija zagadnienie archiwizacji stron internetowych. Ta sytuacja skłoniła dwójkę autorów Constantino Landino, pracownika Centralnego Instytutu Archiwistyki oraz Linę Marzotti, archiwistkę, do wywołania zagadnienia archiwizacji internetu na łamach Forum Administracji Publicznej (Forum Publica Amministrazione- FPA- firma konsultingowo doradcza specjalizująca sie w komunikacji instytucjonalnej).
Obecnie istnieje możliwość dotarcia do stron internetowych od 1996 r. dzięki pracy Internet Archives, które to właśnie od tego roku rozpoczęło archiwizować strony internetowe za pomocą narzędzia Wayback Machine. Obecnie Archiwum Internetu zawiera 330 miliardów stron internetowych, 20 milionów książek i tekstów, 4,5 miliona nagrań, 4 miliony filmów, 3 miliony zdjęć i 200 tys. programów. Softrware Archives przechowuje oprogramowanie wraz z informacjami na jego temat, w tym silniki gier.

Archiwum Internetu jest amerykańską instytucją non profi, która w dwumiesięcznych odstępach czasowych gromadzi ogólnodostępne strony www z całego świata. Także kopie ArchNetu, z początku naszej działalności sprzed szesnastu lat, można w nim znaleźć.
Włoscy archiwiści stawiają pytanie dlaczego w państwowym programie informatyzacji administracji publicznej nie pojawił się problem archiwizacji stron internetowych powstających we Włoszech. Obecnie komunikacja polityczna i społeczna odbywa się w olbrzymiej części poprzez internet. W dużej mierze jest on źródłem informacji i wiedzy, z którego korzystają konwencjonalne media takie, jak prasa i telewizja. Pojawiło się zatem pytanie, w jaki sposób możliwe będzie zapewnienie w przyszłości autentyczności informacji powstającej dziś, czyli jak w przyszłości zapewnić wiarygodność źródła  wiedzy o przeszłości. Jak chronić sieć i zapewnić informacji wiarygodność i dać pewność, że nie została zmanipulowana dla dziś nieidentyfikowanych celów.
Podstawowym celem archiwizacji stron internetowych jest utrzymanie jej w sposób trwały w długim okresie czasu. W przypadku stron web nie jest to sprawa prosta, ponieważ strony internetowe są tworami medialnymi o bardzo złożonej strukturze. Tekst, dokumenty, kody źródłowe, arkusze stylów nie tylko muszą być przechowywane w swoich formatach, ale muszą być ze sobą logicznie i fizycznie powiązane. Żywotność stron jest też różnorodna, a bywa że  bardzo krótka, bo np.: stroma web została stworzona dla realizacji określonego celu. Cel zaś, w danym momencie, mógł być społecznie ważny itd…
Dziś wiadomo, że wiele stron internetowych bezpowrotnie stracono i nigdy nie zostaną przywrócone, bo nie istnieją.
Sytuacja jeszcze bardziej się komplikuje za sprawą technologii Content Management System (CMS), pozwalającej użytkownikom na dowolne kształtowanie  wyglądu i treści stron internetowych (np.: ArchNet, oparty na joomli, jest właśnie takim przykładem).
CMS stworzył systemy witryn www pozwalające na interakcję pomiędzy użytkownikami. W konsekwencji proces tworzenia nowych treści uległ poważnemu przyspieszeniu podobnie i aktualizacja stron. Dzięki CMS upowszechniło się korzystanie z sieci, czynią owe sieci znacznie bardziej złożonymi konstrukcyjnie. W efekcie poważnie skomplikowało to proces archiwizacji cyfrowej.
Reasumując utrzymanie – zarchiwizowanie stron internetowych jest od każdym względem trudnym wyzwaniem, nie tylko z przyczyn technologicznych ale i ekonomicznych.
Dlatego też włoskie środowisko archiwalne zareagowało na brak archiwizacji internetu w programie informatyzacji administracji publicznej.

Wiecej:

Perché dovremmo pensare al web archiving

ArchNet z 2004 r.

oprac. Adam Baniecki
AP Wrocław O/Bolesławiec