WĘGRY: Dzień Pamięci Ofiar Komunizmu: publikacja bazy danych o deportowanych

W Dniu Pamięci Ofiar Komunizmu, 25.02.2021 r., Węgierskie Archiwum Narodowe opublikowało ogromną bazę danych o Węgrach deportowanych w czasie II wojny światowej do Związku Sowieckiego.

Przed prawie dwoma laty, 8 kwietnia 2019 r. Węgierskie Archiwum Narodowe i Rosyjskie Państwowe Archiwum Wojskowe (RGVA) zawarły porozumienie dotyczące digitalizacji kart rejestracyjnych (w jęz. rosyjskim „учётная карточка”) węgierskich żołnierzy i cywilów schwytanych przez Armię Czerwoną podczas II wojny światowej i deportowanych w charakterze jeńców wojennych i internowanych do Związku Sowieckiego, a następnie przekazanie kopii cyfrowych tej dokumentacji Węgierskiemu Archiwum Narodowemu. Strona rosyjska przygotowała również (w języku rosyjskim) opisy kopii dokumentów przekazanych do Węgierskiego Archiwum Narodowego, zawierające najważniejsze informacje z kart rejestracyjnych, które można było powiązać z każdą osobą.

Obecnie w bazie są blisko 682 000 kart więźniów; wyszukiwanie konkretnych osób jest możliwe na podstawie ich danych osobowych, można także przeglądać cyfrowe kopie kart. Przetwarzanie rosyjskojęzycznej bazy danych i zbiorów cyfrowych stanowiło poważne wyzwanie dla węgierskich archiwistów. Największym problemem była identyfikacja osób, których dane były na kartach, ponieważ w większości były one wypełniane przez żołnierzy sowieckich, którzy nie mówili po węgiersku, a dane we wszystkich przypadkach były wpisywane odręcznie. Baza zawiera nazwisko i imię osoby zarejestrowanej, miejsce i datę urodzenia, miejsce i czas odbywania kary, obywatelstwo skazanego, powód i czas opuszczenia obozu oraz informacje, czy dana osoba zmarła w obozie jenieckim – w takim przypadku podano datę śmierci i jej przyczynę – 17 elementów danych z prawie 682 000 kart więźniów to łącznie 11 i pół miliona danych, których ręczne przetworzenie zajęłoby lata. Transkrypcja i tłumaczenie nazw osobowych i geograficznych zostały wykonane przy użyciu specjalnie opracowanych algorytmów maszynowych opartych na przetwarzaniu języka – przy zaangażowaniu budapeszteńskiego Instytutu Lingwistyki.

Baza danych jest dostępna na stronie https://adatbazisokonline.hu/gyujtemeny/szovjetunioba-elhurcoltak

 oprac. Edyta Łaborewicz

AP we Wrocławiu O/Legnica