Jak digitalizować mapy nie wydając fortuny

Fragment mapy z kolekcji Instytutu Piłsudskiego w Ameryce: Rozmieszczenie wojsk w okolicy Stęszew z raportu Francuskiej Misji Wojskowej w Polsce, 1920
 Fragment mapy z kolekcji Instytutu Piłsudskiego w Ameryce: Rozmieszczenie wojsk w okolicy Stęszew z raportu Francuskiej Misji Wojskowej w Polsce, 1920

Fragment mapy z kolekcji Instytutu Piłsudskiego: Rozmieszczenie wojsk w okolicy Stęszewa z raportu Francuskiej Misji Wojskowej w Polsce, 1920 r.

Skanowanie dużych obiektów stanowiło zawsze wyzwanie dla archiwistów. Mapy, plakaty, i inne materiały o dużych formatach nie mieszczą się na stołach typowych skanerów o formacie A-3. Jednocześnie cena skanera rośnie eksponencjalnie ze wzrostem wielkości powierzchni skanowanej i często kupno skanera wielkoformatowego przekracza możliwości budżetowe instytucji. Jedną z opcji którą można zastosować zamiast skanera jest fotografia cyfrowa. Wymaga ona spełnienia wielu warunków, jak równomiernego oświetlenia, odpowiedniego systemu montowania kamery, płaskiego utrzymywania obiektu, korekcji na aberracje sferyczną i chromatyczną obiektywu itp. Największym ograniczeniem jest jednak ciągle nie wystarczająca rozdzielczość czujnika aparatów cyfrowych.

Jeszcze kilka lat temu braliśmy pod uwagę wynajęcie firmy profesjonalnej lub wysłanie archiwalnych map do archiwum posiadającego skaner wielkoformatowy. Jednakże postępy w oprogramowaniu do tworzenia panoram pozwoliło nam na opracowanie techniki, która kosztuje niewiele a pozwala na udostępnienie archiwalnych map w ich całej wspaniałości. Daje ona z możliwość podziwiania kunsztu grafików wojskowych i oglądania najmniejszych detali mapy. Technika ta polega na skanowaniu mapy w sekcjach a następnie sklejania ich, ale nie ręcznie a automatycznie, z użyciem odpowiedniego programu.

Skanowanie w sekcjach

Używając dowolnego płaskiego skanera, mapę można zeskanować w nakładających się sekcjach. W Instytucie używamy do tego skanerów o formacie A-3 firmy Epson. Aby ułatwić pracę, skonstruowaliśmy prosty stół (blat) z grubej sklejki, z wycięciem na skaner w środku blatu. Na stole tym zaznaczone są liniami przedłużenia konturów powierzchni aktywnej skanera, co umożliwia łatwe dopasowanie kolejnych sekcji przez wyrównanie ich z liniami. Stosujemy nakładkę ok 20% wymiaru liniowego (długości lub szerokości) powierzchni aktywnej skanera, co pozwala zwykle na bezbłędne sklejenie sekcji. Przykładowo, dla długości powierzchni aktywnej 420 mm (długość formatu A-3), pierwszy skan ma wielkość ok 400 mm a drugi przesunięty jest o 320 mm. Tak więc mapa o wymiarze liniowym 700 mm może być zeskanowana w tym wymiarze w dwóch sekcjach, z pozostawieniem 20 mm marginesów z każdej strony. Około 20% takiego pasa powtarza się na obu skanach. Po zakończeniu jednego pasa przesuwamy mapę ponownie o 80% wymiaru skanera w prostopadłym kierunku i kontynuujemy tworzenie sekcji.

Skany dokonywane są zgodnie z zasadami digitalizacji wypracowanymi w Instytucie, w rozdzielczości 600 dpi, w kolorze, i zapisywane w formacie tiff bez kompresji. Tak wykonane skany są przechowywane jako oryginały cyfrowe; dla celów dalszej obróbki tworzymy kopie cyfrowe, typowo o rozdzielczości  300 dpi w stosunku do oryginału, w formacie jpeg wysokiej jakości. Te kopie poddawane są dalszej obróbce, o czym poniżej

Sklejanie sekcji mapy

Osiągnięcia w matematycznym opisie cech obrazu z ostatnich 10 lat doprowadziły do rozwiązań pozwalających na automatyczne połaczenie ze sobą zeskanowanych sekcji. Metody te zostały opracowane z myślą o tworzeniu panoram poprzez sklejanie wielu zdjęć wykonywanych typowo aparatem fotograficznym. Sklejanie takie opiera się na algorytmach, które rozpoznają elementy obrazu powtarzające się na kilku zdjęciach, a następnie na takim manipulowaniu obrazami poprzez ich obracanie, przesuwanie, skalowanie i deformację, aby te elementy nałożyły się na siebie. Proces ten nie jest prosty: należy dodatkowo uwzględnić problemy perspektywy (przesuwanie się obiektów położonych bliżej), obiekty ruchome na zdjęciach, różnice w poziomie oświetlenia, oraz co najważniejsze projekcję kartograficzną – jak wiadomo nie da się odwzorować powierzchni sferycznej na płaskim obrazie bez zniekształceń. W chwili obecnej istnieje juz wiele rozwiązań technicznych w lepszym lub gorszym stopniu dających sobie radę z tymi problemami.

Dla naszych celów wybraliśmy technikę opracowaną przez badaczy z Uniwersytetu Kolumbii Brytyjskiej w Vancouver, Davida G. Love i Matthew Borowna[1]. Technika ta (o nazwie SIFT, Niezależna od Skali Transformacja Cech) opiera się na użyciu funkcji Gaussa do zidentyfikowania punktów (cech) obrazu niezależnych od skali, przypisaniu im orientacji i wyodrębnieniu punktów kluczowych niezależnych od orientacji i oświetlenia (koloru). Po zidentyfikowaniu takich punktów możliwe jest nałożenie na siebie sekcji (zdjęć), dokonując niezbędnego obrotu i odkształcenia tak, aby uzyskać jeden złączony obraz. Oprogramowanie to było w fazie początkowej dostępne w sposób otwarty. W roku 2004 francuska firma Kolor zakupiła licencję na SIFT od Uniwersytetu Kolumbii Brytyjskiej w Vancouver i wkrótce opracowała produkt komercyjny, który jest ciągle udoskonalany. W Instytucie do sklejania skanów używamy oprogramowania Autopano firmy Kolor. Po wskazaniu foldera zawierającego jedną lub wiele map w sekcjach, program automatycznie rozpoznaje sekcje należące do każdej mapy i pokazuje podgląd wyniku łączenia. W tym etapie można dokonać poprawek i udoskonaleń, ale zwykle nie jest to potrzebne. Nastepnie uruchamia się proces wsadowy, który tworzy końcową mapę w zadanej rozdzielczości.

Metadane

Metadane, szczegóły opisu mapy, skala, wymiary, itp. zapisywane są wraz z metadanymi innych dokumentów z użyciem programu DSpace. Mapy wymagają dodatkowych metadanych specyficznych dla tego medium, takich jak wymiary mapy, skala, itp. W końcowym wyniku metadane te są prezentowane wraz z oryginalnymi dokumentami na stronie dokumentów archiwalnych online.

Prezentacja na stronie internetowej

Po sklejeniu mamy gotowy plik mapy, który można użyć do wydrukowania mapy, ale który nie jest bardzo wygodny do oglądania go na stronie www. Wielkość pliku powoduje jego powolne ładowanie, i trudno jest go wyświetlić ze względu na skalę. Dlatego też używamy oprogramowania specjalnie przystosowanego do wyświetlania dużych plików graficznych. W Instytucie używamy do tego celu programu o nazwie Zoomify, który dzieli sklejoną mapę na płytki (tiles). Przy oglądaniu program pobiera tylko te płytki, które są wymagane przy oglądaniu danego fragmentu, pozwalając jednocześnie na zbliżenie i przesuwanie tak, jak przy oglądaniu map z serwisów komercyjnych. Przy użyciu programu Zoomify płytki są tworzone na etapie przygotowania mapy i umieszczane na serwerze. Przykładowa mapa – “Szkic ofenzywy na Ukrainie od 25 kwietnia do 15 maja 1920 roku“ ilustruje tę funkcjonalność.

Dalsze transformacje

Gotowe mapy można poddawać dalszej obróbce. Jedną z podstawowych operacji jaką można dalej dokonać na mapach jest przypisanie im współrzędnych geograficznych (georeferencing). Operacja ta powoduje, że mapę można nałożyć na współczesną mapę danego terenu, a także dokonać innych zestawień (mashups) map z danymi geograficznymi dostępnymi online. Istnieje otwarte oprogramowanie pozwalające na takie operacje, np. QGis albo Mapwarper. W chwili obecnej nie planujemy dokonywania mashups map w Instytucie, ale zachęcamy użytkowników do eksperymentowania. 

Inne oprogramowanie

Istnieje wiele innych programów (w tym tworzone w systemie Otwartego Oprogramowania), które można użyć w kolejnych etapach procesu. Do sklejania skanów można użyć otwartego programu Hugin, który w ostatnim okresie uzyskał wiele udoskonaleń, i który powinien nadawać się do sklejania map. Aby stworzyć płytki do wyświetlania, można użyć serwera płytek IIPImage. W odróżnieniu od Zoomify wymaga on instalacji na serwerze www; generuje on płytki na zamówienie, w sposób dynamiczny, nie wymagając ich wcześniejszej generacji. Warto też przyjrzeć się oprogramowaniu OpenLayers, które pozwala na tworzenie płytek i inne operacje na mapach. Istnieje szerokie pole wiedzy o systemach informacji geograficznej (GIS), ale jest ono dużo szersze od tematu tego blogu.

Dziękujemy wolontariuszom, Włodzimierzowi Szlahusek i Emily Sujka za pomoc w konstrukcji systemu i w skanowaniu map z zasobów Instytutu.

Przypisy:

1. Matthew Brown i David G. Lowe, Automatic Panoramic Image Stitching using Invariant Feature, International Journal of Computer Vision, 74, 1 (2007), pp. 59-73, dostępne online.

Czytaj więcej:

  • Old maps Online – portal poświęcony kolekcjom starych map dostępnych w Internecie.
  • Christopher Fleet, Kimberly C. Kowal, Petr Přidal, Georeferencer: Crowdsourced Georeferencing for Map Library Collections, D-Lib Magazine, Vol.18, Nr 11/12, November/December 2012, dostępne online.

Marek Zieliński

Artykuł ukazuje się jednocześnie Blogu archiwistów i bibliotekarzy Instytutu Piłsudskiego

Może Cię też zainteresować