Interpretacja danych złożonych

Analiza wielu zmiennych w środowisku morskim może być wyzwaniem. Pływy morskie wpływają na ruch morski, społeczności przybrzeżne oraz okresy lęgowe; temperatura wody wpływa na wzrost glonów, które z kolei mają wpływ na zwierzęta morskie i sektor rybołówstwa; lista jest bardzo długa. Sprawy komplikują się jeszcze bardziej, gdyż ważnym aspektem pozyskiwania danych morskich jest czas. Zwykle dane zbiera się w czasie, a nie w przestrzeni, co prowadzi do powstania dużych zestawów danych wielu zmiennych, które zawierają wiele informacji. Jednak informacja te nie mogą być przydatne, jeśli nie zostaną odpowiednio zwizualizowane.

Tradycyjne techniki wizualizacji 2D i 3D, takie jak wykresy liniowe/ rozrzutu lub słupkowe są odpowiednie do analizy podstawowej, ale zawiodą, gdy wymagana jest analiza dużych i małych wzorców danych. Dr Richard Koehler, założyciel firmy Visual danych Analytics, swoją karierę zawodową poświęcił na zademonstrowanie odmiennego podejścia do wizualizacji danych, które ułatwia zrozumienie skomplikowanych ekosystemów.

Poniższy wykres 2D obrazuje dzienny przepływ dorosłych ryb morskich z gatunku Czawycza. Oś X prezentuje dni roku, a oś Y oznacza całkowitą liczbę łososi mijających miernik stacji. Każda linia wykresu prezentuje inny rok.


Duże wzorce, takie jak fragmenty pików są łatwe do odróżnienia, ale mniejsze, takie jak zmienność sezonowa są trudne do zidentyfikowania. Dodatkowo, powyższy wykres przedstawia jedynie dane zgromadzone w ciągu pięć lat. Jeśli ww. okres gromadzenia danych jest zbyt krotki, można zobaczyć jaki bałagan na wykresie powstanie podczas dodawania kolejnych 10, 20 lub 50 lat.

Alternatywną techniką wizualizacji danych, którą zastosował dr Koehler jest przedstawienie danych szeregów czasowych w formie mapy obrazu, znanej jako mapa rastrowa. Data zostaje przekształcona do dwóch współrzędnych czasowych, gdzie oś X jest krótkim okresem czasu tj. dni lub minuty, a oś Y jest już dłuższym okresem czasu tj. kilka miesięcy lub lat. Wartość Z jest reprezentowana w lokalizacji komórki.


Wykorzystując tę technikę mapy czasowej, dane przepływu ryb Czawycza są wykreślone na mapach konturowych, griddingu i powierzchniowych 3D w programie Surfer.

Na poniższej mapie, pojawią się dane z dodatkowych 71 lat. Pomimo dodatkowych informacji, można dość łatwo odróżnić wzorce czasowe, zarówno duże, jak i małe, które zostałyby pominięte na wykresie liniowym 2D. Mniejsze, wiosenne i letnie wzorce przebiegu są teraz łatwiejsze do zobaczenia na tym obrazie. Ponadto godny uwagi jest stały wzrost liczby osobników łososia w ostatnich latach w okresie od sierpnia do września.


Mapy czasowe są także przydatne do przedstawienia danych dotyczących pływów oceanu.

Port Hawk Inlet na Wyspie Admiralicji w południowo-wschodniej Alasce jest jednym z portów, gdzie przybycie i odpływ statku zależy od pływów morskich. Harmonogram pływów i godziny dzienne są kluczowymi czynnikami dla bezpiecznej żeglugi; dlatego ważne jest, aby wiedzieć, kiedy pływy są korzystne dla podróży statku.

Poniższy wykres przedstawia pływy morskie , gdzie wysokie i niskie pływy odróżniają się. Jednak wyświetlone dane nie są wystarczające do planowania ruchu statków, wyznaczania czasu kiedy mogą się one bezpiecznie poruszać i wyjść z portu ze wskazaniem dnia, tygodnia lub miesiąca. Znaczna ilość informacji zostaje stracona i zrozumienie wzorów pływów w tym widoku jest praktycznie niemożliwe.


Jednak dzięki zastosowaniu techniki wizualizacji mapy w czasie, dr Koehler uzyskał zupełnie nowy obraz. Planiści mogą szybko zlokalizować dni i godziny, kiedy poziom pływów sprzyja podróżom statków. Widok ten ułatwia również dodawanie dodatkowych informacji, takich jak czas wschodu i zachodu słońca, który jest reprezentowany przez jasnoszare linie. Pomimo tego, że wykres zawiera ponad pół miliona punktów danych, to jest jasny i zrozumiały. Nie tylko planiści portów korzystają z informacji o pływach, ale także menedżerowie straży przybrzeżnej przygotowują i informują o zagrożeniu powodzią wędkarzy, surferów i żeglarzy czy naukowców pracujących nad projektami odbudowy siedlisk.


Analiza czasowa wielu zmiennych to kolejny obszar, w którym mapy czasowe zapewniają jaśniejszą i bardziej zrozumiałą wizualną reprezentację złożonych danych. Na przykład, kilka czynników środowiska musi być branych pod uwagę przy analizie zakwitu glonów. Takie czynniki obejmują temperaturę powierzchni morza, zasolenie powierzchni morza, temperaturę powietrza, opady, przepływ potoków, różnice wysokości pływów, podnoszenie sie oceanicznych wód głębinowych i prędkość wiatru. Indywidualnie, czynniki te nie mają wielkiego wpływu na to, czy wystąpi zakwit glonów. Zamiast tego, czynniki muszą zostać przeanalizowane jako całość, co może być zadaniem kłopotliwym. Tradycyjne wykresy 2D i 3D zawodzą dla tego typu zadania. Przydatne będą mapy czasowe Dr. Koehler’a.

Pierwszym krokiem jest wyświetlenie każdego czynnika środowiskowego w formie mapy czasowej. W tym przypadku zostanie utworzonych siedem różnych środowiskowych map czasowych. Po drugie do danych należy zastosować filtr binarny, który podkreśla dni z korzystnymi warunkami dla rozkwitu glonów. Wartość jeden prezentuje dni ze sprzyjającymi warunkami, a wartość zero to dni, które nie są korzystne dla rozkwitu glonów. Filtr binarny jest także wyświetlany jako mapa czasowa.

Na przykład, jednym z czynników środowiska jest przepływ strumienia. Przepływy mniejsze niż 350 metrów sześciennych / sekundę są korzystne dla rozkwitu glonów. Przeglądając mapę binarną obrazu można szybko zlokalizować, gdy przepływ strumienia jest mniejszy niż 350 metrów sześciennych / sekundę. Powstają one zazwyczaj między sierpniem a październikiem. Można też zobaczyć, że w 2001r. wystąpiła susza, czego wynikiem był mniejszy, niż zwykle strumień przepływu od stycznia do kwietnia. We wszystkie dni reprezentowane kolorem czarnym są korzystne warunki przepływu strumienia dla rozkwitu glonów.


Ww. czynności należy powtórzyć dla wszystkich pozostałych czynników środowiskowych.

Ostatnim krokiem jest zsumowanie danych binarnych dla poszczególnych czynników oraz wyświetlenie danych wynikowych w formie mapy czasowej. Zsumowane dane będą zawierać wartości od zera do ośmiu. Komórki zawierające zero wskazują na określony dzień, w którym żaden z ośmiu czynników nie dawał warunków odpowiednich do zakwitu glonów. Komórki z wartością cztery wskazują określony dzień, gdzie cztery z ośmiu czynników środowiskowych miały odpowiednie warunki dla kwitnienia glonów. Komórki o wartości osiem wskazują wszystkie osiem czynników środowiskowych, które miały odpowiednie warunki dla rozkwitu glonów danego dnia. Podczas wyświetlania tych połączonych danych w formie mapy czasowej binarnej, wartość osiem oznacza, że wszystkie kryteria zostały spełnione, a wartości od zera do siedmiu oznaczają, że co najmniej jedno kryterium nie zostało spełnione.


Spośród 4.380 dni między 1993r. a 2005r. było 127 dni, gdy wszystkie osiem czynników środowiskowych było korzystnych dla rozkwitu glonów.

Kluczem do stworzenia mapy czasowej jest prawidłowo przekonwertowany typowy format daty, 5/1/2015, na dwie współrzędne czasowe, dzień i rok, w pliku wejściowym. Używając arkusza kalkulacyjnego Excel® ten wykres pokazuje formuły użycia roku kalendarzowego. Oś X jest dniem, a oś Y rokiem. Wartość Z byłaby szeregiem czasowym, tak jak w przypadku przepływu łososia, liczenia wysokości pływów lub przepływu strumienia. Rozmieszczanie danych wejściowych powinno wyglądać następująco: kolumna A = dzień (x), kolumna B = rok (Y), kolumna C = wartość (Z).


Gdy dane mają odpowiedni format, mapy czasu mogą być tworzone w programie Surfer przez gridding, znany również jako interpolacja, dane i tworzenie obrazu mapy z siatki danych.

Analizy można znacznie ulepszyć poprzez dodanie wizualizacji danych. W zależności od potrzeb, tradycyjne widoki 2D i 3D są zadowalające, jednakże, poprzez tworzenie nowych sposobów wizualizacji zarówno jednozmiennowych (univariate) i wielu zmiennych danych, często można znaleźć unikalne i wartościowe wyniki.

"Celem każdej grafiki jest przekształcenie danych w informacje," mówi dr Koehler, "Dobrze przygotowane wykresy mogą być bardzo przydatne w zrozumieniu danych i przedstawienia swojego punktu widzenia. Posiadanie odpowiednich narzędzi jest kluczem do osiągnięcia tego celu."

Mapy czasowe Dr Koehler’a rzeczywiście osiągnęły ten cel. Przekazują informacje poprzez przekształcenie złożonych danych czasowych w przejrzyste, zrozumiałe modele wizualne.

Script logo