O platformie
Platforma analityczna FINLINK powstała w ramach projektu badawczo-rozwojowego pt. „Przetwarzanie i analiza danych masowych w odniesieniu do przestępstw gospodarczych” (FINLINK) finansowanego przez Narodowe Centrum Badań i Rozwoju w ramach programu na rzecz obronności i bezpieczeństwa państwa. Platforma jest nowoczesnym i wszechstronnym rozwiązaniem informatycznym opracowanym z myślą o wsparciu funkcjonowania służb i organów ścigania w kontekście identyfikacji i rozpoznawania przestępstw, a w szczególności przestępstw gospodarczych. Głównym celem postawionym w ramach projektu było rozwiązanie problemu polegającego na konieczności przetwarzania przez analityka kryminalnego dużej ilości danych pochodzących z odmiennych źródeł, co wiąże się z obsługą różnych typów plików źródłowych o bardzo zróżnicowanej strukturze semantycznej i syntaktycznej. Ważnym założeniem była także otwartość i elastyczność docelowego rozwiązania zarówno w zakresie nowych dziedzin analizy i źródeł danych, jak i wykorzystywanych narzędzi analitycznych.
Mając na uwadze powyższe założenia, docelowa platforma to nie zamknięty monolit trudny do rozszerzenia i narzucający analitykowi konkretny proces przetwarzania danych, ale ekosystem współpracujących ze sobą narzędzi, z których analityk sam dobiera te, które w danym momencie uzna za pomocne. Jednocześnie ekosystem wspiera proces analizy w sposób kompleksowy: począwszy od ekstrakcji i konwersji danych z zewnętrznych źródeł, poprzez ładowanie i czyszczenie danych, ich integrację i unifikację, a następnie efektywne przeszukiwanie, analizę, kojarzenie, wizualizację i eksport do zewnętrznych formatów na potrzeby archiwizacji lub dalszej analizy czy też realizacji procesu szkoleniowego.
Poniższy rysunek przedstawia schemat zrealizowanej platformy z wymienionymi poszczególnymi narzędziami i wskazanymi zależnościami.
W skład platformy wchodzi 6 rozwiązań, które można podzielić na następujące grupy:
- narzędzia ekstrakcji i przetwarzania danych: IMEX3, FinLink Konwerter;
- narzędzia integracji, analizy i wizualizacji danych: LINK3;
- narzędzia persystencji danych: DBLINK;
- narzędzia pomocnicze: Generator map, Anonimizer.
Celem pierwszej grupy narzędzi jest ekstrakcja i transformacja danych z zewnętrznych formatów do postaci tabelarycznej, łatwej w dalszej obróbce i analizie. Zrealizowane narzędzia obsługują konkretne typy danych, takie jak księgi wieczyste, wypisy z Krajowego Rejestru Sądowego czy pliki z systemu PNR, jak również dowolne pliki tekstowe, w ramach których użytkownik jest w stanie wskazać regułę ekstrakcji danych. Dzięki zautomatyzowanym procesom masowego przetwarzania plików oraz mechanizmom szablonów możliwe jest szybkie przygotowanie plików do dalszej analizy w ramach środowiska analitycznego LINK3 lub zapisanie danych w analitycznej bazie DBLINK.
LINK3 jest kolejną odsłoną znanego rozwiązania, które w ramach projektu rozbudowano o szereg nowych funkcji. Dzięki elastycznemu importerowi danych możliwe jest budowanie własnych schematów importu, a konfigurowalny mechanizm automatycznego przetwarzania danych masowych pozwala dosłownie w ciągu kilkunastu sekund uzyskać przetworzone i zintegrowane w obrębie jednego grafu powiązań dane pochodzące z różnych plików wejściowych. Dzięki tym nowym możliwościom oraz nowemu modułowi przetwarzania danych finansowych możliwa jest wygodna praca z danymi pozyskanymi w zakresie wykorzystania narzędzi IMEX3 lub FinLink Konwerter.
Celem analitycznej bazy danych jest umożliwienie użytkownikom pracy zespołowej i współdzielenie się informacjami. W tym zakresie system umożliwia budowę dowolnych modeli danych wykorzystujących współdzielony model atrybutów, dzięki czemu możliwe jest przeszukiwanie systemu i integracja danych pochodzących z odmiennych źródeł danych. Mechanizm ten pozwoli zapytać o nazwisko w różnych modelach danych lub o lokalizację. Dane gromadzone są w teczkach analitycznych i mogą być współdzielone z innymi użytkownikami systemu. System oferuje zaawansowane funkcje przeszukiwania danych oraz podstawowe widoki do wizualizacji danych na grafie bądź mapie geograficznej. Wyposażony jest w konfigurowalny system uprawnień, audytu i wersjonowania poszczególnych obiektów analitycznych.
Ostatnia grupa narzędzi stanowi zestaw pomocniczy pozwalający z jednej strony na przygotowanie map geograficznych do pracy w trybie offline, a z drugiej na anonimizację danych, co ma znaczenie np. podczas procesu szkoleniowego. Anonimizer został też wyposażony w funkcję deanonimizacji, dzięki czemu możne wspierać inne scenariusze wymagające np. zaangażowania zewnętrznych ekspertów w przedmiocie prowadzonego postępowania bez konieczności ujawniania rzeczywistych danych sprawy.