Dark data i orphaned data – dwa wyzwania na 2017 rok
Według Data Geonomics Index aż 41 proc. danych globalnych przedsiębiorstw nie było modyfikowanych od ostatnich trzech lat. Z kolei 12 proc. danych w ciągu siedmiu minionych lat nigdy nie zostało nawet otwartych. 33 proc. zbieranych przez firmy danych klasyfikuje się jako ROT, czyli Redundant, Obsolete or Trivial: zbędne, przestarzałe lub nieistotne. – W efekcie wiele takich danych jest po prostu sztucznie utrzymywanych, zajmując tylko miejsce na firmowych serwerach. W nadchodzącym roku biznes będzie musiał się z nimi zmierzyć i będzie miał dwa wyjścia: albo wyrzuci je do kosza, albo sprawdzi ich realną wartość poprzez integrację z danymi z zewnętrznych platform DMP (Data Management Platforms). Tylko w ten sposób biznes będzie mógł stwierdzić: czy ma pod ręką dane wartościowe i użyteczne, czy też są to tylko cyfrowe przeżytki, których firma bez żalu może się pozbyć – mówi Piotr Prajsnar, CEO Cloud Technologies.
Dark Data można określić trojako. Po pierwsze – są to dane, z których istnienia przedsiębiorstwo w ogóle nie zdaje sobie sprawy, więc ani ich nie gromadzi, ani nie przetwarza. Po drugie – mogą to być dane, o których przedsiębiorstwo wie i je gromadzi, lecz nie ma pojęcia, jak je przetworzyć. Po trzecie – to również dane, o których istnieniu przedsiębiorstwo wie i nawet dysponuje narzędziami do ich analizy, lecz jej nie podejmuje, ponieważ uznaje ją za zbyt kosztowną lub obawia się, że jej rezultaty będą niewspółmierne z nakładem pracy, jaki trzeba było w nią włożyć. Problem jest poważny, ponieważ według szacunków IDC około 80-90 proc. wszystkich danych w Internecie to obecnie dark data.
Orphaned data to z kolei pojedyncze, wyrwane z kontekstu informacje, które nie zostały umieszczone w szerszym ekosystemie cyfrowym, wskutek czego trudno jest ocenić ich biznesową przydatność. Takie dane zajmują miejsce na firmowych serwerach i są mniej cenne niż dane występujące w jakimś łańcuchu powiązań. Według Vanity Technologies „osierocone dane” zajmują na serwerach firmy o około 222 proc. więcej przestrzeni niż pozostałe dane. Managerowie IT zatrzymują takie dane na firmowych serwerach, wierząc, że im większą wagę ma taki plik, tym więcej kryje się za nim cennych informacji, która uda się kiedyś połączyć z innymi.
Marcin Złoch