Czego o jakości danych uczą nas stacje benzynowe?
Jedną z mniej przyjemnych czynności dla każdego kierowcy są wizyty na stacji benzynowej. Pół biedy, jeśli jest to stacja jednego z popularnych graczy na rynku i jedyną nieprzyjemnością jest konieczność zapłacenia za paliwo.
Gorzej, gdy stajemy z pustym bakiem przed nieznaną stacją benzynową, która nie budzi naszego zaufania. Czy to, co za chwilę wlejemy do baku nie uszkodzi samochodu? Czy silnik nie będzie się dławił mieszaniną benzyny i wody? Może trzeba było tak zaplanować podróż, żeby uniknąć takiego ryzyka.
Dane jak paliwo
Ciekawe jest, że tak łatwo zauważyć nam dylematy związane z wlewaniem do baku paliwa niewiadomej jakości, a dużo trudniej spostrzec nam, że nasze firmy aż dławią się od „paliwa” jakie im podajemy. Jeśli w obecnych czasach spojrzymy na przedsiębiorstwo, jak na pracujący z uporem silnik to paliwem go napędzającym nazwiemy dane.
W erze Big Data to zdolność do zbierania i wykorzystywania danych stała się głównym polem osiągania przewagi konkurencyjnej. Skąd więc taka beztroska w doborze „paliwa” dla naszych firm?
Zapewne dlatego, że woda w paliwie samochodowym niszczy silnik w łatwy do zaobserwowania sposób. Natomiast niskiej jakości dane korodują firmy po cichu i długo pozostają niezauważone.
Jakość danych
Aby omówić skutki działania niskiej jakości danych, najpierw zdefiniujmy czym owa jakość jest. Systematyczny i encyklopedyczny opis tego zagadnienia to temat na osobny artykuł. Na potrzeby naszego zagadnienia wystarczy wiedza intuicyjna.
Podobnie jak woda dolana do paliwa jest nieprawidłowością, tak łatwo stwierdzić, że błędem jest za krótki numer pesel, data urodzenia w przyszłości oraz faktura wystawiona na osobę, której wcale nie mamy w bazie klientów.
Błędne decyzje
W dzisiejszych czasach lubimy mówić, że podejmujemy decyzje na podstawie raportów, analiz i pogłębionej informacji. To bardzo dobry trend. Odchodzimy od „odczuć” do realnego opisu sytuacji przed podjęciem kluczowych i codziennych decyzji biznesowych.
Co jednak, kiedy raport, który jest podstawą naszych wyborów zawiera błędy? Co, jeśli KPI, który decyduje o naszej strategii jest zaburzony przez kilka błędnych rekordów znacząco zmieniających jego wartość? Doświadczenie pokazuje, że intuicyjne decyzje bywają dużo lepsze niż te podjęte na podstawie błędnych danych.
Dodatkowa praca
W jednej z dużych organizacji z branży finansowej prowadziłem kiedyś prezentację na temat jakości danych i opowiadałem o dodatkowej pracy, jaką muszą wykonywać osoby przygotowujące raporty, aby z 15 form zapisu miasta Białystok (Bialystok, Baiłystok, Białysto,…) stworzyć jeden wspólny wiersz z wynikiem sprzedażowym dla tego miasta.
Audytorium podzieliło się na dwie grupy. Pierwsza (odbiorcy raportów) patrzyli ze zdziwieniem i zastanawiali się, jak można wykonywać tak bezsensowną pracę. Druga (twórcy raportów) kiwali głowami ze zrozumieniem. Tak właśnie wyglądała ich codzienna praca. Zamiast analizować dane i szukać przewag konkurencyjnych, Ci pracownicy zajmowali się ręcznym poprawianiem błędów w raportach. Ogromne marnotrawstwo talentów, pieniędzy i czasu.
Robotyzacja i Sztuczna Inteligencja
Najmodniejszymi słowami ostatnio stały się robotyzacja i sztuczna inteligencja. Mamy ambitny cel wykorzystania komputerów do wykonywania pracy, obniżenia kosztów i zwiększenia skuteczności procesów biznesowych. W całym tym pędzie zapominamy, że 80% pracy przy automatyzacji procesów to przygotowanie danych. Dlaczego?
Bo tak, jak my intuicyjnie czujemy, że wspomniany Białystok, Bialystok i Baiłystok to to samo miasto, tak algorytmy Machine Learning (spoza grupy metod przetwarzania języka naturalnego) potraktują je jako trzy osobne byty. Sztuczna Inteligencja nie posiada intuicji, więc jest jeszcze bardziej wrażliwa na niską jakość danych niż człowiek.
Projekty IT
Według raportu Gartnera, niska jakość danych jest powodem 40% niepowodzeń inicjatyw biznesowych. Dzieje się tak, ponieważ planując projekt często nie bierzemy pod uwagę kosztu i czasu, jaki jest potrzebny na przygotowanie danych.
Koszt ten, szczególnie gdy mówimy o niskiej jakości danych, często przekracza koszt reszty projektu. Niestety zarówno organizacje, jak i integratorzy usług IT nieświadomie pomijają koszty i czas jaki trzeba poświęcić na przygotowanie danych. Konsekwencją jest, nie tylko utrata środków zainwestowanych w nieudany projekt, ale i demotywacja pracowników, którzy brali udział w przedsięwzięciu.
Identyfikacja klienta
Niedługo mija rok od momentu rozpoczęcia obowiązywania RODO w Polsce. Z wielu stron słyszę, że prawo to realnie nie zmieniło sposobu działania firm. Jednak wprowadzenie RODO przyczyniło się do budowy świadomość klientów, że dane osobowe mają wartość i są ich własnością.
Zaraz za tym nadążać powinna świadomość firm, że kluczowe dla skutecznej komunikacji z klientem jest jego poprawna identyfikacji w systemach IT, działających w przedsiębiorstwie. W przypadku, gdy dane klientów są słabej jakości ciężko je ze sobą połączyć.
Jeśli trudno je ze sobą połączyć to tym bardziej ciężko zbudować poprawny profil klienta, skierować do niego trafną kampanię marketingową lub choćby uniknąć korespondencji wysłanej na zapisane błędnie nazwisko.
Podsumowanie
Powyższe punkty nie zawierają w sobie wszystkich obszarów na jakie wpływa jakość danych. Warto wymienić dodatkowo kary związane z regulacjami prawnymi, zwiększone koszty utrzymania i zapewnienia wydajności systemów IT, czy choćby błędne rozliczenia finansowe z partnerami biznesowymi.
Jak widać, podobnie jak niskiej jakości paliwo będzie miało wpływ na wydajność silnika naszego samochodu, a w dłuższej konsekwencji może go nawet zniszczyć, tak niska jakość danych spowalnia firmy w których pracujemy, powoduje dodatkowe koszty i obniża konkurencyjność. Pozytywna informacja jest taka, że to od naszych decyzji zależy to, jakiej jakości paliwo będzie napędzać nasze firmy w przyszłości.