Bez uporządkowanych danych i transformacji organizacyjnej banku wdrażanie AI nie zakończy się sukcesem

Bez uporządkowanych danych i transformacji organizacyjnej banku wdrażanie AI nie zakończy się sukcesem
Karolina Słowińska. Fot. Iron Mountain
Z dr Karoliną Słowińską, Prezes Zarządu Iron Mountain Polska sp. z o.o., rozmawiał Karol Mórawski.

Według najświeższych danych, spory odsetek projektów wdrażających AI w sektorze bankowym kończy się fiaskiem. Jaka jest tego przyczyna i czy bankowość należy do segmentów gospodarki wyróżniających się pod względem odsetka udanych wdrożeń, czy może pozostaje za innymi segmentami rynku?

– Z perspektywy wdrożeń sektorowych widzimy, że bankowość nie wyróżnia się znacząco na tle innych branż; jest raczej w środku stawki pod względem skuteczności implementacji AI. Główne przyczyny niepowodzeń są w dużej mierze uniwersalne, ale w bankowości nabierają szczególnego znaczenia.

Pierwszym częstym problemem jest brak jasno zdefiniowanego celu biznesowego. Projekt zaczyna się od technologii zamiast od konkretnego wyzwania operacyjnego lub strategicznego, które trzeba uporządkować od strony procesowej. Z tym wiąże się również zbyt słabe zaangażowanie biznesu: projekty AI bywają traktowane jako standardowe inicjatywy IT, bez realnego wsparcia linii biznesowych, które mają później korzystać z ich efektów. Do tego dochodzi niedoszacowanie wymagań kompetencyjnych. Skuteczne wdrożenie wymaga zespołów łączących wiedzę sektorową (bankowość), technologiczną oraz kompetencje z obszaru data science.

W procesie często zapomina się też o użytkowniku końcowym, czyli człowieku. Dopóki nie zostanie właściwie przeszkolony i nie nabierze zaufania do danego rozwiązania, trudno mówić o skutecznym wdrożeniu jakiejkolwiek innowacyjnej technologii.

Fundamentalnym wyzwaniem pozostaje jakość i struktura danych wejściowych. To właśnie dane są częstym, choć nadal niedocenianym, źródłem porażek projektów AI w bankowości. Zasada „garbage in, garbage out” ma tu bardzo praktyczny wymiar: nawet najbardziej zaawansowany algorytm nie wygeneruje wartościowych wyników z danych niepełnych, niespójnych lub błędnych.

Dlaczego ma to tak duże znaczenie? Ano dlatego, że banki często dysponują danymi fragmentarycznymi. Są one rozproszone w wielu systemach, a te same atrybuty mogą występować w różnych formatach, z różną częstotliwością aktualizacji i na różnym poziomie szczegółowości. Banki mają też długie serie historyczne, co teoretycznie sprzyja modelom AI. Problem w tym, że standardy ich gromadzenia zmieniały się na przestrzeni lat: dane sprzed dekady mogą być zapisane według innych schematów, z inną granularnością, często po migracjach systemowych, które wprowadziły dodatkowe nieciągłości lub błędy. Model trenowany na takich zasobach może uczyć się artefaktów procesu zbierania danych zamiast rzeczywistych wzorców biznesowych.

Co więcej, dane bez kontekstu tracą wartość. AI potrzebuje bowiem nie tylko samych danych, ale również informacji o ich pochodzeniu, czasie ich pozyskania, sposobie pomiaru oraz poziomie wiarygodności. Brak takich metadanych sprzyja powstawaniu błędnych wniosków.

Gdy mówimy o fiasku projektów AI przy współpracy z klientami z sektora bankowego, w praktyce zwykle chodzi o jedną z trzech sytuacji. Po pierwsze, model został wytrenowany na danych niskiej jakości i w środowisku produkcyjnym, co daje wyniki gorsze niż proste reguły biznesowe. Po drugie, predykcje są technicznie poprawne, ale biznesowo bezużyteczne, bo bazują na niepełnym obrazie rzeczywistości, właśnie z powodu jakości i kompletności danych. Po trzecie, system i tak wymaga ręcznej weryfikacji większości decyzji, co w dużej mierze niweluje korzyści z automatyzacji.

Z naszych obserwacji wynika, że o sukcesie projektu AI w największym stopniu decydują dane, a dopiero w drugiej kolejności sama technologia. Banki, które zaczynają od audytu jakości danych i inwestują w ich uporządkowanie jeszcze przed wyborem narzędzi, osiągają znacznie wyższe wskaźniki powodzenia.

Decyzje biznesowe podejmowane z wykorzystaniem sztucznej inteligencji są tak dobre, jak dane, na których się opierają. Bez solidnej bazy AI pozostaje kosztowną technologią, która nie przekłada się na realną wartość dla organizacji.

Rynek finansowy dość często korzysta z danych, zarówno własnych, jak i sektorowych. Powszechnym zjawiskiem w bankowości jest wymiana informacji. Tymczasem rewolucja AI ujawniła, że wciąż spora ich część (nawet 70%) nie nadaje się do wykorzystania przez zautomatyzowane algorytmy. Jakie działania należałoby podjąć, aby ustrukturyzować te zasoby tak, by nadawały się do wykorzystania przez AI?

– Faktycznie, problem data readiness (gotowości danych do wykorzystania) jest jednym z kluczowych wyzwań. Z naszych obserwacji wynika, że wysoki odsetek danych nieprzydatnych w projektach AI ma kilka głównych przyczyn. Najczęstsze z nich to:

  • duży udział danych niestrukturyzowanych, takich jak dokumenty, e-maile czy notatki z rozmów z klientami, które trudno jest szybko i bezpiecznie przetwarzać na potrzeby modeli;
  • dane w silosach – brak spójnych schematów i standardów między departamentami oraz systemami;
  • niska jakość metadanych – brak informacji o pochodzeniu danych, ich kontekście, dacie pozyskania i aktualności;
  • ograniczenia compliance – część danych nie może być użyta (np. ze względu na wymagania RODO lub wewnętrzne zasady przetwarzania).

Dlatego zalecamy klientom podejście pragmatyczne. W pierwszej kolejności audyt, czyli mapowanie danych w kontekście konkretnych use case’ów AI. Kluczowe pytanie brzmi: jakie dane są krytyczne dla 3-5 najważniejszych inicjatyw AI wpisanych w strategię banku?

Kolejny krok to wdrożenie ram zarządzania danymi (data governance framework). Zdefiniowanie standardów jakości danych oraz mechanizmów monitorowania jest podstawą, bez której trudno skalować rozwiązania AI. Warto też aktywnie uczestniczyć w inicjatywach sektorowych dotyczących standaryzacji danych (np. formatów wymiany informacji między bankami), ponieważ takie działanie realnie obniża koszty przyszłych integracji.

Obserwujemy, że banki, które traktują przygotowanie danych jako odrębną inicjatywę strategiczną, a nie część projektu AI, osiągają wyraźnie lepsze wskaźniki skuteczności wdrożeń. To fundamentalna inwestycja, a nie jednorazowy koszt projektu.

Czy, biorąc pod uwagę regulacje w zakresie ochrony prywatności, jak i te dedykowane rynkowi finansowemu, możliwe jest powierzenie algorytmom przetwarzania wszystkich rodzajów informacji bankowych, czy też pozostaną takie, które będą musiały być przetwarzane tradycyjnie? Jakie zasady powinny stosować banki, by używanie danych w procesach AI nie generowało ryzyk natury regulacyjnej bądź compliance?

– Technicznie jest to jak najbardziej realne, natomiast regulacyjnie z istotnymi ograniczeniami. Unijne ramy prawne, w szczególności RODO, AI Act, a także dyrektywy i regulacje sektorowe (m.in. MiFID II, PSD2 oraz przepisy AML wynikające z kolejnych dyrektyw AMLD), tworzą złożony ekosystem wymogów. Nie zakazuje on wykorzystywania AI w bankowości, ale stawia przed nią konkretne wymagania.

W praktyce wiele systemów AI stosowanych w bankach będzie kwalifikowanych jako systemy wysokiego ryzyka (zgodnie z aneksami do AI Act, w szczególności z Aneksem III). To z kolei oznacza m.in. konieczność przeprowadzenia oceny zgodności przed wdrożeniem, zapewnienie skutecznego nadzoru ludzkiego (human oversight), spełnienie wymogów dotyczących jakości danych treningowych, a także prowadzenie szczegółowej dokumentacji technicznej i projektowej.

Na czym polega proces inteligentnego przetwarzania dokumentów, na ile jest on rozpowszechniony w polskiej bankowości i czy jego wykorzystanie pozwoli na budowę obsługi w pełni omnikanałowej?

– IDP (Intelligent Document Processing) to ewolucja tradycyjnego OCR, która łączy kilka technologii AI:

  • Computer vision – służący do rozpoznawania układu i struktury dokumentu;
  • OCR/ICR – do ekstrakcji tekstu oraz pisma ręcznego;
  • NLP/NLU – do rozumienia kontekstu i znaczenia wyodrębnionych informacji;
  • Machine learning – do klasyfikacji dokumentów i walidacji wyników;
  • Process automation – do orkiestracji całego procesu od przyjęcia dokumentu po zapis danych w systemach banku.

W przeciwieństwie do klasycznego OCR, IDP nie tylko widzi tekst, ale również rozumie, co dany dokument reprezentuje. Potrafi obsługiwać dokumenty o zmiennej strukturze, a jednocześnie uczy się tego wszystkiego dzięki kolejnym przetworzonym przypadkom.

W bankowości najczęstsze obszary wykorzystania IDP to:

  • onboarding klientów korporacyjnych (przetwarzanie dokumentów rejestrowych, sprawozdań finansowych);
  • procesy kredytowe (analiza zaświadczeń o dochodach, wycen nieruchomości);
  • operacje back-office (faktury, polecenia przelewu, obsługa korespondencji);
  • compliance (np. weryfikacja dokumentów w procesach KYC).

Jednocześnie większość wdrożeń nadal ma charakter punktowy – obejmuje pojedyncze procesy i konkretne typy dokumentów, a nie w pełni zintegrowaną, spójną platformę do zarządzania dokumentami w skali całej organizacji.

Jak zatem przygotować organizację na uporządkowanie i digitalizację dotychczasowych zasobów i na czym powinien polegać modelowy podział obowiązków między bankiem a dostawcą technologii?

– Przygotowanie organizacji do kompleksowego uporządkowania i digitalizacji danych to proces wieloetapowy. Wymaga równoległych działań na wielu płaszczyznach: technologicznej, procesowej i organizacyjnej. Dostawca technologii, jako partner merytoryczny, może wesprzeć bank warsztatami i znajomością najlepszych praktyk, ale nie jest w stanie narzucić strategii. To bank musi ją zdefiniować i wziąć za nią odpowiedzialność.

Równie istotne jest ustanowienie przez bank jasnych zasad zarządzania projektem, w tym realnego sponsorowania na poziomie zarządu. Duże znaczenie mają dedykowane grupy robocze oraz właściwe przydzielenie zadań osobom, które mają aktywnie uczestniczyć w pracy, a nie tylko odbierać efekt końcowy. Dostawca może dostarczyć metodykę i narzędzia do inwentaryzacji danych, jednak faktyczne mapowanie zasobów musi wykonać bank, oczywiście przy wsparciu konsultingowym. A późniejsza praca wdrożeniowa i porządkowanie danych w praktyce to domena ekspertów branżowych i właścicieli procesów.

Dostawca może przeprowadzić najlepsze szkolenia techniczne i zaproponować pilotaże, ale nie zastąpi wewnętrznego change agenta – osoby, która rozumie kulturę organizacji, zna realia działania banku i potrafi mówić językiem zrozumiałym dla użytkowników biznesowych.

Może to brzmieć jak truizm, ale z reguły sukcesem kończą się te projekty, w których klient i dostawca traktują siebie jako partnerów pracujących na wspólny sukces. Ostatecznie za każdym wdrożeniem i każdym procesem stoi człowiek.

Czy wraz z porządkowaniem danych powinny następować zmiany w sferze organizacyjnej, tak by w przyszłości nie dochodziło do nieefektywnego zarządzania informacją?

– Absolutnie tak – jest to kluczowa lekcja z obserwacji setek wdrożeń w różnych sektorach. Porządkowanie danych traktowane wyłącznie jako projekt techniczny to prosta droga do powstania chaosu organizacyjnego w ciągu 12-18 miesięcy po zakończeniu projektu. Trwała zmiana wymaga głębokiej transformacji organizacyjnej, która osadzi zarządzanie danymi w DNA instytucji. W erze AI dane muszą być traktowane jako aktywa strategiczne, które świadomie projektuje się, zarządza nimi i monetyzuje.

Co zatem mogą zaproponować dostawcy technologii instytucjom finansowym zainteresowanym kompleksowym zarządzaniem swoimi danymi?

– Rynek rozwiązań do zarządzania danymi w instytucjach finansowych przeszedł w ostatnich latach wyraźną transformację – od narzędzi punktowych w stronę kompleksowych platform. Widzimy silny trend w kierunku podejścia end-to-end data management. To odpowiedź na rosnącą świadomość banków, że fragmentaryczne podejście do danych w erze AI po prostu nie działa.

Współczesne platformy integrują kilka kluczowych warstw zarządzania danymi. Obejmują m.in. data cataloging, czyli automatyczne katalogowanie źródeł danych w całej organizacji; data lineage – śledzenie przepływu danych od źródła przez wszystkie transformacje; data quality management – ciągły monitoring oraz automatyczne raportowanie jakości, a także Master Data Management (MDM), czyli budowanie jednolitych, referencyjnych zbiorów danych o klientach, produktach czy kontrahentach. Coraz częściej same platformy wykorzystują również AI do automatyzacji zadań data governance – od automatycznej klasyfikacji danych wrażliwych, przez rekomendacje działań naprawczych przy wykryciu problemów jakościowych, aż po sygnalizowanie potrzeby usuwania danych zgodnie z predefiniowanymi okresami retencji.

Szczególnie istotnym, choć często pomijanym, elementem kompleksowego zarządzania danymi jest też powiązanie systemowe z archiwum fizycznym. Banki nadal przechowują ogromne ilości dokumentacji papierowej. To nie są martwe zasoby – w wielu przypadkach okazują się kluczowe w sporach sądowych, audytach regulacyjnych czy przy ocenie długoletnich relacji z klientami. Nowoczesne podejście obejmuje m.in. digitalizację on-demand – zamiast masowego skanowania całego archiwum system identyfikuje dokumenty potrzebne w konkretnych procesach i digitalizuje je priorytetowo. Ważnym elementem jest też inteligentne indeksowanie – wykorzystanie OCR i NLP do automatycznego pozyskiwania metadanych podczas digitalizacji. Do tego dochodzi zarządzanie hybrydowe, czyli jednolity interfejs do przeszukiwania zarówno danych cyfrowych, jak i  zdigitalizowanych dokumentów papierowych oraz compliance tracking – automatyczne pilnowanie okresów retencji, zarówno dla kopii cyfrowych, jak i dla oryginałów papierowych.

Warto przy tym podkreślić, że kompleksowość nie powinna oznaczać podejścia „wszystko w jednym narzędziu za wszelką cenę”. W praktyce chodzi raczej o przemyślaną architekturę, w której poszczególne komponenty, nawet od różnych dostawców, tworzą spójny ekosystem. Powinien on mieć jednolity model bezpieczeństwa i uprawnień, centralny katalog danych, zunifikowane data lineage obejmujące wszystkie systemy, wspólne standardy jakości danych oraz możliwie spójne i intuicyjne korzystanie z informacji przez zespoły biznesowe, niezależnie od źródła ich pochodzenia.

Źródło: Miesięcznik Finansowy BANK