Zastosowanie uczenia maszynowego i przetwarzania języka naturalnego na potrzeby AML/CFT w sektorze finansowym
Liczni regulatorzy i nadzorcy na całym świecie wskazują na konkretne przykłady wykorzystania (starych) nowych technik, np. do wyszukiwania, oznaczania, tagowania czy opracowywania dokumentów lub tekstów, np. transkrypcji głosu. Wiele z zastosowań NLP czy uczenia maszynowego możemy znaleźć m.in. w obszarze RegTech czy SupTech, czyli rozwiązań technologicznych upraszczających procesy związane z zarządzaniem wymogami regulacyjnymi czy nadzorczymi.
Jednocześnie rośnie ilość danych, z którymi przychodzi nam się mierzyć – Big Data nie jest już tylko „Big”, ale „enormous” – co powoduje, że prędzej czy później wszyscy będziemy musieli przenieść się z procesów manualnych na automatyczne lub przynajmniej półautomatyczne.
Impulsy z obszaru AML/CFT
Przykładem obszaru, który intensywnie się rozwija z punktu widzenia automatyzacji i jest jednym z punktów szczególnego zainteresowania szeroko rozumianego sektora publicznego jest przeciwdziałanie praniu pieniędzy i finansowania terroryzmu, czyli popularny AML/CFT.
O zastosowaniu narzędzi ułatwiających pracę analityków AML/CFT najczęściej myślą instytucje o dużej skali potencjalnie podejrzanych transakcji
Coraz więcej podmiotów staje się instytucjami obowiązanymi, które stosować muszą pewne wymogi wynikające z przepisów unijnych i krajowych, a które mają zapewnić, że podejrzane podmioty i osoby „trafią” pod lupę organów bezpieczeństwa finansowego czy ścigania.
Automatyzacja nie w każdym przypadku jednak się sprawdzi, bo jednak generuje – przynajmniej na etapie implementacji – duże koszty operacyjne oraz niekiedy infrastrukturalne (choć chmura obliczeniowa wiele ułatwia). Dlatego o zastosowaniu narzędzi ułatwiających pracę analityków AML/CFT najczęściej myślą instytucje o dużej skali potencjalnie podejrzanych transakcji, w tym w szczególności instytucje z sektora finansowego.
Czytaj także: AI w bankach – czy to już powszechny standard?
ML jako narzędzie dla AML/CFT
I tutaj dochodzimy do sedna dzisiejszego artykułu, czyli możliwości (ale i ograniczeń) zastosowania uczenia maszynowego (czy też głębokiego) i przetwarzania języka naturalnego na potrzeby procesów AML/CFT w sektorze finansowym. Jest to tematyka, która z wielu względów w wielu instytucjach dopiero raczkuje, co jest m.in. konsekwencją dość rygorystycznego podejścia przez regulatorów do możliwości outsourcingu kluczowych obszarów przeciwdziałania praniu pieniędzy i finansowania terroryzmu.
Instytucja finansowa, która zamierza nawiązać relację biznesową musi przeprowadzać badanie klientów pod kątem występowania ryzyka prania pieniędzy i finansowania terroryzmu
Przykładowo Europejski Urząd Nadzoru Bankowego (EBA) opracował stosunkowo długą i szczegółową listę operacyjnych etapów całego procesu, które nie powinny być powierzane podmiotom trzecim m.in. ze względu na krytyczność tych procesów zarówno dla działalności samej instytucji, jak i bezpieczeństwa finansowego w globalnej skali. Oczywiście nie oznacza to, że niektórych etapów nie można uprościć czy zautomatyzować, bo przecież nie byłoby tego artykułu (a EBA nie opracowałaby innego raportu nt. RegTech i potencjalnych korzyści dla procesów AML/CFT), ale „decyzyjność” musi pozostać po stronie samej instytucji.
Zanim przejdziemy do sedna omówmy sobie, jak może wyglądać proces AML i gdzie jest potencjał dla wspomnianych technik.
Weryfikacja pod kątem ryzyka prania pieniędzy
Nie będziemy jednak omawiać wszystkich etapów, ale skupimy się na dwóch zasadniczych procesach:
– onboardingu (wdrożenia) klienta i jego tzw. due diligence oraz
– monitorowania transakcji (tym obszarem zajmiemy się w kolejnym „odcinku”).
Weryfikacja może obejmować zarówno pozyskanie danych od samego klienta, np. jego dokumentów finansowych, (…), jak i dane oraz informacje pochodzące ze źródeł zewnętrznych
Są to kluczowe dla instytucji finansowej obszary, które wymagają szczególnej uwagi i które zarazem generują spore koszty (zastanawialiście się kiedyś skąd tyle centrów usług wspólnych w „tańszych” jurysdykcjach – często to właśnie centra obsługi AML/CFT). Instytucja finansowa, która zamierza nawiązać relację biznesową musi przeprowadzać badanie klientów pod kątem występowania ryzyka prania pieniędzy i finansowania terroryzmu, co w zależności od matrycy ryzyk i systemu zarządzania tymi ryzykami będzie wyglądało inaczej. Zazwyczaj w odniesieniu do osób fizycznych mamy mniejsze wymagania, a dla osób prawnych i podobnych stosujemy podwyższony standard weryfikacji. Szczególnie jeżeli mamy podmiot, którego siedziba znajduje się w „egzotycznej” jurysdykcji.
Weryfikacja może obejmować zarówno pozyskanie danych od samego klienta, np. jego dokumentów finansowych, umowy spółki czy skanu paszportów członków organów wykonawczych, samej instytucji – np. w związku ze wcześniejszymi relacjami, jak i dane oraz informacje pochodzące ze źródeł zewnętrznych, w tym publicznych baz danych.
Tutaj spore możliwości otworzą się wraz z implementacją dyrektywy o otwartych danych. Sprawa może się też nieco komplikować, jeżeli do identyfikacji stosujemy technologię przetwarzania danych biometrycznych, ale o tym przy innej okazji.
Efekt tej analizy będzie de facto warunkował możliwość podjęcia relacji i ewentualną odpowiedzialność samej instytucji i ewentualnych obowiązków raportowych. Ważne jest przy tym to, że raz zrobiona weryfikacja i nawiązanie relacji nie oznaczają, że nie powinniśmy wykonywać sprawdzenia w przyszłości, a taki proces jest niewątpliwie pewną uciążliwością dla klienta.
Czytaj także: Automatyzacja procesów decyzyjnych. StrategyOne silnik, który napędza Twój bank
Ograniczenia?
Dlatego istotne jest przy tym odpowiednie archiwizowanie dokumentacji, w tym szczególności powodów, dla których podjęta została konkretna decyzja. Już dzisiaj pewna część instytucji polega na częściowo zautomatyzowanym procesie weryfikacji klienta, który odbywa się oczywiście „z tyłu”, w tzw. back-endzie systemu instytucji.
Wyzwaniem jest przede wszystkim efektywny dostęp do danych, ale także możliwość „wyciągnięcia” tego, co istotne z tych danych
W przypadku bardziej złożonych podmiotów sprawa nie jest jednak tak prosta, bowiem stają przed nami spore ograniczenia, na które wskazuje chociażby Hong Kong Monetary Authority (organ nadzoru) w swoim dokumencie „Regtech Adoption Practice Guide Issue #2: Anti-Money Laundering/ Counter-Financing of Terrorism” z lipca tego roku, do których zaliczyć można:
– Przewaga manualnych procesów związanych z koniecznością przeczytania dokumentów (brak jednolitych standardów, dostępu „od ręki” czy „nieedytowalność” i brak możliwości przełożenia treści na format „maszynowy”) oraz opracowania raportu.
– Utrudnienie dla klienta, który musi dostarczyć niezbędne dokumenty (podpisane przez reprezentantów, „wyciągane” z głębokich szaf, pozyskiwane od podmiotów z grupy kapitałowej).
– Poleganie na informacji ze strony klienta, a nie własnym źródle informacji (może to wyglądać inaczej w przypadku klientów o podwyższonym ryzyku AML/CFT, ale jednak zasadniczo instytucja będzie bazować głównie na okresowych przeglądach oraz ewentualnych zgłoszeniach ze strony klienta).
– Silosowość organizacji, która powoduje, że potencjalnie istotne informacje na temat klienta (np. przeprowadzone transakcje czy zaciągnięte kredyty) są rozproszone po całej organizacji i nie zawsze przepływ informacji jest zapewniony lub jest on na niezadowalającym poziomie.
W pewnym uproszczeniu można więc wskazać, że wyzwaniem jest przede wszystkim efektywny dostęp do danych, ale także możliwość „wyciągnięcia” tego, co istotne z tych danych. Manualne procesowanie wszystkich dokumentów powoduje straty operacyjne związane z koniecznością angażowania znacznych zasobów (po prostu czasu analityków, prawników i innych) do przetwarzania znacznej ilości nieistotnych informacji. Nierzadko z jednego dokumentu potrzeba nam wyciągnąć zaledwie kilka zdań. Dołóżmy do tego fakt, że niektóre dokumenty są nieedytowalne, a więc taka osoba musi przepisać „ręcznie” konkretne fakty i mamy obraz, jak angażujący i nieefektywny może być taki proces.
Nie oznacza to jednak, że wszystko da się w 100% zautomatyzować i „poddać” algorytmizacji. Przykładem niech będą podpisy składane w formie „wet-signature”, czyli po prostu odręcznie. Takie podpisy będą podlegały weryfikacji ze wzorami podpisów będących w posiadaniu instytucji, co wykonywać będzie oddelegowany do tego człowiek, np. opiekun klienta.
Oczywiście, pewne rozwiązania z zakresu uczenia głębokiego są w stanie porównać podpisy, ale autentyczności podpisu już raczej nie dokonają. Nadzieja w tym, że niedługo przejdziemy na w pełni cyfrowe procesy, w tym w zakresie identyfikacji użytkowników (projekt eIDAS2), które znacznie przyśpieszą również procesy w obszarze AML, choć nie w każdym obszarze wyeliminują manualne procesy.
Nie oznacza to jednak, że wszystko da się w 100% zautomatyzować i „poddać” algorytmizacji. Przykładem niech będą podpisy składane w formie „wet-signature”
Możliwości jest jednak całkiem sporo, a największe perspektywy i szanse daje rozwój przetwarzania języka naturalnego, który choć nadal nie jest na perfekcyjnym poziomie, to NLP osiąga coraz lepsze rezultaty, również w odniesieniu do tzw. „myślenia kontekstowego”.
W kolejnym artykule przybliżę trochę na czym w ogóle polega NLP i dam konkretne przykłady zastosowania dla obszaru due diligence klienta. Czekajcie cierpliwie, bo jest o czym pomyśleć. Do następnego!
Michał Nowakowski,
https://pl.linkedin.com/in/michal-nowakowski-phd-35930315, Head of NewTech w NGL Advisory oraz Counsel w NGL Legal, założyciel www.finregtech.pl, wykładowca studiów podyplomowych SGH: FinTech ‒ nowe zjawiska i technologie na rynku finansowym. Adres e-mail: michal.nowakowski@ngladvisory.com
Opinie wyrażone w artykule są osobistymi opiniami Autora i nie mogą być utożsamiane z jakąkolwiek instytucją, z którą Autor jest lub był związany.