IT@BANK. Technologie – NTT Poland: Odpowiedź jest w twoich danych. Potęga posiadanych informacji w odniesieniu do uczenia maszynowego i sztucznej inteligencji

IT@BANK. Technologie – NTT Poland: Odpowiedź jest w twoich danych. Potęga posiadanych informacji w odniesieniu do uczenia maszynowego i sztucznej inteligencji
Udostępnij Ikona facebook Ikona LinkedIn Ikona twitter
Teoretycy sztucznej inteligencji (SI) rozróżniają dwa jej typy: miękką i twardą, nazywane też inteligencją wąską i ogólną. Pierwsza potrafi podejmować decyzje tylko w wąsko zdefiniowanym kontekście, czyli wykonywać jedynie takie zadania, do których została zbudowana - i żadne inne. Ten typ SI jest już z nami od jakiegoś czasu. Drugi, na razie tylko teoretycznie postulowany, powinien uczyć się rozwiązywać problemy dowolnego typu.

Artur Walendzik
NTT Poland

Wpotocznym odbiorze myśli się o samouczących się sieciach neuronowych tak, jakby te miały intencje. Tymczasem nie ma na razie podstaw, aby antropomorfizować sztuczną inteligencję. Jeśli podejmuje ona jakieś decyzje, to nie robi tego z własnej woli i dla własnego dobra. Należy to podkreślić zwłaszcza w kontekście tego, że potocznie utożsamia się inteligencję ze świadomością.

Rozumienie i procesowanie naturalnej mowy człowieka

Z punktu widzenia procesów związanych z Customer Experience (CX), największy potencjał, jak i wyzwanie, drzemie w SI, która specjalizuje się w rozumieniu i przetwarzaniu naturalnego języka człowieka (Natural Language Understanding/Natural Language Processing). Dziś każda większa organizacja gromadzi wielkie ilości danych tekstowych, typu maile, skany dokumentów, opisy produktów, zapisy rozmów czatowych, telefonicznych. Każda z nich ma również potrzebę implementacji nowych narzędzi klasy NLU/NLP, ponieważ tradycyjne metody nie są w stanie przeszukać tak dużych zbiorów danych i wydobyć z nich wiedzy potrzebnej do podejmowania decyzji czy obsługi procesów biznesowych.

Przykładowe modele NLP  i ich zastosowanie

Analizator tekstu

To podstawowe narzędzie pozwalające na konwersję tekstu napisanego przez człowieka luźnym językiem do formatu, który może być zapisany np. w arkuszu Excel, gdzie każda informacja z komunikatu użytkownika trafi do odpowiedniej kolumny arkusza. Narzędzie działa jak maszyna, która całą wypowiedź rozkłada na małe elementy, a następnie stara się rozpoznać każdy z nich tak, aby w rezultacie móc je odpowiednio podpisać i umieścić we właściwym miejscu.

Analizator tekstu jest niczym kilof w rękach poszukiwacza skarbów, przełamuje pierwszą warstwę danych i separuje to co najcenniejsze, aby w dalszych krokach inne narzędzia mogły zacząć pracować. Narzędzia te składają się na model procesowania języka naturalnego. W skład narzędzi wchodzą m.in. maszyny, które potrafią rozpoznać, czy wiadomość napisał ktoś zdenerwowany, czy zadowolony – są to analizatory wydźwięku.

Innym przykładem jest maszyna, która rozpoznaje, czy wiadomość przychodząca jest reklamacją, a może prośbą o kontakt. Tego rodzaju maszyny nazywamy klasyfikatorami. Jeszcze inna maszyna potrafi w długiej wypowiedzi odnaleźć imię, nazwisko oraz model auta, wszystko o czym wspomniał autor w swojej wiadomości – ta maszyna służy do rozpoznawania złożonych fraz w wypowiedziach ludzi.

Dzięki maszynom komputer, który dostaje wiadomość, może odpowiedzieć m.in. na następujące pytania:

  • Kto jest autorem wiadomości?
  • Jak się nazywa autor?
  • Czy jest kobietą?
  • Jakie miał uczucia, kiedy pisał?
  • O czym pisał?
  • Czy czegoś od nas chce?

Analiza wydźwięku

Jest to usługa identyfikująca emocje, jakie niesie za sobą wiadomość. Poprzez analizę tekstu identyfikowany jest społeczny wydźwięk badanego podmiotu, np. jakość produktu, obsługi klienta.

Źródło opinii do przeprowadzenia analizy jest dowolne. Analityk wybiera interesującą domenę tematyczną, np.: płatności, rejestracja, dostawa, zwroty. Następnie przygotowuje właściwe źródło danych do analizy: e-maile, chaty, serwisy społecznościowe, artykuły.

Główne korzyści płynące dla biznesu to wgląd w kluczowe aspekty badanego podmiotu na podstawie opinii użytkowników, którzy „o tym mówią” oraz uwypuklenie intencji i rzeczywistych oczekiwań klientów.

Wyobraźmy sobie następujący scenariusz. Usługa w czasie rzeczywistym analizuje spływające opinie, wskazując zmieniający się trend na temat usług danej organizacji. Jest w stanie wyodrębnić przyczyny, dlaczego jakość idzie w dół lub w górę i wskazać zmieniający się w czasie rozkład zwolenników oraz przeciwników. Jest to nieoceniona pomoc przy uwzględnianiu potencjalnych usprawnień w procesach biznesowych, czy jakości oferowanych usług lub weryfikacji podjętych już wcześniej działań.

Kategoryzacja wiadomości

Zbiory danych, którymi dysponujemy, nie zawsze są opisane. Przykładowo – posiadając zbiór maili, nie zawsze wiemy, jakie tematy są w nich poruszane. Ta wiedza może być dla nas bardzo cenna. Z pomocą przychodzą modele kategoryzacji. Dzięki nim możemy się dowiedzieć, jakie kategorie da się wyodrębnić z dużej kolekcji. Co więcej, jesteśmy w stanie ustalić, jak dużej części naszych maili takie kategorie dotyczą. Omawiany problem wykrywania kategorii rozwiązywany jest przez algorytmy uczenia maszynowego. Możemy nadzorować pracę algorytmów i z góry zakładać, że np. poszukujemy 10 kategorii lub pozwolić maszynie na wykrycie rzeczywistej liczby takich grup.

Najważniejsza korzyść z zastosowania tego modelu to wykrywanie problemów w ich wczesnym stadium. Duże ilości komunikatów, jakie docierają do organizacji, i struktury organizacyjne powodują, że istota problemów często zostaje zamazana. Dlatego ważne jest, aby maszyny mogły przetwarzać duże wolumeny tekstu i już na wczesnym etapie informować człowieka o pojawiających się trendach w wiadomościach.

Wyszukiwarka w bazie wiedzy

Silnik wyszukiwarki opartej na zbiorze danych z dokumentu „Najczęściej zadawane pytania” usługodawcy pozwala na wyszukiwanie rekordów przy użyciu narzędzi NLP. Silnik pracuje w oparciu o przygotowane zbiory danych opisujące m.in. taksonomię oraz ontologię analizowanych danych.

Możliwość dostarczenia odpowiedzi klientowi na jego zapytanie napisane językiem naturalnym redukuje liczbę kontaktów z organizacją.

Klasyfikacja wiadomości

Realizacja procesu klasyfikacji sprowadza się do dostarczenia do systemu np. 10 000 maili, komunikatów z chatu, czy komentarzy do produktu. Następnie uruchamiamy model i klasyfikujemy je w kontekście np.: pożyczki, oszczędności, kart, bezpieczeństwa czy innego tematu, który wyda się nam interesujący. Można zasilić system zbiorem maili z ostatniego miesiąca i pokategoryzować je pod kątem zgłaszanych problemów, aby zobaczyć, jakie obszary biznesu wymagają szybkiej poprawy.

Przykładem może być produkt firmy ITmatica, który dostarcza kilka podstawowych modeli do kategoryzacji. Model tematyczny – umożliwia wybór tematów, pod kątem których ma być analizowany zbiór. Model uczenia maszynowego oparty jest na algorytmach, które same proponują klasy charakteryzujące dany zbiór.

Klasyfikacja komunikatów przychodzących pozwala na przeniesienie pracy dotyczącej identyfikacji potrzeb klienta z operatora na algorytm. Dzięki temu jesteśmy w stanie odpowiadać na maile w trybie 24/7 w ciągu kilku sekund. System rozpoznaje intencje i odpowiada na mail w sposób wcześniej predefiniowany dla danego problemu. Rozwiązanie redukuje ruch przychodzący, obsługując część wiadomości automatycznie. Nierozpoznane wiadomości są kierowane do obsługi ręcznej.

Detekcja intencji

Wiadomość najczęściej niesie ze sobą jakąś informację. Może ona mówić o chęciach lub zamiarach osoby piszącej. Np. w zdaniu „Chciałbym uzyskać informację o kredycie hipotecznym na zakup mieszkania” – intencją jest „zakup„. Osoba pisząca komunikat precyzuje też przedmiot, o jaki jej chodzi, czyli „kredyt hipoteczny”. Dzięki detekcji intencji na dużych zbiorach danych jesteśmy w stanie określić, jak wygląda ich rozkład w czasie, czy może jest sezonowy, czy też może niektóre problemy powracają, a ich przyczynę da się wyjaśnić?

Dzięki możliwości rozpoznania intencji system jest w stanie, na podstawie komunikatów, wykryć użytkowników, którzy są zainteresowani jednym z naszych produktów. Możemy także szybko wykryć intencje odejścia klienta i odpowiednio zareagować w celu jego zatrzymania. Ponadto możemy lepiej zrozumieć komentarze. Ich ocena po gwiazdkach to zbyt mało. Dopiero analiza intencji w komentarzach pokaże nam kierunki, jakie powinniśmy obrać, zmienić lub poprawić.

Rozpoznawanie istotnych fraz (NER)

Każdy komunikat bez względu na źródło, z którego pochodzi (SMS, mail, chat, komunikator, media społecznościowe) może zostać poddany analizie pod względem występowania w nim istotnych zwrotów wielowyrazowych. Rozumiemy przez to zwroty typu: „lokata krótkoterminowa”, „systematyczne oszczędzanie”, „karta płatnicza”. W zależności od problematyki, w jakiej się poruszamy, zbiory tych pojęć będą się różnić.

Dzięki rozpoznawaniu istotnych zwrotów można ze złożonego tekstu wykryć, co jest kluczowe w naszym procesie, zidentyfikować dane osobowe osoby piszącej komunikat, wykryć podany przez nią adres, telefon czy model produktu, o którym pisze. Automatyczne wykrycie tych treści redukuje czas pracy, jaki musi zostać poświęcony na procesowanie rekordu. Wykrycie istotnych cech może również zautomatyzować proces weryfikacji, np. statusu zgłoszonych reklamacji, rozpatrywanych wniosków.

Automatyzacja dokumentu

„Najczęściej zadawane pytania”

Podpięty analizator monitoruje zewnętrzne komunikaty tekstowe, m.in. maile, chaty, starając się wykryć anomalie w poruszanych nurtach tematycznych i przyporządkować je właściwym etykietom. Usługa nasłuchująca przypisuje analizowanej treści zestaw cech, w celu powiązania intencji z problemem, np. założenie konta osobistego, stopa oprocentowania.

Najważniejszą korzyścią jest przekierowywanie użytkownika do właściwego miejsca w dokumencie. Usługa badająca treść zgłoszeń jest w stanie zaproponować rozwiązania problemu, zanim komunikat faktycznie zostanie wysłany do serwisu klienta. Dodatkowo wspiera ona pracę analityka, dając wgląd w wykryte anomalie, i zestawia problematyczne tematy.

Dzięki temu pracownik może:

  • zweryfikować, czy istniejący dokument faktycznie jasno określa, co należy zrobić,
  • wprowadzić nową dziedzinę „pytań i odpowiedzi” do dokumentu,
  • zaproponować uproszczenie samego procesu lub przejrzystości informacji w krytycznym węźle.

Efektem tego działania jest udrożnienie zatoru i redukcja ilości kontaktów z helpdeskiem.

Źródło: Miesięcznik Finansowy BANK