Bielik zapewnia suwerenność technologiczną

„Warto posiadać własny, krajowy model językowy ze względu na suwerenność technologiczną” – mówił Sebastian Kondracki.
„Chodzi także o suwerenność lokalną, to znaczy, żeby organizacja, która wdraża sztuczną inteligencję, na przykład bank, miał do wyboru model, który może na dowolnej infrastrukturze uruchomić – czyli na własnym komputerze, na własnym serwerze, na własnej chmurze. Często takiej możliwości przy modelach zamkniętych nie ma” – wyjaśniał.
„Pamiętajmy, że zamknięte zagraniczne modele, które jak się nam wydaje, świetnie mówią w języku polskim, to jest taki Polak z Ameryki, że tak powiem, a my potrzebujemy jednak modeli, które potrafią posługiwać się językiem potocznym, wychwytują literówki, błędy, mogą analizować tekst w emocjach” – dodał.
Czytaj także: BankTech 2025: suwerenna AI w bankowości to już dzień dzisiejszy
Zalety otwartego modelu
Tłumacząc znaczenie faktu, że Bielik jest otwartym modelem językowym Sebastian Kondracki mówił:
„Bardzo często w dużych modelach językowych w ogóle mówimy, że my możemy sobie ściągnąć wagi. Wiem, że to trochę brzmi technicznie, ale to pozwala, że my takie wagi pobierając do siebie możemy na przykład ten model u siebie uruchomić i możemy go w przyszłości rozszerzyć, dostroić do swoich dokumentów” – wyjaśniał.
Okazuje się jednak, że jest kolejna zaleta otwartości Bielika. Ze względu na to, że Bielik udostępnia duży zbiór danych, to bank lub inna organizacja może zacząć trenować na tych danych zupełnie inny model językowy niż Bielik.
„Mamy też całe oprogramowanie do trenowania modeli, czyli możemy Bielika pobrać, pobrać także to oprogramowanie i dostrajać do własnych dokumentów”.
Dodatkowo SpeakLeash (Spichlerz) – fundacja zajmująca się rozwojem Dużego Modelu Językowego, udostępnia testy zagranicznych modeli językowych.
„Możemy sprawdzić jak chiński QueEn, albo Mistral, albo Llama od Meta AI radzą sobie z różnymi zadaniami, bo być może będą zadania, które inny model lepiej wykona niż Bielik.
Tak więc istnieje otwartość Bielika na różnych poziomach, co pozwala nam nie tylko użyć Bielika, ale też nawet wytrenować całkowicie nowy model” – podkreślił Sebastian Kondracki.
Czytaj także: Bielik to nie jedyny polski model językowy
Czym karmić Bielika?
Na pytanie na czym był trenowany Bielik – Sebastian Kondracki wyjaśnił, że na polskich mocno zróżnicowanych tekstach, nie tylko na raportach bankowych.
Były to dokumenty związane z orzecznictwem sądowym, akty prawne, ale także książki do których prawa autorskie już wygasły. Korzystano z Wikipedii i stron eksperckich, do których uzyskano dostęp w celu trenowania modelu językowego.
Jak podkreślił Sebastian Kondracki – dla banków w Polsce nie jest większym problemem korzystanie z Bielika, bo miały już kontakt z AI i korzystały z dużych modeli językowych w chmurze. Dodał, że istnieją różne modele wsparcia dla korzystających z Bielika w zależności od tego, gdzie on jest uruchamiany.
Okazuje się, że bank nie zawsze musi zasilać Bielika swoimi danymi. Są obszary bankowości, gdzie ten model działa w zasadzie od razu.
„Jeśli na przykład chcielibyśmy Bielikiem klasyfikować reklamację, albo pocztę przychodzącą do banku, to on już ma na tyle rozbudowaną wiedzę, że potrafi rozróżniać dokumenty bankowe, prawne. Określi czy dany mail to jest reklamacja, czy też wniosek, skarga, opinia lub coś innego.
Ale jeśli chcemy od Bielika np. analiz związanych z klientami banku, które są zależne od wewnętrznych procedur banku, to trzeba go zapoznać z tymi procedurami, żeby zrozumiał jak działa bank” – wyjaśniał.
Sebastian Kondracki przypomniał, że banki korzystają nie tylko z Bielika, ale także z innych dużych modeli językowych. Najczęściej jest on używany do uproszczenia komunikacji, do klasyfikacji dokumentów, maili. Ułatwia realizacje zadań za pomocą botów, czy chatbotów w relacjach między pracownikami banku.
Zdradził, że w dwóch polskich bankach Bielik jest wdrażany do bardziej skomplikowanych wewnętrznych procedur.
Na pytanie czy Bielik może działać jak agent AI i samodzielnie podejmować pewne decyzje – Sebastian Kondracki odparł:
„Mamy już rodzinę Bielików, a nie jeden model Bielika. Małe Bieliki – powiedziałbym – są lekko głupiutkie, ale jak się je pobierze do własnej infrastruktury, dostroi do jednego zadania, to stają się wtedy specjalistami i mogą właśnie działać jak agent AI.
Ale też pracujemy nad Bielikiem wnioskującym, to jest takim, który będzie potrafił planować pracę innych agentów i tu już jest właśnie ten element powiedziałbym podejmowania decyzji, ale przede wszystkim planowania, co trzeba zrobić żeby daną decyzję podjąć. Można już używać Bieliki w systemach wspomagających decyzje, albo przygotowujących planowanie podjęcia decyzji”.
Jeden czy więcej modeli językowych?
Podczas konferencji BankTech 2025 Michał Macierzyński z PKO BP poinformował, że ten bank pracuje nad własnym modelem językowym, byłyby to więc obok Bielika i PLLuM (Polish Large Language Model) trzeci polski model językowy.
„To jest właśnie ciekawe, że sztuczna inteligencja tak mocno wchodzi w nasze życie biznesowe. To jest trochę jak w motoryzacji: mogą być różne typy pojazdów od wózków widłowych, koparek, po ekskluzywne samochody, furgonetki czy ciężarówki.
Podobnie w dużych modelach językowych. PLLuM bardziej działa w sektorze publicznym, służy do kontaktu pomiędzy obywatelem a sektorem publicznym. Bielik natomiast bardziej w obszarze biznesowym” – tak skomentował tę informację współtwórca Bielika.
Zauważył, że zamknięty model językowy w PKO BP do pewnych wyspecjalizowanych zadań może być lepszy niż Bielik.
„Bardzo dobrze, że w Polsce mamy już możliwość wyboru pomiędzy dwoma czy trzema modelami, a za chwilę może setkami” – stwierdził Sebastian Kondracki.