Polski model językowy Bielik.AI wkrótce będzie „mówić” w 50 językach
– Zainteresowanie projektem Bielik jest dość duże. Dlaczego? Po pierwsze, jest to mały, kompaktowy model, co jest jego zaletą. Możemy go uruchomić na własnej infrastrukturze, a wszędzie tam, gdzie jest tajemnica państwowa, bankowa, medyczna, tam jest potrzeba używania modeli na własnej infrastrukturze. Bielik jest odpowiedzią na tę potrzebę – mówi agencji Newseria Sebastian Kondracki, prezes Bielik.AI.
Jak wskazuje Ministerstwo Cyfryzacji, wiele narzędzi AI uprzywilejowuje języki dominujące, podczas gdy użytkownicy mówiący językami „mniejszymi” mają dostęp do gorzej działających modeli lub do żadnych narzędzi w swoim języku.
Wyspecjalizowane modele narodowe mają tę lukę zniwelować. Polskie modele LLM (ang. Large Language Models) rozumieją polski język, kulturę i kontekst, a także działają lokalnie. Rozwijane są przede wszystkim na podstawie polskojęzycznych zbiorów danych i dziedzictwa kulturowego.
– Specjalizacja w języku polskim powoduje też, że Bielik najlepiej radzi sobie w polskich zadaniach, prawie, niuansach językowych, na przykład gdy pojawia się język potoczny – wyjaśnia Sebastian Kondracki.
– Jego popularność jest na tyle duża, że mamy 2,8 mln pobrań i wyprzedziliśmy w ostatnim miesiącu Mistrala. To jest alternatywa francuska, która ma bardzo dużo modeli, ale w modelach kompaktowych miesięczna liczba pobrań była większa w Bieliku – dodaje.
Czytaj także: Bielik zapewnia suwerenność technologiczną
Bielik.AI wersja 3.1 proponuje 50 języków, także chiński i arabski
Bielik.AI to rodzina europejskich otwartoźródłowych modeli językowych. Od początku 2026 roku obsługuje 30 języków europejskich i stanowi część ekosystemu europejskich projektów społecznych, takich jak Eskadra Bielik, czyli budowania kompetencji twórców agentów AI w całej Polsce, a także Obywatel Bielik. To obywatelska inicjatywa rozwijająca multimodalną, inkluzywną i dostępną dla wszystkich sztuczną inteligencję.
– Bardzo ważne jest to, że Bielik już nie musi pracować na własnej infrastrukturze tylko w polskich firmach, ale także zagranicznych. W czerwcu [2026] chcemy jeszcze wypuścić wersję 3.1, która będzie miała 50 języków, łącznie z chińskim i arabskim – tłumaczy prezes Bielik.AI.
– Rozwijamy się, a to jeszcze nie koniec. Organizujemy bardzo dużo edukacyjnych spotkań, konferencji, m.in. w listopadzie odbędzie się Bielik Summit. Dużo się więc dzieje, nie tylko w obszarze modeli, ale też budowania kompetencji cyfrowych związanych ze sztuczną inteligencją.
Zgodnie z zapowiedziami 26 listopada 2026 roku odbędzie się Bielik Summit, gdzie na czterech scenach ma wystąpić 120 prelegentów z Polski i zagranicy. Uczestnicy będą mogli się zapoznać z ponad 200 case studies wykorzystania AI, Bielika i modeli kompaktowych w biznesie i administracji publicznej.
Jedno z zadań dla Bielika: upraszczanie języka
Bielik.AI został opracowany, aby wspierać polskie przedsiębiorstwa w przetwarzaniu danych, a także zwiększać efektywność operacyjną dzięki automatyzacji procesów obsługi klienta, analizie danych oraz wsparciu dokumentacji urzędowej.
– Główne zastosowania są w tych obszarach, gdzie modele kompaktowe są silne. Po pierwsze więc – język polski. Jest bardzo dużo zastosowań w upraszczaniu języka. Kiedy chcemy uprościć bardzo biurokratyczny tekst, na przykład dla seniorów, Bielik fantastycznie sobie radzi.
Nawet tak dobrze, że jest aplikacja Proste Pismo stworzona na Bieliku przez poznańskich naukowców – wyjaśnia Sebastian Kondracki.
Proste Pismo to narzędzie do upraszczania warstwy językowej pism urzędowych, powstałe przy współpracy z językoznawcami z Uniwersytetu im. Adama Mickiewicza, Urzędem Miasta Poznania oraz specjalistami z Poznańskiego Centrum Superkomputerowo-Sieciowego.
Aplikacja wspierała m.in. upraszczanie treści publikowanych na stronie polskiej prezydencji w Radzie UE oraz w innych materiałach związanych z komunikacją.
Zadanie nr 2: np. e-commerce i przetwarzanie ogromnych ilości danych
– Po drugie, tam gdzie jest duża wolumetria danych, kiedy musimy przetworzyć ogromne ilości danych, np. e-commerce, Bielik świetnie sobie radzi, ponieważ nie płacimy za każde słowo czy token.
Im więcej produktów musimy przetworzyć, tym większe rachunki, tzw. paragony grozy. Pobieramy go bezpłatnie, musimy zainwestować w infrastrukturę, ale już nie płacimy za każde przetworzenie.
Bielik sprawdza się więc tam, gdzie jest dużo danych, dokumentacji, produktów – zaznacza ekspert.
– Również wszelkich danych wrażliwych. Na Bieliku powstają aplikacje, które wspierają rejestrację pacjentów. Może on przetwarzać dane medyczne bez wysłania ich do chmury – podkreśla Sebastian Kondracki.
Plany Fundacji SpeakLeash dot. rozwijania LLM Bielik
Bielik.AI został stworzony przez Fundację SpeakLeash we współpracy z naukowcami i Akademickim Centrum Komputerowym Cyfronet AGH, które udostępniło zasoby obliczeniowe dwóch superkomputerów: Heliosa i Atheny. Modele mają charakter open source lub działają na przystępnych licencjach, dlatego każdy może je pobrać, używać i rozwijać, dostosowując do własnych potrzeb.
Na jego bazie można budować modele wyspecjalizowane, np. medyczne. Bielik.AI został objęty patronatem przez Ministerstwo Cyfryzacji, a wspierają go firmy.
– Pamiętajmy, że my nie jesteśmy firmą, tylko fundacją. Za dnia pracujemy w biznesie, a wieczorami trenujemy Bielika. Nie stoją za nami ogromne kapitały i fundusze inwestycyjne. Utrzymujemy się ze sponsorów i patronów. Oczywiście największym wyzwaniem jest to, żeby polski biznes nas wspierał również finansowo – podkreśla Sebastian Kondracki.
– Drugą rzeczą jest to, żeby ludzie, którzy zaczynają używać sztucznej inteligencji i Bielika, dzielili się z nami opinią z uzasadnieniem. Powtarzam, że potrzebujemy bardzo dużo kciuków w dół i niech ktoś nam powie, że w niektórych obszarach powinniśmy jeszcze coś ulepszyć. To jest największa wiedza, której potrzebujemy, żeby Bielik był coraz lepszy i pracował sprawnie w biznesie – dodaje.
Jak podkreśla, działanie w takim modelu daje twórcom elastyczność, która jest konieczna w pracach nad AI.
– Jeśli chodzi o wsparcie z sektora publicznego czy od państwa, my je dostajemy w formie tego, że możemy trenować na polskich superkomputerach. To jest duże wsparcie. Natomiast nie staramy się o duże dotacje czy granty, bo musielibyśmy mieć stały harmonogram, a w sztucznej inteligencji wszystko dzieje się tak szybko, że musimy się poruszać bardzo elastycznie – wyjaśnia prezes Bielik.AI.
– Wystarczy, że gdzieś na świecie pojawi się nowy artykuł naukowy i my już musimy zacząć trening w tych obszarach. Gdybyśmy mieli grant z harmonogramem na dwa–trzy lata, bardzo trudno byłoby nam o tę elastyczność.
Moc obliczeniowa i dane są nam potrzebne od państwa, czasami obywateli, natomiast będziemy się starać realizować to z własnych środków czy też od sponsorów – podsumowuje Sebastian Kondracki.
