Kogo niepokoją bieżące koszty korzystania z AI?
„Płatki Śnieżne” nie wydzielają (jeszcze?) pozycji „A.I. tokens” w osobnej linii, ale jest już tego blisko, bowiem w wierszu – „compute costs, including model inference and token usage” firma oddzielnie ujawnia dane o wysokości kosztów korzystania ze sztucznej inteligencji.
Pojęcie „model inference” odnosi się do używania wiedzy uzyskanej przez model AI do wykonania zadanej mu pracy, czyli odpowiedzi na polecenie.
Tokeny są natomiast jednostką pomiaru korzystania z modeli AI i są jak waty mocy energii elektrycznej. Po amerykańskich newsroomach krążą wieści, że od stycznia 2025 r. wydatki na tokeny AI wzrosły aż 13-krotnie, zaś ten olbrzymi wzrost zużycia nazwany został „tokenmaxxing”.
Maksymalizacja zużycia tokenów ma swoich oczywistych promotorów w firmach robiących majątki na boomie w sektorze sztucznej inteligencji.
Jeszcze jesienią 2024 r. kapitalizacja spółki Nvidia, tj. głównego producenta procesorów graficznych GPU niezbędnych do trenowania modeli AI, wynosiła „zaledwie” ok. 1 bilion (1 000 mld) dolarów. Dziś przekracza 5 bilionów i Nvidia jest w takim ujęciu największą firmą świata.
Szef Nvidii Jen-Hsun (Jensen) Huang powiada zatem i chyba nieprzypadkowo, że od inżyniera zarabiającego u niego pół miliona dolarów rocznie oczekuje zużycia przez rok co najmniej 250 tys. tokenów.
Rosnący popyt na tokeny
Olbrzymich graczy zainteresowanych wzrostem popytu na tokeny jest oczywiście więcej. Liderem w grupie producentów chipów pamięci będących podstawą sztucznej inteligencji jest Samsung. W maju ’26 przestał być w niej samotnym bilionerem pod względem kapitalizacji. Dołączyła doń amerykańska firma Micron oraz kolejny po Samsungu południowokoreański potentat – SK Hynix.
W Samsungu powodzenie odbiło się czkawką. Pracownicy dywizji czipów zagrozili mianowicie strajkiem, jeśli koncern nie podzieli się z nimi częścią zysków z produkcji układów scalonych. Po miesiącu przepychanek zarząd ustąpił i zgodził się na wypłacenie dziesiątkom tysięcy pracowników po 600 mln wonów (ok. 400 tys. dol.) nadzwyczajnej premii.
Jeden token starcza mniej więcej na pół polskiego słowa i na 3/4 angielskiego. Nasz język jako bardziej fleksyjny i rozwlekły już zatem na starcie stawia nas w dalszym szeregu stawki pretendentów do mistrzostwa w AI.
Rachunek kosztów AI
Boom na korzystanie ze sztucznej inteligencji ma jednak co najmniej dwie strony. Firmy wierzą, że dzięki temu mają szanse zwiększyć produktywność (wydajność), innowacyjność oraz polepszyć bieżące wskaźniki.
Pytanie brzmi wszakże, czy skórka warta jest wyprawki, tzn. czy na obecnym etapie rozwoju AI korzyści rzeczywiście dorównują kosztom? Właśnie dlatego do głosu zaczyna dochodzić rachunek kosztów eksploatacji sztucznej inteligencji, który nie był dotychczas przedmiotem szczególnej uwagi.
W kwietniu ’26 sektor AI uważnie odnotował słowa Praveen’a Neppalli Naga – szefa techniki (Chief Technology Officer – CTO) w Uberze, który oznajmił, że już w ciągu pierwszego kwartału jego firma wydała cały tegoroczny budżet na korzystanie ze sztucznej inteligencji.
Firmy, zwłaszcza mniejsze i mniej zasobne, zaczynają zatem oszczędzać. Już daje się zauważyć w USA rezygnowanie z korzystania z drogich modeli AI firm Anthropic i OpenAI na rzecz modeli udostępnianych bezpłatnie (np. chińskie DeepSeek i Tencent) lub modelu Gemini ze stajni Google, którego użytkowanie kosztuje o połowę mniej niż modele AI z najwyższej półki w rodzaju Claude 4.7 Opus.
Giganci też przeglądają budżety. Microsoft poinformował, że po części z powodów finansowych anuluje właśnie większość licencji na Claude Code kupionych od Anthropika i dopinguje swoich inżynierów do używania własnego narzędzia do kodowania software pn. GiTHub Copilot CLI.
Popularność zyskują narzędzia takie jak OpenRouter, który jest rodzajem bazaru z najróżniejszymi modelami AI w łącznej obecnie liczbie ok. 400. Można na nim wybierać modele dostosowane do danego zadania, unikając przepłacania za proste przedsięwzięcia lub z drugiej strony opóźnień, gdy użyty model jest za słaby.
Modele „wynajmowane” przez OpenRouter zużywają obecnie (druga połowa maja ’26) ok. 25 bilionów (25 000 mld) tokenów tygodniowo, podczas gdy pół roku wcześniej zużycie wynosiło 5 bilionów.
Jak zawsze, pojawiają się głosy, że boom w AI jest przedwczesny i bańka wielkich oczekiwań wybuchnie z jeszcze większym hukiem.
Będzie, co będzie – mawiają ludzie sterani doświadczeniem, ale tymczasem już 10 czerwca na nowojorskim festiwalu Tribeca odbędzie się premiera pełnometrażowego filmu pt. „Dreams of Violets”. Jego akcja dzieje się w czasie styczniowych protestów antyreżimowych w Teheranie, które wybuchły po zamknięciu przez władze dostępu do Internetu.
Obraz z gatunku docudrama został „nakręcony” w całości przez sztuczną inteligencję. Powstał w kilka miesięcy bez udziału aktorów, kamer i planu. Produkcja z użyciem chińskiego agenta Kling AI od firmy Kuaishou kosztowała ok. 2 000 dolarów, a więc w kontekście rozważań powyżej – jednak tylko grosze.
