AI alignment: nie tylko technologia

O tym, czym jest AI alignment, i czemu proces ten ma tak duże znaczenie z punktu widzenia implementacji AI w praktyce, opowiedział nam moderator jednej z sesji tegorocznego BankTech, Piotr Łukasiński, Master Data Scientist, Tribe Business Intelligence w Santander Banku Polska:
AI alignment to proces (i obszar badań), który ma sprawić, że AI będzie wykonywać to, o co zamierzaliśmy poprosić i pozostanie w zgodzie z naszymi wartościami. Innymi słowy cel jaki próbuje realizować system AI powinien być spójny z naszym.
Jeśli nasze instrukcje lub cele jakie postawimy AI są zbyt wąskie i nieprecyzyjnie zdefiniowane, system może znaleźć nieoczekiwane skróty lub zignorować ważny kontekst.
Ilustruje to mit o królu Midasie. Jego życzeniem (określonym celem) było: aby wszystko, czego dotknie, zamieniało się w złoto. Jego prawdziwym pragnieniem było bogactwo i władza. Dosłowne spełnienie życzenia doprowadziło do katastrofy: jedzenie, woda i córka zamienione w złoto.
AI musi „zinternalizować” nasze wartości społeczne i korporacyjne, i działać w zgodzie z intencją człowieka, a nie tylko dosłownym poleceniem. Bez tego grozi nam, że AI — jako doskonały optymalizator — wykona instrukcję w sposób perfekcyjny, ale szkodliwy.
AI alignment ma zapewnić, że systemy jakich używamy są:
Pomocne – wspierają ludzi w osiągnięciu zamierzonych celów;
Bezpieczne – unikają wyrządzania szkód fizycznych, psychicznych, finansowych i społecznych, a także dyskryminujących czy nieetycznych decyzji;
Niezawodne – działają spójnie i przewidywalnie, także przy nietypowych danych lub w nowym środowisku.
Możemy tu użyć analogii z wychowaniem dziecka. Rodzice i opiekunowie uczą dziecko wartości i odpowiednich zachowań, aby potrafiło reagować w nowych sytuacjach zgodnie z oczekiwaniami społecznymi.
Celem jest nie tylko przestrzeganie reguł, ale wewnętrzne zrozumienie zasad i intencji. Podobnie, AI alignment dąży do tego, aby system AI działał zgodnie z ludzkimi wartościami, nawet w nieprzewidzianych sytuacjach.
AI alignment jest ważne, ponieważ wspiera budowę zaufania użytkowników, a przez to akceptację społeczną technologii. Jest fundamentalne dla dalszych, coraz bardziej autonomicznych zastosowań AI.