Sztuczna inteligencja pokonała arcymistrzowski program szachowy. Ludziom zostało kibicowanie

Artykuł/Nauka 08.12.2017
Sztuczna inteligencja pokonała arcymistrzowski program szachowy. Ludziom zostało kibicowanie

Sztuczna inteligencja pokonała arcymistrzowski program szachowy. Ludziom zostało kibicowanie

4 godziny. Tyle czasu potrzebowała SI Google, żeby nauczyć się grać w szachy lepiej, niż Stockfish – program uznawany za obecnego arcymistrza.

Szachy z ludzkiego punktu widzenia to bardzo trudna gra, z ogromną liczbą strategii do opanowania. Jednak dla programów komputerowych od dawna nie jest ona aż tak dużym wyzwaniem.

W pojedynczym ruchu szachowym dostępnych jest ok. 20 posunięć – już 20 lat temu firmie IBM udało się stworzyć oprogramowanie, które było w stanie ograć ludzkiego arcymistrza. Chodzi tu oczywiście o sławny mecz Kasparow kontra Deep Blue.

Od 1997 r. nauczyliśmy się tworzyć oprogramowanie, którego sami do końca nie rozumiemy, a szachy… No cóż, szachy są po prostu za mało skomplikowaną grą, żeby testowanie za ich pomocą konstruktów SI miało jakikolwiek sens. No chyba, że skupimy się na samym czasie nauki potrzebnym do osiągnięcia arcymistrzowskiego poziomu.

Arcymistrzostwo w 4 godziny

sztuczna inteligencja szachy

240 minut. Przez tyle czasu AlphaZero – sztuczna inteligencja Google’a uczyła się grać w szachy sama ze sobą. Ludzie, którzy nadzorowali cały eksperyment ograniczyli się do „nauczenia” AlphaZero reguł gry. Strategie SI przygotowała sobie już sama, korzystając z możliwości algorytmów maszynowego uczenia się.

Po kilkuset tysiącach gier (i pojedynczych scenariuszy), które AlphaZero rozegrała sama ze sobą, zespół DeepMind postanowił sprawdzić, jak ich SI wypadnie grając przeciwko najwyżej notowanemu programowi na świecie Stockfish.

Aktualizacja #1: Jak słusznie zauważył nasz czytelnik Mateusz, Stockfish od wczoraj nie jest już uznawany za mistrza wśród silników szachowych. Od wczoraj tytuł ten należy do Houdini 6.03.

28 zwycięstw i 72 remisy

AlphaZero i Stockfish rozegrały 100 gier między sobą. Sztuczna inteligencja Google wygrała 28 partii, w tym 25 grając białymi (która ma przewagę pierwszego ruchu) i 3 po czarnej stronie. Pozostałe 72 pojedynki zakończyły się remisem. Stockfishowi nie udało się wygrać nawet pojedynczej partii.

Aktualizacja #2: Nasz czytelnik zauważył również, że możliwości Stockfisha w tym pojedynku były „okrojone”:

Np. taki głupi 1 GB hash dla Stockfish to ekstremalnie mało, ale ponieważ oni wiedzą co robią, to dostosowali ustawienia (inne ustawienia też) tak, by wyszło, że Alpha jest niepokonana. Gdyby parametry sprzetowo-programowe były zbliżone, a AlphaGo Zero by wygrała, to pewnie by się tym bardziej chwalili, a tak, Stockfish jest “przycięty” pod tezę (pewnie w zbliżonych warunkach “obliczeniowych” sytuacja nie była już tak kolorowa). Dopóki Google nie uwolni kodu AlphaGo, to można sobie gdybać co to robi i z jaką siłą. – Mateusz

sztuczna inteligencja szachy

Wynik ten sam w sobie jest oczywiście imponujący, dopóki nie ujmie się go w nieco szerszym kontekście. AlphaZero ma na swoim koncie wygraną w o wiele bardziej złożoną grę – Go. Taka ciekawostka: Amerykański szachista i miłośnik gry go, zmarły w 1981 roku Edward Lasker powiedział, że skoro szachy to król gier, to go jest ich cesarzem.

W szachach pierwszy ruch (tzw. otwarcie) ograniczony jest do kilkunastu możliwości – co umożliwia stworzenie przekalkulowanych drzew gry. W przypadku Go jest odwrotnie – pierwszy ruch to kilkaset możliwości (rozmiar planszy go to 19×19 pól = 361).

W trakcie gry liczba możliwości spada aż do momentu pierwszego zbicia – wtedy ponownie rośnie. Zbicia potrafią zmienić sytuację na całej planszy, często w sposób dramatyczny przeważyć szalę zwycięstwa. Szachy to przy tym „pikuś”.

SI odnosi też sukcesy w grach komputerowych.

W sierpniu, podczas największego turnieju w Dotę 2 swoje możliwości zaprezentowała sztuczna inteligencja tworzona przez firmę Deepmind (w którą zainwestował m.in. Elon Musk). Dota 2 jest grą drużynową, w której normalnie udział bierze 10 osób (po 5 w każdej drużynie).

Na potrzeby pojedynku z SI zasady nieco uproszczono. Rozgrywkę ograniczono do pojedynków 1 na 1, na środkowej linii mapy, bez możliwości korzystania z niektórych przedmiotów magicznych. Jak pewnie się domyślacie, algorytm nie miał większych problemów z pokonaniem najlepszych ludzkich graczy.

Można się oczywiście czepiać, że na potrzeby SI rozgrywka została mocno uproszczona, ale profesjonalni gracze byli i tak pod ogromnym wrażeniem możliwości algorytmu. Wielu zawodników zwróciło się do firmy Deepmind, aby ta udostępniła im swoją SI w celach treningowych. Na mnie największe wrażenie zrobiło to, że Deepmind w trakcie rozgrywek z ludzkimi przeciwnikami… blefowała w bardzo przekonywujący sposób.

Możliwości sztucznej inteligencji już dawno wykroczyły poza gry.

sztuczna inteligencja szachy

Opanowanie gry w szachy w 4 godziny oczywiście imponuje, ale w szerszym ujęciu jest mało znaczącym osiągnięciem. Przypominam, że już teraz potrafimy wykorzystywać SI do znacznie ważniejszych i bardziej złożonych zadań.

Mi osobiście najbardziej imponują zastosowania algorytmów w medycynie. IBM Watson już teraz uznawany jest za jednego z najlepszych diagnostów na świecie. Deep Patient z kolei, korzystając z informacji zapisanych na kartach pacjentów, sam nauczył się diagnozować schizofrenię, co do tej pory wydawało nam się niemożliwe.

I tak, jak powoli oswajamy się z koncepcją autonomicznych samochodów, już wkrótce zaczniemy oswajać się z ideą całego, inteligentnego miasta. Wyobraźcie sobie metropolię, której wszystkie “procesy” – sygnalizacja drogowa, transport publiczny (autonomiczny rzecz jasna), oświetlenie, służby porządkowe zarządzane są przez jeden, centralny algorytm.

I w ogóle nie dziwię się ekonomistom, którzy już teraz zastanawiają się jak pod naciskiem postępującej i zoptymalizowanej do granic możliwości automatyzacji zmieni się nasz świat. Założę się, że nikt nie spodziewał się na przykład powstania religijnego kultu na bazie SI.

Ciekawe, czym SI zaskoczy nas w przyszłości.

Dołącz do dyskusji

Advertisement