OpenAI Pięć. | OpenAI

🎁Amazon Prime 📖Kindle Unlimited 🎧Audible Plus 🎵Amazon Music Unlimited 🌿iHerb 💰Binance

Video

Transkrypcja

Dota to jedna z najpopularniejszych i najbardziej wymagających gier komputerowych w historii.

Gra w Dotę wymaga koordynacji i gry zespołowej od pięcioosobowych drużyn.

W zeszłym roku zbudowaliśmy bota, który pokonał najlepszych graczy na świecie w minigrze 1v1.

Ale w tym roku chcemy pokonać najlepsze profesjonalne zespoły w pełnej wersji gry.

Aby to zrobić, stworzyliśmy nową sztuczną inteligencję, którą doskonaliliśmy przez ostatnie kilka miesięcy,

Oparliśmy ją na technologii Reinforcement Learning i użyliśmy dużej ilości komputerów,

by nauczyć nasze boty jak grać jako zespół.

Aby sprawdzić umiejętności naszego bota, zaczynamy grać przeciwko amatorskim drużynom

i ku naszemu zaskoczeniu, do tej pory wygraliśmy naszą pierwszą serię gier

przeciwko każdej drużynie, którą przetestowaliśmy.

[GRACZ:] Ostrożnie, atakuje cię! Potrzebujemy więcej ludzi!

Niech wszyscy się teleportują! Niech wszyscy się teleportują!

Atakuj tego gościa! Dobra, nie warto.

[NARRATOR:] Aby lepiej zrozumieć poziom umiejętności naszego bota,

poprosiliśmy profesjonalnego gracza, aby rzucił na niego okiem.

Nazywam się William Lee, lepiej znany w społeczności Doty jako Blitz.

Mówi Blitz razem z Christy, opowiemy wam teraz

podstawowe zasady gry w Dotę.

Są bardzo proste: “Unieszkodliw wroga, zniszcz budynki”.

Każdy bohater ma wiele unikatowych czarów;

drużyny będą grać mecz lustrzany, w którym obie mają tych samych bohaterów.

[NARRATOR:] Widzimy tu drużynę ludzi,

która w piątkę zadaje spore obrażenia bazie botów. W tym czasie Crystal Maiden

podchodzi obronić baraki. Doskakuje używając Blink Dagger, osłania się z pomocą

Black King Bar, i rzuca Freezing Field, by zadać ogromne obrażenia,

których nie można przerwać. Ta kombinacja kończy się zdjęciem czterech ludzi z planszy

w potyczce dwóch na pięciu.

Ludzie napisali “GG” czyli “Dobra gra”. Uważają, że nie mogą już wygrać.

Mają sto procent racji.

Tak więc ich zespół programistów został całkowicie pokonany.

Myślę, że była to najkrótsza gra, którą kiedykolwiek komentowałem.

Następnie przyszedł czas na drugą grę. Ludzie mieli czas przemyśleć strategię i tak dalej…

zostali zdruzgotani jeszcze mocniej.

Boty zrobiły dokładnie to, na co liczyłem:

Przejęły ten obszar. Zabrały te dwie trzecie mapy,

nawet nie dotykając dwóch dolnych wież.

To poprawny ruch.

Jest to zagranie na najwyższym możliwym poziomie.

Tę stronę mapy niesamowicie trudno przejąć,

więc oni po prostu grają na górnej i środkowej części,

ponieważ rozumieją, że to są dwa najważniejsze obszary.

Robienie tego intuicyjnie jest niebywałe.

Gdyby to była jedna gra, uznałbym to za szczęśliwy przypadek.

Ale dwie gry z rzędu, ze zmianą stron - to coś więcej niż zbieg okoliczności.

Jestem całkiem dobrym graczem, ale i tak potrzebowałem około ośmiu lat

aby nauczyć się tych strategii, które dla bota były tak intuicyjne.

Aby trenować nasze boty, stosujemy Reinforcement Learning.

Symulujemy grę na stu tysiącach procesorów

i nasze boty uczą się z każdej rozgrywki, którą grają przeciwko sobie.

Ponieważ Dota jest trudna do opanowania, nawet dla pojedynczego gracza,

stworzyliśmy hiper-parametr, który nazwaliśmy Team Spirit (“duchem zespołowym”).

Pięć botów zaczyna naukę całkowicie samolubnych,

ale zmiana tego parametru sprawia, że troszczą się o resztę drużyny

aby ostatecznie nauczyć się gry zespołowej.

Po wygranej botów z zespołem testowym,

Blitz chciał sam rzucić wyzwanie. Jest dużo lepszym graczem od tych z zespołu testowego,

I będzie grać z najlepszymi graczami z naszej widowni.

[CASTER 1:] Jak widać, Blitz wkrótce zostanie pobity.

[CASTER 2:] Blitz jest zdecydowanie unieszkodliwiony, tak.

[CASTER 1:] Ludzie nie są w najlepszej sytuacji. Nie ma dwóch członków ich zespołu.

Pozostało dwadzieścia sekund, a boty zaraz zniszczą pierwsze baraki.

Mamy tu kolejną walkę. A boty wydają się… wygrywać!

Na początku gry ludzie mieli przewagę,

ale ostatecznie nasz bot zdołał pokonać również ten silniejszy zespół.

Wciąż jesteśmy daleko od pobicia profesjonalnych zespołów, ale myślę, że wszyscy byliśmy zaskoczeni tymi grami.

Uważam, że praca zespołowa w czasie walk była doskonała.

Bot nie popełniał błędów.

Jeżeli chodzi o koordynację, to były jedne z najlepszych, najczystszych walk drużynowych, jakie widziałem.

Czułem, że mój każdy błąd był wykorzystywany.

Wydaje mi się, że ludzie tak nie robią.

Mistrzostwa świata w Docie odbędą się w sierpniu.

Podczas gdy najlepsi gracze na świecie szykują się do rywalizacji,

my też pracujemy - nad kolejną wersją naszego bota.

Aby przekonać się, jak daleko zaszliśmy, w lipcu zagramy mecz na żywo przeciwko drużynie ze światowej czołówki.

Stosowana przez nas metoda trenowania sztucznej inteligencji jest bardzo ogólna.

Skupiamy się na nauce Doty, ale mamy nadzieję zrozumieć, jak

sztuczna inteligencja może rozwiązywać dowolne skomplikowane problemy.

To jest w tym najlepsze: gdy słyszę, że bot robi postępy, nie boję się,

jestem podekscytowany. Pokonanie bota będzie dla mnie

kolejnym wyzwaniem. Jest to coś, czemu niewielu ludzi będzie w stanie podołać.

Dawajcie!