Wyścigi Formuły 1 to jeden z najbardziej złożonych sportów na świecie. Jest to niesamowite połączenie doskonałości człowieka i maszyny, które tworzy zwycięską jedność. To właśnie ta mieszanka sprawia, że wyścigi F1, a właściwie talent kierowcy, są trudne do zinterpretowania. Naprzeciw temu wychodzi algorytm Amazon Machnie Learning Solutions Lab. Pozwala on w oparciu o dane zmierzyć „prędkość” samego zawodnika.
Jak sztuczna inteligencja typuje najszybszego kierowcę Formuły 1 z ostatnich 40 lat?
Wyścigi Formuły 1 to jeden z najbardziej złożonych sportów na świecie. Jest to niesamowite połączenie doskonałości człowieka i maszyny, które tworzy zwycięską jedność. To właśnie ta mieszanka sprawia, że wyścigi F1, a właściwie talent kierowcy, są trudne do zinterpretowania. Naprzeciw temu wychodzi algorytm Amazon Machnie Learning Solutions Lab. Pozwala on w oparciu o dane zmierzyć „prędkość” samego zawodnika.
Ile wyścigów lub mistrzostw świata naprawdę wygrałby Michael Schumacher bez geniuszu technicznego Benettona, a później Ferrari? Czy Lewis Hamilton naprawdę sięgnąłby po siedem tytułów mistrzowskich, gdyby nie Mclaren oraz Mercedes? Istnieje ogrom kierowców, których talent pozostawał w ukryciu przez dużą część kariery. Sztuczna inteligencja może pomóc wyłowić ich z tłumu.
Formuła 1 oraz Amazon Machnie Learning Solutions Lab przez okrągły rok prowadzili prace rozwojowe nad algorytmem, który zaowocował narzędziem zdolnym utworzyć ranking najszybszych kierowców z ostatnich 40 lat. Wykorzystuje on uczenie maszynowe do porównywania wyników w kwalifikacjach. Nie są brane pod uwagę wyniki z wyścigów, jedynie czysta prędkość na pojedynczym okrążeniu.
Znacząco przyczynił się do tego zespół kierowany przez dyrektora ds. systemów danych Formuły 1 Roba Smedleya, dyrektora ds. transmisji i mediów Dean Locke oraz głównego naukowca i starszego menedżera Amazon ML Solutions Lab dr Priyę Ponnapalli. Znalazł on sposoby na wykrywanie wartości odstających. To przykładowo – wypadki, awarie samochodów czy zmieniające się warunki pogodowe. Dzięki ich izolacji udało się stworzyć prawdziwie uczciwy ranking.
Jak to działa?
Za odpowiedzią na pytanie „Kto jest najszybszym kierowcą?” stoi ogrom przeanalizowanych danych. Oprogramowanie do uczenia maszynowego AWS przeczesywało rezultaty każdej sesji kwalifikacyjnej od 1983 roku, usuwało wartości odstające i normalizowało dane, aby stworzyć złożoną sieć wyników kierowców. Były one analizowane w stosunku do ich kolegów z zespołu.
Algorytm stojący za rozwiązaniem problemu
Algorytm korzysta z metody Masseya (forma regresji liniowej), aby klasyfikować kierowców przy użyciu zestawów równań liniowych, w których ocena każdego kierowcy jest obliczana jako średnia różnica czasu okrążenia w stosunku do kolegów z zespołu. Dodatkowo, porównując oceny członków drużyny, model wykorzystuje liczbę wystąpień kierowcy znormalizowaną przez liczbę interakcji z kierowcą. Ogólnie rzecz biorąc, model nadaje wysokie oceny kierowcom, którzy radzą sobie wyjątkowo dobrze z kolegami z drużyny lub z innymi silnymi przeciwnikami.
Celem jest przypisanie każdemu kierowcy oceny liczbowej. Pozwala to ocenić przewagę kierowcy nad innymi, przy założeniu, że oczekiwany margines różnicy czasu okrążenia w dowolnym wyścigu jest proporcjonalny do różnicy w prawdziwej wewnętrznej ocenie kierowcy.
Dla bardziej matematycznego czytelnika: niech xj reprezentuje każdego ze wszystkich kierowców, a rj reprezentuje prawdziwe wewnętrzne oceny kierowcy. Dla każdego wyścigu możemy przewidzieć margines przewagi lub niekorzyści czasu okrążenia (yi) pomiędzy dowolną parą dwóch kierowców jako:
W tym równaniu xj to +1 dla zwycięzcy i -1 dla przegranego, a ei jest błędem wynikającym z niewyjaśnionych zmienności. Dla danego zbioru m obserwacji gry i n kierowców możemy sformułować układ równań liniowych (m * n):
Oceny kierowców (r) to rozwiązanie równania za pomocą regresji liniowej:
To kto jest najszybszy?
Na szczycie listy najszybszych kierowców znajdują się:
- Ayrton Senna.
- Michael Schumacher.
- Lewis Hamilton.
- Max Verstappen
- Fernando Alonso.
Model tworzy ranking zestawu danych na podstawie prędkości (lub czasów kwalifikacji) wszystkich kierowców od dziś do 1983 roku, po prostu uszeregowując kierowców w kolejności malejącej od Kierowca, Ranga (liczba całkowita), Gap to Best (milisekundy).
Jaka jest rola AWS i chmury obliczeniowej?
Aby zaimplementować metodę Masseya, użyto serwera webowego w oparciu o Pythona.
Jedną z komplikacji było to, że dane kwalifikacyjne wykorzystywane przez model są aktualizowane o nowe czasy okrążeń po każdym weekendzie wyścigowym. Aby temu zaradzić, oprócz standardowego żądania do serwera www o rankingi, wdrożono żądanie odświeżenia, które nakazuje serwerowi pobranie nowych danych kwalifikujących z Amazon Simple Storage Service (Amazon S3).
Wdrożono modelowy serwer www na endpoincie modelu Amazon SageMaker. Dzięki temu endpoint jest wysoce dostępny, ponieważ wieloinstancyjne endpointy modelu Amazon SageMaker są domyślnie rozmieszczone w wielu AZ’s i mają wbudowane funkcje automatycznego skalowania.
Dodatkową korzyścią jest integracja punktów końcowych z innymi funkcjami Amazon SageMaker, takimi jak jako Amazon SageMaker Model Monitor, który automatycznie monitoruje dryf modelu w punkcie końcowym. Korzystanie z w pełni zarządzanej usługi, takiej jak Amazon SageMaker, oznacza, że ostateczna architektura jest bardzo wydajna. Aby zakończyć wdrożenie, dodano warstwę API wokół naszego punktu końcowego za pomocą Amazon API Gateway i AWS Lambda. Poniższy diagram przedstawia tę architekturę w akcji.
Podsumowanie
W świecie akademickim jest takie stare powiedzenie, że dane można wykorzystać do potwierdzenia wszystkiego, czego tylko zechcesz.
I chociaż ranking „The Fastest Driver” może wydawać się trochę zabawny, zaawansowane modelowanie danych użyte w tym przypadku jest podobne do tych stosowanych przez zespoły F1, aby wybierać nowych kierowców.