top of page

Rozszerzona rzeczywistość na piłkarskim boisku. ReSpo.Vision zmienia obraz sportu

Rozmawiają

1621268604134.jpeg

Wojciech Rosiński

CTO w ReSpo.Vision

1517022735286.jpeg

Tomasz Popielarczyk

Smartcast

Co można osiągnąć, instalując kamery wspierane sztuczną inteligencją i analityką danych na piłkarskim boisku? Football Managera w rzeczywistości - właśnie taką wizję sportu sprzedaje ReSpo.Vision. Polska firma ma wśród swoich klientów m.in. takie kluby, jak PSG, Chelsea czy Liverpool. Dzięki ich rozwiązaniu trenerzy uzyskują dostęp do danych, o których do tej pory im się nawet nie śniło!


Wojciech Rosiński, CTO w ReSpo.Vision nie pozostawia wątpliwości - kluby, które mają dostęp do większej liczby danych, mają przewagę nad tymi, które (jeszcze) takiej złożonej analityki nie wykorzystują. I trudno się temu dziwić, bo trenerskie oko bywa zawodne, a przede wszystkim nie jest w stanie wychwycić wszystkich niuansów i zmian, jakie zachodzą na murawie podczas treningów czy samych meczów.


ReSpo.Vision to zaawansowana technologia wykorzystująca moc chmury obliczeniowej do analizy tego, co dzieje się na boisku i gromadzenia szczegółowych danych na temat piłkarzy. Co istotne, cały mechanizm może opierać się na jednej kamerze. Ważne, by nagranie było dobrej jakości (Full HD, a najlepiej 4K), a algorytmy ReSpo.Vision zajmą się resztą.


System jest w stanie przeanalizować 50 charakterystycznych punktów ciała każdego zawodnika, a więc dokładnie odtworzyć jego sposób poruszania. To otwiera drogę do wielu zaawansowanych analiz taktycznych oraz pozwala lepiej ocenić wydajność, efektywność i stan zdrowia drużyny.


Nie byłoby to możliwe, gdyby nie chmura obliczeniowa, w której dzieje się cała magia ReSpo.Vision. O tym, a także o wyzwaniach związanych z wdrażaniem i monetyzacją tej technologii, usłyszycie więcej w samym odcinku.


Przydatne linki


ReSpo.Vision - https://respo.vision/ 
Let's get (c)loud - https://ochk.cloud/pl/lets-get-cloud

Wysłuchaj tego odcinka na:

Google Podcast

Pozostałe odcinki cyklu "Poznaj się na chmurze"

Tomasz Popielarczyk: Cześć! Jest mi ogromnie miło przywitać Was w nowym odcinku podcastu Smartcast. Ja nazywam się Tomasz Popielarczyk, a dziś motywem przewodnim jest technologia, która wykorzystuje AI i computer vision na sportowych boiskach i z pewnością rozpali wyobraźnię niejednego fana piłki nożnej. O tym, czym jest respovision i kto z tego rozwiązania korzysta opowie nam Wojtek Ruciński, który pełni funkcję CTO w firmie. Dzień dobry Wojtku!


Wojciech Rosiński: Cześć Tomku! Bardzo miło mi być w dzisiejszym podcaście, dzięki za zaproszenie!


Podcast realizujemy we współpracy z OChK, a więc – jak łatwo się domyślić – zahaczymy w naszej rozmowie o wątki chmurowe, które są jednym z fundamentów, na których opiera się Respovision. Zanim jednak o tym, Wojtek opowiedz co nieco o tym, co robisz u Was w firmie, w ogóle czym Wy się zajmujecie i na czym polega Wasza technologia? To jest mega fajne, mega ciekawe.


Bardzo miło to usłyszeć. Ja w Respo pełnię rolę CTO. W praktyce można to tłumaczyć jako osoba techniczna, która zajmuje się po trochę wszystkim, jak to w start-upie. Tematów jest dużo. Po części realizuję tematy stricte związane z technologią – z prowadzeniem projektów czy zarządzanie naszą warstwą inżynierską też chmurową, stąd te tematy chmurowe mi są najbliższe w naszej firmie. Poza samymi tematami technologicznymi czy związanymi z projektami, które u nas realizujemy zajmuję się też łączeniem warstwy biznesu z technologią. Szczególnie przy tak skomplikowanym projekcie czy systemie, który my tworzymy jest to bardzo ważne. Właściwie codziennie mierzymy się z wyzwaniami czy z decyzjami, które powinniśmy podejmować w sposób, który będzie pozwalał nam iść do przodu, realizować cele biznesowe, ale jednocześnie wybierając drogę technologiczną, która pozwoli nam je osiągnąć jak najszybciej przy efektywnie jak najmniejszym koszcie. Ja mam background ML-owy. Swoją przygodę z ML-em zacząłem mniej więcej 8 lat temu. Rozpocząłem ją w ogóle od konkursów na Kaggle, która jest największą platformą na świecie, na której organizowane są konkursy ML-owe, gdzie ludzie z całego świata przygotowują rozwiązania dla danego problemu i starają się zbudować rozwiązania o jak największej celności. Na tych konkursach spędziłem mniej więcej 3 lata. To dało mi dużo cennych umiejętności czy doświadczenia, które wykorzystuję może już nie na co dzień u nas, ale na pewno wykorzystywałem na co dzień w nieco wcześniejszym etapie rozwoju firmy. Po pierwsze – zbudowaliśmy system, który pozwala nam na ekstrakcję bardzo szczegółowych danych z nagrań z wydarzeń sportowych. Obecnie skupiamy się na piłce nożnej, ale realizujemy też projekty związane z footballem amerykańskim. Efektywnie system oparty jest na Computer Vision, które jest jedną z działek AI mission learningu. System pozwala nam na wyciąganie bardzo szczegółowych danych z nagrań video z jednej kamery, co jest dużym osiągnięciem ze względu na to, że obecnie zdecydowana większość systemów polega na dedykowanym systemie hardwarowym, co bardzo ogranicza ich elastyczność. Zauważyliśmy potrzebę wprowadzenia bardziej zaawansowanej analityki do sportu, szczególnie piłki nożnej, bo niektóre z innych tą swoją rewolucję analityczną przeszły, o czym pewnie porozmawiamy w większym szczególe później. Ale w piłce nożnej wciąż ta analityka jest na bardzo wczesnym etapie. Naszą hipotezą jest, że dzięki tym bardziej szczegółowym danym będziemy w stanie pomóc trenerom czy też mediom, broadcasterom w lepszy sposób rozumieć piłkę nożną oraz dostarczać kontent, który będzie bardziej interesujący, szczególnie dla młodych pokoleń, bo jednak natura konsumpcji sportu naszym zdaniem też się zmienia.


Wspomniałeś o tym, że potrzebujecie jednej kamery do nagrywania płyty boiska i zbieracie na tej podstawie dane. Czy to musi być jakaś specjalna kamera?


Podstawą naszego rozwiązania jest właśnie to, że to nie musi być kamera o bardzo określonych parametrach. Jesteśmy w stanie wziąć jakiekolwiek nagranie, które będzie sensownej jakości. W najprostszym przykładzie jest to nagranie takie, jakie możemy oglądać w telewizji. To nagranie będzie danymi wejściowymi do systemu, które następnie rozbierzemy na klatki video. Z każdej z tych klatek wyciągniemy różne informacje – czy to o graczach, czy o piłce. Za pomocą szeregu modelu deep learningowych oraz mission learningowych, co ostatecznie pozwoli nam na wygenerowanie tego zbioru danych 3D, gdzie pozycje każdego z piłkarzy oraz piłki będą opisane trójwymiarowymi współrzędnymi na przestrzeni boiska, a dla każdego z piłkarzy efektywnie wyciągniemy mniej więcej 50 punktów charakterystycznych jego ciała, więc bardzo dokładnie będziemy odtworzyć sposób, w jaki się rusza. To otwiera szereg ciekawych zastosowań. Po pierwsze – są to bardziej zaawansowane zastosowania analityczne, gdzie możemy analizować sposób w jaki piłkarze się ruszają. Czy to w czasie rzeczywistym podczas trwania samego meczu, aby być w stanie lepiej ocenić jakość ich występu czy performance fizyczny w trakcie trwania samego meczu lub też odblokowuje to dużo możliwości bardziej zaawansowanej analityki po fakcie. Na przykład analizy taktyczne czy też skauting, wyszukiwanie nowych obiecujących graczy w innych ligach, w innych klubach na podstawie podobieństwa, sposobu gry i ruchu.


To trochę brzmi jak Football Manager w rzeczywistości. Nie wiem, czy kojarzysz serię tych symulatorów? Moje pierwsze skojarzenie, gdzie każdy piłkarz jest opisany przez tonę statystyk i ta seria jest dla największych freaków, którzy lubują się w tych cyferkach, w tych parametrach, w tych wszystkich danych, które spływają z boiska. Tam od jakiegoś czasu wprowadzono w tej grze funkcję „analityka danych”, żeby on tłumaczył te wszystkie liczby na taki ludzki język i dostarczał tym początkującym graczom, którzy siadają do tego Football Managera i od samego początku są przytłoczeni przez to. Czyli można powiedzieć, że Wy jesteście wirtualnym analitykiem danych? Czy analizujecie te dane i wyciągacie jakieś wnioski? Czy dostarczacie surowy wór liczb i Wasi klienci sobie potem na tym pracują?


Do tej pory koncentrowaliśmy się na tym drugim scenariuszu, czyli dostarczaniu jak najbardziej szczegółowych i jak najwyższej jakości surowych danych – tak, aby później we współpracy z firmami analitycznymi czy też klubami oraz ligami można było już te konkretne insighty wyciągać. Na ten moment strategia, którą przyjęliśmy oparta jest na założeniu, że my jesteśmy ekspertami w Computer Vision, w Mission Learningu i będziemy w stanie jako firma zbudować system, który będzie dostarczał dane wyższej jakości i wyższej szczegółowości niż te, które są dostępne na rynku. Jednocześnie nie jesteśmy ekspertami od piłki nożnej jeszcze, więc uważamy, że dużo więcej sensu ma ten setup, który wybraliśmy, czyli my po prostu jesteśmy dostarczycielem danych, z których później wybrane firmy analityczne, kluby będą mogły wyciągać insighty czy też sprawdzać swoje konkretne hipotezy. To też jest o tyle dobre z perspektywy biznesowej, że mamy dużo szerszą gamę odbiorców na jedno rozwiązanie, które łatwiej jest skalować. Wchodząc głębiej w analitykę często kończy się to tym, że dla poszczególnych klientów musisz realizować bardzo konkretny szereg rzeczy, które utrudniają ci stworzenie jednego koherentnego offeringu. Niemniej jednak jest to coś, co oecnie eksplorujemy, starając się zebrać nasze doświadczenia z rozmów z wieloma klubami, z wieloma firmami analitycznymi – tak, aby wydestylować te najbardziej interesujące insighty czy też statystyki lub metryki, które później będziemy przygotowywać i wysyłać w formie skondensowanych raportów.


Czy możesz zdradzić, kto jest Waszym klientem? Jakie firmy korzystają z Waszych usług?


Niestety nie wszystkich mogę wymienić z nazwy. Niemniej jednak jest kilka klubów, z którymi obecnie aktywnie współpracujemy. Są to kluby takie jak PSG, Chelsea czy Liverpool. Celujemy w światowy TOP, co ma duże uzasadnienie ze względu na to, że przy naszej obecnej strategii i koncentracji na wyciąganiu surowych danych wysokiej jakości firmy czy docelowi klienci muszą posiadać swoje zasoby, które pozwolą im na obróbkę tych danych i testowanie swoich hipotez. Z tego względu przy współpracy z klubami duży sens ma koncentrowanie się na klubach, które są analitycznie zaawansowane, bo to one są w stanie później te dane przetwarzać i rzeczywiście wyciągać z nich wartość. Niemniej jednak staramy się powiększać świadomość korzyści, które wynikają z posiadania tak szczegółowych danych i tego, czego można z nich wyciągnąć, więc będziemy między innymi tymi raportami celować w kluby o mniejszych zasobach analitycznych.


Jak to wygląda od strony technicznej? Czy Wy przyjeżdżacie i montujecie na stadionie kamerę w takim punkcie, w którym Wy chcecie? Czy otrzymujecie jakieś nagrania i analizujecie? Czy dostarczacie tylko sam software, specyfikację i dalej sobie klient radzi sam z tym?


To zależy. Naszą przygodę zaczęliśmy od tego fundamentalnego założenia, że będziemy w stanie obrobić praktycznie dowolne video tak długo jak będzie ono spełniało podstawowe kryteria jakościowe. W tym scenariuszu braliśmy video od zewnętrznych dostawców, które później przerabialiśmy i dostarczaliśmy w oparciu o dane. To jest ten podstawowy scenariusz, w którym żaden hardware po naszej stronie jest niepotrzebny. Jedyne co dostarczamy to warstwę softwaru, która będzie pozwalała na przetworzenie video. Teraz jednak staramy się zbudować setup bardziej holistyczny, gdzie łączymy hardware, który jest przygotowywany przez naszych partnerów z softwarem, który my przygotowujemy – tak, aby stworzyć rozwiązanie, które będzie można łatwo skalować, co jest ważne szczególnie w przypadku rozmów z ligami. Chcąc oferować rozwiązanie ligom powinno to być rozwiązanie, które jest jednolite w ramach tak naprawdę wszystkich stadionów na których zostanie ono wdrożone, a to bywa trudne, kiedy chcemy bazować stricte na video od zewnętrznych dostawców. Przykładem może być nawet Premier Ligue, które część ze swoich nagrań puszcza w full HD, a część w 4K. Wtedy wiadomo, że jakość pochodząca z 4K będzie nieco lepsza, a chcąc oferować analitykę chcemy jednak mieć pewność, że zawsze będzie ten wspólny mianownik. Efektywnie to video jest tym wspólnym mianownikiem z naszej perspektywy.


Czyli może być tak, że jeżeli nagranie jest w 4K i inne nagranie jest w full HD to możecie z tego wyciągać inne dane albo błędy popełnić?


Tak, na pewno prawdopodobieństwo popełnienia błędu rośnie wprost proporcjonalnie do spadku jakości ze względu na to, że video w wyższej rozdzielczości efektywnie jest bardziej gęste, jeżeli chodzi o informacje, co ma szczególne znaczenie w przypadku danych 3D. Patrząc na piłkarza, na video i chcąc wyciągnąć szczegółowe informacje o ułożeniu jego ciała – im większy ten piłkarz będzie w pikselach to tym łatwiej będzie wyciągnąć te informacje. Jest to trywialne, jak się o tym myśli, ale dokładnie tak to wygląda.


Jakie statystyki jesteście w stanie wyciągnąć? Czy to jest prędkość biegu, siła kopnięcia? Czy to są jakieś inne parametry?


Jeżeli chodzi o same statystyki – na ten moment skupiamy się na danych fizycznych, które jesteśmy w stanie dostarczyć zarówno live w trakcie trwania meczu, jak i również w ramach analizy pomeczowej. W skład tych danych fizycznych wchodzi między innymi przebyty dystans, liczba sprintów, liczba biegów o wysokiej intensywności, przyspieszenie chwilowe, prędkość chwilowa, dzięki czemu można badać zarówno wysoko poziomowe agregaty jak chociażby dystans czy liczba wykonanych sprintów. Ale też można patrzeć na przebieg meczu czy formę danych piłkarzy w trakcie trwania rozgrywki patrząc na ich średnie prędkości, ich maksymalne prędkości na przestrzeni czasu.


Czy są jakieś ograniczenia związane z łącznością? Czy stadion musi mieć jakieś światłowody czy 5G, żeby był w stanie dostarczać Wam te dane w takim czasie rzeczywistym?


Rzeczywiście w przypadku setupu, który łączy hardware z softwarem musi być spełniony szereg warunków infrastrukturalnych na stadionie, aby efektywnie podłączenie tego hardwaru było możliwe. Tutaj zwykle na szczęście wystarcza odpowiednie miejsce na umieszczenie kamery oraz dopływ prądu stabilny. W przypadku, w którym chcielibyśmy dodatkowo zapewnić przetwarzanie live rzeczywiście musi być pociągnięty światłowód, abyśmy byli w stanie to video na bieżąco przetwarzać i wysyłać do chmury, gdzie następnie realizowane będzie przetwarzanie.


Czy celujecie w rynek konsumencki? Może jakaś aplikacja, która by pozwalała ludziom na stadionie oglądać ten mecz razem z tymi wszystkimi statystykami, które oglądacie? Czy raczej macie tylko ambicję, żeby się skupić tylko na klientach biznesowych?


Nasza obecna strategia zakłada, że skupiamy się na klientach biznesowych. Niemniej jednak poza samymi danymi oferujemy też wizualizację 3D, które są unikalnym produktem umożliwionym przez ekstrakcję danych 3D. Efektywnie posiadając dane 3D, które opiszą zarówno położenie piłki, jak i też każdej z kończyn gracza możemy wyrenderować całe boisko w trójwymiarowej przestrzeni efektywnie odtwarzając Fifę, co daje kilka ciekawych możliwości. Między innymi dowolnego ustawienia kamery czy też punktu widzenia. To umożliwi generowanie nowych produktów. Obecnie koncentrujemy się raczej na B2B, więc celujemy w media oraz broadcasterów. Niemniej jednak widzimy też potencjał na przeniesienie tego rozwiązania do aplikacji, gdzie rzeczywiście konsumenci mogliby w wybrany przez siebie sposób doświadczać tego meczu. Przykładowo – oglądając widowiskowy gol z perspektywy atakującego, z perspektywy bramkarza czy też podążając za piłką. Jest to naszym zdaniem coś, co da naprawdę duży potencjał na zmianę sposobu, w jaki konsumowane są obecnie wydarzenia sportowe.


Ale raczej to nie będzie taka perspektywa, że przychodzi tłum ludzi, zakłada gogle VR na stadionie i wszyscy oglądają mecz?


Może i tak będzie. Ale na to pewnie przyjdzie nam poczekać jeszcze kilka lat. Raczej na ten moment zakładamy, że w aplikacji będzie można wybrać kilka predefiniowanych punktów widzenia i między nimi przełączać się – tak, aby wybraną akcję obejrzeć właśnie z tych kilku punktów widzenia. To powinno znaleźć ciekawe zastosowania nawet w warstwie analizy technicznej czy performancu, ponieważ będzie pozwalało na spojrzenie na wybraną akcję jednak z innej perspektywy niż z tej, z której patrzy się zwykle, czyli z kamery telewizyjnej lub alternatywnie zza linii bocznej w przypadku osób, które rzeczywiście są na boisku.


Słuchając tego wszystkiego mam wrażenie, że te kluby, te firmy, które będą używały takiej technologii i miały dostęp do tych wszystkich statystyk będą miały przewagę taktyczną nad klubami, firmami, które tego nie robią. Czy to prawda? Czy się nie mylę?


Dokładnie tak. Taki jest cel analityki. To też moglibyśmy obserwować w innych sportach, gdzie rzeczywiście ta rewolucja analityczna nastąpiła.
Wracając do kwestii bardziej technicznej – wszystkie te obliczenia, wszystkie analizy tego nagrania odbywają się w chmurze. Wasz klient nie potrzebuje jakiegoś super mocnego hardwaru, żeby to przetwarzać czy Wy nie potrzebujecie. Nie trzymacie jakoś super komputera w biurze u siebie, który nad tym pracuje. Z jakich rozwiązań tutaj korzystacie?
Rzeczywiście masz rację – nie trzymamy u nas w biurze żadnego super komputera, a właściwie całe przetwarzanie odbywa się w chmurze. My nasz system obecnie wdrożyliśmy w Google Cloud migrując się z Oracle. Nasz setup zakłada w zdecydowanej większości wykorzystanie wirtualnych maszyn oraz ich skalowanie wykorzystując Kubernetes. Poza tym mamy kilka dodatkowych usług, które albo pozwalają nam na efektywne zarządzanie danymi jak Google Storage czy BigQuery czy też wspierają nas w realizowaniu poszczególnych use casów na przykład przetwarzania w czasie rzeczywistym, gdzie wykorzystujemy Neuro Store.


Dlaczego zrezygnowaliście z Oracle’a na rzecz Google’a? Co stało za taką decyzję?


W Google mamy zdecydowanie większą elastyczność w wyborze zasobów, które używamy do przetwarzania – czy to w codziennej pracy deweloperskiej, czy we wdrożeniach produkcyjnych. To jest jeden duży argument przemawiający za Google. Co więcej – ostatnimi czasy widać bardzo duży shortage szat graficznych wśród providerów chmurowych. Jest to temat, który dotyczy wielu providerów. Niemniej jednak dzięki oferowanej elastyczności i wielu klasom kart graficznych na Google ten problem z naszej perspektywy praktycznie nie występuje. Do tego Google oferuje szereg usług, które pozwalają nam na oszczędzenie czasu poprzez łatwą ich integrację zamiast potrzeby budowania wszystkiemu samemu. Sam proces migracji z Oracle na Google Cloud przeszedł w naszym przypadku właściwie bezboleśnie, co było możliwe w dużej mierze dzięki wsparciu ze strony Google’a oraz OChK. Jeżeli rzeczywiście pojawiają się potrzeby na to, aby migrować swoją infrastrukturę uważam, że nie powinno się tego bać. Szczególnie że coraz bardziej popularnym staje się model Multi Cloud, gdzie firmy operują aktywnie u kilku różnych providerów chmurowych, wybierającv odpowiedniego do każdego ze swoich zastosowań, use casów czy też usług, którzy ci providerzy oferują.


Rozmawialiśmy wcześniej z innymi gośćmi o programie Let’s Get Cloud OChKa, który chyba jest czymś takim, co wspiera ten Multi Cloud i tego typu przejścia, tego typu migracje na nowe chmury, bo o ile wiem tych usług chmurowych w Googlu jest cały wór. Kilkadziesiąt, kilkaset chyba nawet.


Tak.


Odnalezienie się w tym na pewno nie było łatwe.


Tak, to prawda. Zespół OChK i Google’a bardzo nam pomógł w przeprowadzeniu sprawnej migracji. To wsparcie inżynierskie podczas całego procesu z naszej perspektywy było bezcenne i zdecydowanie przyspieszyło sam proces. Właściwie już po kilku tygodniach byliśmy w stanie wznowić nasze operacje na Googlu, co z perspektywy firmy jest bardzo ważnym, bo nie było przestojów w przetwarzaniu, nie było przestojów w zleceniach czy w projektach zrealizowanych dla klientów. Do tego Let’s Get Cloud oferuje też eventy networkingowe, które są bardzo korzystne. Po pierwsze – można porozmawiać z firmami, które często są w podobnym miejscu, w którym ty, a to zawsze daje możliwość wymiany cennych informacji. Po drugie – można też porozmawiać face do face z inżynierami – z Googla czy OChK, którzy chętnie zawsze podpowiedzą jak rozwiązać dany problem.


Swego czasu miałem taką możliwość na jednym ze stadionów francuskich wspieranych przez operatora, którego nazwy nie będę wypowiadał zobaczyć bardzo podobną technologię do Waszej. Tam to było rozwijane w ramach ich start-upowego hubu. Problemem tego rozwiązania było to, że była aplikacja, była technologia, było wsparcie całego 5G i tych wszystkich kamer, ale nie potrafili tego w żaden sposób zmonetyzować. Widzę, że Wy jesteście już o krok dalej, bo nie dość, że macie technologie to macie klientów i faktycznie to monetyzujecie.


Tak. Rzeczywiście monetyzacja tego typu rozwiązań nie jest prosta, trzeba mieć na to jasna strategię. W naszym przypadku strategiczną decyzją, którą podjęliśmy, szczególnie na początku, jest to, że koncentrujemy się na budowie systemu, który pozwoli na samą ekstrakcję danych, a nie będziemy próbować robić wielu rzeczy na raz.


Jak wygląda kwestia skalowalności Waszego rozwiązania? Wrócę jeszcze do kwestii chmury. Czy sky is the limit i jesteście w stanie poradzić sobie z obsługą 4, 5, 10 największych lig na świecie? Czy jednak musicie stopować swoje ambicje trochę?


W tym momencie mamy wszystkie fundamenty, które pozwolą nam na osiągnięcie skali przetwarzania kilku, nawet kilkunastu lig, ponieważ całe rozwiązanie oparte jest właśnie o usługi chmurowe, mamy już zbudowaną warstwę, która zapewnia nam elastyczne skalowanie. Tak, bylibyśmy w stanie przetwarzać mecze nawet z kilkunastu lig. Przy czym oczywiście ze względu na różnorodną jakość video między tymi ligami oraz między nawet konkretnymi meczami w ramach danych lig trudno jest zagwarantować, że za każdym razem dane wychodzące z tego systemu będą dokładnie takie same. Tutaj musimy być świadomi tego, że jednak część z nich będzie wysokiej jakości, jeżeli samo video wyjściowe będzie wysokiej jakości. A dla części z nich albo same dane wyjściowe będą nieco niższej jakości, albo rozsądnym będzie ograniczenie się do konkretnego podzbioru danych.


Czy możesz powiedzieć coś więcej na temat Waszych planów na najbliższy czas? Ja tutaj oczyma wyobraźni widzę tą technologię podczas transmisji na żywo, podczas analiz w przerwach, w studiach, generalnie chyba możliwości są ogromne, jeśli chodzi o wdrożenia.


Tak. Wspomniałeś tutaj o analizach w trakcie przerw czy też o pokazywaniu poszczególnych statystyk czy wizualizacji na żywo. To jest dokładnie kierunek, który obecnie rozwijamy. W tym momencie skupiamy się na dwóch konkretnych rzeczach. Po pierwsze – jest to zbudowanie tego dedykowanego, zunifikowanego setupu, który będzie łączył hardware oraz software – tak, aby móc wyjść z konkretnym oferingiem dla lig. Obok tego rozwijamy system do przetwarzania danych w czasie rzeczywistym oraz warstwę wizualizacji 3D, które pozwolą nam na zrealizowanie całej tej warstwy związanej z generowaniem na żywo renderingu 3D.


Czyli rozumiem, że prezenterzy telewizyjni, którzy do tej pory rysowali tymi fikuśnymi mazakami po tych tablicach mogą czuć się zagrożeni?


Myślę, że nie powinni czuć się zagrożeni, ale powinni być świadomi tego, że nie będą już musieli rysować mazakami na tablicy, a zostaną im dostarczone narzędzia, które zdecydowanie ułatwią skupienie się na konkretnych aspektach przedstawionej akcji, bo będą mogli wybrać dowolny punkt widzenia oraz zaznaczyć czy przybliżyć, skoncentrować się na konkretnych elementach danej akcji, które rzeczywiście uważają za interesujące lub kluczowe.


Sztuczna inteligencja jest jednym z fundamentów Waszego rozwiązania. Dużo się w tym aspekcie teraz dzieje. Czy Wy już jakoś wykorzystujecie te nowe technologie udostępnione przez OpenAI czy Microsoft? Czy może jeszcze dopiero im się przyglądacie i zastanawiacie z której strony by je ugryźć?


Biorąc pod uwagę to, co się dzieje w świecie General TFI nie można obok tego przechodzić obojętnie, więc i my aktywnie kierunki wykorzystania technologii typu chat GPT eksplorujemy. Na ten moment skupiamy się przede wszystkim na integracji narzędzi zbudowanych w oparciu o wielkie modele językowe LLM-y, nasz chociażby codzienny workflow dewelopmentowy, ponieważ są one w stanie często zauważalnie pomóc lub przyspieszyć proces tworzenia czy testowania kodu czy nawet podpowiedzieć pomysły, w jaki można konkretne rozwiązanie czy też model poprawić. Raczej nie myślimy teraz o tworzeniu własnych modeli General TFI, niemniej jednak są one nam pomocne w codziennej pracy.


Łącząc Waszą technologię z może nie stricte chatem GPT, ale generatywną AI to można chyba byłoby już teraz – może jeszcze nie do końca skuteczną – ale już teraz stworzyć technologię, która by nie dość, że komentowała mecz to podawała jakieś statystyki, informowała o tym kto jest przy piłce, może by nawiązywała do historii danego zawodnika itd. Gdzie tu miejsce na czynnik ludzki, prezentera? Dobrze że Darek Szpakowski pożegnał się już z robotą, bo by ją pewnie stracił.


Tak się wydaje. Niemniej jednak moim zdaniem to, co rzeczywiście powoduje, że ludzie są zainteresowani sportem to jest w dużej mierze właśnie ludzkie współzawodnictwo i też ludzki komentarz. Dobrym przykładem na to, że ludzie nie są zainteresowani stricte AI są chociażby modele do grania w szachy. W końcu Deep Mind lat temu już kilka stworzył modele, które są dużo lepsze od ludzi, niemniej jednak nikt efektywnie nie jest zainteresowany pojedynkami modeli z ludźmi. Wszyscy wciąż zainteresowani są pojedynkami ludzi z ludźmi. Dlatego też wydaje mi się, że komentarz generowany przez same modele traciłby dużo uroku i powodowałby, że jednak czegoś by nam brakowało podczas oglądania tych wydarzeń sportowych. Mimo tego wydaje się, że rzeczywiście znajdzie to szereg zastosowań – tam, gdzie nie ma profesjonalnego komentatora.
Bazując na swoim doświadczeniu i backgroundzie, który posiadasz – myślisz, że AI będzie w stanie za ileś lat dostarczać te emocje, ten czynnik ludzki, symulować go, udawać w taki sposób, żeby przekonywać ludzi do tego, że coś tu się dzieje na ekranie i sprzedawać te sportowe emocje?
Myślę, że rzeczywiście w ciągu kilku lat, może nawet kilku miesięcy będzie istniała technologia, która niewiele będzie różniła się od jakości komentarza czy nawet emocji przekazywanych przez komentarz od tego, co są w stanie powiedzieć czy jak są w stanie komentować ludzie. Ale wciąż wydaje mi się, że praktycznie każdy z nas mając do wyboru komentarz na żywo szczególnie przez osobę, którą lubi, szanuje lub komentarz wygenerowany automatycznie wybierze jednak to pierwsze.


Ja idę jeszcze o krok dalej i dodajmy do tego voice cloning, czyli Dariusz Szpakowski, który już chyba nie będzie komentował może zostać sklonowany przez AI, która nie dość, że będzie udawała jego głos, udawała emocje to jeszcze dostarczała to wszystko w takiej postaci, w której ludzie będą myśleli, że to prawdziwy człowiek.


Spodziewałem się tego pytania i wydaje mi się, że jeżeli rzeczywiście cały ten stack modeli będzie w stanie odtworzyć sposób, w jaki komentują ludzie i nikt nie wspomni o tym, że to komentuje model, a nie człowiek to już wtedy możemy stracić przewagę.


To takim nie wiem, czy mało optymistycznym akcentem, ale zakończymy. Dziękuję Ci bardzo serdecznie za fajną rozmowę!


Dziękuję bardzo!


Dziękuję naszym Słuchaczom, którzy zostali z nami do końca! Jeżeli interesują Was nowe technologie – szczególnie te, które zmieniają świat – zachęcam gorąco do subskrybowania Smartcastu i do usłyszenia następnym razem! Dzięki!


Dzięki!

bottom of page