Tesla a budúcnosť AI v autonómnom riadení
Ako sa Teslin systém “end-to-end” líši od konkurencie
Ashok Elluswamy, viceprezident pre AI/Autopilot softvér v Tesle, ponúkol zriedkavý pohľad do vnútra toho, ako sa AI systém spoločnosti učí riadiť. Po svojom vystúpení na Medzinárodnej konferencii o počítačovom videní zdieľal na sociálnej sieti X detaily o Teslinom neurónovom sieti “end-to-end”.
Na rozdiel od väčšiny ďalších spoločností, ktoré sa zameriavajú na autonómne riadenie a spoliehajú sa na modulárne systémy plné senzorov, kde je každý aspekt – vnímanie, plánovanie a kontrola – oddelený, Teslina metóda spojuje všetko do jednej kontinuálne trénovanej neurónovej siete. „Gradienty prechádzajú až od kontrol až po senzorické vstupy, čím sa optimalizuje celá sieť ako celok,“ vysvetlil Elluswamy.
Poukázal na to, že hlavnou výhodou tejto architektúry je škálovateľnosť a súlad s ľudským podobným uvažovaním. Na príkladoch z reálneho riadenia uviedol, že AI Tesly sa môže učiť subtilné hodnotové úsudky – rozhodnúť sa, či obísť mláku alebo na chvíľu zasiahnuť do prázdneho protismeru. „Autonómne vozidlá sú neustále vystavené mini-problémom s električkou,“ napísal Elluswamy. „Trénovaním na ľudských dátach sa roboty učia hodnotám, ktoré sú v súlade s tým, čo ľudia považujú za dôležité.“
Tento systém, zdôraznil Elluswamy, umožňuje AI interpretovať zložité úmysly, ako napríklad či majú zvieratá na ceste zámer prejsť alebo zostať stáť. Takéto nuansy sú veľmi ťažko zakódovateľné ručne.
Riešenie škálovateľnosti, interpretovateľnosti a simulácie
Elluswamy priznal, že výzvy sú obrovské. AI Tesly spracováva miliardy „vstupných tokenov“ z viacerých kamier, navigačných máp a kinematických dát. Aby zvládla tento rozsah, globálna flotila spoločnosti poskytuje to, čo nazval „vodopádom dát Niagara“, pričom denne generuje ekvivalent 500 rokov jazdy. Sofistikované dátové pipeline následne kurátujú najcennejšie vzorky na tréning.
Tesla vyvinula nástroje, ktoré robia jej sieť interpretovateľnou a testovateľnou. Metóda spoločnosti pre generatívne Gaussovo škvrnenie dokáže rekonštruovať 3D scény v milisekundách a modelovať dynamické objekty bez zložitého nastavenia. Okrem toho umožňuje Teslin simulačný svet neurónovým inžinierom bezpečne testovať nové modely riadenia vo virtuálnych realistických prostrediach, generujúc vysokorozlíšenlivé, kauzálne reakcie v reálnom čase.
Elluswamy uzavrel, že tá istá architektúra sa nakoniec rozšíri aj na Optimus, humanoidného robota spoločnosti Tesla. „Práca, ktorá sa tu vykonáva, bude nesmierne prospešná pre celé ľudstvo,“ povedal a nazval Teslu „najlepším miestom na svete na prácu s AI v súčasnosti.“

