Ono što ChatGPT nikada neće moći

Budućnost UI
10 komentara

Godine 1950., kada je računalstvo bilo nešto više od automatizirane aritmetike i jednostavne logike, Alan Turing postavio je pitanje koje i danas odzvanja: mogu li strojevi misliti? Trebala je izvanredna maštovitost da se u onome što je on vidio nasluti: da bi se inteligencija jednoga dana mogla izgraditi, a ne samo roditi. Taj uvid kasnije je pokrenuo neumoljivu znanstvenu potragu zvanu umjetna inteligencija (UI). Dvadeset i pet godina u svojoj karijeri u području UI-a, i dalje se osjećam nadahnut Turingovom vizijom. No koliko smo zapravo blizu? Odgovor nije jednostavan.

Danas vodeće tehnologije UI-a poput velikih jezičnih modela (VJM) počele su mijenjati način na koji pristupamo apstraktnom znanju i radimo s njim. Ipak, oni ostaju vješti rukovatelji riječima u tami; rječiti, ali neiskusni, znanstveni, ali neutemeljeni. **Prostorna inteligencija** preobrazit će način na koji stvaramo i stupamo u interakciju sa stvarnim i virtualnim svjetovima – do temelja će promijeniti pripovijedanje, kreativnost, robotiku, znanstvena otkrića i više od toga. To je sljedeća velika granica umjetne inteligencije.

Potraga za vizualnom i prostornom inteligencijom Sjevernjača je koja me vodi od mog ulaska u ovo polje. Zato sam proveo godine izgrađujući ImageNet, prvu opsežnu zbirku podataka za vizualno učenje i mjerenje učinka te jedan od tri ključna elementa koji su omogućili rođenje moderne UI-a, uz algoritme neuronskih mreža i suvremenu računalnu snagu poput grafičkih procesnih jedinica (GPU). Zato je moj akademski laboratorij na Stanfordu proveo posljednje desetljeće kombinirajući računalni vid s robotskim učenjem. I zato smo moji suosnivači Justin Johnson, Christoph Lassner, Ben Mildenhall i ja prije više od godinu dana stvorili World Labs: kako bismo po prvi put u potpunosti ostvarili tu mogućnost.

U ovom ću eseju objasniti što je prostorna inteligencija, zašto je važna i kako gradimo modele svijeta koji će je otključati – uz utjecaj koji će preoblikovati kreativnost, utjelovljenu inteligenciju i ljudski napredak.

Prostorna inteligencija: skela ljudske spoznaje

Umjetna inteligencija nikad nije bila uzbudljivija. Generativni modeli UI-a poput VJM-ova preselili su se iz istraživačkih laboratorija u svakodnevni život, postavši alati kreativnosti, produktivnosti i komunikacije za milijarde ljudi. Pokazali su sposobnosti za koje se nekad smatralo da su nemoguće: stvaraju koherentan tekst, planine programskoga koda, fotorealistične slike, pa čak i kratke videoisječke s lakoćom. Više se ne postavlja pitanje hoće li UI promijeniti svijet. Prema bilo kojoj razumnoj definiciji, već ga je promijenio.

Ipak, toliko toga još uvijek leži izvan našega dosega. Vizija autonomnih robota ostaje zanimljiva, ali spekulativna, daleko od uobičajenih dijelova svakodnevnoga života kakve su futuristi dugo obećavali. San o znatno ubrzanom istraživanju u područjima poput liječenja bolesti, otkrivanja novih materijala i fizike čestica ostaje uvelike neispunjen. I obećanje UI-a koji uistinu razumije i osnažuje ljudske stvaratelje – bilo da su učenici koji uče zamršene pojmove molekularne kemije, arhitekti koji vizualiziraju prostore, filmski stvaratelji koji izgrađuju svjetove ili bilo tko tko traži potpuno uronjena virtualna iskustva – ostaje nedostižno.

Da bismo saznali zašto te sposobnosti ostaju nedostižne, moramo ispitati kako se prostorna inteligencija razvila i kako oblikuje naše razumijevanje svijeta.

Vid je dugo bio kamen temeljac ljudske inteligencije, no njegova je moć proizašla iz nečega još temeljnijega. Mnogo prije nego što su životinje mogle graditi gnijezda, brinuti se za mladunčad, komunicirati jezikom ili graditi civilizacije, sam jednostavan čin osjetilnoga opažanja potajno je potaknuo evolucijsko putovanje prema inteligenciji.

Ta se naizgled izolirana sposobnost prikupljanja informacija iz vanjskoga svijeta, bilo da se radi o tračku svjetlosti ili osjećaju teksture, stvorila most između percepcije i preživljavanja koji je s prolaskom generacija postajao samo sve jači i složeniji. Sloj po sloj neurona izrastao je iz tog mosta, tvoreći živčane sustave koji tumače svijet i usklađuju interakcije između organizma i njegove okoline. Stoga su mnogi znanstvenici pretpostavili da su percepcija i djelovanje postale središnja petlja koja pokreće evoluciju inteligencije i temelj na kojemu je priroda stvorila našu vrstu – vrhunsko utjelovljenje opažanja, učenja, mišljenja i činjenja.

Prostorna inteligencija igra temeljnu ulogu u određivanju načina na koji stupamo u interakciju s fizičkim svijetom. Svakoga se dana oslanjamo na nju u najobičnijim radnjama: parkiramo auto zamišljajući sužavajući se razmak između branika i rubnika, hvatamo prebačeni čitav svežanj ključeva, prolazimo kroz prepunu pločnicu bez sudara ili pospano ulijevamo kavu u šalicu ne gledajući. U iznjedrenijim okolnostima vatrogasci se probijaju kroz rušeće zgrade usred gustoga dima, donoseći djelić-sekundne prosudbe o stabilnosti i preživljavanju, komunicirajući gestama, govorom tijela i zajedničkim profesionalnim instinktom za koji ne postoji jezična zamjena. A djeca provode cijeli svoj predverbalni period učeći svijet kroz razigrane interakcije sa svojom okolinom. Sve se to odvija intuitivno, automatski – tečnost koju strojevi tek trebaju postići.

Prostorna je inteligencija također temeljna za našu maštu i kreativnost. Pripovjedači stvaraju jedinstveno bogate svjetove u svojim umovima i koriste mnoge oblike vizualnih medija kako bi ih približili drugima, od drevnoga slikanja po pećinama do modernoga filma i uronjivih videoigara. Bilo da se radi o djeci koja grade dvorce od pijeska na plaži ili igraju *Minecraft* na računalu, prostorno utemeljena mašta čini osnovu za interaktivna iskustva u stvarnim ili virtualnim svjetovima. A u mnogim se industrijskim primjenama simulacije objekata, scena i dinamičkih interaktivnih okolina koriste u bezbrojnim kritičnim poslovnim slučajevima, od industrijskoga dizajna i digitalnih blizanaca do robotske obuke.

Povijest je puna trenutaka koji su obilježili civilizaciju, a u kojima je prostorna inteligencija igrala središnju ulogu. U staroj je Grčkoj Eratosten pretvorio sjene u geometriju – izmjerivši kut od 7 stupnjeva u Aleksandriji u točno onome trenutku kada sunce u Sieni nije bacalo sjenu – kako bi izračunao opseg Zemlje. Hargreavesova „pokretačka Jenny” do temelja je promijenila tekstilnu proizvodnju prostornim uvidom: postavljanje više vretena jedno pored drugoga u jednom okviru omogućilo je jednomu radniku da prede više niti istovremeno, čime se produktivnost povećala osmerostruko. Watson i Crick otkrili su strukturu DNK fizički gradeći trodimenzionalne molekularne modele, manipulirajući metalnim pločama i žicom sve dok se prostorni raspored parova baza nije uskladio. U svakome je slučaju prostorna inteligencija pokrenula civilizaciju naprijed kada su znanstvenici i izumitelji morali manipulirati predmetima, vizualizirati strukture i prosuđivati o fizičkim prostorima – ništa od toga ne može se obuhvatiti samo tekstom.

Prostorna je inteligencija skela na kojoj je izgrađena naša spoznaja. Djeluje kada pasivno promatramo ili aktivno nastojimo stvoriti. Pokreće naše rasuđivanje i planiranje, čak i o najapstraktnijim temama. I ključna je za način na koji stupamo u interakciju – verbalno ili fizički, s našim vršnjacima ili sa samom okolinom. Dok većina nas većinu dana ne otkriva nove istine na razini Eratostena, mi rutinski razmišljamo na isti način – dajemo smisao složenome svijetu opažajući ga putem svojih osjetila, a zatim se oslanjamo na intuitivno razumijevanje njegova načina djelovanja u fizičkim, prostornim pojmovima.

Nažalost, današnja umjetna inteligencija još ne razmišlja tako.

Doista je postignut golem napredak u posljednjih nekoliko godina. Multimodalni veliki jezični modeli (MVJM), uz tekstualne podatke trenirani i na golemim količinama multimedijskih podataka, uveli su neke osnove prostorne svijesti, a današnji UI može analizirati slike, odgovarati na pitanja o njima te stvarati hiperrealistične slike i kratke videozapise. A kroz napretke u području senzora i haptike, naši najnapredniji roboti mogu u visoko ograničenim okruženjima početi manipulirati predmetima i alatima.

Ipak, iskrena je istina da prostorne sposobnosti UI-a i dalje ostaju daleko od ljudske razine. A granice se brzo otkrivaju. Vrhunski MVJM modeli rijetko postižu bolje rezultate od puke slučajnosti u procjenjivanju udaljenosti, orijentacije i veličine – ili „mentalnom” rotiranju predmeta regenerirajući ih iz novih kutova. Ne mogu snalaziti se u labirintima, prepoznati prečace ni predvidjeti osnovnu fiziku. UI-em generirani videozapisi – u povojima i, da, vrlo zanimljivi – često izgube koherentnost nakon nekoliko sekundi.

Iako današnji vrhunski UI može briljirati u čitanju, pisanju, istraživanju i prepoznavanju obrazaca u podacima, ti isti modeli nose temeljna ograničenja kada trebaju predstavljati fizički svijet ili u njemu djelovati. Naš je pogled na svijet cjelovit – ne samo ono što promatramo, već i kako je sve prostorno povezano, što to znači i zašto je važno. Razumijevanje toga putem mašte, rasuđivanja, stvaranja i interakcije – a ne samo opisa – moć je prostorne inteligencije. Bez nje, umjetna je inteligencija odvojena od fizičke stvarnosti koju nastoji razumjeti. Ne može učinkovito upravljati našim automobilima, usmjeravati robote u našim domovima i bolnicama, omogućiti potpuno nove načine uronjivih i interaktivnih iskustava za učenje i rekreaciju niti ubrzati otkrića u znanosti o materijalima i medicini.

Filozof Wittgenstein jednom je napisao: „Granice moga jezika znače granice moga svijeta.” Ja nisam filozof. Ali znam barem to da za umjetnu inteligenciju postoji više od samo riječi. Prostorna inteligencija predstavlja granicu izvan jezika – sposobnost koja povezuje maštu, percepciju i djelovanje te otvara mogućnosti da strojevi uistinu obogate ljudski život, od zdravstva do kreativnosti, od znanstvenih otkrića do svakodnevne pomoći.

Sljedeće desetljeće umjetne inteligencije: izgradnja istinski prostorno inteligentnih strojeva

Dakle, kako da izgradimo prostorno inteligentnu umjetnu inteligenciju? Koji je put do modela sposobnih za rasuđivanje s Eratostenovom vizijom, inženjerstvo s preciznošću industrijskoga dizajnera, stvaranje s maštom pripovjedača te interakciju sa svojom okolinom tečnošću djelatnika hitne pomoći?

Izgradnja prostorno inteligentne umjetne inteligencije zahtijeva nešto još ambicioznije od velikih jezičnih modela: **modele svijeta**, novu vrstu generativnih modela čije su sposobnosti razumijevanja, rasuđivanja, stvaranja i interakcije sa semantički, fizički, geometrijski i dinamički složenim svjetovima – virtualnim ili stvarnim – daleko izvan dosega današnjih VJM-ova. To je područje u povoju, a trenutačne se metode kreću od apstraktnih modela rasuđivanja do sustava za generiranje videa. World Labs osnovan je početkom 2024. upravo na tom uvjerenju: da se temeljni pristupi još uvijek uspostavljaju, čime to postaje odlučujući izazov sljedećega desetljeća.

U tom novome području najvažnije je uspostaviti načela koja vode razvoj. Za prostornu inteligenciju modele svijeta određujem kroz tri bitne sposobnosti:

  1. Generativnost: modeli svijeta mogu generirati svjetove s perceptivnom, geometrijskom i fizičkom dosljednošću
    Modeli svijeta koji otključavaju prostorno razumijevanje i rasuđivanje također moraju moći generirati vlastite simulirane svjetove. Moraju biti sposobni stvarati beskrajno raznolike i različite simulirane svjetove koji slijede semantičke ili perceptivne upute – a da pritom ostanu geometrijski, fizički i dinamički dosljedni – bilo da predstavljaju stvarne ili virtualne prostore. Istraživačka zajednica aktivno istražuje trebaju li ti svjetovi biti predstavljeni implicitno ili eksplicitno u terminima svojih urođenih geometrijskih struktura. Nadalje, uz moćne latentne reprezentacije, vjerujem da izlazi univerzalnoga modela svijeta također moraju dopustiti generiranje eksplicitnoga, opažljivoga stanja svjetova za mnoge različite slučajeve uporabe. Posebice, njegovo razumijevanje sadašnjosti mora biti usklađeno s njegovom prošlošću; s prethodnim stanjima svijeta koji su doveli do sadašnjega.
  2. Multimodalnost: modeli svijeta su po svojoj prirodi multimodalni
    Baš kao što to čine životinje i ljudi, model svijeta trebao bi moći obraditi ulaze – poznate kao „zahjevi” u području generativne umjetne inteligencije – u najrazličitijim oblicima. S obzirom na djelomične informacije – bilo da se radi o slikama, videozapisima, kartama dubine, tekstualnim uputama, gestama ili radnjama – modeli svijeta trebali bi predvidjeti ili generirati stanja svijeta što je potpunije moguće. To zahtijeva obradu vizualnih ulaza vjernošću stvarnoga vida uz podjednako lako tumačenje semantičkih uputa. To omogućuje i agentima i ljudima da s modelom komuniciraju o svijetu putem raznolikih ulaza i da zauzvrat primaju raznolike izlaze.
  3. Interaktivnost: modeli svijeta mogu dati sljedeća stanja na temelju ulaznih radnji
    Napokon, ako su radnje i/ili ciljevi dio zahjeva modelu svijeta, njegovi izlazi moraju uključivati sljedeće stanje svijeta, bilo implicitno ili eksplicitno predstavljeno. Kada je dana samo radnja sa ciljnim stanjem ili bez njega kao ulaz, model svijeta trebao bi proizvesti izlaz koji je usklađen s prethodnim stanjem svijeta, namjeravanim ciljnim stanjem (ako postoji) te njegovim semantičkim značenjima, fizičkim zakonima i dinamičkim ponašanjima. Kako prostorno inteligentni modeli svijeta postaju sve moćniji i robusniji u svojim sposobnostima rasuđivanja i stvaranja, moguće je zamisliti da bi u slučaju zadanoga cilja sami modeli svijeta mogli predvidjeti ne samo sljedeće stanje svijeta, već i sljedeće radnje na temelju novoga stanja.

Opseg toga izazova nadmašuje sve s čime se umjetna inteligencija dosad susrela.

Dok je jezik čisto generativna pojava ljudske spoznaje, svjetovi se pokoravaju mnogo složenijim pravilima. Ovdje na Zemlji, primjerice, gravitacija upravlja gibanjem, atomske strukture određuju kako svjetlost proizvodi boje i svjetlinu, a bezbrojni fizički zakoni ograničavaju svaku interakciju. Čak su i najmaštovitiji, najkreativniji svjetovi sastavljeni od prostornih objekata i agenata koji se pokoravaju fizičkim zakonima i dinamičkim ponašanjima koja ih određuju. Usklađivanje svega toga dosljedno – semantičkoga, geometrijskoga, dinamičkoga i fizičkoga – zahtijeva potpuno nove pristupe. Dimenzionalnost predstavljanja svijeta znatno je složenija od one jednodimenzionalnoga, slijednoga signala poput jezika. Postizanje modela svijeta koji će pružiti vrstu univerzalnih sposobnosti kakvima mi, ljudi, uživamo zahtijevat će prevladavanje nekoliko teških tehničkih prepreka. U World Labsu naši su istraživački timovi posvećeni postizanju temeljnoga napretka prema tom cilju.

Evo nekoliko primjera naših trenutačnih istraživačkih tema:

  1. Nova, univerzalna funkcija zadaće za treniranje: određivanje univerzalne funkcije zadaće koja je jednostavna i elegantna poput predviđanja sljedećega simbola u VJM-ovima dugo je bio središnji cilj istraživanja modela svijeta. Složenost i njihovih ulaznih i izlaznih prostora takvu funkciju čini samom po sebi težom za formulirati. No iako ostaje još mnogo toga za istražiti, ta ciljna funkcija i pripadajuće reprezentacije moraju odražavati zakone geometrije i fizike, poštujući temeljnu prirodu modela svijeta kao utemeljenih reprezentacija i mašte i stvarnosti.
  2. Podatci za treniranje velikih razmjera: treniranje modela svijeta zahtijeva daleko složenije podatke od sređivanja teksta. Objavljujuća je vijest da masovni izvori podataka već postoje. Zbirke slika i videa na mrežnoj razmjeri predstavljaju obilne, dostupne materijale za treniranje – izazov leži u razvoju algoritama koji iz tih dvodimenzionalnih signala temeljenih na slikama ili video-kadrovima (tj. RGB) mogu izvući dublje prostorne informacije. Istraživanje tijekom protekloga desetljeća pokazalo je snagu zakona skaliranja koji povezuju obujam podataka i veličinu modela u jezičnim modelima; ključno otkriće za modele svijeta jest izgradnja arhitektura koje mogu iskoristiti postojeće vizualne podatke na usporedivoj razmjeri. Osim toga, ne bih podcijenio snagu visokokvalitetnih sintetičkih podataka i dodatnih modaliteta poput dubine i taktilnih informacija. Oni nadopunjuju podatke na mrežnoj razmjeri u ključnim koracima procesa treniranja. No put naprijed ovisi o boljim senzorskim sustavima, robusnijim algoritmima za izdvajanje signala i daleko moćnijim metodama neuronske simulacije.
  3. Nova arhitektura modela i reprezentacijsko učenje: istraživanje modela svijeta neizbježno će potaknuti napredak u arhitekturi modela i algoritmima učenja, osobito izvan sadašnjih MVJM i video-difuzijskih paradigmi. Obje obično podjeljuju podatke u jednodimenzionalne ili dvodimenzionalne nizove, što jednostavne prostorne zadaće čini nepotrebno teškima – poput brojanja jedinstvenih stolica u kratkome videu ili pamćenja kako je soba izgledala prije sat vremena. Mogu pomoći alternativne arhitekture, poput metoda osviještenih o 3D ili 4D za podjelu u simbole, kontekst i pamćenje. Primjerice, u World Labsu naš je nedavni rad na modelu za generiranje u stvarnome vremenu temeljenom na kadrovima pod nazivom RTFM pokazao tu promjenu; on koristi prostorno utemeljene kadrove kao oblik prostornoga pamćenja kako bi postigao učinkovito generiranje u stvarnome vremenu uz istodobno održavanje postojanosti u generiranome svijetu.

Jasno je da se još uvijek suočavamo s teškim izazovima prije nego što u potpunosti možemo otključati prostornu inteligenciju modeliranjem svijeta. To istraživanje nije samo teorijska vježba. Ono je središnji motor za novu klasu kreativnih alata i alata za produktivnost. A napredak u World Labsu ohrabruje. Nedavno smo ograničenomu broju korisnika pružili uvid u Marble, prvi model svijeta ikad koji se može potaknuti multimodalnim ulazima kako bi generirao i održavao dosljedna trodimenzionalna okruženja za korisnike i pripovjedače da ih istražuju, s njima komuniciraju i nadalje izgrađuju u svome kreativnom tijeku rada. I naporno radimo na tome da ga uskoro učinimo dostupnim javnosti!

Marble je samo naš prvi korak u stvaranju istinski prostorno inteligentnoga modela svijeta. Kako napredak ubrzava, istraživači, inženjeri, korisnici i poslovni čelnici počinju prepoznavati njegov izvanredni potencijal. Sljedeća će generacija modela svijeta omogućiti strojevima da postignu prostornu inteligenciju na potpuno novoj razini – postignuće koje će otključati bitne sposobnosti koje su u današnjim sustavima umjetne inteligencije još uvelike odsutne.

Korištenje modela svijeta za izgradnju boljega svijeta za ljude

Važno je što pokreće razvoj umjetne inteligencije. Kao jedan od znanstvenika koji su pomogli da započne era moderne umjetne inteligencije, moja je motivacija uvijek bila jasna: umjetna inteligencija mora proširiti ljudske sposobnosti, a ne zamijeniti ih. Godinama radim na usklađivanju razvoja, primjene i upravljanja umjetnom inteligencijom s ljudskim potrebama. Ekstremni narativi tehnoutopije i apokalipse ovih su dana obilni, no ja i dalje zastupam pragmatičniji stav: umjetnu inteligenciju razvijaju ljudi, koriste je ljudi i njome upravljaju ljudi. Uvijek mora poštovati sposobnost i dostojanstvo ljudi. Njena čarolija leži u proširenju naših mogućnosti; čini nas kreativnijima, povezanijima, produktivnijima i ispunjenijima. Prostorna inteligencija predstavlja tu viziju – umjetnu inteligenciju koja osnažuje ljudske stvaratelje, skrbnike, znanstvenike i sanjare da postignu ono što je nekad bilo nemoguće. To uvjerenje pokreće moju predanost prostornoj inteligenciji kao sljedećoj velikoj granici umjetne inteligencije.

Primjene prostorne inteligencije protežu se na različite vremenske horizonte. Kreativni alati pojavljuju se već sada – World Labsov Marble već stavlja te sposobnosti u ruke stvaratelja i pripovjedača. Robotika predstavlja ambiciozan srednjoročni horizont dok usavršavamo vezu između percepcije i djelovanja. Najpreobrazbenije će znanstvene primjene potrajati dulje, no obećavaju dubok utjecaj na ljudski procvat.

Na svim tim vremenskim horizontima nekoliko se područja ističe po svom potencijalu da preoblikuju ljudske sposobnosti. Trebat će značajan zajednički napor, više nego što ga može uložiti pojedinačan tim ili tvrtka. Zahtijevat će sudjelovanje cijeloga ekosustava umjetne inteligencije – istraživača, inovatora, poduzetnika, tvrtki, pa čak i kreatora politike – koji će raditi prema zajedničkoj viziji. No tu je viziju vrijedno slijediti. Evo što ta budućnost nosi:

Kreativnost: supernapajanje pripovijedanja i uronjivih iskustava

„Kreativnost je inteligencija koja se zabavlja.” To je jedan od omiljenih citata moga osobnoga heroja Alberta Einsteina. Mnogo prije pisanoga jezika ljudi su pričali priče – slikali ih po zidovima pećina, prenosili kroz generacije, gradili cijele kulture na zajedničkim narativima. Priče su način na koji dajemo smisao svijetu, povezujemo se preko udaljenosti i vremena, istražujemo što znači biti čovjek i, što je najvažnije, pronalazimo smisao u životu i ljubavi u sebi samima. Danas prostorna inteligencija ima potencijal preobraziti način na koji stvaramo i doživljavamo pripovijesti na načine koji odaju počast njihovoj temeljnoj važnosti te proširuju njihov utjecaj od zabave do obrazovanja, od dizajna do izgradnje.

World Labsova platforma Marble stavljat će neviđene prostorne mogućnosti i uredničku upravljivost u ruke filmskih stvaratelja, dizajnera igara, arhitekata i pripovjedača svih vrsta, dopuštajući im da brzo stvaraju i ponavljaju cijele trodimenzionalne svjetove koji se mogu istraživati, bez opterećenja uobičajenoga trodimenzionalnoga dizajnerskoga softvera. Kreativni čin ostaje jednako vitalan i ljudski kao i uvijek; alati umjetne inteligencije jednostavno pojačavaju i ubrzavaju ono što stvaratelji mogu postići. To uključuje:

  1. Iskustva pripovijedanja u novim dimenzijama: filmski stvaratelji i dizajneri igara koriste Marble kako bi dozvali cijele svjetove bez ograničenja proračuna ili zemljopisa, istražujući raznolikost scena i perspektiva koje bi u tradicionalnome proizvodnom procesu bile neprohodne za istraživanje. Dok se granice između različitih oblika medija i zabave brišu, približavamo se bitno novim vrstama interaktivnih iskustava koja stapaju umjetnost, simulaciju i igru – personaliziranim svjetovima u kojima bilo tko, a ne samo studiji, može stvoriti i nastaniti svoje vlastite priče. S usponom novijih, bržih načina pretvaranja koncepata i sinopsisa u potpuna iskustva, pripovijesti više neće biti vezane za jedan medij; stvaratelji će moći slobodno graditi svjetove sa zajedničkim nitima kroz bezbrojne površine i platforme.
  2. Prostorne pripovijesti kroz dizajn: u biti, svaki proizvedeni predmet ili izgrađeni prostor mora biti dizajniran u virtualnome 3D prije njegove fizičke izrade. Taj je proces vrlo ponavljajući i skup u smislu i vremena i novca. S prostorno inteligentnim modelima na raspolaganju, arhitekti mogu brzo vizualizirati strukture prije nego što ulože mjesece u nacrte, prohodati kroz prostore koji još ne postoje – u biti pripovijedajući priče o tome kako bismo mogli živjeti, raditi i okupljati se. Industrijski i modni dizajneri mogu maštu trenutačno pretvoriti u oblik, istražujući kako predmeti stupaju u interakciju s ljudskim tijelima i prostorima.
  3. Nova uronjiva i interaktivna iskustva: samo iskustvo jedan je od najdubljih načina na koji mi kao vrsta stvaramo smisao. Tijekom cijele ljudske povijesti postojao je jedan jedinstveni trodimenzionalni svijet: fizički svijet koji svi dijelimo. Tek smo posljednjih desetljeća, kroz igranje igara i ranu virtualnu stvarnost (VS), počeli naslućivati što znači dijeliti alternativne svjetove vlastite izrade. Sada prostorna inteligencija u kombinaciji s novim oblicima, poput uređaja za VS i proširenu stvarnost (PS) te uronjivih zaslosa, uzdiže ta iskustva na neviđene načine. Približavamo se budućnosti u kojoj će ulazak u potpuno ostvarene višedimenzionalne svjetove biti prirodan poput otvaranja knjige. Prostorna inteligencija čini izgradnju svijeta dostupnom ne samo studijima s profesionalnim produkcijskim timovima, već i pojedinačnim stvarateljima, nastavnicima i svima koji imaju viziju za dijeljenje.

Robotika: utjelovljena inteligencija u djelovanju

Životinje, od insekata do ljudi, ovise o prostornoj inteligenciji da bi razumjele svoje svjetove, snalazile se u njima i s njima komunicirale. S robotima neće biti drugačije. Prostorno svjesni strojevi san su tog područja od samih njegovih začetaka, uključujući i moj vlastiti rad sa studentima i suradnicima u mojem istraživačkom laboratoriju na Stanfordu. Zato me i mogućnost njihova ostvarenja pomoću vrste modela koje World Labs gradi toliko oduševljava.

  1. Mjerilo robotskoga učenja pomoću modela svijeta: napredak robotskoga učenja ovisi o mjerljivom rješenju održivih podataka za treniranje. S obzirom na goleme prostore mogućih stanja koje roboti moraju naučiti razumjeti, rasuđivati o njima, planirati i s njima komunicirati, mnogi su pretpostavili da je za istinsko stvaranje univerzalnih robota potrebna kombinacija mrežnih podataka, sintetičke simulacije i hvatanja ljudskih demonstracija u stvarnome svijetu. No za razliku od jezičnih modela, podaci za treniranje danas su oskudica za robotska istraživanja. Modeli svijeta odlučujuću će ulogu imati u tome. Kako povećavaju svoju perceptivnu vjernost i računalnu učinkovitost, izlazi modela svijeta mogu brzo zatvoriti jaz između simulacije i stvarnosti. To će zauzvrat pomoći u treniranju robota putem simulacija bezbrojnih stanja, interakcija i okruženja.
  2. Pratitelji i suradnici: roboti kao ljudski suradnici, bilo da pomažu znanstvenicima za laboratorijskim stolom ili asistiraju starijim osobama koje žive samostalno, mogu proširiti onaj dio radne snage koji je u očajnoj potrebi za više radnika i produktivnosti. No za to je potrebna prostorna inteligencija koja opaža, rasuđuje, planira i djeluje – i, što je najvažnije, pritom ostaje empatijski usklađena s ljudskim ciljevima i ponašanjima. Primjerice, laboratorijski robot mogao bi rukovati instrumentima kako bi se znanstvenik mogao usredotočiti na zadaće koje zahtijevaju spretnost ili rasuđivanje, dok bi kućni pomoćnik mogao pomoći starijoj osobi pri kuhanju bez umanjivanja njezina uživanja ili samostalnosti. Istinski prostorno inteligentni modeli svijeta koji mogu predvidjeti sljedeće stanje ili čak moguće radnje usklađene s tim očekivanjem ključni su za postizanje tog cilja.
  3. Širenje oblika utjelovljenja: humanoidni roboti imaju svoju ulogu u svijetu koji smo izgradili za sebe. No puni će se doprinos inovacija ostvariti iz daleko raznolikijega raspona dizajna: nanorobota koji isporučuju lijekove, mekih robota koji se probijaju kroz uske prostore i strojeva izgrađenih za duboko more ili svemir. Bez obzira na njihov oblik, budući modeli prostorne inteligencije morat će objediniti i okruženja u kojima ti roboti obitavaju i njihovo vlastito utjelovljeno opažanje i kretanje. No ključni je izazov u razvoju tih robota nedostatak podataka za treniranje u onim širokim raznolikostima oblika utjelovljenja. Modeli svijeta odlučujuću će ulogu imati u simulacijskim podatcima, okruženjima za treniranje i zadaćama za mjerenje učinka u tim naporima.

Duži horizont: znanost, zdravstvo i obrazovanje

Uz kreativne i robotske primjene, dubok će se utjecaj prostorne inteligencije proširiti i na područja u kojima umjetna inteligencija može proširiti ljudske sposobnosti na načine koji spašavaju živote i ubrzavaju otkrića. Ispod ističem tri područja primjene koja mogu biti duboko preobrazbena, iako je podrazumijevano da su slučajevi uporabe prostorne inteligencije uistinu široki i obuhvaćaju mnogo više industrija.

U znanstvenome istraživanju prostorno inteligentni sustavi mogu simulirati pokuse, paralelno testirati hipoteze i istraživati okruženja nedostupna ljudima – od dubokih oceana do udaljenih planeta. Ta tehnologija može preobraziti računalno modeliranje u područjima poput klimatologije i istraživanja materijala. Integrirajući višedimenzionalnu simulaciju s prikupljanjem podataka iz stvarnoga svijeta, ti alati mogu sniziti računalne prepreke i proširiti ono što svaki laboratorij može promatrati i razumjeti.

U zdravstvu prostorna će inteligencija preoblikovati sve od laboratorija do samoga kreveta. Na Stanfordu su moji studenti i suradnici proveli mnogo godina radeći s bolnicama, domovima za starije i nemoćne i pacijentima u kućnom okruženju. To iskustvo uvjerilo me u preobrazbeni potencijal prostorne inteligencije na tom području. Umjetna inteligencija može ubrzati otkrivanje lijekova modeliranjem molekularnih interakcija u više dimenzija, poboljšati dijagnostiku pomažući radiolozima da uoče obrasce u medicinskoj snimci te omogućiti sustave neposrednoga praćenja koji pružaju potporu pacijentima i njegovateljima bez zamjene ljudske povezanosti koja je potrebna za ozdravljenje, a da i ne spominjemo potencijal robota u pomaganju našim zdravstvenim djelatnicima i pacijentima u mnogim različitim okruženjima.

U obrazovanju prostorna inteligencija može omogućiti uronjivo učenje koje apstraktne ili složene pojmove čini opipljivim te stvoriti ponavljajuća iskustva koja su toliko bitna za način na koji su naši mozgovi i tijela „ožičeni” za učenje. U doba umjetne inteligencije potreba za bržim i učinkovitijim učenjem i prekvalificiranjem osobito je važna i za školarce i za odrasle. Učenici mogu istraživati stanične mehanizme ili prohodati kroz povijesne događaje u više dimenzija. Nastavnici dobivaju alate za personaliziranu nastavu kroz interaktivna okruženja. Stručnjaci – od kirurga do inženjera – mogu sigurno vježbati složene vještine u realističnim simulacijama.

Na svim tim područjima mogućnosti su bezgranične, no cilj ostaje nepromijenjen: umjetna inteligencija koja proširuje ljudsku stručnost, ubrzava ljudska otkrića i pojačava ljudsku skrb – ne zamjenjujući prosudbu, kreativnost i empatiju koje su središnje za čovječanstvo.

Umjesto zaključka

Prošlo je desetljeće u kojem je umjetna inteligencija postala globalna pojava i prekretnica u tehnologiji, gospodarstvu, pa čak i geopolitici. No kao istraživač, nastavnik, a sada i poduzetnik, još uvijek me najviše nadahnjuje duh iza Turingova pitanja staroga 75 godina. Još uvijek dijelim njegov osjećaj čuđenja. To je ono što me svaki dan pokreće pred izazovom prostorne inteligencije.

Po prvi put u povijesti na pomolu smo izgradnje strojeva toliko usklađenih s fizičkim svijetom da se na njih možemo osloniti kao na istinske partnere u najvećim izazovima s kojima se suočavamo. Bilo da ubrzavamo način na koji razumijemo bolesti u laboratoriju, do temelja mijenjamo način na koji pričamo priče ili pružamo potporu u našim najranjivijim trenucima zbog bolesti, ozljede ili starosti, na rubu smo tehnologije koja uzdiže one aspekte života do kojih nam je najviše stalo. To je vizija dubljega, bogatijega, osnaženijega života.

Gotovo pola milijarde godina nakon što je priroda oslobodila prve tračke prostorne inteligencije u predačkim životinjama, imamo sreću naći se među generacijom tehnologa koji će uskoro možda obdariti strojeve istom sposobnošću – i imamo privilegiju iskoristiti te sposobnosti za dobrobit ljudi posvuda. Naši snovi o istinski inteligentnim strojevima neće biti potpuni bez prostorne inteligencije.

Autor: Dr. Fei-Fei Li

Generativni modelikreativnostModeli svijetaProstorna inteligencijaumjetna inteligencija
PRAVILA KOMENTIRANJA: Vaši komentari ne smiju biti kritika drugog komentatora, nego vaše mišljenje, prijedlog ili ideja o temi. Nema rasprave tko je u pravu. Čitatelji neka zaključe što je istina. Cilj nije polemika, nego napredak svih Logičara. Inspiracija, umjesto uvjeravanja. Ako nemate ideju, ne komentirajte. Ne budete li respektirali pravila, biti će te blokirani.
Pretplatiti se
Obavijesti o
10 Komentari
Najstariji
Najnoviji Najviše komentiran
Inline povratne informacije
Pogledaj sve komentare
Celzija
19 dana prije

Nikoli ne bo povedala resnice, ki je, da sta Dump in Putler pajdaša in zločinca. Aidarous al-Zubaidi je iz Jemna pobegnil kot mala kurba. Madura je Dump ujel kot bi dojenčku ukradel dudo. Putler je 14 let načrtno pobijal Arabce v Siriji in zdaj v imenu svojega židovskega boga Saturna načrtno pobija Ukrajince in Ruse. Mi Slovenci in vi Hrvati tudi ste dovolj pametni, da bi oba tako Putlerja kot tudi Zelenskega obesili v Kijevu in Moskvi. Nikoli ne bi dovolili, da zločinski sin stare židovske prostitutke Shelomove ubije toliko slovanov.

pirandelo
19 dana prije

Kaže žutokosi piščunac kako su briljantno i bravurozno za samo 47 sekundi njegovi komankosi venazuelanskoga konduktera autobusa izvukli iz piđame doveli do vrata (blokiranog) bunkera da ga uslikaju kao upišanka i da za samo manje od minute poubijali 40+ kubanskih bubašva koji su čtitili predsednika. I to sve zahvaljujući što su USuper vojničine imale iplementirane u glavu Arteficijalnu Inteligenciju (dakle dokaz(ano) od strane uvaženog dr-prof općenatodne obrane „sveučilišta dr sv.Franjo Tuđinski“ dakle in facti da UI-AI inteligentno misli !!!

Koke
19 dana prije

Naši snovi o istinski inteligentnim strojevima ?!

Biti-ili-ne-biti
19 dana prije

Svaka čast umjetnoj inteligenciji i njihovim robotima Terminatorima.
Ono što je bitno je da se UI već više godina može usmjeriti da na tržištu radi za nas i konkretno pravi novce, a brbljanje s UI kroz nekakva pitanja i odgovore je zabava za malu djecu.

Štokrla
19 dana prije

Evo!
Ravna zemlja ne stoji na slonovima, kornjačama ili… šta ja znam…na nekom Q.
Ako lažem ja, ne laže slika…u ruci robota.

habanero
19 dana prije

Logično, većina ilustracija vam je AI. Prije AI
nije vam padalo na pamet toliko koristiti usluge ilustratora da poprati neki vaš text. Ne glumite sad pravovjerne u svijetu u kojem AI poput simulakrumu u prvoj fazi usisava sve ljudske vrijednosti. Stvara se Zemlja 2.0 i novi realitet. U jednom momentu će se analogni i digitalni čovjek razdvojiti. Tada će AI biti u posljednjoj trećoj fazi simulakruma.

Dumandi
19 dana prije

Razlika između pomagala, koje je stvoreno da bude pomagalo i normalnog je u tome, lijenost i glupost ljudi je neizmjerna, eeeeee, znači nikada stroj to ne može postići, stroj je efikasan, ne zna za lijenost, ne zna za prazan hod, tu je vic i tu sve nastaje. To je inteligencija i to je kreativnost.
AI je mudo Marjanovo

© 2024 – Portal Logično

POVEZANE VIJESTI