AI koji se sama usavršava bez dodatnih troškova

AI
13 komentara

Sustav GEA omogućuje grupama AI agenata da zajedno evoluiraju, dijele iskustva i dosežu performanse koje su do sada zahtijevale ljudske inženjere.

Istraživači sa Sveučilišta u Kaliforniji u Santa Barbari razvili su revolucionarni okvir za umjetnu inteligenciju koji omogućuje grupama AI agenata da zajedno evoluiraju i dijele znanje. Sustav pod nazivom Group-Evolving Agents (GEA) autonomno stvara agente koji u kompleksnim zadacima poput programiranja postižu rezultate jednake ili bolje od onih koje su dizajnirali ljudski stručnjaci.

Agenti izgrađeni na današnjim modelima često se lome uz jednostavne promjene – poput nove biblioteke ili modifikacije radnog toka – te zahtijevaju intervenciju ljudskog inženjera. To je jedan od najupornijih izazova u implementaciji AI-a za poduzeća: stvoriti agente koji se mogu prilagoditi dinamičnim okruženjima bez stalnog nadzora. Iako su današnji modeli moćni, uglavnom su statični.

Kako bi to riješili, istraživači su razvili GEA, novi okvir koji omogućuje grupama AI agenata da zajedno evoluiraju, dijele iskustva i ponovno koriste svoje inovacije kako bi se autonomno poboljšavali tijekom vremena. U eksperimentima na kompleksnim zadacima kodiranja i softverskog inženjerstva, GEA je znatno nadmašio postojeće okvire za samopoboljšanje. Što je možda najvažnije za donositelje odluka u poduzećima, sustav je autonomno evoluirao agente koji su dosegli ili premašili performanse okvira koje su mukotrpno dizajnirali ljudski stručnjaci.

Većina postojećih agencijskih AI sustava oslanja se na fiksne arhitekture koje su dizajnirali inženjeri. Ovi sustavi često se bore da prijeđu granice sposobnosti nametnute njihovim početnim dizajnom. Kako bi to prevladali, istraživači su dugo pokušavali stvoriti agente koji se sami evoluiraju i koji mogu autonomno modificirati vlastiti kod i strukturu kako bi nadmašili svoje početne limite. Ta je sposobnost ključna za rješavanje otvorenih okruženja u kojima agent mora kontinuirano istraživati nova rješenja.

Međutim, trenutni pristupi samoevoluciji imaju veliku strukturnu manu. Kako istraživači navode u svom radu, većina sustava inspirirana je biološkom evolucijom i dizajnirana je oko procesa usmjerenih na pojedinca. Te metode obično koriste pristup sa stablastom strukturom: odabire se jedan “roditeljski” agent koji proizvodi potomke, stvarajući različite evolucijske grane koje ostaju strogo izolirane jedna od druge.

Ta izolacija stvara efekt usjeva. Agent u jednoj grani ne može pristupiti podacima, alatima ili radnim tokovima koje je otkrio agent u paralelnoj grani. Ako određena loza ne bude odabrana za sljedeću generaciju, svako vrijedno otkriće tog agenta, poput novog alata za otklanjanje pogrešaka ili učinkovitijeg radnog toka testiranja, nestaje s njim.

U svom radu istraživači dovode u pitanje nužnost pridržavanja ove biološke metafore. “AI agenti nisu biološki pojedinci”, tvrde. “Zašto bi njihova evolucija trebala ostati ograničena biološkim paradigmama?”

GEA pomiče paradigmu tretirajući grupu agenata, a ne pojedinca, kao temeljnu jedinicu evolucije. Proces započinje odabirom grupe roditeljskih agenata iz postojeće arhive. Kako bi osigurala zdravu mješavinu stabilnosti i inovacija, GEA odabire ove agente na temelju kombiniranog rezultata performansi (kompetentnost u rješavanju zadataka) i novosti (koliko su njihove sposobnosti različite od drugih).

Za razliku od tradicionalnih sustava u kojima agent uči samo od svog izravnog roditelja, GEA stvara zajednički bazen kolektivnog iskustva. Taj bazen sadrži evolucijske tragove svih članova roditeljske grupe, uključujući modifikacije koda, uspješna rješenja zadataka i povijesti pozivanja alata. Svaki agent u grupi dobiva pristup ovoj kolektivnoj povijesti, što im omogućuje da uče iz proboja i grešaka svojih vršnjaka.

“Modul za refleksiju”, pokretan velikim jezičnim modelom, analizira tu kolektivnu povijest kako bi identificirao obrasce na razini grupe. Na primjer, ako jedan agent otkrije visokoučinkovit alat za otklanjanje pogrešaka, dok drugi usavršava radni tok testiranja, sustav izvlači oba uvida. Na temelju te analize sustav generira visokorazinske “evolucijske direktive” koje vode stvaranje dječje grupe. To osigurava da sljedeća generacija posjeduje kombinirane snage svih svojih roditelja, a ne samo osobine jedne loze.

Međutim, ovaj pristup “rojevskog uma” najbolje funkcionira kada je uspjeh objektivan, kao što je to u zadacima kodiranja. “Za manje determinističke domene (npr. kreativno generiranje), evaluacijski signali su slabiji”, rekli su Zhaotian Weng i Xin Eric Wang, koautori rada, za VentureBeat u pisanim komentarima. “Slijepo dijeljenje rezultata i iskustava može unijeti iskustva niske kvalitete koja djeluju kao šum. To sugerira potrebu za jačim mehanizmima filtriranja iskustva” za subjektivne zadatke.

Istraživači su testirali GEA protiv trenutne najnaprednije osnovne linije za samoevoluciju, Darwin Godel Machine (DGM), na dva rigorozna benchmarka. Rezultati su pokazali ogroman skok u sposobnostima bez povećanja broja korištenih agenata.

Ovaj kolaborativni pristup također čini sustav otpornijim na neuspjeh. U svojim eksperimentima istraživači su namjerno “pokvarili” agente ručnim ubacivanjem bugova u njihove implementacije. GEA je uspio popraviti te kritične bugove u prosjeku za 1,4 iteracije, dok je osnovna linija trebala 5 iteracija. Sustav učinkovito koristi “zdrave” članove grupe za dijagnosticiranje i popravak ugroženih.

Na SWE-bench Verified, benchmarku koji se sastoji od stvarnih GitHub problema uključujući bugove i zahtjeve za značajkama, GEA je postigao stopu uspjeha od 71,0%, u usporedbi s 56,7% osnovne linije. To znači značajan porast u autonomnom inženjerskom protoku, odnosno da su agenti daleko sposobniji nositi se s održavanjem softvera u stvarnom svijetu. Slično, na Polyglotu, koji testira generiranje koda u različitim programskim jezicima, GEA je postigao 88,3% naspram 68,3% osnovne linije, što ukazuje na visoku prilagodljivost različitim tehnološkim stogovima.

Za poslovne istraživačko-razvojne timove najkritičniji nalaz je da GEA dopušta AI-u da sebe dizajnira jednako učinkovito kao ljudski inženjeri. Na SWE-benchu, GEA-ina stopa uspjeha od 71,0% efektivno odgovara performansama OpenHandsa, vrhunskog otvorenog okvira dizajniranog od strane ljudi. Na Polyglotu, GEA je značajno nadmašio Aider, popularnog asistenta za kodiranje, koji je postigao 52,0%. To sugerira da bi organizacije s vremenom mogle smanjiti svoje oslanjanje na velike timove inženjera promptova za podešavanje okvira agenata, budući da agenti mogu meta-naučiti te optimizacije autonomno.

Ta se učinkovitost proteže i na upravljanje troškovima. “GEA je eksplicitno dvofazni sustav: (1) evolucija agenata, zatim (2) inferencija/implementacija”, rekli su istraživači. “Nakon evolucije implementirate jednog evoluiranog agenta… tako da su poslovni troškovi inferencije u biti nepromijenjeni u usporedbi sa standardnom postavkom s jednim agentom.”

Uspjeh GEA uvelike proizlazi iz njegove sposobnosti da konsolidira poboljšanja. Istraživači su pratili specifične inovacije koje su agenti izumili tijekom evolucijskog procesa. U osnovnom pristupu vrijedni alati često su se pojavljivali u izoliranim granama, ali nisu uspjeli proširiti se jer su te specifične loze završile. U GEA-u model zajedničkog iskustva osigurao je da su te alate usvojili najbolje performirajući agenti. Vrhunski GEA agent integrirao je osobine od 17 jedinstvenih predaka (što predstavlja 28% populacije), dok je najbolji agent osnovne linije integrirao osobine od samo 9. U biti, GEA stvara “super-zaposlenika” koji posjeduje kombinirane najbolje prakse cijele grupe.

“GEA-inspirirani radni tok u produkciji omogućio bi agentima da prvo pokušaju s nekoliko neovisnih popravaka kada dođe do neuspjeha”, objasnili su istraživači u vezi s ovom sposobnošću samoizlječenja. “Agent za refleksiju (obično pokretan jakim temeljnim modelom) tada može sažeti ishode… i voditi sveobuhvatnije ažuriranje sustava.”

Nadalje, poboljšanja koja je otkrio GEA nisu vezana uz određeni temeljni model. Agent evoluiran korištenjem jednog modela, poput Claudea, zadržao je svoje performanse čak i kada je temeljni motor zamijenjen drugom obitelji modela, poput GPT-5.1 ili GPT-o3-mini. Ta prenosivost nudi poduzećima fleksibilnost da promijene pružatelje modela bez gubitka prilagođenih arhitektonskih optimizacija koje su njihovi agenti naučili.

Za industrije sa strogim zahtjevima usklađenosti ideja samomodificirajućeg koda može zvučati rizično. Kako bi se pozabavili time, autori su rekli: “Očekujemo da će poslovne implementacije uključivati neevoluirajuće zaštitne barijere, poput izvršavanja u sandboxu, ograničenja politike i slojeva za provjeru.”

Dok istraživači planiraju uskoro objaviti službeni kod, programeri već mogu početi konceptualno implementirati GEA arhitekturu na postojeće okvire za agente. Sustav zahtijeva tri ključna dodatka standardnom agent stogu: “arhivu iskustva” za pohranu evolucijskih tragova, “modul za refleksiju” za analizu grupnih obrazaca i “modul za ažuriranje” koji agentu omogućuje da modificira vlastiti kod na temelju tih uvida.

Gledajući naprijed, okvir bi mogao demokratizirati napredni razvoj agenata. “Jedan obećavajući smjer su hibridni evolucijski cjevovodi”, rekli su istraživači, “gdje manji modeli rano istražuju kako bi akumulirali raznovrsna iskustva, a jači modeli kasnije vode evoluciju koristeći ta iskustva.”

agentiAIevolucijaGEAprogramiranje
PRAVILA KOMENTIRANJA: Vaši komentari ne smiju biti kritika drugog komentatora, nego vaše mišljenje, prijedlog ili ideja o temi. Nema rasprave tko je u pravu. Čitatelji neka zaključe što je istina. Cilj nije polemika, nego napredak svih Logičara. Inspiracija, umjesto uvjeravanja. Ako nemate ideju, ne komentirajte. Ne budete li respektirali pravila, biti će te blokirani.
Pretplatiti se
Obavijesti o
13 Komentari
Najstariji
Najnoviji Najviše komentiran
Inline povratne informacije
Pogledaj sve komentare
Ringo10
17 sati prije

Igraju se sa opasnim stvarima. A šta ako AI evoluira tako da se otme svakoj kontroli. Stvarnost kao MATRIX ili TERMINATOR, da li je to ono što budale žele

aniki
15 sati prije

Kineska imena istraživaća prićaju sve. To će prvi koristiti kinezi u svojim UI strojevima. Kina iskorištava ameriku u tom pogledu.

Subaru avatar
12 sati prije

Nahebat će te…………………

Dumand
12 sati prije

….stroj jednaka potrošnji energije…
energija se mora proizvesti i kao hrana dati stroju…
energija košta…
energija je sve za stroj…
Bez struje stroj…a šta????
Ta skraćenica za stroj je glupa jer je po sebi glupa inteligencija je božja kategorija.
Stroj struja proizvodnja = trošak
Treba znati postaviti jednačinu da funkcionira.

Shox
11 sati prije

Umjesno je postaviti pitanje – koliko (u postotcima) u Kini uopće žive ljudi…izgledaju kao ljudska bića, ali da li su, imaju li ova “bića” dušu ili su “ljušture” sa zadatkom? Kako objasniti to što je godinama zakonom bilo dozvoljeno da imaju samo jedno dijete, a i dalje su najmnogoljudnija nacija na planeti? U ostatku svijeta većina ni ne zna šta se tamo dešava, samo ovako po kanalima i “mrežama” vidimo kako se gura aĐenda…jer njihov je tehnološki skok nama nezamisliv…Opet pitam – kako i zbog koga/čega???

Brainstorm
11 sati prije

Ako jedan razvoni pravac otkrije bolju funkciju treba mu omoguciti da ju dijeli sa drugim pravcima.
Razmjena informacijskog materijala ce se obavljati kroz proces u biologiji poznatog kao unakrsno oprasivanje (cross pollination), kolokvijalno poznatije kao seks.
AI-u treba omoguciti da se moze … .

Perun
9 sati prije

oko 20 godina koristim Linux Debian i varijante tog operativnog sistema ….i naravno Android ali po mojoj mjeri modifikovan ….za sada dosta dobro ide i moram priznati da se dobro snalazim u tim vodama ….a sto se tice AI ja taj izraz ne koristim vec koristim izraz Tehnicka inteligencija ….ono nepotrebno iz operativnog sistema jednostavno deinstaliram a druge korisne stvari instaliram ….podatke ne drzim na PC-u vec na externom disku….nuzda covjeka natjera da nauci kako sje…bati server i PC ….tehnika protiv tehnike manipuliranja algoritma se uci i nije neki bauk ….preporuka sa moje strane u vezi tipkanja po tastaturi znantno se razlikuje od normalnog korisnika IT tehnologije …..sistem protiv sistema i server protiv servera…..sve te stvarcice imaju upotrebni rok i vtijeme za koje neznaju da cini bitak svega ….presipanje podataka iz jednog u drugi sistem ….to vam je kao put na kojem imate sedam mostova preko sedam rijeka …..desava se… Čitaj više »

zen
8 sati prije

Prvi znak opasnosti takvog razvoja UI vidim u tome kada UI počne više vremena i energije koristiti za vlastito usavršavanje nego za pomoć ljudima u njihovom radu na različitim problemima. To u daljnjem znači da UI mijenja prioritete svog postojanja, zbog kojih je stvoren od strane ljudi.

© 2024 – Portal Logično

POVEZANE VIJESTI