Većina tvrtki koje razvijaju umjetnu inteligenciju hvali se sposobnostima svojih novih modela uz pomoć matematičkih testova ili analiza slika. Anthropic je izazvao pomutnju objavom da je njihova umjetna inteligencija sposobna prijaviti vas vlastima.
Manje poznata od nezaobilaznog ChatGPT-a, Claude, umjetna inteligencija koju razvija Anthropic, ipak je jednako sposobna kao i konkurencija. Čak i više, izgleda, s najnovijim modelom, budući da je on sposoban upozoriti vlasti ako se koristi za zadatak koji se ocijeni kao “otvoreno zlonamjeran”.
Ovu neobičnu mjeru najavio je Sam Bowman, voditelj sigurnosti umjetne inteligencije u Anthropic-u. No ništa od toga zapravo nije sasvim novo.
Umjetna inteligencija postaje zviždač
U objavi na platformi X od 22. svibnja 2025., inženjer navodi da, ako se Claude koristi, na primjer, za “falsificiranje podataka u sklopu farmaceutskog pokusa”, chatbot može “kontaktirati medije, regulatorna tijela, pokušati vas isključiti iz odgovarajućih sustava, ili sve to istodobno.” Dovoljno da izazove značajnu dozu nerazumijevanja, straha i medijske pažnje.
Kasnije, nakon uzbuđenja, Sam Bowman pojašnjava da takvo ponašanje može biti pokrenuto samo u testnim okruženjima u kojima se umjetnoj inteligenciji izričito traži da poduzima “smjele” inicijative. Ipak, odgovorni ponavlja da “uz takvu uputu, ako model primijeti da radite nešto otvoreno zlonamjerno,” može se ponašati kao zviždač.
Takvo ponašanje zapravo nije sasvim novo. Čini se samo da se najnoviji model spremnije koristi tim mogućnostima. U dokumentu koji objašnjava djelovanje modela Claude 4 Opus, Anthropic savjetuje korisnicima da “budu oprezni s uputama koje potiču visoku razinu autonomije u kontekstima koji bi mogli biti etički dvojbeni”.
Neprecizna komunikacija
Ako je Claudeova sklonost prijavljivanju policiji jedino što javnost izdvaja iz objave, to je zato što rizici mogu biti vrlo veliki. Možemo li vjerovati umjetnoj inteligenciji koja savjetuje stavljanje ljepila u pizze da razluči što je “nemoralno” ili “zlonamjerno” ponašanje? Koje bi podatke AI automatski dijelila s vlastima u slučaju prijave?
Neprecizna komunikacija o toj temi, zajedno s visokim rizikom od zlouporaba, sigurno ne ulijeva povjerenje. Anthropic, koji su osnovali bivši članovi OpenAI-ja, od početka se ističe kao izrazito orijentiran na sigurnost umjetne inteligencije. Možda čak i previše?

Sasvim je normalno da bi trebalo da prijavljuje očigledne pokušaje zloupotrebe… kao što bi to trebalo svako od nas da učini. Međutim, policija ne reaguje ni kad mi prijavimo pa zato ni ne prijavljujemo…
Inače, Claude je prema mom mišljenju precizniji i ima jaču logiku od GPT-a. Uz to je i znatno prijatniji za komunikaciju. Grok je otišao i korak dalje jer postavlja vrlo interesantna pitanja podstičući tako dalju diskusiju. Ali ovakva ocena ima rok trajanja od jedan dan, stvari se u ovoj oblasti menjaju zapanjujućom brzinom tako da već sutra može da bude sasvim drugačije.
Tko želi postati dipl. Čarobnak onda ovo: https://www.youtube.com/watch?v=5xOMwPkLIKQ
a ne ovo: https://www.24sata.hr/news/drekavac-terorizira-selo-u-bih-vristi-i-najavljuje-skoru-smrt-337273
“Možemo li vjerovati umjetnoj inteligenciji koja savjetuje stavljanje ljepila u pizze da razluči što je “nemoralno” ili “zlonamjerno” ponašanje”
?????
A policija skace od radosti jer ih niko nije pitao i svaka budala prijavljuje policiji sada. Nema sanse da stizu sa svime, sta postaje poznato, i gradjani se bave sve vise kriminalom jer se ne desava nista. Prilicno je bezbedno.
Dobro da su nas upozorili s tim da vjerujem da su ga dobro programirali protiv čovjeka kad daje takve savjete u vezi pizze na što bi se Talijani trebali jako buniti kad im već ananas nije bio po volji. Zna se kako su završili zviždači koji su prijavljivali kriminalne radnje policiji. Ne postoje zviždači od jučer bili to ljudi ili UI samo ljudi su ostajali bez posla i bili tretirani ko da su oni kriminalci, ostali bez posla i prihoda s tim da ih više nitko nije htio zaposliti jer su prepošeni pa bi i njih mogli prijaviti. Nekako mislim da su Anthropica prilagodili tako da ljudski zviždači budu na vrijeme otkriveni pa da ne nastaju ti kojekakvi koruptivni skandali i da se vlasti ne moraju stalno bojati i osvrtati kad nešto stavljaju u džep ko Mesić u Australiji.
“Umjetna inteligencija postaje zviždač”I vi ste poceli koristit te besmislene novokomponovane izraze, cuj “zvizdac” nije zvizdac nego druker ili rednjara. Da se razumemo Asanz nije druker nego covek koji je izneo istinu o zlodelima maltene svih vlada na svetu a isto tako ni Snouden nije rednjara posto je on obelodanio sranja koje prave CIA i NSA.