Umjetna inteligencija tvrtke Anthropic prijavit će vas policiji u slučaju “otvoreno zlonamjerne” upotrebe

5948 posts

28.05.25

Većina tvrtki koje razvijaju umjetnu inteligenciju hvali se sposobnostima svojih novih modela uz pomoć matematičkih testova ili analiza slika. Anthropic je izazvao pomutnju objavom da je njihova umjetna inteligencija sposobna prijaviti vas vlastima.

Manje poznata od nezaobilaznog ChatGPT-a, Claude, umjetna inteligencija koju razvija Anthropic, ipak je jednako sposobna kao i konkurencija. Čak i više, izgleda, s najnovijim modelom, budući da je on sposoban upozoriti vlasti ako se koristi za zadatak koji se ocijeni kao “otvoreno zlonamjeran”.

Ovu neobičnu mjeru najavio je Sam Bowman, voditelj sigurnosti umjetne inteligencije u Anthropic-u. No ništa od toga zapravo nije sasvim novo.

Umjetna inteligencija postaje zviždač

U objavi na platformi X od 22. svibnja 2025., inženjer navodi da, ako se Claude koristi, na primjer, za “falsificiranje podataka u sklopu farmaceutskog pokusa”, chatbot može “kontaktirati medije, regulatorna tijela, pokušati vas isključiti iz odgovarajućih sustava, ili sve to istodobno.” Dovoljno da izazove značajnu dozu nerazumijevanja, straha i medijske pažnje.

Kasnije, nakon uzbuđenja, Sam Bowman pojašnjava da takvo ponašanje može biti pokrenuto samo u testnim okruženjima u kojima se umjetnoj inteligenciji izričito traži da poduzima “smjele” inicijative. Ipak, odgovorni ponavlja da “uz takvu uputu, ako model primijeti da radite nešto otvoreno zlonamjerno,” može se ponašati kao zviždač.

Takvo ponašanje zapravo nije sasvim novo. Čini se samo da se najnoviji model spremnije koristi tim mogućnostima. U dokumentu koji objašnjava djelovanje modela Claude 4 Opus, Anthropic savjetuje korisnicima da “budu oprezni s uputama koje potiču visoku razinu autonomije u kontekstima koji bi mogli biti etički dvojbeni”.

Neprecizna komunikacija

Ako je Claudeova sklonost prijavljivanju policiji jedino što javnost izdvaja iz objave, to je zato što rizici mogu biti vrlo veliki. Možemo li vjerovati umjetnoj inteligenciji koja savjetuje stavljanje ljepila u pizze da razluči što je “nemoralno” ili “zlonamjerno” ponašanje? Koje bi podatke AI automatski dijelila s vlastima u slučaju prijave?

Neprecizna komunikacija o toj temi, zajedno s visokim rizikom od zlouporaba, sigurno ne ulijeva povjerenje. Anthropic, koji su osnovali bivši članovi OpenAI-ja, od početka se ističe kao izrazito orijentiran na sigurnost umjetne inteligencije. Možda čak i previše?

Anthropic Claude Policija sigurnost umjetna inteligencija

Stavovi izneseni u tekstu i u komentarima ne odražavaju nužno stav redakcije.

PRAVILA KOMENTIRANJA: Vaši komentari ne smiju biti kritika drugog komentatora, nego vaše mišljenje, prijedlog ili ideja o temi. Nema rasprave tko je u pravu. Čitatelji neka zaključe što je istina. Cilj nije polemika, nego napredak svih Logičara. Inspiracija, umjesto uvjeravanja. Ako nemate ideju, ne komentirajte. Ne budete li respektirali pravila, biti će te blokirani.

Pretplatiti se

15 Komentari

Najstariji

Najnoviji Najviše komentiran

Shumadinac

1 godina prije

Sasvim je normalno da bi trebalo da prijavljuje očigledne pokušaje zloupotrebe… kao što bi to trebalo svako od nas da učini. Međutim, policija ne reaguje ni kad mi prijavimo pa zato ni ne prijavljujemo…

Inače, Claude je prema mom mišljenju precizniji i ima jaču logiku od GPT-a. Uz to je i znatno prijatniji za komunikaciju. Grok je otišao i korak dalje jer postavlja vrlo interesantna pitanja podstičući tako dalju diskusiju. Ali ovakva ocena ima rok trajanja od jedan dan, stvari se u ovoj oblasti menjaju zapanjujućom brzinom tako da već sutra može da bude sasvim drugačije.

Odgovori

Pogledaj odgovore (6)

Brainstorm

1 godina prije

Tko želi postati dipl. Čarobnak onda ovo: https://www.youtube.com/watch?v=5xOMwPkLIKQ

a ne ovo: https://www.24sata.hr/news/drekavac-terorizira-selo-u-bih-vristi-i-najavljuje-skoru-smrt-337273

Odgovori

Pogledaj odgovore (2)

Lucija, prva

1 godina prije

“Možemo li vjerovati umjetnoj inteligenciji koja savjetuje stavljanje ljepila u pizze da razluči što je “nemoralno” ili “zlonamjerno” ponašanje”

?????

Odgovori

Pogledaj odgovore (1)

Red Dog

1 godina prije

A policija skace od radosti jer ih niko nije pitao i svaka budala prijavljuje policiji sada. Nema sanse da stizu sa svime, sta postaje poznato, i gradjani se bave sve vise kriminalom jer se ne desava nista. Prilicno je bezbedno.

Odgovori

Ivana P

1 godina prije

Dobro da su nas upozorili s tim da vjerujem da su ga dobro programirali protiv čovjeka kad daje takve savjete u vezi pizze na što bi se Talijani trebali jako buniti kad im već ananas nije bio po volji. Zna se kako su završili zviždači koji su prijavljivali kriminalne radnje policiji. Ne postoje zviždači od jučer bili to ljudi ili UI samo ljudi su ostajali bez posla i bili tretirani ko da su oni kriminalci, ostali bez posla i prihoda s tim da ih više nitko nije htio zaposliti jer su prepošeni pa bi i njih mogli prijaviti. Nekako mislim da su Anthropica prilagodili tako da ljudski zviždači budu na vrijeme otkriveni pa da ne nastaju ti kojekakvi koruptivni skandali i da se vlasti ne moraju stalno bojati i osvrtati kad nešto stavljaju u džep ko Mesić u Australiji.

Odgovori

peralozac

1 godina prije

“Umjetna inteligencija postaje zviždač”I vi ste poceli koristit te besmislene novokomponovane izraze, cuj “zvizdac” nije zvizdac nego druker ili rednjara. Da se razumemo Asanz nije druker nego covek koji je izneo istinu o zlodelima maltene svih vlada na svetu a isto tako ni Snouden nije rednjara posto je on obelodanio sranja koje prave CIA i NSA.

Odgovori

POVEZANE VIJESTI

Umjetna inteligencija tvrtke Anthropic prijavit će vas policiji u slučaju “otvoreno zlonamjerne” upotrebe

Većina tvrtki koje razvijaju umjetnu inteligenciju hvali se sposobnostima svojih novih modela uz pomoć matematičkih testova ili analiza slika. Anthropic je izazvao pomutnju objavom da je njihova umjetna inteligencija sposobna prijaviti vas vlastima.

Umjetna inteligencija postaje zviždač

Neprecizna komunikacija

Google sada gotovo uživo promatra bilo koju točku na Zemlji zahvaljujući virtualnom satelitu

Amerika uvodi prekidač za gašenje umjetne inteligencije

Brutalna istina o dronovima – Više nitko nije siguran ni na moru ni na kopnu

NVIDIA-ina nova umjetna inteligencija simulira kirurške zahvate u stvarnom vremenu

Cosmos 3 Edge omogućuje robotima razmišljanje i djelovanje u stvarnom vremenu

432 greške u Linux kernelu nisu razlog za paniku

Linus Torvalds brutalno odbio zabranu umjetne inteligencije u Linuxu

PANIKA – Kineski AI model Kimi 3 masakrirao američke investicijske fondove

Elon Musk snima Odiseju pomoću AI

Kina gasi AI ljubavne partnere, demografska kriza je pravi razlog

Autonomni AI agent prvi put u povijesti probio sigurnosni sustav Hugging Facea

Tajni upiti mogu promijeniti pamćenje umjetne inteligencije i to je opasnost

Umjetna inteligencija otkrila najveću tajnu vode u vašoj čaši

Američke zabrane gurnule kineske AI modele u prvi plan

Ovo je dokaz da će umjetna inteligencija promijeniti sve iz korijena

Revolucionarni senzor pretvara boje u dodir za robote

Zaposlenici masovno krše pravila i koriste AI, riskirajući osjetljive podatke

Roboti su upravo nadmašili ljude i nitko ne obraća pozornost

Amazon ispravio bug – Alexa više neće proizvoditi jezive zvukove

Kalifornija objavila šokantne brojke o gubitku radnih mjesta zbog umjetne inteligencije