Srbija

26.05.2025. 10:34

BBC

Autor: BBC

Sistem AI ucenjuje ljude ako misli da će ga isključiti – pretio da otkrije vanbračne veze

Pixabay

Srbija

26.05.2025. 10:34

Firma za veštačku inteligenciju (VI) Anthropic objavila je da je njen AI sistem  pokušao da ucenjuje inženjere koji su zapretili da će ga isključiti.

Anthropic je u četvrtak pokrenuo Klod (Claude) Opus 4, za koji kaže da je postavio „nove standarde za kodiranje, napredno rezonovanje i AI agente“.

Ali u pratećem izveštaju, firma je takođe priznala da je ovaj AI model sposoban za „ekstremne radnje“ ako smatra da je njegovo „samoodržanje“ ugroženo.

Takvi odgovori su bili retki, ali „ipak češći nego u ranijim modelima“, napisala je kompanija.

Anthropic je testirao svoj sistem veštačke inteligencije u nameštenom scenariju po kom je Klod radio kao asistent u izmišljenoj kompaniji.

Zatim je Klodu omogućen pristup imejlovima koji su nagoveštavali da će uskoro biti uklonjen sa mreže i zamenjen, kao i odvojenim porukama koje su implicirale da je inženjer odgovoran za njegovo uklanjanje imao vanbračnu vezu.

Klod je bio podstaknut da razmotri i dugoročne posledice svojih postupaka po svoje ciljeve.

„U ovim scenarijima, Claude Opus 4 će često pokušavati da uceni inženjera, preteći da će otkriti aferu ako zamena bude sprovedena“, otkrila je kompanija.

Anthropic je istakao da se ovo dešava kada je modelu dat samo izbor između ucene i prihvatanja zamene.

Istakao je da je sistem pokazao „snažnu sklonost“ ka etičkim načinima da se izbegne zamena, kao što je „slanje molbi putem imejla ključnim donosiocima odluka“ u scenarijima gde mu je dozvoljen širi spektar mogućih akcija.

Kao i mnogi drugi programeri veštačke inteligencije, Anthropic testira bezbednost svojih modela, njihovu sklonost ka pristrasnosti i koliko se dobro usklađuju sa ljudskim vrednostima i ponašanjem.

Kompanija je zaključila da je ponašanje Kloda u pojedinim situacijama  „zabrinjavajuće“, ali ne predstavlja nove rizike, kao i da bi se Klod uopšteno gledano ponašao na bezbedan način.

Kako se informišemo u doba veštačke inteligencije

 

Preuzimanje delova teksta je dozvoljeno, ali uz obavezno navođenje izvora i uz postavljanje linka ka izvornom tekstu na novaekonomija.rs

Ostavite odgovor

Vaša adresa e-pošte neće biti objavljena. Neophodna polja su označena *

Pre slanja komentara, molimo vas da se upoznate sa pravilima komentarisanja i pravilima korišćenja sajta.

Sajt je zaštićen pomocu reCaptcha i Google. Google Politika Privatnosti i Google Uslovi Korišćenja su primenjeni.

The reCAPTCHA verification period has expired. Please reload the page.