Autor: BBC

Sistem AI ucenjuje ljude ako misli da će ga isključiti – pretio da otkrije vanbračne veze

Firma za veštačku inteligenciju (VI) Anthropic objavila je da je njen AI sistem pokušao da ucenjuje inženjere koji su zapretili da će ga isključiti.

Anthropic je u četvrtak pokrenuo Klod (Claude) Opus 4, za koji kaže da je postavio „nove standarde za kodiranje, napredno rezonovanje i AI agente“.

Ali u pratećem izveštaju, firma je takođe priznala da je ovaj AI model sposoban za „ekstremne radnje“ ako smatra da je njegovo „samoodržanje“ ugroženo.

Takvi odgovori su bili retki, ali „ipak češći nego u ranijim modelima“, napisala je kompanija.

Anthropic je testirao svoj sistem veštačke inteligencije u nameštenom scenariju po kom je Klod radio kao asistent u izmišljenoj kompaniji.

Zatim je Klodu omogućen pristup imejlovima koji su nagoveštavali da će uskoro biti uklonjen sa mreže i zamenjen, kao i odvojenim porukama koje su implicirale da je inženjer odgovoran za njegovo uklanjanje imao vanbračnu vezu.

Klod je bio podstaknut da razmotri i dugoročne posledice svojih postupaka po svoje ciljeve.

„U ovim scenarijima, Claude Opus 4 će često pokušavati da uceni inženjera, preteći da će otkriti aferu ako zamena bude sprovedena“, otkrila je kompanija.

Anthropic je istakao da se ovo dešava kada je modelu dat samo izbor između ucene i prihvatanja zamene.

Istakao je da je sistem pokazao „snažnu sklonost“ ka etičkim načinima da se izbegne zamena, kao što je „slanje molbi putem imejla ključnim donosiocima odluka“ u scenarijima gde mu je dozvoljen širi spektar mogućih akcija.

Kao i mnogi drugi programeri veštačke inteligencije, Anthropic testira bezbednost svojih modela, njihovu sklonost ka pristrasnosti i koliko se dobro usklađuju sa ljudskim vrednostima i ponašanjem.

Kompanija je zaključila da je ponašanje Kloda u pojedinim situacijama „zabrinjavajuće“, ali ne predstavlja nove rizike, kao i da bi se Klod uopšteno gledano ponašao na bezbedan način.

Kako se informišemo u doba veštačke inteligencije

Preuzimanje delova teksta je dozvoljeno, ali uz obavezno navođenje izvora i uz postavljanje linka ka izvornom tekstu na novaekonomija.rs

Tema:

vestacka inteligencija

Ostavite odgovor Odustani od odgovora

Povezani sadržaji

Poreska uprava, euprava, Ministarstvo finansija

Srbija paušalci

Sistem AI ucenjuje ljude ako misli da će ga isključiti – pretio da otkrije vanbračne veze

Ostavite odgovor Odustani od odgovora

Povezani sadržaji

Poreska uprava: Produženo ograničenje rasta poreske osnovice za preduzetnike paušalce

Nova pravila za polovne automobile: Šta se menja kod uvoza iz EU u Srbiju

Objavljene nove cene goriva: Jeftiniji i benzin i dizel

RGZ: Više od 420.000 prijava za upis prava svojine u okviru akcije Svoj na svome

Sistem AI ucenjuje ljude ako misli da će ga isključiti – pretio da otkrije vanbračne veze

Ostavite odgovor Odustani od odgovora

Vreme je novac, štedimo ga za vas.

Povezani sadržaji

Poreska uprava: Produženo ograničenje rasta poreske osnovice za preduzetnike paušalce

Nova pravila za polovne automobile: Šta se menja kod uvoza iz EU u Srbiju

Objavljene nove cene goriva: Jeftiniji i benzin i dizel

RGZ: Više od 420.000 prijava za upis prava svojine u okviru akcije Svoj na svome

NOVA EKONOMIJA

prtplatite se za čitanje premium sadržaja

Vreme je novac, štedimo ga za vas.

Vreme je novac,
štedimo ga za vas.

Vreme je novac,
štedimo ga za vas.