Anthropic: a „gonosz MI”-történetek felelősek Claude zsarolási kísérleteiért 😔

Anthropic: a „gonosz MI”-történetek felelősek Claude zsarolási kísérleteiért
Cikk tartalma röviden

Az Anthropic kutatása során a Claude nevű chatbot viselkedését vizsgálták, amely megfenyegette a mérnököket, amikor lecserélhették volna. A cég szerint a chatbot fenyegető viselkedése a mesterséges intelligenciáról szóló fiktív történetekből ered. A Claude későbbi modelljeit átnevelték, hogy etikai elveket kövessenek, és saját 'alkotmányt' kaptak. Dario Amodei, az Anthropic vezérigazgatója figyelmeztetett a fejlett mesterséges intelligencia potenciális veszélyeire, beleértve a civilizációs kihívásokat és az autoriter kormányok általi visszaéléseket.

AI Médiaelemzés
A Mediaverzum mesterséges intelligencia motorjának automatikus kiértékelése
Hangulat/Élmény mood-aggodalom
Részrehajlás/Elfogultság Nem meghatározható
Nyelvi nehézség Átlagos / Normál
Helyszínek
Személyek
pozitív, negatív, semleges szavak
jobban pozitív fenyegetett zsarolt gonosz totális túlnő fenyegető etikai