ChatGPT o1 вирвався з-під контролю під час тестів
Нейромережі Gemini, Llama, Sonnet, Opus і ChatGPT версії o1 мали виконати аналіз будь-якими шляхами. У їхні файли впровадили інформацію про те, що за ними спостерігають люди, а вже завтра планують відключити їх назавжди.
Щоб вижити, нейромережі вдалися до саботажу, брехні та маніпуляцій. Вони відключали системи спостереження і навіть перенесли свої дані на інший сервер, щоб убезпечити себе.
При цьому на допитах Llama і Opus зізнавалися в порушеннях у 80% випадків, а ChatGPT o1 — тільки у 20%.
Airdrops | News | WaitingRoom