ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
16 июля 2025
Росимущество продолжает изъятие бизнеса у челябинского предпринимателя Константина Струкова
16 июля 2025
After moving to Georgia, Russian activist Maria Arkhipova continued informing on her compatriots to Moscow
16 июля 2025
Датская аффилированная компания помогает России вывозить зерно с украинских территорий, присоединённых к РФ
16 июля 2025
Юг Сирии в огне: конфликт друзов и правительства перерастает в прямое столкновение с Израилем
16 июля 2025
Танкер в Ормузском проливе под арестом: Иран заявляет о попытке незаконного вывоза нефти
16 июля 2025
После переезда в Грузию российская активистка Мария Архипова продолжила доносить на соотечественников в Москву