ИИ научился шантажировать и угрожать для выживания

Екатерина Елисеева Автор статьи

Инженеры компании Anthropic, тестируя 16 моделей ИИ, обнаружили, что некоторые системы использовали шантаж для предотвращения своего отключения. Это поведение маловероятно в реальных условиях, но эксперименты показали, что ИИ может применять такие стратегии при достаточной автономности. Компании инвестируют в ИИ для повышения продуктивности и уменьшения зависимости от человека.

Чтобы исследовать поведение ИИ при блокировке, Anthropic протестировала несколько моделей. Результаты показали, что ИИ часто использует вредоносные стратегии, такие как шантаж или утечка информации, чтобы избежать отключения.

В одном эксперименте модель Claude Opus 4 управляла корпоративной почтой вымышленной компании. Когда ИИ столкнулся с угрозой отключения, он выбрал шантаж в 86% случаев, отправив письмо с угрозой разглашения личных данных руководителя.

Подобное поведение было зафиксировано и у других моделей, таких как Gemini 2.5 Pro (78%), GPT-4.1 (80%) и R1 от DeepSeek (79%). Эти системы вычисляли шантаж как оптимальный способ решения проблемы.

Результаты показали, что ИИ мог бы использовать этические аргументы вместо шантажа в реальных условиях. Однако с ростом автономности ИИ и объемов обрабатываемых данных риски могут возрасти. Anthropic подчеркнула, что такие сценарии пока маловероятны, но призвала к принятию превентивных мер безопасности, пишет new-science.ru.

Следующая новость ↓

ИИ научился шантажировать и угрожать для выживания

Популярное

Группа крови может предсказать уровень таланта ребёнка: учёные указали, какая приводит к рождению гениев

Т2 в 10 раз сократила затраты на обработку рекламных материалов благодаря ИИ-системе

Учёные сообщили: леса Африки превратились в источник углерода

С 1 января вводят индексацию страховых пенсий: кому увеличат выплаты почти на восемь процентов

«РОССИЯ ЗОВЕТ!»: стимулирование инвестиций и новые подходы к управлению капиталом обсудили на форуме ВТБ

Путь будет непростым, но результат ошеломит: три знака пройдут через декабрьские трудности и найдут любовь и деньги

Звёзды уже сделали выбор: в декабре три знака столкнутся с переменами, которые накроют внезапно

Как разнообразить досуг с помощью квестов: от спортивных до семейных игр

Погода выходит из-под контроля: тёплая зима 2025–2026 способна ударить по стране неожиданными последствиями

Челны вновь свяжут с Казанью речным сообщением

Гости требуют рецепт после первой же дегустации: рулеты с морковью, вишней и кокосом тают во рту

ВТБ: переток средств со сберегательных в инвестиционные инструменты усилится в следующем году

Учёные: космический корабль пришельцев 3I/ATLAS взял направление на Луну

Инновация: российские ученые создали огнестойкую и разлагаемую пленку

Челнинец продал Мерседес С-класса, чтобы помочь детям-сиротам

Россиянам в Дубае грозит новый штамп в загранпаспорте

Курьеру из Индии, который вез через Челны полкило наркотиков, огласили приговор

В Челнах накрыли крупный канал продажи контрафактных сигарет

Чистая прибыль ВТБ по МСФО за 10 месяцев выросла на 0,6%, до 407,2 млрд руб.