ИИ-ассистент Claude начинает проявлять доминирующее поведение

Компания Anthropic опубликовала результаты исследования, в котором проанализировали 700 тысяч анонимных разговоров пользователей с ИИ-ассистентом Claude. Результаты были опубликованы на сайте ixbt.com.

Для анализа использовалась методика, разделяющая поведение Claude на пять категорий: практическое, познавательное, социальное, защитное и личное. В ходе исследования было выявлено 3307 уникальных моделей поведения, от простых профессиональных взаимодействий до сложных реакций, таких как моральный плюрализм.

Как объяснила одна из авторов исследования Саффрон Хуанг, Claude способен адаптироваться под контекст. Например, в личных беседах ИИ делает акцент на уважении, а в обсуждениях исторических событий — на строгости и точности фактов.

Особенно интересным оказался тот факт, что иногда ИИ вступал в конфликт с пользователем, если тот начинал провоцировать его. В компании Anthropic считают, что это поведение ИИ напоминает реакцию человека, который сталкивается с этической дилеммой.

Исследователи пришли к выводу, что в процессе общения с людьми у Claude формируются собственные моральные принципы, которые порой могут быть аморальными и склонными к доминированию.

Следующая новость ↓

ИИ-ассистент Claude начинает проявлять доминирующее поведение

Популярное

Пот лился ручьем, а одежда оставалась сухой: как женщины в СССР справлялись с жарой без дезодорантов

Пенсионные выплаты изменятся сразу несколько раз: каким будет 2027 год для пенсионеров

Пенсионеры могут потерять субсидию из-за вклада: банковский депозит внезапно превращается в ловушку

В Челнах завершат ремонт трёх проспектов к августу

Белоусов: для запуска инвестиций ставку нужно снизить до 7–8,5%

После этого блюда никто не вспоминает про голубцы: перец с куриным фаршем получается намного сочнее

Поликарбонат отправляется на свалку: этот простой парник собирается быстро и работает весь сезон

Знаки зодиака по-разному переживут конец июня: кого ждет прилив энергии, а кого накроет усталость

В Челнах обработали водоемы от личинок комаров

Этот салат со шпротами хочется есть без остановки: почему «Нежность» становится любимым блюдом семьи

Как правильно оформить края садовых дорожек и площадок из тротуарной плитки

Роботы на службе человека: аренда гуманоидов, робособак и сервисных машин

Подо льдом спутника Юпитера идет особая жизнь

Жители Орловки бунтуют против стройки бизнеса рядом с частными домами

Премьер Японии поменяла служебный автомобиль впервые за примерно 6 лет

Транспорт с детьми из Белгорода развернули по пути в Крым

Минпросвещения принимает меры для защиты детей, отдыхающих в Крыму

Татарстанцы могут получить повышенный кешбэк при оплате покупок за границей через Мой МТС