Top.Mail.Ru

Ученые разобрались, как отличить ИИ текст от человеческого

Анна Сальникова Редактор новостной ленты

Команда исследователей из Сколтеха, МФТИ, AIRI и других научных организаций разработала метод, позволяющий не просто распознавать тексты, написанные ИИ, но и объяснять, почему именно система считает текст сгенерированным. Это важно, ведь большинство существующих детекторов работают как «чёрный ящик»: выдают результат, но не объясняют его.

Учёные подошли к задаче иначе — они изучили внутренние «сигналы» внутри языковых моделей и превратили их в понятные человеку признаки. Для этого использовали метод разреженных автокодировщиков (SAE), который помогает выделить отдельные характеристики текста — например, насколько он сложен, насколько уверен в себе «автор», и есть ли в нём избыточные пояснения.

Исследователи выяснили, что удалось выделить десятки признаков, по которым можно определить, что текст написал ИИ. Например, один из таких признаков связан с запутанным синтаксисом, другой — с избыточно длинными вступлениями. Эти признаки можно не только анализировать, но и управлять ими — усиливая или ослабляя, можно менять стиль текста при генерации.

Исследование показало, что стандартные запросы к ChatGPT и другим ИИ часто приводят к появлению «узнаваемых» особенностей в тексте — таких как формальный тон, повторы и «вода». Эти черты легко фиксируются новым инструментом. Но если изменить стиль или задать нетипичный запрос, ИИ может «замаскироваться», и тогда распознать генерацию сложнее.

Этот подход помогает не просто «угадывать», написал ли текст человек или ИИ, а точно понять, по каким признакам сделан вывод. Это делает детектор более прозрачным, надёжным и полезным, особенно в образовании, научной среде и борьбе с фейками.

Работа принята на конференцию Findings of ACL 2025 и опубликована на arXiv, сообщает Naked Science.