Top.Mail.Ru

Создана программа, отслеживающая изменения в речи

Анна Сальникова Редактор новостной ленты
Учёные Мурманского арктического университета ра...

Учёные Мурманского арктического университета разработали программу, которая отслеживает, как в русском языке появляются новые слова и исчезают старые. Минобрнауки сообщило, что этот метод показывает: в языке растёт доля часто употребляемых слов, а приток новых лексем, наоборот, снижается.

По данным ведомства, запатентированная технология работает как цифровой фильтр: программа анализирует большие массивы текстов и автоматически определяет, как меняется частотность каждой леммы со временем.

Метод протестировали на диахронических корпусах Национального корпуса русского языка объёмом более 250 млн слов. Анализ охватил три исторических периода: досоветский (1700–1916), советский (1918–1991) и постсоветский (1992–2016). Алгоритм приводил слова к начальной форме, подсчитывал все варианты их употребления и сравнивал частотность по эпохам.

Результаты оформили в таблицах, где видно, какие слова практически исчезли — например, псевдогаллюцинация, ангельчик, маслообразный, — а какие, наоборот, стали активно использоваться после 1991 года: транслит, лизинговый, офисный, внедорожник, ликвидность, инвестирование.

Учёные пришли к выводу, что число неологизмов сокращается, но активный словарь становится больше, то есть люди всё чаще используют ограниченный набор слов. Также отмечен рост числа цифр в текстах.

Специалисты считают, что накопленные данные помогут точнее прогнозировать развитие языка и улучшить модели искусственного интеллекта, обучая их понимать динамику лексики.

Рекомендуем также:

  1. Это не просто котлеты, а легенда: пожарский вкус XIX века возвращает в детство и влюбляет заново
  2. С марта для пенсионеров с дачей меняются правила: что важно проверить уже сейчас