В Томском Политехе исследуют исчезающие языки России
02.02.2025


Хантыйский и мансийский языки сегодня имеют статус «серьезно уязвимых». Спасти их от исчезновения взялись специалисты Томского политехнического университета. Ученые проводят исследования, по результатам которых создадут онлайн-тренажеры и алгоритмы языковых моделей, сообщает портал «Научная Россия».
Сейчас в России 136 исчезающих языков. Хантыйский и мансийский — в их числе. Носителей первого — менее 10 тысяч, а второго – и вовсе около тысячи. По словам ученых, такое положение дел — следствие нарушения естественной передачи языка от старшего поколения к младшему. Мало носителей этих языков и среди учителей, поэтому и педагоги часто не способны в нужном объеме дать детям соответствующие знания. Также сложная ситуация с пособиями по грамматике: она недостаточно описана, правила употребления некоторых форм не выявлены, а значит, не внесены в школьные учебники.
Работу по спасению хантыйского и мансийского языков развернули сотрудники Томского политехнического университета, Томского государственного университета, Томского государственного педагогического университета и Института языкознания РАН. Особое внимание ученые планируют уделить исследованию глагольных форм в контексте системных характеристик, выявить их взаимосвязи и роли в структуре языка.
Как пояснила руководитель проекта, доцент отделения иностранных языков Школы общественных наук ТПУ Виктория Воробьёва, хантыйский и мансийский языки — родственные. Они относятся к угорской подветви финно-угорских языков, у них похожие грамматические структуры и лексические элементы. Поэтому ученые могут исследовать их эволюцию и взаимное влияние, выделить общие черты, которые позволят по-новому взглянуть на историю миграций и контактов между народами. Также, по словам Виктории Воробьёвой, у обоих языков — множество диалектов, которые заметно различаются между собой. Их изучение помогает понять, как менялись и адаптировались языки в соответствии с географическим положением носителей.
Проект стал продолжением более ранних исследований. При работе над ним ученые будут опираться на результаты экспедиций в места проживания ваховских и аганских ханты, состоявшихся в 2017–2020 годах. Собранные тогда данные уже частично оцифровали и разместили в виртуальной лаборатории «ЛингвоДок». Также специалисты намерены продолжить полевые исследования. По словам ученых, сбор данных в местах проживания коренных народов ХМАО — первостепенная задача, ведь большинство ваховских ханты, еще способных говорить на этническом языке, – пожилые люди.
При работе с носителями языка ученые используют разные методы: записывают речь, проводят опросы по анкетам на заданные темы. Аудиозаписи расшифровывают и обрабатывают в специальной программе, а полученные файлы загружают в лингвистическую лабораторию «ЛингвоДок». Цель — расширить имеющиеся корпуса хантыйских и мансийских диалектов в лингвистической лаборатории и проанализировать полученные данные.
«Корпус обско-угорских языков, который будет разработан, позволит уточнить спорные моменты в морфологии и может быть применим при комплексном описании характеристик глагола. В дальнейшем он послужит основой для создания новых продуктов, например, этимологических онлайн-словарей обско-угорских языков, онлайн-тренажеров для обучения и для разработки алгоритмов языковых моделей», — пояснила Виктория Воробьёва.
По словам руководителя проекта, такие программы можно будет использовать для межъязыкового перевода или генерации текстов. Сегодня же, подчеркнула доцент ТПУ, нет еще ни одной масштабной цифровой корпусной базы данных по этим языкам, которая позволяла бы анализировать, уточнять и проверять теоретические положения в режиме онлайн.
Подпишитесь на рассылку последних новостей.