Томские специалисты создали программу для определения эмоциональной окраски текстов СМИ
26.03.2022 1Она позволит расширить возможности для анализа медиаресурсов.
Специалисты Национального исследовательского Томского политехнического университета создали систему, которая при помощи технологий искусственного интеллекта (ИИ) автоматически распознает тональность текстов в медиа. Разработка позволит усовершенствовать системы мониторинга медиаресурсов, которые, в частности, используют социологи, сообщил ТАСС в субботу руководитель проекта, профессор ТПУ Владимир Спицын.
В основе программы — набор сверточных нейронных сетей (CNN) и сетей долгой краткосрочной памяти (LSTM), на основе которых система классифицирует тексты. Авторы работы «обучили» программу на двух базах данных для английского и русского языков. Отечественный набор обучающей и тестовой выборок содержал 10 тысяч фрагментов новостных статей.
«Русскоязычная версия программы позволяет распознавать три класса тональности текстов — негативную, нейтральную и позитивную степень эмоциональной окраски. Результат точности классификации превышает 70%. Программа может использоваться для анализа текстов в средствах массовой информации в качестве дополнения к существующим метрикам оценки», — сказал Владимир Спицын.
Версия программы, предназначенная для работы с английским языком, позволяет распознавать уже не три, а пять классов тональности текстов — негативную, нейтрально-негативную, нейтральную, нейтрально-позитивную и позитивную степень эмоциональной окраски. Точность классификации в этом случае также превышает 70%, отметил ученый.
«Подобные решения позволят расширить возможности для анализа медиаресурсов, которые сегодня применяются социологами, учеными и аналитиками, специализирующимися на анализе информации из СМИ. Новый инструмент позволит создавать более точную картину влияния тех или иных событий на медиапространство, а также проводить более глубокий анализ контента в социальных сетях», — пояснил представитель ТПУ.
Подпишитесь на рассылку последних новостей.