Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 619354)
Контекстум
Вестник Московского энергетического института  / №5 2025

Разработка программных средств анализа сообщений участников публичных информационных каналов (300,00 руб.)

0   0
Первый авторХорев
АвторыТемерова П.А.
Страниц8
ID941877
АннотацияЦель работы — разработка метода и реализующего его чат- бота для публичных Telegram- каналов, которые позволят удалять из них спам- сообщения, не относящиеся к основной тематике канала или несущие в себе рекламную информацию. Рассмотрены и проанализированы основные методы классификации и кластеризации коротких текстовых сообщений для обнаружения в них спама. Среди методов кластеризации изучены алгоритм К- средних, самоорганизующиеся карты, спектральная кластеризация, оценка максимального правдоподобия, метод тематической кластеризации и латентно- семантический анализ. Среди методов классификации —методы k- ближайших соседей, Байеса, опорных векторов, логистической регрессии, случайных деревьев, а также классификация на основе искусственных нейронных сетей. По результатам проведенного анализа предложено решение, являющееся комбинацией метода опорных векторов и сверточной нейронной сети. На основе предложенного решения создана модель анализатора коротких текстовых сообщений, а с использованием интерфейса Telegram Bot API — чат- бот для мессенджера Telegram, интегрированный в реальные группы пользователей с постоянными активными участниками. Проведенное тестирование показало, что точность модели, обученной методом опорных векторов, составила 77% , а модели, обученной на основе сверточной нейронной сети, — 95% . Результаты работы могут найти применение при администрировании публичных информационных каналов мессенджера Telegram. В чат- боте, спроектированном на основе предложенного метода классификации, в режиме реального времени обрабатываются сообщения пользователей информационного канала и удаляются те из них, которые идентифицированы как спам или как не относящиеся к теме канала. Эффективность разработанного программного средства подтверждена результатами его тестирования.
Хорев, П.Б. Разработка программных средств анализа сообщений участников публичных информационных каналов / П.Б. Хорев, П.А. Темерова // Вестник Московского энергетического института .— 2025 .— №5 .— С. 138-145 .— URL: https://rucont.ru/efd/941877 (дата обращения: 12.10.2025)

Предпросмотр (выдержки из произведения)

Облако ключевых слов *


* - вычисляется автоматически