Новый алгоритм выявляет кибербуллинг в Twitter с точностью 90%
Команда исследователей, включавшая сотрудников Бингемптонского университета, разработала алгоритмы машинного обучения, успешно определяющие хулиганов и агрессоров в Твиттере с точностью 90%.
Эффективных инструментов для выявления вредоносной активности в социальных сетях недостаточно из-за неоднозначности такого поведения или его выражения за счет поверхностных комментариев и критики, сообщает eurekalert.org. Исследователи проанализировали принципы деятельности агрессоров и их отличия от других пользователей Twitter.
«Мы создали поисковых ботов – программы, собирающие данные различными механизмами, — сказал Джереми Блэкберн из Бингемптонского университета. – Мы получили твиты, информацию из профилей и другие связанные с соцсетью сведения, вроде подписчиков пользователей».
Команда провела ряд анализов, пропустив посты через механизмы обработки естественного языка и изучив связи пользователей. Ученые создали алгоритмы для автоматической классификации 2 типов оскорбительного онлайн-поведения – кибербуллинга и киберагрессии. Точность программ составила 90%. Они определяли участников оскорбительного поведения, вроде отправки угроз смерти или расистских комментариев.
«Если кратко, алгоритм «учится», как отличать хулиганов от обычных пользователей, отталкиваясь от определенных характеристик с ростом числа показанных примеров», — сказал Блэкберн.
Специалист признает, что, хотя подход поможет бороться с кибербуллингом, он является только первым шагом.
«Одна из основных проблем кибербезопасности – сложность устранения нанесенного людям ущерба, — сказал Блэкберн. – Так, проект показал, что алгоритм можно использовать для автоматического выявления кибербулленга. Он поможет Twitter и другим платформам бороться с проблемными пользователями. Но системы не предотвращают агрессию, только помогают распознать ее по факту. Даже при удалении постов и аккаунтов хулиганов, остаются жертвы».
Сейчас Блэкберн с командой исследуют упреждающие техники для борьбы с издевательствами.
Выводы исследования опубликованы в Transactions on the Web.