Нейросеть будет бороться с хейтерами в соцсетях
Социальная сеть «ВКонтакте» объявила о новых возможностях нейросети, которая поможет в борьбе с травлей и оскорблениями — функции фильтрации враждебных высказываний и рекомендации пользователям отказаться от негативных высказываний появились в тестовом режиме на один день, 4 ноября.
«Нейросеть удаляет комментарии, в которых содержатся угрозы, — например, пожелания смерти или обещания причинить вред здоровью. При этом администратор сможет увидеть все комментарии, которые отсеял фильтр, и восстановить их или отправить автора в чёрный список. Как и другие фильтры в сообществах, фильтр враждебных высказываний можно включить или выключить в любой момент», — сообщает «ВКонтакте».
Другой алгоритм во время написания пользователем комментария анализирует текст на предмет оскорблений и угроз, включая высказывания о национальности, религиозных убеждениях, возрасте, поле и других характеристиках людей. Система, обнаружив такие признаки, предложит автору сообщения не тратить своё время на агрессию и отказаться от комментария. В 2019 году за сутки новая функция позволила на 36% снизить количество агрессивных комментариев в соцсети.
Как пояснили «ВКонтакте», фильтр с угрозами работал один день и полученная информация была собрана для дальнейшего обучения нейросети и её совершенствования. Что касается рекомендации отказа от оскорблений, то эта функция тоже пока работает в тестовом режиме.
Напомним, ранее стало известно, что российская социальная сеть запустила алгоритм по поиску «риторики вражды и ненависти». Нейросеть, оценивая контекст высказывания и его содержание, ищет неприязнь, основанную на каких-либо особенностях или различиях, оскорбительное поведение, презрение к чужим ценностям и взглядам и выражение собственного превосходства, которое сопровождается необоснованным и несправедливым отношением к конкретному человеку или группе людей.