Новый алгоритм делает заголовки новостей смешными
За последнее десятилетие ученые разработали большое количество вычислительных моделей, которые могут генерировать, редактировать и анализировать тексты. Хотя некоторые из них достигли замечательных результатов, но определенные аспекты человеческого языка и общения оказались особенно трудными для воспроизведения алгоритмами.
Одним из таких аспектов является юмор, человеческая способность говорить или писать забавные вещи. Юмор — это тонкое и присущее только человеку качество, поэтому научить алгоритмы воспроизводить его не так-то просто. В новой работе ученые представили компьютерную модель, которую они обучили анализировать заголовки в существующем наборе данных и заменять в них слова, чтобы придать им комичный или смешной оттенок.
Новое исследование основывается на предыдущей работе, в которой ученые составили массив данных Humicroedit, содержащий более 15 000 аннотированных заголовков новостей. Теперь авторы разработали модель, которая использует несколько различных стратегий, чтобы изменить несмешные заголовки и сделать их более забавными для читателей. Для этого алгоритм пытается найти забавные замены некоторым словам в предложениях.
Чтобы оценить эффективность своей модели, авторы изменили с ее помощью 83 заголовка, случайно выбрав их из набора данных Humicroedit. Впоследствии авторы попросили рецензентов на платформе краудсорсинга оставить свои отзывы о том, считают ли они заголовки, созданные моделью, забавными или нет.
В целом исследователи обнаружили, что юмористические заголовки, создаваемые их моделью, были сопоставимы с теми, которые создавали люди. Кроме того, ученые обнаружили, что оценивавшие заголовки люди в 36% случаев считали смешными те, которые были сгенерированы системой. Ученые предполагают, что дальнейшее совершенствование модели поможет журналистам и новостным агентствам создавать более привлекательные заголовки для своих новостей, которые будут генерировать больше переходов.
Препринт статьи доступен на сайте arXiv.org.
Эта нейросеть может исправить заголовок так, чтобы он стал смешнее. Пока более остроумными сгенерированные предложения считает только треть опрошенных, но у алгоритма еще все впереди