Больше никакого «кринжа» и «хайпа»: студентка создала программу по переозвучиванию сленговых слов в аудиофайлах

Студенты Московского авиационного института часто разрабатывают IT-инструменты, помогающие в жизни. На этот раз число изобретений пополнилось программой для распознавания и замены сленговых слов.
Больше никакого «кринжа» и «хайпа»: студентка создала программу по переозвучиванию сленговых слов в аудиофайлах
Freepik
Что умеет программа по замене сленговых выражений и как ее использовать?

Программу, способную распознавать сленг в аудиофайлах и заменять его на литературные варианты представила студентка кафедры 806 «Вычислительная математика и программирование» Дарья Иванченко. Принцип работы с сервисом прост.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
  1. Сначала необходимо создать словарь: записать сленговые выражения, которые необходимо обнаруживать в аудиозаписях. Программа преобразует звуки в набор коэффициентов, попросту говоря, в числа.
  2. После через преобразование проходит исходная аудиодорожка, которую нужно проверить на сленг.
  3. Затем динамический алгоритм программы сравнивает оба набора коэффициентов, и в том месте, где они наиболее похожи, он и находит искомое слово, заменяя его на литературный аналог.

Разработка пока не имеет аналогов в России. До сих пор работу по замене в аудиотреке нежелательных слов специалистам приходится делать вручную.

Еще одно важное преимущество инструмента – в том, что замена производится голосом говорящего.

«Сложнее всего оказалось добиться приемлемой точности. Приходилось долго подбирать нужные коэффициенты», – рассказала автор проекта.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Cтудентка создала программу по переозвучиванию сленговых слов в аудиофайлах
Freepik

В будущем разработку студентки можно адаптировать для работы с потоковой речью. В этом случае программа сможет очищать речь говорящего от сленговых и нецензурных слов в прямых эфирах, что может быть полезно для СМИ и блогеров.

Однако для этого программе предстоит еще многому научиться: пока она умеет распознавать только около 50% вводимых сленговых слов.