Секреты шумоподавления: как услышать голос сквозь грохот отбойного молотка
«Это один маленький шаг для человека, но гигантский скачок для всего человечества», — произнес Нил Армстронг, и через полторы секунды его слова услышали на Земле. До товарищей по экипажу, База Олдрина и находящегося на окололунной орбите Майкла Коллинза, они донеслись почти без задержки. Но раньше всех историческую фразу уловил один из микрофонов гарнитуры Plantronics. «На самом деле микрофонов было четыре — основной и три резервных на случай отказа, — говорит Стив Грэхем, старший инженер компании. — Но "лунная" гарнитура с современной точки зрения была очень проста, ее основная задача — обеспечить максимальную надежность. Бороться с шумами не было необходимости, поскольку на Луне их просто нет».
Земные условия в этом отношении гораздо более жесткие: нас везде окружают шумы, и борьба с ними — одна из главных задач инженеров-разработчиков. «Простейший способ отсеять шум — повысить чувствительность микрофона к полезному сигналу, а к вредному — понизить, — объясняет Стив. — Достаточно расположить микрофон как можно ближе к источнику звука и загрубить чувствительность, при этом микрофон у губ уловит даже слабую речь, а шум — нет. Это старый метод, но он в сочетании с направленными микрофонами применяется и сейчас, поскольку дает отличные результаты и не требует сложных аппаратных и программных решений. Именно так делаются гарнитуры для профессиональных применений — для операторов телефонных центров, военных, авиамехаников, пилотов».
Мал, да удал
Однако, как замечает Стив Грэхем, для потребительского рынка такой подход неприемлем: люди успели привыкнуть к миниатюрной электронике, так что разработчики стремятся сделать гарнитуры как можно более компактными, возложив задачу выделения полезного сигнала и отсеивания шумов на отдельный сигнальный процессор: «В наших самых современных беспроводных гарнитурах, таких как Voyager Edge, целых четыре микрофона. Сигналы с всенаправленных микрофонов обрабатываются с помощью нескольких различных алгоритмов — анализируется спектр сигнала и шума, задержки фазы сигналов на отдельных микрофонах, а также форма огибающей. Речь и шум имеют разные характеристики, и это как раз дает возможность отделить полезный сигнал от помех. Такой способ позволяет уверенно отсеивать умеренно громкие равномерные шумы».
Для условий, когда уровень шума, казалось бы, совершенно не дает никаких возможностей для разговора, используются ларингофоны, воспринимающие колебания голосовых связок. К сожалению, ларингофоны не способны передавать звуки с частотами выше примерно 2 кГц, поэтому работают в очень узкой нише — в основном это военные применения в экстремально шумных условиях (например, внутри бронетехники). Для потребительских гражданских нужд такая технология подходит плохо — голос собеседника полностью теряет узнаваемость.
«И мы, и наши коллеги из других компаний неоднократно предпринимали попытки создать улучшенный гражданский вариант ларингофонов, снимая сигнал с костей черепа, — говорит Стив. — Но качество передачи речи при таком методе все равно оставляло желать лучшего, и несколько лет назад от этого способа окончательно отказались. А вот другая модификация метода существует и сейчас. Речь идет о технологии голосовой активации, когда голос воспринимается и с помощью обычных микрофонов, и датчиком колебаний челюстной кости. Я сам много лет работал над этим перспективным направлением, но у технологии есть один существенный недостаток: при нарушении контакта датчика со щекой шумоподавление просто перестает работать. Так что несколько лет назад в Plantronics мы окончательно сделали выбор в пользу многомикрофонной схемы. И не прогадали. Развитие электроники сделало возможным реализацию очень сложных и совершенных алгоритмов обработки сигнала, позволяющих выделить речь при уровне шума в 80−85 дБ, что примерно соответствует работе мощного двигателя или отбойного молотка на расстоянии в несколько метров. То, что раньше считалось невозможным или требовало долгой постобработки с помощью мощного компьютера, теперь делается практически в реальном времени».
От камеры до офиса
Один из основных инструментов работы акустических инженеров Plantronics — несколько безэховых камер, выложенных внутри пенополиуретановыми пирамидками. Такое покрытие полностью поглощает и рассеивает отраженные звуковые волны, которые мешают измерениям. Внутри камеры установлен манекен, лишь отдаленно напоминающий человека, и только одна его деталь воссоздана с фантастической анатомической точностью. Это уши. Дело не только в том, что на манекене закреплены силиконовые реплики настоящих ушных раковин для крепления гарнитур, но и во внутренней начинке, которая создана по образу и подобию человеческих органов слуха, с их специфическим АЧХ (линейным на малой громкости и нелинейным на большой). В камере установлены динамики, которые могут воспроизводить самые различные шумы — от обычного уличного шума и разговоров до рева двигателей. Кроме того, как говорит Стив Грэхем, «в одной из камер можно воссоздать условия Чикаго. Речь, конечно, не о мафиозных перестрелках. Этот город известен своими ветрами. Вентиляторы, установленные в камере, дают возможность имитировать довольно сильный ветер скоростью в 20 км/ч. Но при этом мы вносим в поток турбулентность, которая повышает уровень шума, что примерно соответствует реальному ветру в 30−40 км/ч».
Однако создание гарнитуры не исчерпывается только инженерной и дизайнерской работой. Для того чтобы сделать конечный продукт не просто хорошо сидящим на ухе, но и удобным для использования, в Plantronics придумали несколько типичных пользователей — от операторов телефонного центра до обычных офисных работников. У этих виртуальных персонажей есть не только детально проработанные профили, с биографиями, увлечениями и фотоальбомами, но и реальные (!) рабочие места в офисе компании. Это сделано для того, чтобы любой из инженеров, дизайнеров или маркетологов мог не просто теоретически представлять, для кого он создает свои изделия, но и почти в буквальном смысле «влезть в шкуру» конечного пользователя.
Шепнуть на ушко
Джо Бёртон, директор по технологиям и вице-президент Plantronics, на мой вопрос о том, как он относится к «умным» часам и очкам типа Google Glass, отвечает просто и уверенно: «Я могу сделать лучше!» По его словам, все то, что могут очки за тысячу долларов и часы за пятьсот, можно реализовать в гарнитуре, добавив к ее стоимости всего $50. И это не пустые слова. Джо демонстрирует на первый взгляд обычную гарнитуру Voyager Legend: «В новых серийных моделях Voyager Legend и Voyager Edge есть датчики ношения, благодаря которым можно автоматически ответить на звонок, просто надев гарнитуру на ухо. Но это не серийная модель, а прототип, оснащенный дополнительными датчиками, которые позволяют определить, например, положение головы и направление взгляда человека. Не составляет особой проблемы встроить в него датчики температуры и пульса, да и вообще здесь все ограничено только человеческой фантазией. Да, конечно, у гарнитуры нет экрана, но не стоит забывать, что слух — второй по информативности канал получения данных об окружающем мире. Устные подсказки, на мой взгляд, ничем не хуже визуальных, а в некоторых случаях (скажем, во время вождения автомобиля) даже лучше. Так что гарнитуры в этом отношении — очень перспективное направление, вполне возможно, что именно такие устройства станут следующим поколением носимой электроники — hearables (от hear, слушать, и wearables, носимая электроника)».
Битва технологий
Сегодня на рынке гарнитур с шумоподавлением конкурируют две основные технологии: многомикрофонные схемы и системы с голосовой активацией. В синем углу нашего ринга — Plantronics Voyager Edge, оснащенный четырьмя всенаправленными микрофонами, сигналы с которых обрабатываются по специальному алгоритму. Его противник — Jawbone New Era, использующий голосовую активацию (по сигналам дополнительного датчика колебаний челюстной кости). В качестве тестовых шумов мы использовали жужжание сеточной бритвы, музыку, шум текущей воды, уличные шумы и аэродинамические шумы (ветер). Вот наши субъективные выводы.
Plantronics Voyager Edge
Плюсы: естественная передача голоса в условиях умеренно сильных шумов, голосовое меню на русском языке, распознавание голосовых команд (в том числе на русском языке) при ответе на звонок , «умные» датчики ношения гарнитуры. Минусы: не самая уверенная посадка в ухо, при энергичных движениях может выпасть. Хорошо подавляет: шум электробритвы, уличные шумы, шум текущей воды, аэродинамические шумы; не очень хорошо подавляет: музыку.
Jawbone New Era
Плюсы: очень удобная и уверенная посадка в ухо, не выпадет даже при энергичных движениях; шумоподавление в условиях очень сильных шумов; очень маленькие размеры. Минусы: отcутствие голосового меню на русском языке, не всегда естественная передача голоса, cлабое шумоподавление при плохом контакте датчика гарнитуры со щекой. Хорошо подавляет: уличные шумы, музыку, аэродинамические шумы; не очень хорошо подавляет: шум электробритвы, шум текущей воды.