Какие роботы сейчас популярны? Нейросети, распознавание эмоций, навигация и другие тренды робототехники
Нейросетевые технологии
Каждый день выходят новости о новых областях применения нейронных сетей. В США создается нейросеть, анимирующая 2D-изображения: она обрабатывает данные об объекте, отделяет его от фона и других объектов, а затем создает 3D-модель и механизм ее движения, заполняет фон, который ранее был закрыт объектом. В Израиле нейросеть определяет интеллект по форме черепа — система анализирует черты лица человека и на их основе определяет, какие особенности заложены в его ДНК. В России создают нейросеть, способную торговать криптовалютой — анализировать рынок и делать прогнозы.
Сфер применения этой технологии достаточно много. Например, нейросеть должна отличать собак и кошек. Для настройки алгоритма дается большой массив подписанных изображений кошек и собак. Нейросеть анализирует признаки объектов на этих картинках и строит распознавательную модель, которая минимизирует процент ошибок относительно эталонных результатов.
Кстати, когда Google просит вас подтвердить, что вы не робот, и отметить светофоры или автобусы, вы проходите не элементарный тест на когнитивные способности, а обучаете нейросеть различать объекты дорожной инфраструктуры. Система будет использоваться в беспилотниках.
Применение нейронных сетей ничем не ограничено, однако свое наиболее широкое применение в робототехнике нейросети нашли в голосовых помощниках и взаимодействии с людьми. Нейросети обеспечивают точность ответа на вопросы. Качество голосового помощника зависит именно от них. Среди голосовых помощников выделяются Alexa от Amazon, Cortana от Microsoft и Siri от Apple. Среди русских — «Алиса» от Яндекса.
Чем качественнее обучена нейросеть, тем лучше она подбирает ответы на запросы собеседника: понимает обратный порядок слов, контекст и непрямой запрос. Именно это направление станет одним из самых перспективных в разработках будущего. Поскольку интернет меняет социальные процессы, скорость передачи информации и, вообще, темп жизни колоссально выросли. Но человек становится все более одиноким. Здесь будет актуален робот-компаньон, который сможет удовлетворить потребность в общении, понимании, поддержке.
В Японии уже появляются цифровые компаньоны, функционал которых выходит за рамки простых консультантов. Они становятся помощниками, друзьями и даже женами. Запад тоже не отстает: 47 млн жителей США (а это почти 20% всего взрослого населения) пользуются умными колонками, Amazon Echo или Google Alexa. Причем, исходя из последних исследований, пользуются умными колонками, не только чтобы давать им команды: 25% берут их с собой спать, 20% шутят с ними, 15% используют как няню для детей — колонка рассказывает сказки и помогает отвлечь ребенка.
Умение поддерживать диалог станет одним из ключевых требований к роботам и одним из перспективных и востребованных направлений разработки.
Система распознавания речи
Одно дело просто подобрать ответ на запрос, но правильно услышать и расшифровать запрос собеседника намного труднее. На точность влияют все элементы системы распознавания речи: обучающая выборка и сами алгоритмы распознавания.
Влияет качество аудиопотока — отношение сигнал/шум, разборчивость речи и громкость. Современные системы пытаются дополнять «нерасслышанное» за счет лингвистических моделей — в каждом языке есть свои устойчивые выражения и связки слов.
То есть, когда говорят, что для распознавания используется контекст, понимается наличие подстройки под распознавание за счет дополнительных данных, например, конкретные фразы использования, как в умных колонках, или использование определенного словаря для конкретной предметной области.
Точность или качество распознавания считается как отношение правильно распознанных слов к количеству всех произнесенных слов. Также добавляется метрика ложных распознаваний как отношение ложно распознанных слов ко всем распознанным словам.
Компания LG представила в 2018 году своего домашнего помощника. На сцене Дэвид Вандервол, старший директор по маркетингу, пытался продемонстрировать Cloi — новую технологию от LG. По размеру чуть больше капельной кофеварки, Cloi должна находиться на столе, у нее нет рук и колес, ее голова вращается и кивает во время разговора. Это голосовой помощник, предназначенный помогать в организации вашей жизни.
На сцене Вандервол спрашивал у Cloi, когда закончится стирка — относительно простой запрос должен был точно продемонстрировать, какого именно помощника LG намерена продавать. В ответ Cloi ошеломляюще замолчала.
«Даже у роботов бывают тяжелые дни, — пытался отшутиться Вандервол. — Так, если нам известно, когда закончится стирка, то можно синхронизировать работу стиральной машины с сушилкой и вспомнить, что у нас в холодильнике курица, срок годности которой истекает через три дня. Похоже, мы должны ее приготовить. Cloi, включайся в беседу: что я могу приготовить из курицы».
Но даже на эту фразу Cloi ничего не ответила.
Неизвестно, что стало причиной провала: большое пространство с акустикой, качество интернет-соединения или же недоработки в ПО. Так или иначе, робот-проводник между человеком и техникой попросту не работал.
Флагманом индустрии считается Google — уже много лет он занимается разработками в этой области, достигнув наибольшей точности и стабильности распознавания. Так, летом 2019 года компания представила обновленный голосовой помощник, утверждая, что точность распознавания (английского языка) сопоставима с человеческой. Чтобы обработать запрос и выдать релевантный ответ, системе Google требовалось не более секунды.
Однако для использования системы распознавания от Google необходимо приобретать лицензии, и это достаточно дорого. К тому же, устройство с распознаванием речи может использоваться в самых разных условиях. Параметры распознавания для домашнего помощника и робота в местах повышенного скопления людей разные. И эту специфику стараются учитывать разработчики «Промобота» — они разрабатывают систему микрофонных массивов и офлайн распознавания. Это позволит роботам меньше зависеть от качества интернет-соединения и оставаться хорошим собеседником как при нестабильном соединении, так и в шумных помещениях.
Технология распознавания лиц и эмоций
Для того чтобы организовать качественное взаимодействие между человеком и роботом, необходимо понимать, кто находится перед машиной и какие эмоции испытывает человек. Такие данные позволят ему выбирать наиболее эффективную коммуникационную стратегию, делать релевантные предложения. Например, предложить скидку на любимый сорт мороженого, чтобы вы не грустили, или сообщить об акции в отделе косметики, если робот видит перед собой девушку.
Российская компания VisionLabs предлагает самые разные отрасли применения данной технологии. Платформа распознавания лиц LUNA позволит владельцу открывать машину без ключа и оплачивать покупки с помощью селфи. Распознавание лиц от VisionLabs уже внедрено в пропускную систему школы Сбербанка, используется для верификации студента при сдачи экзаменов в Московском институте психоанализа.
Если говорить о распознавании эмоций, то оно востребовано индустриями, где предполагается обслуживание. Например, «Альфа-банк» тестирует систему распознавания эмоций клиента. Алгоритм анализирует выражение лица посетителя, после обслуживания выставляет оценку. Так банк получает обратную связь, не прибегая к опросам и интервью.
«Промобот» и Neurodata Lab запустили пилотный проект робота-эмпата, способного распознавать до 20 эмоциональных состояний человека. В соответствии с распознанной эмоцией робот будет выстраивать общение — ободрять или успокаивать собеседника, начнет шутить и дерзить, если заметит положительную реакцию. Пока проект находится на стадии тестирования, однако робот уже был представлен на выставке CES в Лас-Вегасе.
Система навигации
В зависимости от задач, существуют outdoor- и indoor-технологии. Outdoor-навигация нужна для беспилотных автомобилей и летательных аппаратов, indoor-навигация — для охранных и сервисных роботов в зданиях.
Сегодня существуют два типа навигации: глобальные и локальные. Глобальные предполагают навигацию по спутниковым системам, они востребованы в системах outdoor, но непригодны для indoor. Не всегда есть связь и низкая точность отображения положения. Локальные включают в себя навигацию посредством ультразвуковых, оптических и инфракрасных систем. Существующие системы — дорогие, потому главным вызовом на 2022 год станет их удешевление.
Например, система датчиков для автомобиля Tesla стоила несколько сотен тысяч долларов. Но вследствие большого распространения автомобилей с автопилотом стоимость лидара уменьшилась из-за перехода из нишевого и дорогого товара в область широко распространенного. А с появлением доступных и дешевых СВЧ-решений в робототехнике начинают применять радары миллиметрового диапазона, что раньше было доступно только как дорогая опция премиум-автомобилей.
Например, стартап Marvelmind создал высокоточную систему indoor-навигации стоимостью $349. Однако для его работы нужно от четырех стационарных маяков и один мобильный маяк, что затрудняет его применение на больших площадях и вне помещений.
Если говорить о роботах в привычном понимании, то для того, чтобы робот «Промобот» передвигался самостоятельно, без столкновений, разработчики используют почти все типы измерений: ультразвук, инфракрасные датчики ближнего действия, лидары. Это обеспечивает максимальный уровень безопасности передвижения робота.
Информационная безопасность
Обеспечение безопасности — самое главное направление робототехники. После спада эйфории относительно роботов люди начали задумываться о безопасности себя и своих данных.
Тренды угроз информационной безопасности в сфере робототехники, в целом, не сильно отступают от общих в информационной среде. Развитие интернета вещей повлияло на активное распространение ботнет-сетей, что, к сожалению, также актуально и для подавляющего числа роботизированных устройств.
Производители часто пренебрегают серьезной защитой от киберугроз или же вообще ей пренебрегают, что приводит к использованию роботов с целью шпионажа, фишинга или кражи данных.
Недавно исследователи Positive Technologies заметили, что роботы-пылесосы подслушивают своих хозяев и передают эту информацию через интернет — и даже могут майнить криптовалюту. Используя уязвимости в системе безопасности, злоумышленник может перехватить конфиденциальные данные через сетевой трафик: это не только ваши фото, но даже данные банковского счета.
В 2018 году был опубликован отчет об уязвимостях робота Pepper. Экспертам удалось передать на устройство сторонние файлы без аутентификации и даже войти в аккаунт суперпользователя. Также они смогли осуществить перехват платежной информации, данных с видеокамер и микрофонов.
С точки зрения серьезности последствий, сегодня вопрос наиболее остро стоит в сфере промышленной робототехники. На конец 2018 года число атак на информационные сети российских АСУ ТП выше, чем на банки или частных лиц, а резонансные ситуации с вирусами-шифровальщиками служат подтверждением, что даже АЭС может стать жертвой кибератаки.
Одним из решений данной проблемы может стать использование ИИ для менеджмента безопасности, что уже сегодня постепенно реализуется ведущими производителями антивирусных систем.
Вместе с тем в ближайшие несколько лет количество роботов, с которыми нам приходится сталкиваться каждый день, существенно возрастет. От этого критерия зависит безопасность человека — ключевое направление, мировая робототехника обратит внимание на эту сферу как можно раньше.
Количество автоматизированных процессов растет, а значит и все больше роботов проникает в нашу повседневность. Требования к качеству работы роботов возрастают, поскольку они выходят на уровень инфраструктурной единицы, а не диковины и причуды. С развитием наиболее востребованных отраслей робототехники необходимо повысить качество работы голосовых ассистентов, включающих распознавание речи, качество обработки запросов и ответ на них. Для распространения беспилотников и сервисных роботов требуется удешевление систем навигации. Главным образом, для защиты человека и его данных при взаимодействии с роботами необходимо исключить все уязвимости в системе безопасности. Это и есть главные вызовы на 2022 год.
Искусственная нейронная сеть (ИНС) — математическая модель (а также ее программное или аппаратное воплощение), построенная по принципу организации и функционирования биологических нейронных сетей — нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы.