Компьютеры научились «видеть» не хуже приматов
В течение многих десятилетий нейрофизиологи пытались разработать компьютерные сети, которые смогли бы имитировать визуальные навыки, которые человеческий мозг делает очень быстро и точно — например, распознавание объектов. До сих пор ни одна компьютерная модель не была в состоянии соответствовать мозгу приматов в части визуального распознавания объектов за короткий взгляд. Тем не менее, новое исследование ученых Массачусетского технологического института показывает, что последнее поколение так называемых «глубоких» нейронных сетей вполне соответствует возможностям мозга приматов.
Ученые начали создавать нейронные сети в 1970-х годах в надежде имитировать способность мозга обрабатывать визуальную информацию, распознавать речь и понимать язык. В основе нейронных сетей лежит иерархический принцип представления визуальной информации в головном мозге: от сетчатки глаза в первичную зрительную кору, а затем в нижневисочную кору, на каждом уровне детализируясь вплоть до полной идентификации. Для имитации этого процесса ученые создают несколько слоев вычислений в своих моделях нейронных сетей. Каждый уровень выполняет определенную математическую операцию и на каждом уровне представления о визуальном объекте становятся все более и более сложными, а ненужная информация, такая как местоположение объекта или его движение, отбрасывается.
В нынешнем исследовании ученые впервые измерили способность мозга распознавать объекты, имплантировав электроды в кору головного мозга приматов, а затем сравнили полученные данные с результатами вычислений глубоких нейронных сетей. Результаты показали, что нейронные сети достигли уровня обработки визуальной информации, соответствующего головному мозгу приматов. Теперь ученые собираются усовершенствовать нейронные сети, наделив их возможностью отслеживать движения объектов и распознавать трехмерные формы.