Nature Neuroscience: нейронные сети генерируют собственные представления
Фото: Joshua Woroniecki / Unsplash
Нейробиологи Массачусетского технологического института раскрыли, что глубокие нейронные сети отличаются от человеческого мозга тем, как они распознают различные изображения одних и тех же объектов. Результаты исследования опубликованы в журнале Nature Neuroscience.
Когда нейронные сети использовались для генерации изображения или слова, на которые они реагировали так же, как и на естественный входной сигнал (например, изображение собаки), большинство из них генерировали изображения или звуки, неузнаваемые для людей. Таким образом, ученые показали, что вычислительные модели создают собственные идиосинкратические инварианты (англ. idiosyncratic invariances).
Согласно одной из гипотез, объясняющей, почему искусственные нейронные сети могут повторять вычисления биологических нейронных сетей, заключается в том, что и те, и другие создают «внутри себя» представления об объекте, игнорируя незначительные характеристики. Иными словами, распознавание фигуры человека должно быть инвариантным (неизменным) к позе и направлению освещения.
Материалы по теме:Безопасные связиКвантовые технологии МГУ имени М.В. Ломоносова ведут Россию в будущее9 апреля 2018Злой разумGoogle достигла квантового превосходства. Это может обернуться глобальной катастрофой27 октября 2019
Чтобы подтвердить, присутствуют ли инварианты, подобные тем, что используются вычислительными моделями, в человеческом восприятии, исследователи использовали модели компьютерного зрения и слуха для генерации стимулов (изображений и звуков), которые вызывают примерно одинаковые реакции у конкретного ИИ. Подобное происходит и в мозге людей, когда на определенном этапе обработки информации физически различные стимулы становятся неотличимыми для наблюдателей (например, одинаковые цвета, состоящие из световых волн разной длины). Такие сгенерированные стимулы авторы назвали метамерами модели (англ. model metamers).
Оказалось, что большинство метамеров, создаваемых ИИ, выглядят и звучат не так, как примеры в обучающих выборках. Такие изображения представляли собой беспорядочные цветные пиксели, а звуки напоминали неразборчивый шум. Люди-наблюдатели в большинстве случаев оказались не способны отнести синтезированные изображение к той же категории, что и исходное изображение. При этом каждая модель вырабатывала свои собственные уникальные инварианты, которые были неузнаваемыми для другой модели.
Ученые сделали метамеры более узнаваемыми для людей с использованием подхода, называемым состязательным обучением. Этот тип обучения был изначально разработан для борьбы с неправильным распознаванием стимулов с незаметными для человека изменениями, что известно под названием состязательной атаки. Метод задействует две нейронные сети, одна из которых генерирует образцы, а другая старается отбраковывать неправильные. В результате метамеры стали более узнаваемыми, хотя они на вид все еще сильно отличались от исходных стимулов. В то же время это улучшение не зависело от влияния обучения на устойчивость к атакам, поэтому причина эффекта пока остается загадкой.