You are here

Учёные МГУ: нейронные сети рисуют хуже людей

Printer-friendly versionSend by email

Сотрудники факультета вычислительной математики и кибернетики МГУ сравнили успехи профессиональных художников и компьютерных алгоритмов в восстановлении испорченных изображений. Оказалось, что художники с этой задачей справляются гораздо лучше искусственного интеллекта. Результаты эксперимента помогут в развитии программ для редактирования фото и видео. Тест проводился в рамках большого проекта разработки алгоритмов обработки видео.

Image inpainting — процесс восстановления недостающей части изображения, то есть заполнение областей изображения, содержимое которых неизвестно. При восстановлении важно «дорисовать» фотографию так, чтобы не было заметно отреставрированной части. Метод image inpainting часто используется при удалении лишних объектов с изображения или при восстановлении старых фотоснимков.

Дмитрий Ватолин, старший научный сотрудник лаборатории компьютерной графики и мультимедиа факультета вычислительной математики и кибернетики МГУ, пояснил: «Существует масса случаев, когда объект нужно удалить на картинке. Самые известный случай — это ретуширование. Пример современной модной темы — "Селфи без чудаков" — когда делаешь селфи, кто-то обязательно норовит хотя бы в край кадра попасть. Текущее развитие алгоритмов скоро приведет к тому, что такие фото можно будет неплохо ретушировать полностью автоматически даже при достаточно сложном фоне».

Ранее image inpainting требовал больших временных и физических затрат. Обновлением и реставрацией изображений занимались художники вручную. Однако сейчас существуют разные автоматические методы рисования.

Учёные МГУ получили результаты реконструкции изображений девяти технологичных методов рисования и трех профессиональных художников. Были взяты несколько изображений разной сложности в зависимости от количества деталей на фотографии. В центре каждого изображения был нарисован черный квадрат, который и предстояло зарисовать искусственному интеллекту и художникам. Люди и машины должны были восстановить первоначальный вид искаженного изображения. В эксперименте были использованы шесть методов рисования на основе нейросетей и три метода, разработанные еще до глобального тренда на искусственный интеллект.

Изображения, отретушированные нейросетевыми методами и классическими, сравнили между собой и с изображениями, отретушированными художниками. Для сравнения использовалась платформа Subjectify.us, на которой 215 человек выбирали, кто справился с ретушированием изображения лучше, — нейросеть, классический метод или человек. Пользователи платформы не знали автора ретуши и не видели до этого оригинальных изображений.

Оказалось, что способности художников превзошли результаты машинного интеллекта с большим отрывом. Лишь в одном случае реставрация алгоритма превзошла работу человека. Интересно, что изображения художников оказались на одном уровне с оригинальными фотографиями, а иногда выглядели даже лучше.

Первое место среди автоматических подходов досталось нейросетевому методу Generative Image Inpainting. Но в некоторых случаях классические методы превзошли результаты нейросетевых. Так, нейросетевой метод Generative Image Inpainting, который был предложен в 2018 году, восстановил фотографию морских волн хуже, чем классический метод Exemplar-Based Image Inpainting, предложенный 14 лет назад.

Михаил Ерофеев, младший научный сотрудник лаборатории компьютерной графики и мультимедиа факультета ВМК МГУ, где проводили эксперимент, объяснил итоги исследования: «В результате можно говорить, что в большинстве случаев люди справляются с восстановлением изображений лучше, чем автоматические методы, — восстание машин пока не предвидится. Классические подходы составляют достойную конкуренцию новейшим нейросетевым методам. Например, нейросетевой метод Generative Image Inpainting хоть и занял первое место среди автоматических методов в среднем, на отдельных изображениях уступил первенство другим подходам, включая классические. Следом за ним идет не нейросетевой метод Content-Aware Fill из Adobe Photoshop CS5, разработанный в 2010 году, задолго до начала повсеместного применения нейронных сетей».

Subscribe to Syndicate

Все материалы сайта доступны по лицензии Creative Commons Attribution 4.0 International