Ученые создали инструмент для редактирования объектов на изображении

N+1Hi-Tech

Нейросеть получила удобный интерфейс редактирования изображений

Он напоминает редактор внешности в видеоиграх

Виктория Земляк

40c394a560f62d417ec8c9208cc0404f.gif
Пример работы DragGAN. Theobalt et al. / arXiv, 2023

Ученые из США и Германии создали инструмент для редактирования объектов на изображении DragGAN. Он основан на нейросети, которая на лету генерирует новые изображения. Пользователь может отмечать мышкой разные элементы на фотографии, и они реалистично перемещаются, поворачиваются, растягиваются и уменьшаются — похожий подход нередко используют в видеоиграх для редактирования внешности персонажа. Препринт доступен на arXiv.org.

В последние пару лет случился бум диффузионных нейросетей для генерации изображений по текстовым запросам — например, Stable Diffusion, DALL-E и Midjourney. Диффузионная модель умеет генерировать реалистичные изображения из случайного шума, а текстовое описание подсказывает модели, что именно должно быть на изображении. Но есть проблема: диффузионные нейросети недостаточно точны и не подходят, если нужно выполнить очень конкретную задачу при редактировании: сдвинуть объект на несколько пикселей в определенную сторону или повернуть его на определенное количество градусов.

Задачу точного редактирования изображений можно решить с помощью других нейросетевых архитектур. Например, до появления диффузионных нейросетей часто использовали GAN — генеративно-состязательные сети. Такая модель состоит из двух нейросетей: генеративной и состязательной. По сути две нейросети соревнуются друг с другом: состязательная сеть учится отличать реальные изображения от сгенерированных, а генеративная, в свою очередь, пытается сгенерировать максимально реалистичные изображения из случайного шума (на этой идее основаны и диффузионные модели). Состязательная сеть посылает сигнал генеративной модели — сообщает ей, насколько реалистичное получилось изображение. И так до тех пор, пока генеративная сеть не научится обманывать состязательную.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

У горных горилл насчитали шестьдесят три жеста У горных горилл насчитали шестьдесят три жеста

Ученые описали жестовый репертуар диких горных горилл

N+1
Как изменились цены на популярные автомобили в России. Список Как изменились цены на популярные автомобили в России. Список

Как изменились цены самых популярных автомобилей на российском рынке

РБК
Как роботы захватывали ПМЭФ: от диковинки до обыденности Как роботы захватывали ПМЭФ: от диковинки до обыденности

Как на примере роботов ПМЭФ можно проследить путь прорывной технологии

Inc.
Солнце Солнце

«Солнце не только великий созидатель, но и великий разрушитель»

Здоровье
История культового символа Лондона: почему телефонные будки красного цвета История культового символа Лондона: почему телефонные будки красного цвета

Почему телефонные будки Лондона окрашены именно в яркий красный цвет?

ТехИнсайдер
Зло под солнцем: что такое тропическая медицина и какие болезни представляют наибольшую угрозу для путешественников Зло под солнцем: что такое тропическая медицина и какие болезни представляют наибольшую угрозу для путешественников

Опасные заболевания постепенно осваивают умеренные широты

Вокруг света
Где берут энергию бактерии подледных озер Антарктиды Где берут энергию бактерии подледных озер Антарктиды

Как в условиях Антарктиды работает углеродный цикл?

ТехИнсайдер
Компания амазонок: самые громкие женские имена в истории русского авангарда Компания амазонок: самые громкие женские имена в истории русского авангарда

Художницы-авангардистки не считали себя феминистками

Правила жизни
Полезное расставание: как превратить неудачу в успех — мнение психолога Полезное расставание: как превратить неудачу в успех — мнение психолога

Даже из расставания можно вынести пользу

Psychologies
Ненормированный график и мозоли на теле: как устроен модельный бизнес в Китае Ненормированный график и мозоли на теле: как устроен модельный бизнес в Китае

Труд модели в Китае хорошо оплачивается, но условия работы сильно отличаются

Forbes
«Оля хайпилась на разводе, меня хотели заснять с любовницей»: Дмитрий Тарасов рассказал, как ушел от Бузовой «Оля хайпилась на разводе, меня хотели заснять с любовницей»: Дмитрий Тарасов рассказал, как ушел от Бузовой

Дмитрий Тарасов заверил, что не изменял Ольге Бузовой с нынешней супругой

VOICE
Особенный ребенок Особенный ребенок

Как на ранних стадиях распознать, что с ребенком что-то не так

Лиза
Проверяйте ответы ChatGPT: его надежность пока на низком уровне Проверяйте ответы ChatGPT: его надежность пока на низком уровне

Ученые проверили надежность ответов, которые дают генеративные поисковые системы

ТехИнсайдер
ИИ не может отличить текст, написанный человеком, от текста, созданного ИИ ИИ не может отличить текст, написанный человеком, от текста, созданного ИИ

Объем текстов, созданных ИИ, становится слишком большим

ТехИнсайдер
От воздержания до терроризма: кто такие инцелы, где они обитают и чем опасны От воздержания до терроризма: кто такие инцелы, где они обитают и чем опасны

Глава из книги «Инцелы. Как девственники становятся террористами»

Psychologies
Главное вовремя начать Главное вовремя начать

Какие протоколы красоты сочетают антиэйдж и превент в одном флаконе

Собака.ru
Как создавался образ Дарта Вейдера — главного кинозлодея в истории Как создавался образ Дарта Вейдера — главного кинозлодея в истории

Но как появился этот образ и почему Лорд ситхов выглядит именно так?

Правила жизни
Сейсмическую активность вулкана Йеллоустоун исполнят на рок-концерте! Послушали бы? Сейсмическую активность вулкана Йеллоустоун исполнят на рок-концерте! Послушали бы?

Ученые планируют создать «рок»-музыку, задействуя сейсмическую активность

ТехИнсайдер
От чистого сердца? От чистого сердца?

Истории, в которых за добрыми поступками явно прослеживается другой мотив

Лиза
Научиться дозировать Научиться дозировать

Есть способы преодолеть переедание, а заодно и усталость (и нелюбовь к себе)

Psychologies
Можно ли «отмотать назад» свой возраст? Да, говорят генетики, и вот как стать новым Дорианом Греем Можно ли «отмотать назад» свой возраст? Да, говорят генетики, и вот как стать новым Дорианом Греем

Ученые показали, как повернуть вспять ход собственных биологических часов

Вокруг света
Кто охраняет Меган Маркл, Бейонсе и других звезд - самые крутые телохранители Голливуда Кто охраняет Меган Маркл, Бейонсе и других звезд - самые крутые телохранители Голливуда

Искать компанию звездам не приходится - рядом всегда будет бодигард

VOICE
Черная мамба: реальные факты о самой опасной змее на свете Черная мамба: реальные факты о самой опасной змее на свете

Как много вы знаете о черной мамбе?

ТехИнсайдер
Проблемы с сексом, тайная любовница Гитлера на протяжении 16 лет и жена на 36 часов: тяжелая судьба красавицы Евы Браун Проблемы с сексом, тайная любовница Гитлера на протяжении 16 лет и жена на 36 часов: тяжелая судьба красавицы Евы Браун

Имя Гитлера на слуху у всех, но что нам известно про любовницу и жену?

ТехИнсайдер
Дыхание предка Дыхание предка

Правда ли, что митохондрии сделали нас эукариотами

N+1
Темная материя ведет себя не как частица, а скорее как волна Темная материя ведет себя не как частица, а скорее как волна

Как именно ведут себя элементы таинственной «темной материи»

ТехИнсайдер
Враги-государства Враги-государства

Звезда «Игры в кальмара» дебютирует в качестве режиссера со шпионским боевиком

Weekend
Не весь зуд из-за плохой гигены! Вот почему хочется чесаться Не весь зуд из-за плохой гигены! Вот почему хочется чесаться

Существует ли беспричинный зуд?

ТехИнсайдер
Устремленные в небо: посмотрите на 10 самых высоких памятников в России Устремленные в небо: посмотрите на 10 самых высоких памятников в России

10 самых высоких памятников нашей страны

Вокруг света
«Сила волчьей стаи» «Сила волчьей стаи»

Реальные истории из жизни диких хищников

N+1
Открыть в приложении