Как установить и использовать DragGAN AI Tool?

Редактирование фотографий — лишь одна из нескольких областей, в которых искусственный интеллект произвел революцию. Инструмент искусственного интеллекта DragGAN, созданный Институтом Макса Планка. Исследовательская команда является одной из последних разработок в этой области.

Благодаря интуитивно понятному интерфейсу перетаскивания этот инструмент является значительным шагом вперед в развитии программного обеспечения для редактирования фотографий. Здесь мы рассмотрим инструмент для редактирования фотографий AI DragGAN и покажем вам, как его настроить и запустить на вашем компьютере.

Пошаговые инструкции по установке DragGAN AI Tool

Инструмент искусственного интеллекта DragGAN теперь доступен только в качестве предварительного просмотра через публикацию исследовательской группы. Тем не менее, команда также поделилась кодом публично, и веб-сайт инструмента в настоящее время работает. Выполните следующие шаги, чтобы установить инструмент DragGAN AI на свой компьютер Mac или Windows:

Шаг 1: Установите Конду

  • Если у вас еще не установлена ​​Conda, поищите в Интернете инструкции по установке Conda в вашей операционной системе. Вы также можете следить за официальная документация.
  • После установки Conda перейдите к следующему шагу.

Шаг 2: Клонируйте репозиторий

  • Теперь перейдите к Репозиторий GitHub для DragGAN и нажмите кнопку «<> Код» в правом верхнем углу.
  • Затем убедитесь, что вы выбрали вкладку «Локальные» > вкладку «HTTPS» и щелкните значок «Копировать ссылку», чтобы скопировать ссылку на репозиторий.
  • Откройте терминал или командную строку.
  • Перейдите в каталог, в который вы хотите установить DragGAN.
  • Клонируйте репозиторий DragGAN, выполнив следующую команду:

git clone (URL-адрес репозитория)

Замените (URL-адрес репозитория) на URL-адрес репозитория DragGAN, который вы скопировали ранее.

Шаг 3: Настройте среду Conda

  • Измените каталог на папку DragGAN:

компакт-диск DragGAN

  • Создайте новую среду Conda, используя файл environment.yml:

conda env создать -f environment.yml

Если вы видите ошибку, вы должны изменить файл environment.yml.

Запустите текстовый редактор или IDE, например Visual Studio Code, и перейдите к файлу environment.yml. Если вы используете Mac, а не видеокарту NVIDIA, вы можете удалить строку набора инструментов Cuda (cudatoolkit). Однако вам необходимо установить Cuda Toolkit версии 11.1 или 11.3.1, если вы используете компьютер Windows с графической картой NVIDIA. Вы также должны переместить его из раздела «зависимости» в раздел «pip» файла.

Затем замените одинарный знак равенства двойным знаком равенства в строке «scipy» и переместите его из раздела «зависимости» в раздел «pip» файла. Сохраните файл и вернитесь к терминалу.

  • Создайте новую среду Conda, используя файл environment.yml:

conda env создать -f environment.yml

  • Активируйте только что созданную среду Conda, выполнив следующую команду:

conda активировать stylegan3

  • Установите необходимые зависимости Python, выполнив следующую команду:

pip install -r требования.txt

На этом этапе вы можете получить ошибку. Но не волнуйтесь. Вы можете смело игнорировать ошибку.

Шаг 4. Включите резервные копии для MPS

Экспортируйте переменную среды, чтобы включить запасные варианты для MPS (версия CUDA от Apple):

экспорт PYTORCH_ENABLE_MPS_FALLBACK=1

Этот шаг обеспечивает совместимость с центральными процессорами, если ускорение графического процессора недоступно.

Шаг 5: Загрузите предварительно обученные модели

Загрузите предварительно обученные модели, выполнив следующую команду:

скрипты Python/download_model.py

Обратите внимание, что этот процесс может занять некоторое время из-за большого размера моделей. Убедитесь, что у вас есть стабильное подключение к Интернету во время загрузки.

Шаг 6: Запустите графический интерфейс

Запустите графический интерфейс, выполнив следующую команду для Mac и Windows соответственно:

ш-скрипты/gui.sh

.\скрипты\gui.bat

К сожалению, на данный момент эта команда не работает. В качестве обходного пути вы можете использовать эту команду для запуска графического интерфейса:

Python visualizer_drag_radio.py

Локальный URL будет отображаться в терминале. Скопируйте URL-адрес и откройте его в веб-браузере.

Для получения дополнительной информации вы можете проверить видео по Мэтью Берман ниже.

Как использовать ДрагГАН

Если вы хотите изменить изображение, посетите локальный URL-адрес, на котором будет размещен DragGAN AI, и загрузите его туда. Изображения могут быть чем угодно, от людей и животных до пейзажей и автомобилей. Вот как использовать DragGAN:

  • После того, как вы открыли локальный URL-адрес в веб-браузере, вас должен приветствовать интерфейс DragGAN.
  • В верхнем левом углу интерфейса DragGAN выберите предварительно обученную модель, соответствующую теме вашего изображения (например, собаки, лошади, люди и т. д.).
  • Нажмите на изображение и выберите как минимум две точки (нажмите Добавить точку), чтобы определить желаемое преобразование. Вы можете выбрать дополнительные точки для более точной настройки.

ДрагГАН

  • После того, как точки выбраны, нажмите кнопку «Старт».
  • Терминал, на котором вы запустили графический интерфейс, будет отображать ход обработки изображения с номером текущего шага.
  • Следите за шагами, чтобы убедиться, что процесс идет правильно. Обратите внимание, что может возникнуть ошибка, из-за которой шаги перестают увеличиваться после 100. В таких случаях остановите процесс вручную.
  • Когда изображение вас удовлетворит, нажмите кнопку загрузки (в правом верхнем углу), чтобы сохранить его на свой компьютер.
  • Чтобы удалить выбранные точки и начать заново, нажмите кнопку «Сбросить точки».

Инструмент все еще находится на ранней стадии разработки, и исследовательская группа постоянно совершенствует его.

Примечание. DragGAN может не полностью использовать ускорение графического процессора на компьютерах с Windows, а Metal на macOS может иметь ограничения. Разработчики работают над решением этих проблем и улучшением совместимости в будущих обновлениях.

Заключительные слова

DragGAN — это захватывающий инструмент искусственного интеллекта для манипулирования изображениями путем выбора отдельных точек. Это изменит наше отношение к редактированию фотографий в будущем. Мы думаем, что это фантастическая инновация, не похожая ни на что, что мы видели раньше. Хотя он находится на ранних стадиях, у него есть потенциал стать следующим крупным достижением в области ИИ.

Мы надеемся, что это руководство помогло вам установить и начать использовать DragGAN. Что вы думаете о DragGAN? Вы уже пробуете это? Вы находите это захватывающим или видите, как это может быть полезно? Поделитесь своими мыслями и опытом в разделе комментариев ниже.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *