Генерация изображений ИИ: StableDiffusion и другие на iPad

Вы когда-нибудь думали об использовании StableDiffusion или Openjourney на iPad? Хотя некоторые приложения работают без проблем, особенно если вы используете мощный iPad Pro с процессором M1 или M2. NextPit объясняет, как вы можете создавать изображения AI с помощью iPad.

Будь то в App Store, Instagram или Reddit, вы вряд ли сможете бросить камень в Интернет прямо сейчас, не наткнувшись на изображение, созданное искусственным интеллектом. Всего несколько месяцев назад единственным способом сделать это был интерфейс браузера а-ля Dall-E Mini, а теперь в свободном доступе бесчисленное множество моделей ИИ для создания практически всех видов изображений.

Когда StableDiffusion и другие прошлым осенью произвели фурор, генерация изображений была совсем не удобной для пользователя. Вам нужен пользовательский интерфейс а-ля Automatic1111 и самая мощная графическая карта, какая только возможна на вашем настольном компьютере. Если у вас нет подходящего графического процессора, вы также можете запускать сценарии на основе Python через Google Colab, облачную среду с практически неограниченной вычислительной мощностью. Или вы могли бы просто заплатить за это в Midjourney, но тогда застряли бы с относительно специфическим стилем изображения.

Так как же StableDiffusion работает на iPad?

Со временем вычислительная мощность, необходимая для создания изображений ИИ, уменьшилась. Генерация изображений ИИ теперь работает не только на высокопроизводительных компьютерах или в облаке, но и на iPad. Мы опробовали на iPad Pro (2022 г.) два разных приложения на базе чипа M2, в которых были представлены как сильные, так и слабые стороны: «Герника» и «Рисуй вещи».

Оба приложения представляют собой просто графический интерфейс для создания изображений с использованием модели. Оба приложения по своей сути предоставляют список моделей изображений, которые вы можете загрузить. Здесь и там вы сможете найти StableDiffusion в различных версиях, а также Openjourney, альтернативу Midjourney с открытым исходным кодом. Draw Things, с другой стороны, предлагает обширный список от Диснея до Аниме и Супер Марио.

И Draw Things, и Guernika также позволяют загружать собственные модели, которые всегда доступны в виде файлов .CKPT. Аббревиатура расшифровывается как Checkpoint и относится к «мыслительному» состоянию модели машинного обучения, замороженной в виде файла. В Интернете есть бесчисленное множество источников для каждой мыслимой модели.

Какие настройки важны?

Помимо модели, в обоих приложениях вы найдете ряд настроек, которые в значительной степени совпадают. Конечно, здесь особенно важны подсказки, а также «Шаги» и «Шкала навигации».

Рисовать вещи Скриншот

Чтобы получить желаемый результат с Draw Things, есть много вариантов настройки — и масштабирование! / © NextPit

Подсказка — это текстовая инструкция, из которой модель ИИ генерирует изображение. На первый взгляд это звучит проще, чем есть на самом деле, потому что для получения хороших результатов в желаемом стиле часто требуются сложные подсказки. Вы также можете использовать отрицательные подсказки, чтобы исключить определенные стили изображения, углы или вещи. Но о подсказках мы поговорим отдельно ниже.

Шаги указывают, сколько шагов используется для создания изображения. Большее количество шагов в основном приводит к более высокому качеству, но также требуется больше вычислительного времени. В зависимости от используемой модели, разное количество шагов даст хорошие результаты. Шкала навигации определяет, насколько модель может отклоняться от ваших подсказок. Низкое значение дает ИИ больше «искусственной свободы».

Как в Draw Things, так и в Guernika вы также можете включать другие изображения в качестве входных данных. Для этого в каждом случае есть ползунок «Сила», который определяет, насколько результат должен быть близок к исходному изображению. Поскольку каждое сгенерированное изображение уникально, Draw Things предлагает возможность создать до 100 изображений за один раз. Герника даже предлагает бесконечный режим!

Герника Скриншот

Герника имеет почти те же настройки, что и Draw Things. Однако вы не можете настроить разрешение (пока). / © NextPit

Последняя функция доступна только в Draw Things: именно здесь вы можете установить выходное разрешение. В настоящее время Guernika предоставляет изображения только размером 512 × 512 пикселей, хотя разработчик пообещал вскоре выпустить обновление с большей гибкостью. Вы также можете добавить масштабирование AI в Draw Things, что еще больше увеличивает разрешение. Таким образом, вы можете создавать изображения с высоким разрешением от 12 мегапикселей и выше.

Похоже, вы готовы к работе! На нашем iPad M2 создание изображений AI заняло от 20 секунд до 5 минут, в зависимости от выбранных нами настроек. Оказалось удобным проверить подсказки с очень низким разрешением на пригодность, а затем сразу же создать большую партию изображений с высоким разрешением, если результаты выглядят многообещающе.

Как получить правильные подсказки?

Написание хороших подсказок — это наука сама по себе, и вам нужно сначала научиться и потренироваться. Неслучайно на профильных порталах уже появляются первые предложения о работе в качестве «оперативного инженера», т.е. того, кто пишет инструкции для ИИ.

Ваши подсказки дают мусор вместо шедевров? Затем позвольте себе вдохновиться комбинациями ключевых слов, которые другие пользователи использовали для достижения отличных результатов. На таких сайтах, как PromptHeroвы можете щелкнуть изображение AI и посмотреть, какая модель или контрольная точка и какая подсказка использовалась для создания каждого изображения.

Кстати, вы также можете попросить ChatGPT написать для вас обширные подсказки по определенным мотивам. Просто попробуйте.

Что вы думаете об искусстве, созданном искусственным интеллектом в целом? Считаете ли вы текущее развитие вокруг Midjourney, StableDiffusion и других захватывающим, пугающим или и тем, и другим? Хотите узнать больше об этой теме на NextPit? Жду вашего мнения в комментариях!

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован.