Проверено лично: как мы тестировали нейросети и что из этого вышло
Сегодня только ленивый не пробовал сгенерировать какую-нибудь картинку в нейросети забавы ради. Мы решили подойти к этой задаче обстоятельно и глубже изучить специфику работы ИИ глазами и руками профессионалов. Первым делом мы выбрали для сравнения три популярные нейросети: Кандинский, Midjourney и Freepic Picaso. Запрос для генерации изображения составили такой: A girl in the forest sitting near fireplace with cup of tea (Девочка в лесу сидит возле камина с чашкой чая). Чем порадовал нас виртуальный разум, расскажем и покажем прямо сейчас. А заодно приложим краткий обзор нейронок со всеми их плюсами и минусами.
Кандинский
Кандинский — нейросеть для создания картинок от Сбера, где генерация осуществляется по текстовому запросу. Впрочем, в этом она схожа с большинством аналогичных продуктов ИИ. Одной из главных фишек программы разработчики называют максимальное приближение к фотореализму. И если топовые нейронки в основном «общаются» с пользователем исключительно на английском, эта нейросеть неплохо понимает русский язык и выдает более чем адекватный результат.
При работе с нашим заданием про девочку в лесу она и правда сгенерировала довольно хорошее изображение, в целом соответствующее запросу.
Немного подробнее остановимся на технических тонкостях. Кандинский позволяет работать со слоями, как в фотошопе или других графических редакторах. Предусмотрена генерация изображений по частям. Кстати, в этой программе можно загрузить уже готовое фото или картинку, задать определенный стиль и получить обновленное изображение. В бесплатной версии легко изменять желаемые размер и пропорции картинки. Один из режимов предусматривает редактирование, или дорисовку. Например, вы берете готовое фото, загружаете в программу и просите нейросеть дополнить его деталями, оставшимися за кадром.
Midjourney
Нейросеть Midjourney входит в топ лучших на протяжении нескольких лет. Во многом благодаря высокому уровню фотореализма и качеству изображений. Эксперты особо отмечают ее возможности в области редактирования и гибкую настойку параметров. Дизайнерам и художникам нейронка нравится еще и тем, что с ней можно создавать иллюстрации в высоком разрешении с сохранением единого стиля. Работа с нейросетью по нашему запросу позволила выявить следующие особенности.
Генерация рассчитана сразу на четыре изображения, то есть одновременно сеть работает над несколькими задачами. И, что особенно ценно — количество попыток до достижения окончательного результата неограниченно. Более того, можно создавать изображения на основе одного из наиболее удачных ранее сгенерированных. Это позволяет получить максимально точное соответствие искомому запросу.
Отдельно отметим, что готовые картинки более художественны, по сравнению с аналогами от других ИИ. При необходимости можно выполнить редактирование конкретных деталей через все тот же фотошоп. Обращаем внимание, сгенерированные по запросу картинки выдаются в низком и среднем разрешении. Также следует упомянуть еще одну удобную функцию — доступ к нейросети через телеграм-бот.
Freepic Picaso
Freepic Picaso — не менее популярная нейросеть, позволяющая создавать изображения на основе пользовательских запросов. В этой программе помимо прочего есть функция преобразования эскизов в полноценные художественные изображения. Работает это так: вы загружаете выполненный от руки рисунок или скриншот и в режиме текущего времени видите на мониторе его облагороженную версию от ИИ.
Картинки с нуля эта нейросеть генерирует тоже шустро и относительно качественно. Судя по работе с нашим запросом, изображения получаются довольно художественными, реалистичными и текстурными. Некоторые фото вышли на удивление атмосферными, с подробной прорисовкой деталей, игрой света и тени.
Однако в процессе тестирования обнаружились недоработки. В частности, генерация изображений особой точностью не отличается. Иногда требовалось больше двух попыток, чтобы скорректировать запрос и добиться более полного соответствия. Например, программа выдала несколько ошибок в изображении рук и других частей тела. Отсюда возникает необходимость редактирования, что замедляет процесс. Тормозит работу и то, что пользователю предоставляется в сутки ограниченное количество попыток на генерацию.
Что важно знать
Подводя итоги, можно сказать, что какую нейросеть не возьми, функционал у нее будет стандартный. Хотя при большом желании можно условно разделить их на категории, исходя из того, под какие задачи они заточены. Например, одни нейронки работают на базе генеративного ИИ, другие — на базе редактирующего.
Вот несколько ценных практических рекомендаций, которые мы вывели в процессе работы с тремя выбранными программами.
- Самое важное и основное — составить максимально четкий и подробный промт, то есть, собственно, техническое задание, которое предстоит выполнять ИИ.
- Очень важно учитывать какая нейросеть в вашем распоряжении, а конкретно — на какие задачи она ориентирована лучше всего.
- Если полученная картинка не совсем отвечает запросу, нужно вернуться к промту и выполнить редактирование.
- Обязательно проверять разрешение и качество сгенерированного изображения, поскольку далеко не все нейросети создают сверхчеткие картинки.
- Кстати, если выбранная нейросеть не дает изображение необходимого качества, можно обратиться к другой, которая умеет повышать разрешение картинки.
- Наконец, нельзя забывать про финальное редактирование. Оно позволит убрать шероховатости и получить максимально точный результат.
Наше собственное тестирование наглядно показывает, создавать картинки с помощью ИИ — больше, чем просто развлечение. В умелых руках нейросеть вполне может стать эффективным и полезным инструментом для решения разных задач. Но для этого нужно больше практиковаться, чтобы понять специфику ее работы и использовать предоставленные возможности на все сто.