«Шедеврум» от «Яндекса»: как пользоваться новой отечественной нейросетью
Компания «Яндекс» выпустила прототип приложения «Шедеврум», которое умеет генерировать изображения с помощью нейросети. Запросы можно составлять как на русском, так и на английском языках. Об этом сообщает издание «Тинькофф Журнал».
Что известно о нейросети «Шедеврум» для генерации рисунков на русском языке
Известно, что «Шедеврум» генерирует изображения методом каскадной диффузии: сначала создает картинки в соответствии с запросом, затем поэтапно увеличивает их разрешения и добавляет детали. Нейросеть учитывает пожелания. Например, «фотореализм» или «высокая детализация», — передаёт pronedra.ru.
Первую версию нейросети обучили на 240 миллионах примеров картинок с текстовыми описаниями. Представители компании «Яндекс» уточнили, что чем подробнее запрос пользователя, тем точнее результат: нейросеть очень любит конкретику. Обучение модели продолжается на наборе данных из 500 миллионов примеров.
«Яндекс» показал несколько примеров генерации изображений. Но пользовательские результаты могут от них отличаться как качеством детализации, так и разрешением.
Как пользоваться нейросетью
Приложение доступно в российских магазинах на iOS и Android. Генерация работает только в мобильном приложении, на сайте такой возможности, к сожалению, нет. На главной странице вам нужно нажать на галочку и ввести запрос на русском или английском языке. Генерация занимает около одной минуты — в зависимости от загруженности сервера. После генерации приложение предложит четыре варианта картинки, как Midjourney. Выбранное изображение можно сохранить и опубликовать в ленте. Сохранить картинку без публикации в ленту не выйдет.
В общей ленте все изображения публикуются рядом с именем автора. Другие пользователи могут лайкать ваши публикации, а в ленте появляются посты с наибольшим количеством лайков. Поэтому публичная лента уже превратилась в соревнование по самым забавным вопросам.
«Шедеврум» генерирует картинки в разрешении 256 х 256. Большее разрешение выставить нельзя, хотя современные нейросети могут рисовать изображения в лучшем качестве. Даже Kandinsky от Сбера генерирует в разрешении 768 х 768.
По словам пользователей, нейросеть хорошо справляется с художественным стилем, но реализм у нее не получается: слишком много артефактов и искажений. Дополнительные параметры вроде «повышенная детализация» или «4K» не помогают.