Три | Яндекс (yandex) @ tele.ga

May 25, 2023

Три неочевидных факта о генеративных картиночных сетях из нового yet another podcast — про Шедеврум, Midjourney, Stable Diffusion и другие генеративные сети.

🌫 Самый современный подход к генерации изображений — диффузионные модели. Во время обучения нейросеть учится удалять с картинок из датасета случайные шумы. Когда она генерирует новую картинку, то постепенно превращает шум в «чистое» изображение.

🖐 Генеративные сети плохо справляются с пальцами по двум причинам. Во-первых, в датасетах для обучения мало изображений рук, пальцев и ладоней. Во-вторых, руки на картинке могут находиться в разных положениях — нейросети сложно в них разобраться.

📷 Генеративные сети хорошо понимают технические описания картинок, например «собака, ISO 1200, Unreal Engine, macro, f/1.8, high resolution», потому что такими тегами часто описываются картинки в датасетах для обучения.

Как генеративные сети придумывают сюрреалистические картинки, заменят ли они художников, что будет делать генеративный Photoshop — про всё это в новом yet another podcast на YouTube и в Яндекс Музыке.

Это Шедеврум! Почему нейросети плохо рисуют пальцы на руках (yet another podcast #12)
Яндекс выпустил собственный продукт для генерации картинок — приложение Шедеврум. Другие генеративные картиночные сети — Midjourney, Stable Diffusion, DALL-E — становятся героями новостей не реже ChatGPT. Одни создают фотореалистичные изображения, другие генерируют сюрреалистические картинки, которые становятся мемами. yet another podcast встретился с разработчиками Шедеврума Сергеем Овчаренко и Артуром Василовым, чтобы получить ответы на самые распространённые вопросы о генеративных сетях: отнимут ли они работу у художников, почему не умеют рисовать пальцы, как изменят иллюстрацию и дизайн. У эксперта, художника и гостя подкаста Кости Martadello тоже накопилось много вопросов про нейросети. yet another podcast — регулярный подкаст о новых технология, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоявшие за ними процессы. 🖼 Паблик Martadello: https://vk.com/mrtdll ⬇️ Шедеврум в App Store: https://clck.ru/34WN9L ⬇️ Шедеврум в Google Play: https://clck.ru/34WN97 🎧 yet another podcast на других платформах • Яндекс Музыка: https://music.yandex.ru/album/24046885 • Apple Podcasts: https://clck.ru/34JYfc • Google Podcasts: https://clck.ru/34JYPX 🕓 Что в подкасте: 00:00 — О чём выпуск 02:55 — Что за Шедеврум 06:07 — Яндекс снова делает соцсеть? 07:28 — Сколько людей в Шедевруме 09:05 — 😔 Алгоритмическая лента Шедеврума 11:07 — «Продукт стартаперского новогоднего производства» 13:32 — Почему Шедеврум? 15:22 — Комиксист оценивает генеративные сети 17:01 — Как рисуют генеративные сети 20:11 — Как появилась кошка-картошка 21:48 — «У разных сеток появляются свои ниши» 23:26 — 🤔 Можно ли «насвистеть» картинку 25:10 — На чём учат картиночные нейросети 28:47 — Допустимы ли ограничения при обучении 32:57 — Как отличить генерацию от картинки 35:18 — «90% картинок в интернете это копии других картинок» 38:31 — Художники против нейросетей? 43:49 — Почему нейросеть не умеет рисовать пальцы 45:44 — Почему нейросеть не умеет рисовать комиксы 49:10 — Про генеративный Photoshop 51:27 — Лайфхаки для генерации красивых картинок 54:32 — 🤯 Ну и почему всё так сложно? 57:22 — Про генеративные мемы 58:52 — Бабуля-бодибилдерша и баги Шедеврума 1:02:10 — Почему Шедеврум не понимает российскую культуру 1:03:24 — Шедеврум берёт картинки из Поиска? 1:05:44 — Что будет с Шедеврумом? 1:08:36 — Как заработать на генеративной сети 1:12:57 — «Генерация видео — катастрофически дорого» 1:16:53 — Так нейросети отнимут работу художников?