Тринеочевидных факта о генеративных картиночных сетях из нового yet another podcast — про Шедеврум, Midjourney, Stable Diffusion и другие генеративные сети.
🌫 Самый современный подход к генерации изображений — диффузионные модели. Во время обучения нейросеть учится удалять с картинок из датасета случайные шумы. Когда она генерирует новую картинку, то постепенно превращает шум в «чистое» изображение.
🖐 Генеративные сети плохо справляются с пальцами по двум причинам. Во-первых, в датасетах для обучения мало изображений рук, пальцев и ладоней. Во-вторых, руки на картинке могут находиться в разных положениях — нейросети сложно в них разобраться.
📷 Генеративные сети хорошо понимают технические описания картинок, например «собака, ISO 1200, Unreal Engine, macro, f/1.8, high resolution», потому что такими тегами часто описываются картинки в датасетах для обучения.
Как генеративные сети придумывают сюрреалистические картинки, заменят ли они художников, что будет делать генеративный Photoshop — про всё это в новом yet another podcast на YouTube и в Яндекс Музыке.
Это Шедеврум! Почему нейросети плохо рисуют пальцы на руках (yet another podcast #12)
This site uses cookies to collect data and enhance your experience. Visit our Privacy Policy to learn more. By using this website you consent to their use. Accept and close.