Forwarded from AI Design Way / Никита Брусков
🎯 Nano Banana vs Seedream 4 — краткий текстовый разбор без хайпа
Для тех, кому лень много читать скажу коротко — 🍌 лучше. Отдельное видео снимать пожалуй не буду. Но точно включи Seedream в видео, где буду сравнивать копирование стиля.
Итак, я сравнил Nano Banana и новый Seedream (который многие уже успели окрестить «убийцей»).
Честно: вау-эффекта от Seedream не испытал. Возможно, нужно копнуть глубже, но в ~90% моих тестов Банан оказался лучше. А у вас как?
По фактам:
👤 Сохранение внешности: без 4K у Seedream лица просто «плывут»/портятся даже там, где их трогать не нужно. С 4K — заметно лучше (ниже скажу о платформах и где это вообще доступно).
🗣️ Промпты: Банан лучше понимает простые формулировки. У Seedream нужно писать точнее. (Есть офиц. гид по промптам, там кстати и прикольные кейс есть: https://bytedance.larkoffice.com/docx/PBvldM6Xlo5OHKxsRNVcyAq4nFe)
👔 Смена одежды: в моём тесте Seedream удалил часть ноутбука — неидеально.
🧳 Замена фона: без 4K сильно «шакалит» лица. С 4K — ок.
🌙 Смена дня/ночи: больше понравилось в Банане, хотя и там не идеально.
👥 Композиции с двумя людьми: у Seedream получилось хорошо.
📦 Товарные фото: тоже отлично.
🧩 Много объектов в одном кадре: результат не такой какой ожидал — вероятно, нужно детальнее прописывать, где что находится.
🧓 Реставрация старых фото: у Seedream намного слабее, чем у Банана.
🖼️ Следование инструкции по фото: увы нет — возможно, надо сильнее заморачиваться с промптом.
📐 Размер кадра: в Seedream нужно заранее задавать размер — это плюс; но если размер нестандартный, не всегда удобно.
⏱️ Скорость: обычно 30–40 cек, иногда 1–2 мин — дольше, чем хотелось бы.
Где запускал
• Krea — всё ок, 4K можно выставить! Единственно надо делайте через раздел генераций, а не через редактирование.
• Freepik — у меня выходит 2K по умолчанию, как сделать в 4K не нашёл.
• Weavy — у меня не слушается пропорции, делает квадрат, и так же не понял как сделать в 4к.
Вывод
🥇 Сильная сторона Seedream — поддержка 4K (из площадок стабильно понял как делать только в Krea).
В остальном явного превосходства не увидел. Плюс Seedream практически нельзя нормально потестить бесплатно (только тут Weavy) — на этом фоне Банан выглядит практичнее.
Скорее всего, в работе буду использовать обе модели под разные задачи, но по умолчанию — Банан. Нужны ещё тесты, копну глубже.
💬 Делитесь своими результатами. Кто у вас выигрывает и в каких задачах?
P.S. — В коментах ещё примеры тестов
Для тех, кому лень много читать скажу коротко — 🍌 лучше. Отдельное видео снимать пожалуй не буду. Но точно включи Seedream в видео, где буду сравнивать копирование стиля.
Итак, я сравнил Nano Banana и новый Seedream (который многие уже успели окрестить «убийцей»).
Честно: вау-эффекта от Seedream не испытал. Возможно, нужно копнуть глубже, но в ~90% моих тестов Банан оказался лучше. А у вас как?
По фактам:
👤 Сохранение внешности: без 4K у Seedream лица просто «плывут»/портятся даже там, где их трогать не нужно. С 4K — заметно лучше (ниже скажу о платформах и где это вообще доступно).
🗣️ Промпты: Банан лучше понимает простые формулировки. У Seedream нужно писать точнее. (Есть офиц. гид по промптам, там кстати и прикольные кейс есть: https://bytedance.larkoffice.com/docx/PBvldM6Xlo5OHKxsRNVcyAq4nFe)
👔 Смена одежды: в моём тесте Seedream удалил часть ноутбука — неидеально.
🧳 Замена фона: без 4K сильно «шакалит» лица. С 4K — ок.
🌙 Смена дня/ночи: больше понравилось в Банане, хотя и там не идеально.
👥 Композиции с двумя людьми: у Seedream получилось хорошо.
📦 Товарные фото: тоже отлично.
🧩 Много объектов в одном кадре: результат не такой какой ожидал — вероятно, нужно детальнее прописывать, где что находится.
🧓 Реставрация старых фото: у Seedream намного слабее, чем у Банана.
🖼️ Следование инструкции по фото: увы нет — возможно, надо сильнее заморачиваться с промптом.
📐 Размер кадра: в Seedream нужно заранее задавать размер — это плюс; но если размер нестандартный, не всегда удобно.
⏱️ Скорость: обычно 30–40 cек, иногда 1–2 мин — дольше, чем хотелось бы.
Где запускал
• Krea — всё ок, 4K можно выставить! Единственно надо делайте через раздел генераций, а не через редактирование.
• Freepik — у меня выходит 2K по умолчанию, как сделать в 4K не нашёл.
• Weavy — у меня не слушается пропорции, делает квадрат, и так же не понял как сделать в 4к.
Вывод
🥇 Сильная сторона Seedream — поддержка 4K (из площадок стабильно понял как делать только в Krea).
В остальном явного превосходства не увидел. Плюс Seedream практически нельзя нормально потестить бесплатно (только тут Weavy) — на этом фоне Банан выглядит практичнее.
Скорее всего, в работе буду использовать обе модели под разные задачи, но по умолчанию — Банан. Нужны ещё тесты, копну глубже.
💬 Делитесь своими результатами. Кто у вас выигрывает и в каких задачах?
P.S. — В коментах ещё примеры тестов
❤4
Forwarded from Нейронично
На миро мегаапдейт про нано банану с десятками юзкейсов и промптами.
https://miro.com/app/board/uXjVJft9A8M=/
По арту есть очень полезные штуки.
Из неартового мне больше всего понравилось, что фудблогеры могут больше вообще не готовить, а просто фоткать продукты прямо в холодильнике и получать шикарные фото готовых блюд 🤌
https://miro.com/app/board/uXjVJft9A8M=/
По арту есть очень полезные штуки.
Из неартового мне больше всего понравилось, что фудблогеры могут больше вообще не готовить, а просто фоткать продукты прямо в холодильнике и получать шикарные фото готовых блюд 🤌
🔥10
Forwarded from Нейросети и Блендер
This media is not supported in your browser
VIEW IN TELEGRAM
Вот что нового у ComfyUI — и почему это уже «идёт в продукт»:
😚 😶🌫️ Comfy запустили приватную бету Comfy Cloud — облачную версию ComfyUI, которая «просто работает»: модели уже на месте, быстрые серверные GPU, стабильность и обновления в ногу с релизами.
😚 😶🌫️ На старте заявлена поддержка всех популярных моделей и растущая библиотека кастомных нод/расширений.
😚 😶🌫️ Важный вектор монетизации: простая подписка по времени GPU — причём время, когда вы собираете граф и GPU простаивает, учитывать не будут.
😚 😶🌫️ Open-source ComfyUI останется бесплатной локально, а Cloud поможет упростить настройку GPU серверов и станет способом устойчиво финансировать развитие проекта.
😚 😶🌫️ Обсуждают rev-share с авторами кастомных нод — хотят, чтобы экосистема зарабатывала вместе с продуктом.
💗 Почему это мне нравится: у Comfy сильная аудитория и живая экосистема (много нод, быстрые релизы) — отличная база, чтобы строить коммерческий облачный продукт поверх знакомого интерфейса.
🧑🎓 Хотя пока не попробуем не поймем. Ждем открытой бетки и тестов от аудитории.
Попробовать залететь в закрытую бету можно тут: LINK
🥲 ☺️ 😊
ALL INFO
Попробовать залететь в закрытую бету можно тут: LINK
ALL INFO
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Forwarded from Ai molodca (Dobrokotov)
Вайб-пикчинг на максималках 😮
Вчера обновился Reve (писал о нем здесь), так что в ряду контекстных моделей прибыло.
Что круто — встроенная LLM'ка, так что процесс создания и редактирования картинок максимально естественный и... развлекательный?
Хотите — мороженого, хотите — пирожного, хотите — броню из Вархамерра, хотите — с десяток ракурсов сцены и других локаций (идеально для датасетов объектно-персонажных лор, которые уже не нужны).
Просто болтаете с чатом и испытываете т.н. радость.
Генерировать дают бесплатно с дневным лимитом на один аккаунт (намек).
Вчера обновился Reve (писал о нем здесь), так что в ряду контекстных моделей прибыло.
Что круто — встроенная LLM'ка, так что процесс создания и редактирования картинок максимально естественный и... развлекательный?
Хотите — мороженого, хотите — пирожного, хотите — броню из Вархамерра, хотите — с десяток ракурсов сцены и других локаций (идеально для датасетов объектно-персонажных лор, которые уже не нужны).
Просто болтаете с чатом и испытываете т.н. радость.
Генерировать дают бесплатно с дневным лимитом на один аккаунт (намек).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤩1
Forwarded from Нейронавт | Нейросети в творчестве
Forwarded from Нейронавт | Нейросети в творчестве
Qwen-Image-Edit-2509
Новая версия Qwen-Image-Edit
— поддерживает редактирование нескольких изображений одновременно, комбинируя их в различных сочетаниях, например, «человек + человек», «человек + продукт», «человек + сцена»
— улучшает согласованность при редактировании одиночных изображений: лучше сохраняет идентичность лица при изменении позы или стиля портрета, сохраняет идентичность продукта при редактировании постеров, позволяет редактировать текст, изменяя его шрифт, цвет и материал
— нативно поддерживает ControlNet, включая работу с картами глубины, контурными картами, картами ключевых точек и другими
— хорошо справляется с созданием мемов, восстановлением старых фотографий, генерацией постеров продуктов и простых логотипов, а также с редактированием текста в сочетании с изображением
Похоже, будут каждый месяц обновлять. Какие же фичи можно еще добавить?
Спасибо @kuvshin8 @aledarx
HF
GGUF
Qwen Chat
#imageediting #referencing #personalization #controlnet #colorize #QIE #imagerestoration
Новая версия Qwen-Image-Edit
— поддерживает редактирование нескольких изображений одновременно, комбинируя их в различных сочетаниях, например, «человек + человек», «человек + продукт», «человек + сцена»
— улучшает согласованность при редактировании одиночных изображений: лучше сохраняет идентичность лица при изменении позы или стиля портрета, сохраняет идентичность продукта при редактировании постеров, позволяет редактировать текст, изменяя его шрифт, цвет и материал
— нативно поддерживает ControlNet, включая работу с картами глубины, контурными картами, картами ключевых точек и другими
— хорошо справляется с созданием мемов, восстановлением старых фотографий, генерацией постеров продуктов и простых логотипов, а также с редактированием текста в сочетании с изображением
В сентябре этого года мы рады представить Qwen-Image-Edit-2509, ежемесячную версию Qwen-Image-Edit
Похоже, будут каждый месяц обновлять. Какие же фичи можно еще добавить?
Спасибо @kuvshin8 @aledarx
HF
GGUF
Qwen Chat
#imageediting #referencing #personalization #controlnet #colorize #QIE #imagerestoration
❤4
Forwarded from Ai molodca (Dobrokotov)
Там это, Kling 2.5 вышел. А в Higgsfield'е бесплатен всю неделю (если есть подписка от Creator и выше).
Forwarded from Нейронавт | Нейросети в творчестве
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Клинг 2.5
Серега SVT меня опередил и в коментах все подробно расписал.
Остается лишь процитировать его:
Клинг обновился, теперь 2,5 моделька.
1. Лучшая точность следования промтам и временной контроль
Новая модель значительно улучшена в плане следования промтам. Оптимизация структуры текста и внутренней архитектуры обработки позволяет глубже анализировать сложные инструкции, включающие несколько шагов и причинно-следственные связи, а не только отдельные действия. Это даёт возможность пользователям управлять более сложным развитием видеоконтента, включая взаимодействия персонажей и переходы между сценами. Благодаря улучшенному контролю временной логики и творческого выражения, статичные изображения можно превращать в динамичные видео с последовательным сюжетом и насыщенными историями.
2. Более плавные и стабильные динамичные сцены
Для генерации более динамичных движений с широким диапазоном действий новая модель использует передовые методы обучения, такие как обучение с подкреплением, и стратегически корректирует распределение обучающих данных. Это позволяет модели лучше изучать и имитировать физическую динамику реального мира, что делает её способной создавать высокодинамичные движения и движения камеры, которые раньше было трудно реализовать. В результате динамика улучшается при сохранении плавности и стабильности, эффективно избегая распространённых проблем в сложных динамических сценах, таких как сбои или искажения.
3. Согласованность с разнообразными стилями
Чтобы обеспечить бесшовное эстетическое соответствие между видео и референсным изображением, модель использует высокоинтенсивные методы кондиционирования изображения и обучается на огромных объёмах высококачественного видеоматериала. Эта стратегия позволяет модели точно сохранять и передавать художественный стиль оригинала, включая цвета, свет, текстуры и общую атмосферу. В результате даже при сложной динамике в видео каждый кадр остаётся в высокой степени согласованным с визуальным стилем и характеристиками референсного изображения.
4. Лучшие результаты по более низкой цене (на 30% дешевле, чем в том же классе 2.1)
Генерация 5 секунд с выходом в 1080p теперь стоит 25 кредитов (раньше было 35 кредитов)! Это означает более 1000+ видео в 1080p с использованием 2.5 Turbo в месяц при Ultra-плане и 320 видео в 1080p с использованием 2.5 Turbo в месяц при Premier-плане.
@cgevent
Серега SVT меня опередил и в коментах все подробно расписал.
Остается лишь процитировать его:
Клинг обновился, теперь 2,5 моделька.
1. Лучшая точность следования промтам и временной контроль
Новая модель значительно улучшена в плане следования промтам. Оптимизация структуры текста и внутренней архитектуры обработки позволяет глубже анализировать сложные инструкции, включающие несколько шагов и причинно-следственные связи, а не только отдельные действия. Это даёт возможность пользователям управлять более сложным развитием видеоконтента, включая взаимодействия персонажей и переходы между сценами. Благодаря улучшенному контролю временной логики и творческого выражения, статичные изображения можно превращать в динамичные видео с последовательным сюжетом и насыщенными историями.
2. Более плавные и стабильные динамичные сцены
Для генерации более динамичных движений с широким диапазоном действий новая модель использует передовые методы обучения, такие как обучение с подкреплением, и стратегически корректирует распределение обучающих данных. Это позволяет модели лучше изучать и имитировать физическую динамику реального мира, что делает её способной создавать высокодинамичные движения и движения камеры, которые раньше было трудно реализовать. В результате динамика улучшается при сохранении плавности и стабильности, эффективно избегая распространённых проблем в сложных динамических сценах, таких как сбои или искажения.
3. Согласованность с разнообразными стилями
Чтобы обеспечить бесшовное эстетическое соответствие между видео и референсным изображением, модель использует высокоинтенсивные методы кондиционирования изображения и обучается на огромных объёмах высококачественного видеоматериала. Эта стратегия позволяет модели точно сохранять и передавать художественный стиль оригинала, включая цвета, свет, текстуры и общую атмосферу. В результате даже при сложной динамике в видео каждый кадр остаётся в высокой степени согласованным с визуальным стилем и характеристиками референсного изображения.
4. Лучшие результаты по более низкой цене (на 30% дешевле, чем в том же классе 2.1)
Генерация 5 секунд с выходом в 1080p теперь стоит 25 кредитов (раньше было 35 кредитов)! Это означает более 1000+ видео в 1080p с использованием 2.5 Turbo в месяц при Ultra-плане и 320 видео в 1080p с использованием 2.5 Turbo в месяц при Premier-плане.
@cgevent
🔥3
Forwarded from Нейронавт | Нейросети в творчестве
Так, поправочка
WAN 2.5 уже доступен на WaveSpeed AI
5 или 10 секунд
до 1080p
Встроена говорилка, как в VEO 3
На старте дают аж 1$, этого хватит на 5-секундное видео в 1080p
Или кстати на ~30 картинок SeeDream 4.0
#text2video #image2video
WAN 2.5 уже доступен на WaveSpeed AI
5 или 10 секунд
до 1080p
Встроена говорилка, как в VEO 3
На старте дают аж 1$, этого хватит на 5-секундное видео в 1080p
Или кстати на ~30 картинок SeeDream 4.0
#text2video #image2video
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Помните наши нейробалеты и нейрогимнастики?
Этот день настал. ИИ смог в гимнастику.
Иногда срезает углы, но почувствуйте прогресс.
И нет, это не Минимах, который радовал нас прыжками в воду, это новый Kling 2.5
8 Вилов Смитов из 10, и 10 за артистичность.
@cgevent
Этот день настал. ИИ смог в гимнастику.
Иногда срезает углы, но почувствуйте прогресс.
И нет, это не Минимах, который радовал нас прыжками в воду, это новый Kling 2.5
8 Вилов Смитов из 10, и 10 за артистичность.
@cgevent
👍7