Mogao: Раскрываем интриги
Вчера писал про таинственный побиватель всех на Image Arena под названием Mogao.
И, кстати, Deep Research выдал мне ссылку на https://jimeng.jianying.com/, а сегодня выяснилось, что Mogao - это генератор картинок от Тиктока под названием Seedream 3.0
Ну то есть это не новый генератор, а новая версия старого, уже известного как Seedream 2.0, по которому есть подробный отчет: https://team.doubao.com/en/tech/seedream
Получается, что они за месяц натренировали версию 3.0, которая побила всех на Image Arena.
Я думаю, что он скоро появится тут: https://dreamina.capcut.com/ai-tool/image/generate
(но пока там версия 2.1)
А версия 3.0 доступна пока на китайском сайте https://jimeng.jianying.com/
Ни про какой код и опенсорс речь не идет. Будем генерить на Дмимине.
Что пока можно сказать:
Быстрый: около 10 секунд на генерацию четырех картинок
Понимание промпта: слабее чем у 4o, рекомендуют использовать deepseek-r1 для промптов
Цена: 79 юаней в месяц, есть бесплатные кредиты - 80 в день.
Цензура: средняя, купальники и пр
Лица: малость одинаковые
АПИ: нет
Разрешение: до 2К нативно
В общем, действительно мир генераторов делится на две территории: одна из которых - Китай, за которым приходится теперь следить более внимательно.
@cgevent
Вчера писал про таинственный побиватель всех на Image Arena под названием Mogao.
И, кстати, Deep Research выдал мне ссылку на https://jimeng.jianying.com/, а сегодня выяснилось, что Mogao - это генератор картинок от Тиктока под названием Seedream 3.0
Ну то есть это не новый генератор, а новая версия старого, уже известного как Seedream 2.0, по которому есть подробный отчет: https://team.doubao.com/en/tech/seedream
Получается, что они за месяц натренировали версию 3.0, которая побила всех на Image Arena.
Я думаю, что он скоро появится тут: https://dreamina.capcut.com/ai-tool/image/generate
(но пока там версия 2.1)
А версия 3.0 доступна пока на китайском сайте https://jimeng.jianying.com/
Ни про какой код и опенсорс речь не идет. Будем генерить на Дмимине.
Что пока можно сказать:
Быстрый: около 10 секунд на генерацию четырех картинок
Понимание промпта: слабее чем у 4o, рекомендуют использовать deepseek-r1 для промптов
Цена: 79 юаней в месяц, есть бесплатные кредиты - 80 в день.
Цензура: средняя, купальники и пр
Лица: малость одинаковые
АПИ: нет
Разрешение: до 2К нативно
В общем, действительно мир генераторов делится на две территории: одна из которых - Китай, за которым приходится теперь следить более внимательно.
@cgevent
👍27❤12🔥4😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Пасхалочка.
Интересно, что Veo2 наотрез отказывается генерить видео по промпту "Crypto Easter".
Изыди, говорит, охальник, это супротив моих убеждений и правил. Бесовщина все это!
А вот промпт "Крипто Пасха" кушает как куличики, один за другим.
Ну и кто у нас ортодокс?
И да, на https://aistudio.google.com/u/2/generate-video все еще можно генерить пяток видео бесплатно на новом Google аккаунте.
P.S. Только сейчас понял, что не включал штатовский впн, а генерил на европейском.
@cgevent
Интересно, что Veo2 наотрез отказывается генерить видео по промпту "Crypto Easter".
Изыди, говорит, охальник, это супротив моих убеждений и правил. Бесовщина все это!
А вот промпт "Крипто Пасха" кушает как куличики, один за другим.
Ну и кто у нас ортодокс?
И да, на https://aistudio.google.com/u/2/generate-video все еще можно генерить пяток видео бесплатно на новом Google аккаунте.
P.S. Только сейчас понял, что не включал штатовский впн, а генерил на европейском.
@cgevent
1👍30❤7🔥3😁1
Для взрослых мальчиков.
Пока мы тут следим за лорами для Вана и вяжем лапшу в ComfyUI, умельцы собирают сайты для нормальных людей на основе всего этого добра.
Забрел по долгу службы на PornworksAI, (смышленая реклама на сайте - обучалась на фото реальных 🔞актрис, ведь скоро синтетика вытеснит теплые ламповые формы) и залип.
А залип на переводе терминов на русский. Очень смешно, однако.
Там и дипфейки, и уже видео работает в полный рост - Хомяку и Хабу стоит беспокоиться, такого добра становится все больше.
Причем можно генерить самим, знай наваливай фантазии.
Там каждую неделю по 100+ новых шаблонов движений, по запросам пользователей вестимо. И я в шоке от хорошего качества. На которое, на таких ресурсах смотрят не особо, ведь главное смысл!
Заходите, если не боитесь: pornworks.ai
@cgevent
Пока мы тут следим за лорами для Вана и вяжем лапшу в ComfyUI, умельцы собирают сайты для нормальных людей на основе всего этого добра.
Забрел по долгу службы на PornworksAI, (смышленая реклама на сайте - обучалась на фото реальных 🔞актрис, ведь скоро синтетика вытеснит теплые ламповые формы) и залип.
А залип на переводе терминов на русский. Очень смешно, однако.
Там и дипфейки, и уже видео работает в полный рост - Хомяку и Хабу стоит беспокоиться, такого добра становится все больше.
Причем можно генерить самим, знай наваливай фантазии.
Там каждую неделю по 100+ новых шаблонов движений, по запросам пользователей вестимо. И я в шоке от хорошего качества. На которое, на таких ресурсах смотрят не особо, ведь главное смысл!
Заходите, если не боитесь: pornworks.ai
@cgevent
3👎73🔥53👍35😁26❤7😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Composition Reference: Интересную штуку прикручивают на Freepik.
Это как бы ControlNet для новых нормальных. Без вот этого вот всего: препроцессоры, веса, трешхолды. А максимально понятный интерфейс. Ясно, что часть гибкости и точности потеряется, но кому-то будет достаточно этого для управления композицией кадра. И да, работает с Флюксом.
Особенно остроумны вот эти выноски с подписями. Не надо в промпте городить "в углу кадра за левым плечом стоит старуха с косой", можно поставить точку и подписать. Региональный промптинг с понятным интерфейсом.
А вообще, я понял, что за последнее время вышло большое количество новых генераторов картинок: Reve, Seadream, Dreamina, Frames, Minimax, Midjourney V7, аггрегаторы Фрипик, Креа, Флора - и все это проприетарное, закрытое.
Давайте-ка сделаем голосование, кто пользуется опенсорсом, а кто генерит на сайтах за кредиты.
Я сделаю мультивыбор, для тех, кто и там, и там, но если вы на 90% сидите на одном из вариантов, выбирайте один, чтобы картина была более отчетливая.
Опрос ниже
@cgevent
Это как бы ControlNet для новых нормальных. Без вот этого вот всего: препроцессоры, веса, трешхолды. А максимально понятный интерфейс. Ясно, что часть гибкости и точности потеряется, но кому-то будет достаточно этого для управления композицией кадра. И да, работает с Флюксом.
Особенно остроумны вот эти выноски с подписями. Не надо в промпте городить "в углу кадра за левым плечом стоит старуха с косой", можно поставить точку и подписать. Региональный промптинг с понятным интерфейсом.
А вообще, я понял, что за последнее время вышло большое количество новых генераторов картинок: Reve, Seadream, Dreamina, Frames, Minimax, Midjourney V7, аггрегаторы Фрипик, Креа, Флора - и все это проприетарное, закрытое.
Давайте-ка сделаем голосование, кто пользуется опенсорсом, а кто генерит на сайтах за кредиты.
Я сделаю мультивыбор, для тех, кто и там, и там, но если вы на 90% сидите на одном из вариантов, выбирайте один, чтобы картина была более отчетливая.
Опрос ниже
@cgevent
👍34🔥10❤5
Как вы генерите картинки? На сайтах, используя кредиты, или локально (или на арендованной машине в облаке) с помощью опенсорсных генераторов типа Flux, Stable Diffusion и др.
Если вы на 90% сидите на одном из вариантов, выбирайте один. @cgevent
Если вы на 90% сидите на одном из вариантов, выбирайте один. @cgevent
Anonymous Poll
57%
На сайтах и сервисах в интернете
28%
Локально, на своей или облачной машине
21%
Бесовщина все это, я не такой, хочу посмотреть результат
1👍11😱6❤2
Ох, ничего себе! OpenAI пилит свой твиттор.
Подробностей мало, там точно будет генерация картинок. И вся эта затея направлена на сбор данных.
Я пока скептичен. OpenAI эпически провалила затею с Gpt Store, и все, что касается модерации и продуктов в целом, получается у них плохо. Один нейминг чего стоит.
А модерации кожаных постов - это титаническая работа.
Или там будет постить только chatGPT?
https://www.theverge.com/openai/648130/openai-social-network-x-competitor
@cgevent
Подробностей мало, там точно будет генерация картинок. И вся эта затея направлена на сбор данных.
Я пока скептичен. OpenAI эпически провалила затею с Gpt Store, и все, что касается модерации и продуктов в целом, получается у них плохо. Один нейминг чего стоит.
А модерации кожаных постов - это титаническая работа.
Или там будет постить только chatGPT?
https://www.theverge.com/openai/648130/openai-social-network-x-competitor
@cgevent
The Verge
OpenAI is building a social network
ChatGPT versus X?
😁31👍20👎7❤2🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Так, пора расчехлить обратно подписку на Gemini Advanced.
Всем платным юзерам раскатывают Veo2, плюс анимацию через Whisk.
Я прошерстил твиттор за лимиты - и вроде как дают 100 видосов в месяц. Но это надо уточнять.
Если это так, то надо считать экономику среднего пользователя.
Сейчас я могу генерить бесплатно и быстро до 5 видосов в день в Gemini без подписки. Проверял утром на криптопасхе. Аккаунтов у меня чуть меньше, чем простых чисел.
Но я все равно куплю. Прогиб будет защитан по-любому. ИИ все помнит.
Почитайте тут, подумайте.
https://blog.google/products/gemini/video-generation/
@cgevent
Всем платным юзерам раскатывают Veo2, плюс анимацию через Whisk.
Я прошерстил твиттор за лимиты - и вроде как дают 100 видосов в месяц. Но это надо уточнять.
Если это так, то надо считать экономику среднего пользователя.
Сейчас я могу генерить бесплатно и быстро до 5 видосов в день в Gemini без подписки. Проверял утром на криптопасхе. Аккаунтов у меня чуть меньше, чем простых чисел.
Но я все равно куплю. Прогиб будет защитан по-любому. ИИ все помнит.
Почитайте тут, подумайте.
https://blog.google/products/gemini/video-generation/
@cgevent
😁40👍30🔥8❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Слухи про социальную сеть от OpenAI оказались сильно преувеличенными(пока).
Утром у меня на chatGPT.com слева появился пункт Library.
Если кликнуть по нему, то появляется лента всех ваших сгенеренных изображений.
На этом, собственно, всё.
Я бы сказал, что это недолента. Ибо, как водится, с продуктами у OpenAI выходит не очень хорошо.
1. Грузятся картинки долго. Если проскролите сразу вниз, то не прогрузятся скорее всего, надо поелозить верх-вниз.
2. Вы не можете удалить картинки. Живите теперь с ними.
3. Вы не можете пошарить картинку (лента, говорите?).
4. Вы можете только кликнуть по ней, а дальше либо скачать, либо ввести промпт для редактирования. Inpaint отсутствует.
5. Нельзя создавать папки\альбомы. Все в одной куче.
6. Нет поиска
7. Я не увидел возможности посмотреть промпт.
8. Соответственно, картинки безымянные. Ни назвать, ни переименовать.
9. Сортировка отсутствует как класс. Есть ведь еще размер, аспект, да и по дате хочется реверснуть иногда.
10. Вы не можете выбрать несколько картинок, чтобы скачать, удалить и пр.
11. Непонятно, что с лимитами на хранение. Сколько можно иметь картинок?
В общем выглядит как сырой недопродукт. Возможно, код ленты написал chatGPT. И в продакшен.
Я пока радуюсь возможности увидеть все мои кривые генерации в одном месте, но скачивать по одной - это, конечно, издевательство.
Социальная сеть, говорили они...
@cgevent
Утром у меня на chatGPT.com слева появился пункт Library.
Если кликнуть по нему, то появляется лента всех ваших сгенеренных изображений.
На этом, собственно, всё.
Я бы сказал, что это недолента. Ибо, как водится, с продуктами у OpenAI выходит не очень хорошо.
1. Грузятся картинки долго. Если проскролите сразу вниз, то не прогрузятся скорее всего, надо поелозить верх-вниз.
2. Вы не можете удалить картинки. Живите теперь с ними.
3. Вы не можете пошарить картинку (лента, говорите?).
4. Вы можете только кликнуть по ней, а дальше либо скачать, либо ввести промпт для редактирования. Inpaint отсутствует.
5. Нельзя создавать папки\альбомы. Все в одной куче.
6. Нет поиска
7. Я не увидел возможности посмотреть промпт.
8. Соответственно, картинки безымянные. Ни назвать, ни переименовать.
9. Сортировка отсутствует как класс. Есть ведь еще размер, аспект, да и по дате хочется реверснуть иногда.
10. Вы не можете выбрать несколько картинок, чтобы скачать, удалить и пр.
11. Непонятно, что с лимитами на хранение. Сколько можно иметь картинок?
В общем выглядит как сырой недопродукт. Возможно, код ленты написал chatGPT. И в продакшен.
Я пока радуюсь возможности увидеть все мои кривые генерации в одном месте, но скачивать по одной - это, конечно, издевательство.
Социальная сеть, говорили они...
@cgevent
😁52👍15❤7🔥6
Принес две полезные ссылки про ИИ и бизнес.
В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.
Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/
@cgevent
В отличие от бесконечных инфоцыганских "применений нейросетей в бизнесе" - это два материала от Google и Open AI.
Первый - 601 реальный пример применения ИИ от разных компаний в 11 индустриях: медиа, здравоохранение, наука, кодинг, телеком, торговля, логистика и др.
https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
Второй - свежий гайд от самих OpenAI о внедрении ИИ в бизнес-процессы в трех частях (каждая - пдф на 30+ страниц)
AI in the Enterprise: Lessons from seven frontier companies
A practical guide to building AI agents: What can AI agents do for your workforce?
Identifying and scaling AI use cases: How early adopters focus their AI efforts
https://openai.com/business/guides-and-resources/
@cgevent
Google Cloud Blog
Real-world gen AI use cases from the world's leading organizations | Google Cloud Blog
Gen AI is everywhere, as top companies, governments, researchers, and startups showcase how they're already using Google's AI solutions to enhance their work.
6👍63🔥16❤3
Forwarded from эйай ньюз
o3 и o4-mini от OpenAI релизятся
Главная фишка — новые модели натренировали использовать тулы прямо во время ризонинга. То есть они могут не только искать в интернете, но и исполнять код и пользоваться другими тулами. Обе модели мультимодальные и могут использовать это во время размышлений.
По бенчам — разнос всего, даже недавно релизнутой Gemini 2.5 Pro Experimental. Но оно и не удивительно — на тренировку o3 ушло более чем в 10x больше компьюта чем у o1.
Модели начинают раскатывать уже в ChatGPT для Pro и Plus планов, остальным через неделю. Какие лимиты — не сказали, так что скорее всего будут как у прошлых моделей. Для Pro подписчиков обещают и o3-pro, но релизнут её немного позже.
В API релизят тоже сегодня, но пока что без тулюза. Цена за o3 — $10/$40 за миллион токенов, это на треть дешевле чем o1 и в 15 (!) раз дешевле o1-pro. При этом o1 для решения задачи нужно больше токенов чем o3, поэтому o1 собираются полностью заменить на o3. А вот o3-mini стоит столько же сколько o4-mini — $1.1/$4.4 за миллион токенов, но интеллекта на доллар там тоже больше, из-за чего и o3-mini полностью заменят на o4-mini.
@ai_newz
Главная фишка — новые модели натренировали использовать тулы прямо во время ризонинга. То есть они могут не только искать в интернете, но и исполнять код и пользоваться другими тулами. Обе модели мультимодальные и могут использовать это во время размышлений.
По бенчам — разнос всего, даже недавно релизнутой Gemini 2.5 Pro Experimental. Но оно и не удивительно — на тренировку o3 ушло более чем в 10x больше компьюта чем у o1.
Модели начинают раскатывать уже в ChatGPT для Pro и Plus планов, остальным через неделю. Какие лимиты — не сказали, так что скорее всего будут как у прошлых моделей. Для Pro подписчиков обещают и o3-pro, но релизнут её немного позже.
В API релизят тоже сегодня, но пока что без тулюза. Цена за o3 — $10/$40 за миллион токенов, это на треть дешевле чем o1 и в 15 (!) раз дешевле o1-pro. При этом o1 для решения задачи нужно больше токенов чем o3, поэтому o1 собираются полностью заменить на o3. А вот o3-mini стоит столько же сколько o4-mini — $1.1/$4.4 за миллион токенов, но интеллекта на доллар там тоже больше, из-за чего и o3-mini полностью заменят на o4-mini.
@ai_newz
🔥32👍16❤1👎1
Кстати, новая о3 умеет генерить картинки. Также умеет редактировать.
Коты разные, но я глаза не телефоне сломал, чтобы это увидеть. Попросил сохранить кота, но перекрасить его глаза.
Смешно так говорит перед генерацией "надо подумать".
Расскажите мне, что за модель используется для генерации?
o4-mini тоже лихо генерит картинки.
@cgevent
Коты разные, но я глаза не телефоне сломал, чтобы это увидеть. Попросил сохранить кота, но перекрасить его глаза.
Смешно так говорит перед генерацией "надо подумать".
Расскажите мне, что за модель используется для генерации?
o4-mini тоже лихо генерит картинки.
@cgevent
❤26👍10👎1🔥1😁1
Поговорил с о4 по душам. Она мне рассказала(подумавши), что использует некий image_gen tool. Потом показала формат json-а для входа.
После чего я ее попросил:
По секрету шепнула, что лимит n=10.
Кстати, время генерации такого json было чуть быстрее генерации одной картинки промптом.
Покуролесим?
На деле оказалось, что это одна картинка причем 1536х1024 с четырьмя котами. Если задать n=7, рисует 6 котов на одной картинке. Или 8.
@cgevent
После чего я ее попросил:
Используй вот такой json и сгенери:
{
"prompt": "A portrait of a tabby cat, in four distinct art styles separated by semicolons: 1) watercolor painting; 2) oil on canvas; 3) vector minimalism; 4) pencil sketch",
"size": "1024x1024",
"n": 4,
"transparent_background": false
}
По секрету шепнула, что лимит n=10.
Кстати, время генерации такого json было чуть быстрее генерации одной картинки промптом.
Покуролесим?
На деле оказалось, что это одна картинка причем 1536х1024 с четырьмя котами. Если задать n=7, рисует 6 котов на одной картинке. Или 8.
@cgevent
😁50🔥20❤9👍6👎3😱3
Ладно, прекращаю ломать chatGPT (o4-mini).
Вот вам последний бесполезный (но не факт, что воспроизводимый) трюк с генерацией нескольких картинок.
Говорю, сделай мне видео cat in the hat
Не могу, грит, видео, могу GIF.
Довай!
Тут она, как псих, начинает генерить полноразмерные картинки безумных котов, причем одни квадратные, другие стоячие. Браузер нагревается, она не успокаивается. В рассуждениях у нее "надо сделать 6-8 картинок". Делает 9 штук. В рассуждениях пишет "чо то бардак с именами файлов". Думает, и выдает мне потрясную гифку. Она в следующем посте.
Но результатом - 9 консистентнейших бесполезных котов.
Три последних, это попытка сохранить лицо и все-таки сделать гифку. После чего пишет
I’m currently hitting the platform’s rate limit for generating images and can’t produce new frames right now.
Довел до истерики все-таки.
@cgevent
Вот вам последний бесполезный (но не факт, что воспроизводимый) трюк с генерацией нескольких картинок.
Говорю, сделай мне видео cat in the hat
Не могу, грит, видео, могу GIF.
Довай!
Тут она, как псих, начинает генерить полноразмерные картинки безумных котов, причем одни квадратные, другие стоячие. Браузер нагревается, она не успокаивается. В рассуждениях у нее "надо сделать 6-8 картинок". Делает 9 штук. В рассуждениях пишет "чо то бардак с именами файлов". Думает, и выдает мне потрясную гифку. Она в следующем посте.
Но результатом - 9 консистентнейших бесполезных котов.
Три последних, это попытка сохранить лицо и все-таки сделать гифку. После чего пишет
I’m currently hitting the platform’s rate limit for generating images and can’t produce new frames right now.
Довел до истерики все-таки.
@cgevent
😁47👍9❤7👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот такую гифку на 12МБ она мне выдала из предыдущего поста.
Видно, что запуталась в именах файлов, взяла не тот, и ну вращать зачем-то.
Мемно, конечно, получилось. Я не против. Именно так и рождаются мемы - в результате галюцинаций и ошибок.
Еслишо, вот код делания гифки:
@cgevent
Видно, что запуталась в именах файлов, взяла не тот, и ну вращать зачем-то.
Мемно, конечно, получилось. Я не против. Именно так и рождаются мемы - в результате галюцинаций и ошибок.
Еслишо, вот код делания гифки:
from PIL import Image
import os
# Locate the original cat-in-hat image by approximate filename
data_dir = '/mnt/data'
# Look for filenames containing 'tabby_cat_in_'
candidates = [f for f in os.listdir(data_dir) if 'tabby_cat_in_' in f]
if not candidates:
raise FileNotFoundError("No cat-in-the-hat image found in /mnt/data")
# Choose the first match
img_path = os.path.join(data_dir, candidates[0])
# Load image
img = Image.open(img_path)
# Generate slight rotation frames for animation
frames = []
for angle in [-10, -5, 0, 5, 10, 5, 0, -5]:
frame = img.rotate(angle, resample=Image.BICUBIC, expand=False)
frames.append(frame)
# Save as animated GIF
gif_path = os.path.join(data_dir, 'cat_in_hat_animation.gif')
frames[0].save(
gif_path,
format='GIF',
save_all=True,
append_images=frames[1:],
duration=200,
loop=0
)
gif_path
@cgevent
😁52👍14❤9🔥5👎3😱2
Ну, за виндсерфинг!
Вот так надо делать стартапы.
3 МИЛЛИАРДА!
Подозреваю, что изначальный код виндсерфа был форком из опенсорса.
Тем более, вот так надо делать стартапы.
Вот что вайб-кодинг животворящий делает!!
https://www.cnbc.com/2025/04/16/openai-in-talks-to-pay-about-3-billion-to-acquire-startup-windsurf.html
@cgevent
Вот так надо делать стартапы.
3 МИЛЛИАРДА!
Подозреваю, что изначальный код виндсерфа был форком из опенсорса.
Тем более, вот так надо делать стартапы.
Вот что вайб-кодинг животворящий делает!!
https://www.cnbc.com/2025/04/16/openai-in-talks-to-pay-about-3-billion-to-acquire-startup-windsurf.html
@cgevent
CNBC
OpenAI in talks to pay about $3 billion to acquire AI coding startup Windsurf
OpenAI is in talks to buy Windsurf, an artificial intelligence tool for coding help, according to a source familiar with the matter.
1👍40😱16❤5👎4😁4🔥2