This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Подсобрал немного видосов (не черри пиков с сайта) и мыслей про Runway GEN-4.
Пока налицо лучшее управление, лучшее понимание промпта, менее сложные промпты для управления, огненный image2video и заява на консистентность персонажей\лиц с первого кадра.
И поглядите на видос с зеленым лицом - какие они сделали зубы!! Неужели после пальцев взялись за стоматологию?
Ну и как только лицо уходит от фотореализма, GEN-4 перестает его пересвечивать и покрывать воском.
Посмотрите на видео с клювами - пара морщин - и лица превращаются потрясающих персонажей.
И меня поражает, как ловко теперь генерятся мультики, анимация объектов, стилизация. Моушен дизайн и реклама уже не будет прежним. Там где композиция и анимация не встречаются в жизни, не повторяют съемку, а придуманы (неважно кем), глаз такой - о, как круто, что-то новое. Нет сравнения со знакомым (лицом, ракурсом).
Да, там мыло в динамике, это это чисто вопрос времени и компьюта. Дотренируют на большее разрешение и меньший разгон.
Ну и гляньте на видос с парашютом - там сравнение с другими генераторами. Не могу сказать, что GEN-4 нравится мне больше, чем Veo2, но время и тесты (и деньги) покажут.
Всем беспокойного сна.
P.S. Второй видос самый жирный.
Пока налицо лучшее управление, лучшее понимание промпта, менее сложные промпты для управления, огненный image2video и заява на консистентность персонажей\лиц с первого кадра.
И поглядите на видос с зеленым лицом - какие они сделали зубы!! Неужели после пальцев взялись за стоматологию?
Ну и как только лицо уходит от фотореализма, GEN-4 перестает его пересвечивать и покрывать воском.
Посмотрите на видео с клювами - пара морщин - и лица превращаются потрясающих персонажей.
И меня поражает, как ловко теперь генерятся мультики, анимация объектов, стилизация. Моушен дизайн и реклама уже не будет прежним. Там где композиция и анимация не встречаются в жизни, не повторяют съемку, а придуманы (неважно кем), глаз такой - о, как круто, что-то новое. Нет сравнения со знакомым (лицом, ракурсом).
Да, там мыло в динамике, это это чисто вопрос времени и компьюта. Дотренируют на большее разрешение и меньший разгон.
Ну и гляньте на видос с парашютом - там сравнение с другими генераторами. Не могу сказать, что GEN-4 нравится мне больше, чем Veo2, но время и тесты (и деньги) покажут.
Всем беспокойного сна.
P.S. Второй видос самый жирный.
This media is not supported in your browser
VIEW IN TELEGRAM
Audio2Audio в Udio
Звучит как заклинание, но тем не менее: теперь вы можете подать на вход любой свой\чужой трек и сказать "сделай на том же вайбе".
И это не Remix или Extend как раньше. Styles помогают "попадать в звук".
"Из предоставленного вами трека или клипа Udio извлекает "представление стиля", в котором собраны все его ключевые стилистические элементы, а затем использует его для создания новых песен с похожим звучанием. Представления стиля содержат гораздо больше информации, чем традиционные текстовые подсказки, позволяя точно улавливать и воспроизводить специфические звуки, которые трудно описать"
И да, можно делать Extend существующего трека в новом стиле из загруженного файла.
Только для подписки PRO. Во всех режимах: Create, Edit, Extend, and Remix.
Есть рулька Styles Similarly и вроде как нет цензуры, то есть проверки авторского контента в загружаемых треках.
Вот, послушайте, как звучат вариации:
https://www.udio.com/playlists/260290ac-eadd-4c32-a60c-f985eac72f76
Звучит как заклинание, но тем не менее: теперь вы можете подать на вход любой свой\чужой трек и сказать "сделай на том же вайбе".
И это не Remix или Extend как раньше. Styles помогают "попадать в звук".
"Из предоставленного вами трека или клипа Udio извлекает "представление стиля", в котором собраны все его ключевые стилистические элементы, а затем использует его для создания новых песен с похожим звучанием. Представления стиля содержат гораздо больше информации, чем традиционные текстовые подсказки, позволяя точно улавливать и воспроизводить специфические звуки, которые трудно описать"
И да, можно делать Extend существующего трека в новом стиле из загруженного файла.
Только для подписки PRO. Во всех режимах: Create, Edit, Extend, and Remix.
Есть рулька Styles Similarly и вроде как нет цензуры, то есть проверки авторского контента в загружаемых треках.
Вот, послушайте, как звучат вариации:
https://www.udio.com/playlists/260290ac-eadd-4c32-a60c-f985eac72f76
This media is not supported in your browser
VIEW IN TELEGRAM
Фридра! Выдра? Тьфу, Хедра!
Хедра анонсировала Фридру - ну то есть возвращение 400 бесплатных кредитов в месяц.
Не стал бы писать, но в чате люди отчаянно продают квартиры жгут кредиты на видеогенерациях. Но к сожалению, генерация в Veo2, Kling и Minimax на сайте недоступна для бесплатных пользователей.
Но аватары у них стали отличные.
https://www.hedra.com/app/video
@ElGarso тебе будет полезно
Хедра анонсировала Фридру - ну то есть возвращение 400 бесплатных кредитов в месяц.
Не стал бы писать, но в чате люди отчаянно
Но аватары у них стали отличные.
https://www.hedra.com/app/video
@ElGarso тебе будет полезно
This media is not supported in your browser
VIEW IN TELEGRAM
Гиблификация = новая анимация?
Есть такая тетенька из фонда a16z - Оливия Мур.
У нее бывают интересные посты с аналитикой типа вот такого (тема для отдельного поста - поминание аналитиков, ибо такие отчеты можно теперь сооружать силами AI\Deep-Research).
Она просто взяла свой же видео-подкаст, превратила рандомный скриншот подкаста в гибли-картинку (в chatGPT), а потом скормила саунд в Хедру.
Получился очень милый подкаст.
Любопытно наблюдать, как бутылки живут своей жизнью (иногда пытаясь попасть в голос), но это лечится маской, которую в принципе можно получить в chatGPT, попросив удалить фон в первом кадре.
Тут хотел написать, что потом понадобится знание After Effects или CapCut (чтобы расширить и кинуть маску на видео), но потом подумал, что нужно просто найти MCP Server для AE или Capcut и поговорить с ним по человечески.
А если нет MCP сервера, попросить его написать (уже полно таких решений, кстати).
В общем время кнопок "Сделай, как надо" приходит.
Есть такая тетенька из фонда a16z - Оливия Мур.
У нее бывают интересные посты с аналитикой типа вот такого (тема для отдельного поста - поминание аналитиков, ибо такие отчеты можно теперь сооружать силами AI\Deep-Research).
Она просто взяла свой же видео-подкаст, превратила рандомный скриншот подкаста в гибли-картинку (в chatGPT), а потом скормила саунд в Хедру.
Получился очень милый подкаст.
Любопытно наблюдать, как бутылки живут своей жизнью (иногда пытаясь попасть в голос), но это лечится маской, которую в принципе можно получить в chatGPT, попросив удалить фон в первом кадре.
Тут хотел написать, что потом понадобится знание After Effects или CapCut (чтобы расширить и кинуть маску на видео), но потом подумал, что нужно просто найти MCP Server для AE или Capcut и поговорить с ним по человечески.
А если нет MCP сервера, попросить его написать (уже полно таких решений, кстати).
В общем время кнопок "Сделай, как надо" приходит.
GPT прошел тест Тьюринга. Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот.
Выводы:
- Ллама 3.1 примерно как человек, в 50% случаев участники угадывают
- GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.
Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/
Выводы:
- Ллама 3.1 примерно как человек, в 50% случаев участники угадывают
- GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.
Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут: https://turingtest.live/
Acid Crunch — AI, GameDev, R&D, нейросети и GPT хаки
Теперь знаем что и такое бывает
⚠️ Память как у рыбки - Как Gpt может вам засрать проект
Из-за текущего наплыва нейро-генераций я всё чаще натыкаюсь на эту ошибку.
Чего стоит опасаться и что может помочь:
1. Если забить хуй на это оповещение и продолжать генерировать, а потом вдруг обновить страницу или чат (а ты почти наверняка так сделаешь, ведь картинки сейчас генерятся по 3–5 минут), — есть высокий шанс потерять свежеиспечённую картинку. С этого момента чат может просто *забыть* всё новое, что было прогружено.
2. Продолжать в этом чате уже нельзя, потому что у модели закончилась память. Весь контекст, история создания, идеи, вайб — всё может кануть в лету.
Промт:
Так хоть что-то удастся сохранить из того, что в противном случае будет навсегда забыто моделью 🧠✨
👇 Подпишись, сохрани и кидай друзьям
#acidcrunch #chatgpt #tutorials #hints | AcidCrunch
Из-за текущего наплыва нейро-генераций я всё чаще натыкаюсь на эту ошибку.
Чего стоит опасаться и что может помочь:
1. Если забить хуй на это оповещение и продолжать генерировать, а потом вдруг обновить страницу или чат (а ты почти наверняка так сделаешь, ведь картинки сейчас генерятся по 3–5 минут), — есть высокий шанс потерять свежеиспечённую картинку. С этого момента чат может просто *забыть* всё новое, что было прогружено.
👉 Что делать: не выключай экран телефона и не обновляй страницу в браузере, пока не сохранишь то, что загрузилось. Просто дождись, пока всё появится, и сразу качай.
2. Продолжать в этом чате уже нельзя, потому что у модели закончилась память. Весь контекст, история создания, идеи, вайб — всё может кануть в лету.
👉 Но это не беда. Просто перекинь промт в свой чат с «памятью рыбки» сохрани тезисы, идеи, описание. А потом закинь это всё в новый чат — вместе с нужными референсами, если важно сохранить целостность персонажа, сцены или истории.
Промт:
🎯 Сделай, пожалуйста, ключевые текстовые поинты этого диалога за всё время. У тебя, похоже, кончается память, а я хочу продолжить в том же духе.
Так хоть что-то удастся сохранить из того, что в противном случае будет навсегда забыто моделью 🧠✨
👇 Подпишись, сохрани и кидай друзьям
#acidcrunch #chatgpt #tutorials #hints | AcidCrunch
😨1
This media is not supported in your browser
VIEW IN TELEGRAM
Еще один любопытный интерфейс обработки текста подключенный к LLM - выделяете текст, и просто лонг тапом выбираете: тональность / сложность / переписывание на разные уровни Английского / минимальные правки орфографии / количество матов и тп и тд
Автор
Автор
❤2
Произошёл крупный релиз в Midjourney, и вот, что нового:
Новый UI/UX
Новый интерфейс для работы с референсами, хотя, по моему опыту, пока выглядит не слишком удобно. Придётся привыкать.
Draft Mode
Позволяет очень быстро генерировать идеи. Конечно, качество или разрешение картинок в этом режиме ниже, но для быстрых эскизов — отличный вариант.
7-я версия модели
Пока это демо-версия, и её ещё будут тюнить, как обычно на старте новых релизов.
Голосовой режим в Draft Mode
Лично для меня это самое кайфовое. Просто говоришь, что хочешь, а система сама генерирует промт. Важный нюанс: чтобы создать что-то кардинально другое, нужно выключить микрофон, а потом включить его снова. Если не сделать, нейронка будет переиспользовать предыдущий запрос с настройкой «Vary Strong».
В общем, релиз обещает ускорить рабочий процесс и открыть новые возможности, хотя есть свои нюансы)))"
👇 Подпишись, сохрани и кидай друзьям
#acidcrunch #midjourney #ainews | AcidCrunch
Новый UI/UX
Новый интерфейс для работы с референсами, хотя, по моему опыту, пока выглядит не слишком удобно. Придётся привыкать.
Draft Mode
Позволяет очень быстро генерировать идеи. Конечно, качество или разрешение картинок в этом режиме ниже, но для быстрых эскизов — отличный вариант.
7-я версия модели
Пока это демо-версия, и её ещё будут тюнить, как обычно на старте новых релизов.
Голосовой режим в Draft Mode
Лично для меня это самое кайфовое. Просто говоришь, что хочешь, а система сама генерирует промт. Важный нюанс: чтобы создать что-то кардинально другое, нужно выключить микрофон, а потом включить его снова. Если не сделать, нейронка будет переиспользовать предыдущий запрос с настройкой «Vary Strong».
В общем, релиз обещает ускорить рабочий процесс и открыть новые возможности, хотя есть свои нюансы)))"
👇 Подпишись, сохрани и кидай друзьям
#acidcrunch #midjourney #ainews | AcidCrunch
❤2
Forwarded from Denis Sexy IT 🤖
Сделал еще один мелкий тул для ChatGPT:
Иногда, когда копируешь что-то в ChatGPT из веба или доков, теряется форматирование – это путает модель, так как теряется почти все – а потом сиди проставляй форматирование в доке руками
Набросал веб-штуку, куда можно вставить кусок текста с форматированием и перегнать в markdown, тот вид который лучше понимают модели:
⚙️ Format to markdown
Как всегда, данные не уходят на сервер и все процессится во вкладке браузера
P.S. Там же, можно этот же markdown перегнать в html – например, чтобы быстрее собрать веб страницу с ответом из LLM
P.P.S. Это та еще верхушка айсберга, поэтому конвертор может иногда пропускать форматы и глючить, я когда-нибудь улучшу(или нет)
Пример:
Иногда, когда копируешь что-то в ChatGPT из веба или доков, теряется форматирование – это путает модель, так как теряется почти все – а потом сиди проставляй форматирование в доке руками
Набросал веб-штуку, куда можно вставить кусок текста с форматированием и перегнать в markdown, тот вид который лучше понимают модели:
Как всегда, данные не уходят на сервер и все процессится во вкладке браузера
P.S. Там же, можно этот же markdown перегнать в html – например, чтобы быстрее собрать веб страницу с ответом из LLM
P.P.S. Это та еще верхушка айсберга, поэтому конвертор может иногда пропускать форматы и глючить, я когда-нибудь улучшу
Пример:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Генерить картинки диффузией конечно интересно, но как насчет генерации диффузионными моделями зданий в майнкрафте?
Нашёл очень подробный гайд к Визуальным возможностям Chat Gpt 4o
Включая 100 стилизаций возможные в СhatGpt с необходимыми промтами.
В обложке показал заранее весь список и он внушаемый)
Автор #hints
Включая 100 стилизаций возможные в СhatGpt с необходимыми промтами.
В обложке показал заранее весь список и он внушаемый)
Автор #hints
❤🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Наконец-то кто-то решает проблему длительности генерации видео – вместо коротких сегментов сцена просто описывается длинным сценарием, где явно указаны начало и конец каждый сцены, и что в сцене должно происходить – на выходе у нас не Голливуд конечно, зато все в одном стиле и с теми же персонажами. Через полгодика, заживем, со всеми этими текст-в-видео
Код и другие примеры тут
Пример промпта который использовали в этом видео:
Код и другие примеры тут
Пример промпта который использовали в этом видео:
The World Trade Center towers stand tall against a clear, bright blue morning sky. Streets bustle with pedestrians in suits, and yellow taxis move slowly through heavy traffic. Sunlight reflects sharply from glass windows of nearby buildings. Tom, the blue-gray cat, walks briskly along the wide gray sidewalk with a single black briefcase in his hand.<end_scene>
<start_scene>Inside the World Trade Center lobby, expansive marble floors reflect warm golden recessed lighting. Gray marble pillars and brass fixtures highlight the elegant entryway, along with a brass elevator door. A uniformed doorman wearing a dark navy-blue suit stands behind a polished wooden counter. Tom, the blue-gray cat, with a single black briefcase in his hand calmly walks in from the right and approaches the elevator doors. Tom's left hand is empty.
Inside the World Trade Center lobby, expansive marble floors reflect warm golden recessed lighting. Gray marble pillars and brass fixtures highlight the elegant entryway, along with a brass elevator door. A uniformed doorman wearing a dark navy-blue suit stands behind a polished wooden counter. Tom, the blue-gray cat, has a single black briefcase in his hand slowly presses the elevator button on the left side of the elevator and waits. Tom's left hand is empty.<end_scene>
И так еще 7 абзацев
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
В Pikaframes можно загрузить до пяти кадров и получить 20 секунд анимации\видео, "проходящей" через эти кадры.
Больше, наверное, ни у кого нет.
Но если посмотреть на 3-4 ролика, то начинаешь точно угадывать момент, в который будет стык.
Во-первых, у них на движение камеры стоит easy-in easy-out и камера притормаживает к концу плана автоматически.
Во-вторых, там типичная ошибка с дублирующимся кадром, его надо ручками выкидывать, похоже. Иначе паузы.
В-третьих, переходы с движущейся камерой получаются одинаковые, некий спотыкач.
А вот на статике может быть поинтереснее. С морфингом неплохо, и очень забавный пример со скетчем. Теперь спид-пайнт можно симулировать задав пять (и еще пять) промежуточных скетчей.
В общем Пика верна себе. Больше вирусности и ваушности.
Но движение в cторону раскадровок хорошее.
Больше, наверное, ни у кого нет.
Но если посмотреть на 3-4 ролика, то начинаешь точно угадывать момент, в который будет стык.
Во-первых, у них на движение камеры стоит easy-in easy-out и камера притормаживает к концу плана автоматически.
Во-вторых, там типичная ошибка с дублирующимся кадром, его надо ручками выкидывать, похоже. Иначе паузы.
В-третьих, переходы с движущейся камерой получаются одинаковые, некий спотыкач.
А вот на статике может быть поинтереснее. С морфингом неплохо, и очень забавный пример со скетчем. Теперь спид-пайнт можно симулировать задав пять (и еще пять) промежуточных скетчей.
В общем Пика верна себе. Больше вирусности и ваушности.
Но движение в cторону раскадровок хорошее.