Forwarded from Neural Shit
Чуваки из the pudding (делают визуальные эссе с помощью разных данных) напилили интересный проект: скормили распознавалке текста все панорамы Google street view Нью-Йорка, спарсили весь текст, а после прикрутили к этим текстам поисковик.
Пишете любое слово в строку поиска, и если такое слово где-то встречалось на панорамах города — сайт отобразит фото надписи и точные координаты места.
Поиграться можно тут.
А вот тут эссе от них же, в котором рассказывается о сути проекта и особо часто встречаемых словах и фразах.
Пишете любое слово в строку поиска, и если такое слово где-то встречалось на панорамах города — сайт отобразит фото надписи и точные координаты места.
Поиграться можно тут.
А вот тут эссе от них же, в котором рассказывается о сути проекта и особо часто встречаемых словах и фразах.
❤2
Forwarded from Нейронутые | ИИ (Егор Апполонов)
Media is too big
VIEW IN TELEGRAM
Google запустил Vids — эксперимент, который может переписать правила видеопроизводства.
Это не просто редактор, а гибридная студия с мозгами Gemini. Алгоритм берет на себя задачи, которые раньше требовали команды: пишет сценарий; предлагает визуальные решения; генерирует иллюстрации; монтирует; озвучивает.
На практике это выглядит так: вы даете идею, а на выходе получаете готовый ролик для соцсетей, презентации или кампании. Никаких навыков монтажа — только диалог с ИИ. Итак, Vids превращает видеопроизводство в текстовый интерфейс.
Создатели говорят: то, что раньше было ремеслом для продакшн-студий, становится доступно любому — и это обещает радикально изменить динамику рынка.
Я отвечу: конечно, никаких людей эта штука не заменит. На уровне простого рилсика — возможно. Но вот делать фестивальное кино или серьезные рекламы — точно нет. Пока нет. А что будет через год — это большой вопрос.
Тестировать по этой ссылке.
Это не просто редактор, а гибридная студия с мозгами Gemini. Алгоритм берет на себя задачи, которые раньше требовали команды: пишет сценарий; предлагает визуальные решения; генерирует иллюстрации; монтирует; озвучивает.
На практике это выглядит так: вы даете идею, а на выходе получаете готовый ролик для соцсетей, презентации или кампании. Никаких навыков монтажа — только диалог с ИИ. Итак, Vids превращает видеопроизводство в текстовый интерфейс.
Создатели говорят: то, что раньше было ремеслом для продакшн-студий, становится доступно любому — и это обещает радикально изменить динамику рынка.
Я отвечу: конечно, никаких людей эта штука не заменит. На уровне простого рилсика — возможно. Но вот делать фестивальное кино или серьезные рекламы — точно нет. Пока нет. А что будет через год — это большой вопрос.
Тестировать по этой ссылке.
🔥4😐1
https://cyber.sports.ru/streamers-twitch/1116887096-sluczkij-sfotografirovalsya-s-risunkom-meddisona-na-nem-izobrazhena-sx.html Тестировал кое что и как раз под пост на киберспорте подошло. Мб как то разлетиться по нэту и у футбольных дедов опять немного подорвет.
❤🔥4❤3
Forwarded from Сергей Марков: машинное обучение, искусство и шитпостинг
Мы тут юбилей пропустили, оказывается. 2 дня назад исполнилось 70 лет понятию «искусственный интеллект»
👍7🤣2
Forwarded from CONWAY
This media is not supported in your browser
VIEW IN TELEGRAM
👤
Mikhail vlll😁18
Forwarded from Ai molodca (Dobrokotov)
Media is too big
VIEW IN TELEGRAM
Генеральские котлы, но это мультивселенная.
130 генераций в Aleph.
Версию для ютуба, если кому-то нужно.
130 генераций в Aleph.
Версию для ютуба, если кому-то нужно.
👍7😁6🔥1
Forwarded from дAI потестить!
This media is not supported in your browser
VIEW IN TELEGRAM
Поговорим про денежки?
Задача: хочу такой же ролик, но на нейронках. Это возможно («Я в интернете видел — все такое делают»)? Сколько стоит («5000 р же?») ? Какие сроки («Что там, на кнопку нажать — недолго»)?
Для меня до сих пор это три самых тяжёлых вопроса. Давайте разбираться.
В видео — 22 шота. Есть консистентный персонаж, консистентная одежда. Есть dolly zoom. Закрывающий шот сложный. Оценим общую сложность — выше среднего.
Расходники:
Статика:
Генерим в midjourney.com — 30 $
Переодеть nextry.app — 24,99 $
Тренировка Lora — 6 $
Подправить, доделать Nano banana — 20 $
Анимация:
Берём расход 1 к 5. Напомню: 22 шота. 22×5 = 110 круток. Kling Ultra — 159,99 $
Звук:
SFX 11Labs — 22 $
Музыка Suno — 8 $
Итого по расходникам — 240,98 $ или 19 591 руб. (курс на сегодня)
Работа:
Генерация шота — заложим на генерацию одного шота 3 часа (статика + анимация).
3×22 = 66 часов
Генерация музыки — 4 часа
Генерация SFX — 4 часа
Монтаж — 4 часа
Итого — 78 часов, или примерно 10 рабочих дней.
Здесь, чтобы понять деньги, нужна часовая ставка исполнителя. Скорее всего, если работа заказана одному исполнителю, человек, который разбирается в генерации статики, анимации, музыки, SFX, понимает в монтаже и сведении звука в мастер-треке, стоить дёшево не может. Но, поскольку я живу в мире розовых единорогов, буду считать по низу рынка.
78 часов — это 48 % рабочего месяца. Пусть исполнитель получает среднюю зарплату по России в регионах — 88 981 руб. в месяц. Тогда его работа будет стоить 43 378 руб.
Итого: 63 329 руб.
Получится, что 1 секунда ролика стоит 3 015 р.
Вот какие мы молодцы. Посчитали. Но это минимальная база — ниже её быть просто не может. Теперь считаем допы.
С чем к нам пришёл заказчик. Для работы должны быть ТЗ, раскадровки, рефы. Делает исполнитель — это доп.
Первый результат работы будет через 10 рабочих дней (2 недели). Нужно быстрее — это доп.
Что там с согласованием? Сколько раундов правок? Если больше трёх — это доп.
Теперь — очень спорное утверждение, но с ним становится легче жить. Специальный коэффициент «M» 😂.
Хорошая практика перед проектом — подготовиться и узнать про заказчика чуть больше: пройтись по чёрным спискам в каналах, спросить в чатах. Обратить внимание, с какими материалами пришёл, насколько человек погружён в индустриию, как быстро реагирует на вопросы в переписке. И если внутри срабатывает чуйка, что могут быть проблемы, то компенсировать это коэффициентом «M».
Это не жадность. Думаю, многие залетали в проекты, где ТЗ меняется на ходу, всё нужно «на вчера», а выплат нет, потому что «я не виноват, это клиент не принимает сделанную тобой работу». Вот тут коэффициент «M» — хорошая защита (особенно когда он больше 3 😊😊).
Вот так считаю я. Го в комменты доказывать, что я не прав 😊😊.
P.S. Автор ролика https://www.instagram.com/reel/DNOBjwmIsWV
P.S.S Я кстати сердечек хочу
Задача: хочу такой же ролик, но на нейронках. Это возможно («Я в интернете видел — все такое делают»)? Сколько стоит («5000 р же?») ? Какие сроки («Что там, на кнопку нажать — недолго»)?
Для меня до сих пор это три самых тяжёлых вопроса. Давайте разбираться.
В видео — 22 шота. Есть консистентный персонаж, консистентная одежда. Есть dolly zoom. Закрывающий шот сложный. Оценим общую сложность — выше среднего.
Расходники:
Статика:
Генерим в midjourney.com — 30 $
Переодеть nextry.app — 24,99 $
Тренировка Lora — 6 $
Подправить, доделать Nano banana — 20 $
Анимация:
Берём расход 1 к 5. Напомню: 22 шота. 22×5 = 110 круток. Kling Ultra — 159,99 $
Звук:
SFX 11Labs — 22 $
Музыка Suno — 8 $
Итого по расходникам — 240,98 $ или 19 591 руб. (курс на сегодня)
Работа:
Генерация шота — заложим на генерацию одного шота 3 часа (статика + анимация).
3×22 = 66 часов
Генерация музыки — 4 часа
Генерация SFX — 4 часа
Монтаж — 4 часа
Итого — 78 часов, или примерно 10 рабочих дней.
Здесь, чтобы понять деньги, нужна часовая ставка исполнителя. Скорее всего, если работа заказана одному исполнителю, человек, который разбирается в генерации статики, анимации, музыки, SFX, понимает в монтаже и сведении звука в мастер-треке, стоить дёшево не может. Но, поскольку я живу в мире розовых единорогов, буду считать по низу рынка.
78 часов — это 48 % рабочего месяца. Пусть исполнитель получает среднюю зарплату по России в регионах — 88 981 руб. в месяц. Тогда его работа будет стоить 43 378 руб.
Итого: 63 329 руб.
Получится, что 1 секунда ролика стоит 3 015 р.
Вот какие мы молодцы. Посчитали. Но это минимальная база — ниже её быть просто не может. Теперь считаем допы.
С чем к нам пришёл заказчик. Для работы должны быть ТЗ, раскадровки, рефы. Делает исполнитель — это доп.
Первый результат работы будет через 10 рабочих дней (2 недели). Нужно быстрее — это доп.
Что там с согласованием? Сколько раундов правок? Если больше трёх — это доп.
Теперь — очень спорное утверждение, но с ним становится легче жить. Специальный коэффициент «M» 😂.
Хорошая практика перед проектом — подготовиться и узнать про заказчика чуть больше: пройтись по чёрным спискам в каналах, спросить в чатах. Обратить внимание, с какими материалами пришёл, насколько человек погружён в индустриию, как быстро реагирует на вопросы в переписке. И если внутри срабатывает чуйка, что могут быть проблемы, то компенсировать это коэффициентом «M».
Это не жадность. Думаю, многие залетали в проекты, где ТЗ меняется на ходу, всё нужно «на вчера», а выплат нет, потому что «я не виноват, это клиент не принимает сделанную тобой работу». Вот тут коэффициент «M» — хорошая защита (особенно когда он больше 3 😊😊).
Вот так считаю я. Го в комменты доказывать, что я не прав 😊😊.
P.S. Автор ролика https://www.instagram.com/reel/DNOBjwmIsWV
P.S.S Я кстати сердечек хочу
❤22👍13
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Forwarded from Acid Crunch — AI, GameDev, R&D, нейросети и GPT хаки
BananaCrunch Draw-to-edit — твоя бесплатная AI-песочница для картинок
Сегодня завайбкодил тебе абсолютно бесплатное приложение BananaCrunch Draw-to-edit. Оно позволяет загружать картинку, редактировать её, добавлять коллажи и подсказки — так проще и точнее объяснить nano-banana, чего именно ты хочешь.
✅ Бесплатно
✅ Всё в одном месте
✅ Без вотермарки
Единственный минус: лимиты AI-Studio. Точной цифры я не нашёл, но картинок можно сделать немало, и счётчик обнуляется по ощущениям каждый час.
Функционал:
⚡️ Работает только на десктопе. На мобиле запустится, но редактировать неудобно.
Ссылка на приложение
😂 Очень надеюсь, что ты закинешь репост и влепишь реакцию — я реально постарался сделать всё максимально простым и удобным. Если вдруг поймаешь баги — пиши, поправлю. Плюс через панель слева от Gemini 2.5 Pro можно самому что-то убрать или добавить под себя. Давай вместе завирусим это приложение!
#aiapps | AcidCrunch
Сегодня завайбкодил тебе абсолютно бесплатное приложение BananaCrunch Draw-to-edit. Оно позволяет загружать картинку, редактировать её, добавлять коллажи и подсказки — так проще и точнее объяснить nano-banana, чего именно ты хочешь.
✅ Бесплатно
✅ Всё в одном месте
✅ Без вотермарки
Единственный минус: лимиты AI-Studio. Точной цифры я не нашёл, но картинок можно сделать немало, и счётчик обнуляется по ощущениям каждый час.
Функционал:
Загрузка в один клик
Кидай картинку через Drag&Drop или вставляй Ctrl+V. Просто нажми на сетку, и приложение поймёт, что ты внутри.
Редактируй как хочешь
Слои, кисть, лассо, текст, стрелки. Можно выбрать цвет для выделения, а у текста и стрелок всегда есть чёрный аутлайн — надписи не теряются даже на однотонном фоне.
Полный контроль шагов
Откат, повтор, удаление всех правок — всё под рукой.
Пресеты (beta)
Готовые универсальные промпты для старта. Если чего-то нет — можно попросить у бота, список пополняется.
Автоперевод на английский
Нейросеть понимает лучше, а результат выходит точнее.
Прозрачность действий
Кнопка логов справа от корзины покажет, что именно отправили в Gemini API и почему генерация могла не пройти.
Назад даже после генерации
Сделал шаг, сгенерировал — и всё равно можешь вернуться назад.
⚡️ Работает только на десктопе. На мобиле запустится, но редактировать неудобно.
Ссылка на приложение
#aiapps | AcidCrunch
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥4❤4🔥2
Forwarded from Ai molodca (Dobrokotov)
Теперь Veo-3 может в вертикальные видео. Огонь.
This media is not supported in your browser
VIEW IN TELEGRAM
🔥7❤1
Forwarded from Neurogen (muzaffar)
SeedDream 4.0 генерация/редактирование изображений
Ключевые особенности
Во первых мультимодалка сильная
Во вторых мне очень понравилась скорость, качество и т.п
🔘 Unified Architecture
SeedDream 4.0 решили юзать единую архитектуру для всех задач
🔘 Редактирование
Может выполнять сложное редактирование изображений, свапать лицо, добавлять удалять объекты, стиль менять и тд
🔘 Интеллектуальная обработка
Модель может самостоятельно думать обрабатывать сложный контекст и рассуждать
🔘 Качество
То что меня приятно удивило, создание изображений студийного качества с разрешением до 4K для профессионального использования.
🔘 Поддержка нескольких референсов
Можно использовать до шести эталонных изображений для точного редактирования, для сложных проектов очень приятная штука
🔘 Пакетная генерация
Можно создавать до девяти связанных изображений за один раз, сохраняя стилистическое и персонажное единство
Цена за изображение 0.03$ (до 4096×4096p)
Оф сайт
Freepik
Krea.ai
Replicate
Fal.ai
higgsfield
Glif
Ключевые особенности
Во первых мультимодалка сильная
- Генерация изображений на основе знаний
- Сложные рассуждения и анализ
- Поддержка референсной согласованности
- Единая архитектура для генерации и редактирования
Во вторых мне очень понравилась скорость, качество и т.п
- Значительно быстрее предыдущих версий
- Высокое разрешение до 4K
- Оптимизированная производительность
SeedDream 4.0 решили юзать единую архитектуру для всех задач
Может выполнять сложное редактирование изображений, свапать лицо, добавлять удалять объекты, стиль менять и тд
Модель может самостоятельно думать обрабатывать сложный контекст и рассуждать
То что меня приятно удивило, создание изображений студийного качества с разрешением до 4K для профессионального использования.
Можно использовать до шести эталонных изображений для точного редактирования, для сложных проектов очень приятная штука
Можно создавать до девяти связанных изображений за один раз, сохраняя стилистическое и персонажное единство
Цена за изображение 0.03$ (до 4096×4096p)
Оф сайт
Freepik
Krea.ai
Replicate
Fal.ai
higgsfield
Glif
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3