Naumov Blog | Леша и Gen AI – Telegram
Naumov Blog | Леша и Gen AI
35 subscribers
17 photos
15 videos
6 links
Йо! Я Леша - founding Gen AI Lead в Unreal Labs - мы делаем видео рекламу с помощью AI, а еще в нас проинвестировала Sequia.
Я дурею с мира генерации и обработки картинок/видео и люблю разрабоку продуктов.
www.helles.dev
x.com/hellesgrind
@aleksei_conf
Download Telegram
Channel photo updated
йоу!
короткое интро обо мне:
я отучился на физфаке МГУ откуда выпустился в 2021 году
После этого я 1,5 года делал свой бизнес - онлайн школу программирования для детей - добежал до выручки 1млн+ в месяц, но закрыл школу когда уехал из России

Потом нелегкая забросила меня в Мюнхен - где я в Terra Quantum познакомился с миром AI - там я успел позаниматься рисерчем сжатия LLM для on-device deployment, попилить AI голосовых ассистентов, AI-агентов, опубликовать несколько статей (Google Scholar), сгонять на конференцию в Сан Франциско, получить одобрение по визе О-1 и отлететь на админ проверку.

Теперь жизнь занесла меня в Лондон по визе Global Talent, где я вместе с ребятами в Unreal Labs AI делаю штуку которая позволяет создавать офигенно-реалистичную и эффективную видео рекламу с помощью ИИ - мы очень сильная и клевая команда, в нас проинвестировала Sequia Capital и мы летим как ракета (чекните ролики которые мы делали для клиентов!)

Я завел канал потому что мне очень интересно знакомиться и общаться с русско-язычным комьюнити ребят из мира tech - тч всегда рад пойматься на кофе или пинту!

А еще у меня есть пару public talk'ов про LLM deployment & on-device inference:
AI on Edge: how to run neural networks on smartphone
LLM self-host deployment
👍1🦄1
Когда я рассказываю людям не работающим с Gen AI, что работаю с генерацией картинок и видео один из первых вопросов которые я слышу: "а где мне погонять модельки для генерации видосиков и картиночек?" и "а какие модели сейчас самые топовые?"

В общем решил собрать ключевые платформы тута - сразу скажу их совсем не так много как может показаться

fal.ai - одурительный агрегатор моделек и API провайдер, есть почти все модели которые сейчас актуальны - от генерации и обработки картинок условной Nano Banana до генерации видео Kling'ом, липсинк видео-аватаров и музяки, они дружат с всеми разрабами foundational моделек и собирают их в едином месте. Есть вкладка "explore" на которой постоянно обновляются топы новых моделей - я часто использую эту вкладку чтобы держать руку на пульсе новых релизов и быстро тестить. А если вы Engineering bro - у них очень стабильное и быстрое АПИ, делают хорошие инженеры - в общем гуд и потестить и в прод катануть потом в свой продукт. Из минусов - UI не самый френдли для non-technical.

replicate.com - аналогичная fal'у история, но они работают по модели а-ля маркетплейс - любой юзер может разместить свою модельку у них. Это порождает большое количество специфических клевых воркфлоу (типа моделька которая делает фейссвоп на gif'ке), у них также есть все текущие важные модели типа nano banana, kling, veo and so on.
Из минусов для разрабов - API у них чахлое, стабильность маленькая, скорость генерации непредсказуемая и в целом SDK более сырое. Но иногда они неизбежная необходимость тк порой там можно найти то, что в других местах не найти.

Платформы для обычных chill guys которые хотят поиграться с модельками типа nano banana, sora, veo и тд и не упарываться в непривычные инженерные интерфейсы:

higgsfield.ai/ - очень много негативного слышал что они дурят с подписками и тд, но сам лично их юзаю и пока не втыкался в проблемы
freepik.com/ - альтернатива higgsfield, есть куча всего нужного
krea.ai - офигенский мульти-тул - есть и nano banana, и генерация видео самыми нужными модельками, и даже апскейлинг видео через Topaz - рекомендую. Недавно выкатили API!

runwayml.com/ - RunWay - делает одну из лучших моделек для видеогенерации, которую полноценно можно погонять только у них, помимо этого на их платформе есть куча прикольных фичей типа "video eraser"/"expand video"/"change lighting" и тд

runcomfy.com/ - если вам хочется познать ад работы с ComfyUI один из самых простых способов познакомиться с ним это платформы вроде этой, из плюсов этой тулы - там можно строить сколь-угодно сложные мультишаговые воркфлоу, соединяющие множество моделек для пост/пре процессинга, генерации и так далее. А еще можете загуглить "comfyui workflows" и провалиться в rabbit-hole разных воркфлоу с танцующими девочками из тиктока и прочего аниме.

suno.com - если хочется погенерить музычки!
hedra.com - если хочется погенерить болтающие бошки!

Пост уже получился некоротким, а рассказать еще много о чем хочется!

В следующих сериях - что сейчас есть "лучшие" модельки и как я их нахожу!
❤‍🔥1🔥1
Как я нахожу новые топовые модельки

1. Explore табы на агрегаторах

Регулярно чекаю Explore секции на fal.ai/explore, replicate.com/explore и wavespeed.ai — большие релизы там появляются быстро. Плюс иногда натыкаешься на мелкие но полезные тулзы типа "video remove anything". Из минусов — очень нишевые модельки туда приходят поздно, или вообще никогда.

2. Фолловлю билдеров моделей напрямую

Слежу за командами и девелоперами типа Kling, Runway, Wan Lab, @topazlabs, @bria_ai_ в X — они часто шипят мелкие sub-модели или тулзы которые живут только на их платформах или в опенсорсе. Если выглядит годно — просто юзаю их API или деплою сам на runpod.io или через fal

3. Gen-AI шаманы в X и YouTube

X и YouTube — вот где появляется реально странное и крутое. Так нахожу супер нишевые, часто опенсорсные модельки и воркфлоу которые никогда не доходят до больших API платформ. Некоторые из лучших штуковин которые я юзаю — оттуда. Лично нашел так воркфлоу для Wan Animate и Video Eraser которые по качеству в 500 раз круче чем все что находил в паблик доступе.
Примеры таких хоуми:
https://www.youtube.com/watch?v=pwA44IRI9tA
https://x.com/wildmindai

4. Сайты с ComfyUI воркфлоу

ComfyUI — это прикормка с которой как раз дуреют эти gen ai энтузиасты. И на сайтах с воркфлоу можно найти пайплайны для задач типа "сгенери этот TikTok танцующее видео но со Шреком".
Линки:
cloud.comfy.org
openart.a


5. hype.replicate.dev

Недооценённая штука! Офигенское место чтобы находить кастомные билды и опенсорсные эксперименты которые не получают шума нигде больше.

6. Hugging Face Spaces
Особенно LoRA Spaces для image моделей. Кликаешь одну, потом другую — и ты залип на уровне с рилсами.
2🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
йоу! я долго молчал про то чем занимаюсь — пора исправляться.

я founding engineer в Unreal Labs - мы делаем AI-редактирование видосиков для рекламных команд — берешь существующий футаж (реальные актеры, реальные продуктовые съемки, реальный b-roll) и генеришь вариации: меняешь актеров, переписываешь скрипт, меняешь окружение. без пересъемок вообще.

по сути — Nano Banana Pro но для видео, заточенная под рекламный юзкейс.

для ребят которые крутят рекламу в Meta/Instagram это прям game changer — AB тестирование разных хуков, CTA, визуалов - это то как ты находишь победителей. мы убрали боттлнек "надо переснять".

команда у нас чисто акулья — ребята с бэкграундом в рекламе, gen AI из Meta и Snap, все профи в ИИ тулах для кодинга - круто когда тима не стариковская, а у которой можно поучиться приколюхам вроде "как нацепить MCP к агенту и через multi-branch шипать 5 фичей параллельно и курить в это время

я gen ai нерд, тч то что погонять свежие видео/картиночные/аудио модельки это часть моей работы это просто услада.

В общем эксайтед лютейше!
❤‍🔥3💩2🔥1