йоу!
короткое интро обо мне:
я отучился на физфаке МГУ откуда выпустился в 2021 году
После этого я 1,5 года делал свой бизнес - онлайн школу программирования для детей - добежал до выручки 1млн+ в месяц, но закрыл школу когда уехал из России
Потом нелегкая забросила меня в Мюнхен - где я в Terra Quantum познакомился с миром AI - там я успел позаниматься рисерчем сжатия LLM для on-device deployment, попилить AI голосовых ассистентов, AI-агентов, опубликовать несколько статей (Google Scholar), сгонять на конференцию в Сан Франциско, получить одобрение по визе О-1 и отлететь на админ проверку.
Теперь жизнь занесла меня в Лондон по визе Global Talent, где я вместе с ребятами в Unreal Labs AI делаю штуку которая позволяет создавать офигенно-реалистичную и эффективную видео рекламу с помощью ИИ - мы очень сильная и клевая команда, в нас проинвестировала Sequia Capital и мы летим как ракета (чекните ролики которые мы делали для клиентов!)
Я завел канал потому что мне очень интересно знакомиться и общаться с русско-язычным комьюнити ребят из мира tech - тч всегда рад пойматься на кофе или пинту!
А еще у меня есть пару public talk'ов про LLM deployment & on-device inference:
AI on Edge: how to run neural networks on smartphone
LLM self-host deployment
короткое интро обо мне:
я отучился на физфаке МГУ откуда выпустился в 2021 году
После этого я 1,5 года делал свой бизнес - онлайн школу программирования для детей - добежал до выручки 1млн+ в месяц, но закрыл школу когда уехал из России
Потом нелегкая забросила меня в Мюнхен - где я в Terra Quantum познакомился с миром AI - там я успел позаниматься рисерчем сжатия LLM для on-device deployment, попилить AI голосовых ассистентов, AI-агентов, опубликовать несколько статей (Google Scholar), сгонять на конференцию в Сан Франциско, получить одобрение по визе О-1 и отлететь на админ проверку.
Теперь жизнь занесла меня в Лондон по визе Global Talent, где я вместе с ребятами в Unreal Labs AI делаю штуку которая позволяет создавать офигенно-реалистичную и эффективную видео рекламу с помощью ИИ - мы очень сильная и клевая команда, в нас проинвестировала Sequia Capital и мы летим как ракета (чекните ролики которые мы делали для клиентов!)
Я завел канал потому что мне очень интересно знакомиться и общаться с русско-язычным комьюнити ребят из мира tech - тч всегда рад пойматься на кофе или пинту!
А еще у меня есть пару public talk'ов про LLM deployment & on-device inference:
AI on Edge: how to run neural networks on smartphone
LLM self-host deployment
👍1🦄1
Когда я рассказываю людям не работающим с Gen AI, что работаю с генерацией картинок и видео один из первых вопросов которые я слышу: "а где мне погонять модельки для генерации видосиков и картиночек?" и "а какие модели сейчас самые топовые?"
В общем решил собрать ключевые платформы тута - сразу скажу их совсем не так много как может показаться
fal.ai - одурительный агрегатор моделек и API провайдер, есть почти все модели которые сейчас актуальны - от генерации и обработки картинок условной Nano Banana до генерации видео Kling'ом, липсинк видео-аватаров и музяки, они дружат с всеми разрабами foundational моделек и собирают их в едином месте. Есть вкладка "explore" на которой постоянно обновляются топы новых моделей - я часто использую эту вкладку чтобы держать руку на пульсе новых релизов и быстро тестить. А если вы Engineering bro - у них очень стабильное и быстрое АПИ, делают хорошие инженеры - в общем гуд и потестить и в прод катануть потом в свой продукт. Из минусов - UI не самый френдли для non-technical.
replicate.com - аналогичная fal'у история, но они работают по модели а-ля маркетплейс - любой юзер может разместить свою модельку у них. Это порождает большое количество специфических клевых воркфлоу (типа моделька которая делает фейссвоп на gif'ке), у них также есть все текущие важные модели типа nano banana, kling, veo and so on.
Из минусов для разрабов - API у них чахлое, стабильность маленькая, скорость генерации непредсказуемая и в целом SDK более сырое. Но иногда они неизбежная необходимость тк порой там можно найти то, что в других местах не найти.
Платформы для обычных chill guys которые хотят поиграться с модельками типа nano banana, sora, veo и тд и не упарываться в непривычные инженерные интерфейсы:
higgsfield.ai/ - очень много негативного слышал что они дурят с подписками и тд, но сам лично их юзаю и пока не втыкался в проблемы
freepik.com/ - альтернатива higgsfield, есть куча всего нужного
krea.ai - офигенский мульти-тул - есть и nano banana, и генерация видео самыми нужными модельками, и даже апскейлинг видео через Topaz - рекомендую. Недавно выкатили API!
runwayml.com/ - RunWay - делает одну из лучших моделек для видеогенерации, которую полноценно можно погонять только у них, помимо этого на их платформе есть куча прикольных фичей типа "video eraser"/"expand video"/"change lighting" и тд
runcomfy.com/ - если вам хочется познать ад работы с ComfyUI один из самых простых способов познакомиться с ним это платформы вроде этой, из плюсов этой тулы - там можно строить сколь-угодно сложные мультишаговые воркфлоу, соединяющие множество моделек для пост/пре процессинга, генерации и так далее. А еще можете загуглить "comfyui workflows" и провалиться в rabbit-hole разных воркфлоу с танцующими девочками из тиктока и прочего аниме.
suno.com - если хочется погенерить музычки!
hedra.com - если хочется погенерить болтающие бошки!
Пост уже получился некоротким, а рассказать еще много о чем хочется!
В следующих сериях - что сейчас есть "лучшие" модельки и как я их нахожу!
В общем решил собрать ключевые платформы тута - сразу скажу их совсем не так много как может показаться
fal.ai - одурительный агрегатор моделек и API провайдер, есть почти все модели которые сейчас актуальны - от генерации и обработки картинок условной Nano Banana до генерации видео Kling'ом, липсинк видео-аватаров и музяки, они дружат с всеми разрабами foundational моделек и собирают их в едином месте. Есть вкладка "explore" на которой постоянно обновляются топы новых моделей - я часто использую эту вкладку чтобы держать руку на пульсе новых релизов и быстро тестить. А если вы Engineering bro - у них очень стабильное и быстрое АПИ, делают хорошие инженеры - в общем гуд и потестить и в прод катануть потом в свой продукт. Из минусов - UI не самый френдли для non-technical.
replicate.com - аналогичная fal'у история, но они работают по модели а-ля маркетплейс - любой юзер может разместить свою модельку у них. Это порождает большое количество специфических клевых воркфлоу (типа моделька которая делает фейссвоп на gif'ке), у них также есть все текущие важные модели типа nano banana, kling, veo and so on.
Из минусов для разрабов - API у них чахлое, стабильность маленькая, скорость генерации непредсказуемая и в целом SDK более сырое. Но иногда они неизбежная необходимость тк порой там можно найти то, что в других местах не найти.
Платформы для обычных chill guys которые хотят поиграться с модельками типа nano banana, sora, veo и тд и не упарываться в непривычные инженерные интерфейсы:
higgsfield.ai/ - очень много негативного слышал что они дурят с подписками и тд, но сам лично их юзаю и пока не втыкался в проблемы
freepik.com/ - альтернатива higgsfield, есть куча всего нужного
krea.ai - офигенский мульти-тул - есть и nano banana, и генерация видео самыми нужными модельками, и даже апскейлинг видео через Topaz - рекомендую. Недавно выкатили API!
runwayml.com/ - RunWay - делает одну из лучших моделек для видеогенерации, которую полноценно можно погонять только у них, помимо этого на их платформе есть куча прикольных фичей типа "video eraser"/"expand video"/"change lighting" и тд
runcomfy.com/ - если вам хочется познать ад работы с ComfyUI один из самых простых способов познакомиться с ним это платформы вроде этой, из плюсов этой тулы - там можно строить сколь-угодно сложные мультишаговые воркфлоу, соединяющие множество моделек для пост/пре процессинга, генерации и так далее. А еще можете загуглить "comfyui workflows" и провалиться в rabbit-hole разных воркфлоу с танцующими девочками из тиктока и прочего аниме.
suno.com - если хочется погенерить музычки!
hedra.com - если хочется погенерить болтающие бошки!
Пост уже получился некоротким, а рассказать еще много о чем хочется!
В следующих сериях - что сейчас есть "лучшие" модельки и как я их нахожу!
❤🔥1🔥1
Как я нахожу новые топовые модельки
1. Explore табы на агрегаторах
Регулярно чекаю Explore секции на fal.ai/explore, replicate.com/explore и wavespeed.ai — большие релизы там появляются быстро. Плюс иногда натыкаешься на мелкие но полезные тулзы типа "video remove anything". Из минусов — очень нишевые модельки туда приходят поздно, или вообще никогда.
2. Фолловлю билдеров моделей напрямую
Слежу за командами и девелоперами типа Kling, Runway, Wan Lab, @topazlabs, @bria_ai_ в X — они часто шипят мелкие sub-модели или тулзы которые живут только на их платформах или в опенсорсе. Если выглядит годно — просто юзаю их API или деплою сам на runpod.io или через fal
3. Gen-AI шаманы в X и YouTube
X и YouTube — вот где появляется реально странное и крутое. Так нахожу супер нишевые, часто опенсорсные модельки и воркфлоу которые никогда не доходят до больших API платформ. Некоторые из лучших штуковин которые я юзаю — оттуда. Лично нашел так воркфлоу для Wan Animate и Video Eraser которые по качеству в 500 раз круче чем все что находил в паблик доступе.
Примеры таких хоуми:
https://www.youtube.com/watch?v=pwA44IRI9tA
https://x.com/wildmindai
4. Сайты с ComfyUI воркфлоу
ComfyUI — это прикормка с которой как раз дуреют эти gen ai энтузиасты. И на сайтах с воркфлоу можно найти пайплайны для задач типа "сгенери этот TikTok танцующее видео но со Шреком".
Линки:
cloud.comfy.org
openart.a
5. hype.replicate.dev
Недооценённая штука! Офигенское место чтобы находить кастомные билды и опенсорсные эксперименты которые не получают шума нигде больше.
6. Hugging Face Spaces
Особенно LoRA Spaces для image моделей. Кликаешь одну, потом другую — и ты залип на уровне с рилсами.
1. Explore табы на агрегаторах
Регулярно чекаю Explore секции на fal.ai/explore, replicate.com/explore и wavespeed.ai — большие релизы там появляются быстро. Плюс иногда натыкаешься на мелкие но полезные тулзы типа "video remove anything". Из минусов — очень нишевые модельки туда приходят поздно, или вообще никогда.
2. Фолловлю билдеров моделей напрямую
Слежу за командами и девелоперами типа Kling, Runway, Wan Lab, @topazlabs, @bria_ai_ в X — они часто шипят мелкие sub-модели или тулзы которые живут только на их платформах или в опенсорсе. Если выглядит годно — просто юзаю их API или деплою сам на runpod.io или через fal
3. Gen-AI шаманы в X и YouTube
X и YouTube — вот где появляется реально странное и крутое. Так нахожу супер нишевые, часто опенсорсные модельки и воркфлоу которые никогда не доходят до больших API платформ. Некоторые из лучших штуковин которые я юзаю — оттуда. Лично нашел так воркфлоу для Wan Animate и Video Eraser которые по качеству в 500 раз круче чем все что находил в паблик доступе.
Примеры таких хоуми:
https://www.youtube.com/watch?v=pwA44IRI9tA
https://x.com/wildmindai
4. Сайты с ComfyUI воркфлоу
ComfyUI — это прикормка с которой как раз дуреют эти gen ai энтузиасты. И на сайтах с воркфлоу можно найти пайплайны для задач типа "сгенери этот TikTok танцующее видео но со Шреком".
Линки:
cloud.comfy.org
openart.a
5. hype.replicate.dev
Недооценённая штука! Офигенское место чтобы находить кастомные билды и опенсорсные эксперименты которые не получают шума нигде больше.
6. Hugging Face Spaces
Особенно LoRA Spaces для image моделей. Кликаешь одну, потом другую — и ты залип на уровне с рилсами.
❤2🔥1
