NEW BOT Телеграм, страница

Naumov Blog | Леша и Gen AI

Когда я рассказываю людям не работающим с Gen AI, что работаю с генерацией картинок и видео один из первых вопросов которые я слышу: "а где мне погонять модельки для генерации видосиков и картиночек?" и "а какие модели сейчас самые топовые?"

В общем решил собрать ключевые платформы тута - сразу скажу их совсем не так много как может показаться

fal.ai - одурительный агрегатор моделек и API провайдер, есть почти все модели которые сейчас актуальны - от генерации и обработки картинок условной Nano Banana до генерации видео Kling'ом, липсинк видео-аватаров и музяки, они дружат с всеми разрабами foundational моделек и собирают их в едином месте. Есть вкладка "explore" на которой постоянно обновляются топы новых моделей - я часто использую эту вкладку чтобы держать руку на пульсе новых релизов и быстро тестить. А если вы Engineering bro - у них очень стабильное и быстрое АПИ, делают хорошие инженеры - в общем гуд и потестить и в прод катануть потом в свой продукт. Из минусов - UI не самый френдли для non-technical.

replicate.com - аналогичная fal'у история, но они работают по модели а-ля маркетплейс - любой юзер может разместить свою модельку у них. Это порождает большое количество специфических клевых воркфлоу (типа моделька которая делает фейссвоп на gif'ке), у них также есть все текущие важные модели типа nano banana, kling, veo and so on.
Из минусов для разрабов - API у них чахлое, стабильность маленькая, скорость генерации непредсказуемая и в целом SDK более сырое. Но иногда они неизбежная необходимость тк порой там можно найти то, что в других местах не найти.

Платформы для обычных chill guys которые хотят поиграться с модельками типа nano banana, sora, veo и тд и не упарываться в непривычные инженерные интерфейсы:

higgsfield.ai/ - очень много негативного слышал что они дурят с подписками и тд, но сам лично их юзаю и пока не втыкался в проблемы
freepik.com/ - альтернатива higgsfield, есть куча всего нужного
krea.ai - офигенский мульти-тул - есть и nano banana, и генерация видео самыми нужными модельками, и даже апскейлинг видео через Topaz - рекомендую. Недавно выкатили API!

runwayml.com/ - RunWay - делает одну из лучших моделек для видеогенерации, которую полноценно можно погонять только у них, помимо этого на их платформе есть куча прикольных фичей типа "video eraser"/"expand video"/"change lighting" и тд

runcomfy.com/ - если вам хочется познать ад работы с ComfyUI один из самых простых способов познакомиться с ним это платформы вроде этой, из плюсов этой тулы - там можно строить сколь-угодно сложные мультишаговые воркфлоу, соединяющие множество моделек для пост/пре процессинга, генерации и так далее. А еще можете загуглить "comfyui workflows" и провалиться в rabbit-hole разных воркфлоу с танцующими девочками из тиктока и прочего аниме.

suno.com - если хочется погенерить музычки!
hedra.com - если хочется погенерить болтающие бошки!

Пост уже получился некоротким, а рассказать еще много о чем хочется!

В следующих сериях - что сейчас есть "лучшие" модельки и как я их нахожу!

❤‍🔥1🔥1

64 views00:28

Naumov Blog | Леша и Gen AI

Как я нахожу новые топовые модельки

1. Explore табы на агрегаторах

Регулярно чекаю Explore секции на fal.ai/explore, replicate.com/explore и wavespeed.ai — большие релизы там появляются быстро. Плюс иногда натыкаешься на мелкие но полезные тулзы типа "video remove anything". Из минусов — очень нишевые модельки туда приходят поздно, или вообще никогда.

2. Фолловлю билдеров моделей напрямую

Слежу за командами и девелоперами типа Kling, Runway, Wan Lab, @topazlabs, @bria_ai_ в X — они часто шипят мелкие sub-модели или тулзы которые живут только на их платформах или в опенсорсе. Если выглядит годно — просто юзаю их API или деплою сам на runpod.io или через fal

3. Gen-AI шаманы в X и YouTube

X и YouTube — вот где появляется реально странное и крутое. Так нахожу супер нишевые, часто опенсорсные модельки и воркфлоу которые никогда не доходят до больших API платформ. Некоторые из лучших штуковин которые я юзаю — оттуда. Лично нашел так воркфлоу для Wan Animate и Video Eraser которые по качеству в 500 раз круче чем все что находил в паблик доступе.
Примеры таких хоуми:
https://www.youtube.com/watch?v=pwA44IRI9tA
https://x.com/wildmindai

4. Сайты с ComfyUI воркфлоу

ComfyUI — это прикормка с которой как раз дуреют эти gen ai энтузиасты. И на сайтах с воркфлоу можно найти пайплайны для задач типа "сгенери этот TikTok танцующее видео но со Шреком".
Линки:
cloud.comfy.org
openart.a

5. hype.replicate.dev

Недооценённая штука! Офигенское место чтобы находить кастомные билды и опенсорсные эксперименты которые не получают шума нигде больше.

6. Hugging Face Spaces
Особенно LoRA Spaces для image моделей. Кликаешь одну, потом другую — и ты залип на уровне с рилсами.

❤2🔥1

92 views20:25

Naumov Blog | Леша и Gen AI

Please open Telegram to view this post

VIEW IN TELEGRAM