Forwarded from Denis Sexy IT 🤖
Вот спрятанное фото которые я получил с помощью симуляции «The World Model» (то есть фотото как бы близко к оригиналу насколько возможно, но точнее уже не получить); если интересно как я их получил то я залил на ютуб пошаговый процесс:
https://youtu.be/eJjRDIEYIR4
Еще из интересного про видео:
— Мне было лень подключать микрофон, поэтому я просто натренил TTS модельку на основе моих прошлых видео, в итоге получился я, с намного лучшим акцентом (хехе)
— Вся музыка сгенерирована
— Все видео и картинки (почти все) тоже
— Все визуальные эффекты для фонов написал Sonnet 3.5, я просто записал экран его HTML-страничек
— А вот текст сценария — мой, тут все еще никакая LLM все еще не поможет; но что мне понравилось, это то что финальный сценарий можно передать LLM и спросить что-то в стиле «А где зритель потеряется, я не слишком быстро перескакиваю с темы на тему?»
В общем, enjoy
Всего 3 года потребовалось☕️
https://youtu.be/eJjRDIEYIR4
Еще из интересного про видео:
— Мне было лень подключать микрофон, поэтому я просто натренил TTS модельку на основе моих прошлых видео, в итоге получился я, с намного лучшим акцентом (хехе)
— Вся музыка сгенерирована
— Все видео и картинки (почти все) тоже
— Все визуальные эффекты для фонов написал Sonnet 3.5, я просто записал экран его HTML-страничек
— А вот текст сценария — мой, тут все еще никакая LLM все еще не поможет; но что мне понравилось, это то что финальный сценарий можно передать LLM и спросить что-то в стиле «А где зритель потеряется, я не слишком быстро перескакиваю с темы на тему?»
В общем, enjoy
Всего 3 года потребовалось
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Fashn.ai Lookswap
Виртуальная примерочная. Говорят, лучшая на сегодняшний день
Код
Демо
Записаться в вейтлист
#tryon
Виртуальная примерочная. Говорят, лучшая на сегодняшний день
Код
Демо
Записаться в вейтлист
#tryon
🔥6👎3❤1👍1🤔1
SimpleTuner теперь поддерживает дообучение Flux - чекпойнтов и LoRa. Но есть нюанс
A100-40G (LoRA, rank-16 or lower)
A100-80G (LoRA, up to rank-256)
3x A100-80G (Full tuning, DeepSpeed ZeRO 1)
1x A100-80G (Full tuning, DeepSpeed ZeRO 3)
Говорят, можно и на 13Гб обучать 2-bit квантизованную модель
Инструкция
#finetuning #flux
A100-40G (LoRA, rank-16 or lower)
A100-80G (LoRA, up to rank-256)
3x A100-80G (Full tuning, DeepSpeed ZeRO 1)
1x A100-80G (Full tuning, DeepSpeed ZeRO 3)
Говорят, можно и на 13Гб обучать 2-bit квантизованную модель
Инструкция
#finetuning #flux
❤10
TexGen: Text-Guided 3D Texture Generation with Multi-view Sampling and Resampling
Генерация текстур на заданный меш по тексту.
Кодов/демов не дают. Только показывают
#texture #text2texture #3Dtotexture #texturing
Генерация текстур на заданный меш по тексту.
Кодов/демов не дают. Только показывают
#texture #text2texture #3Dtotexture #texturing
👀4👎2👍1
FLUX.1-merged
Не спрашивайте как это работает. Это мердж более точной Flux модели Dev и быстрой Schnell, дающий результаты приближенные к Dev за 4 шага
#flux
Не спрашивайте как это работает. Это мердж более точной Flux модели Dev и быстрой Schnell, дающий результаты приближенные к Dev за 4 шага
#flux
👍16🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
MeshAnything V2: Artist-Created Mesh Generation with Adjacent Mesh Tokenization
Универсальный генератор меша, имитирующий кожаного моделера, проапгрейдили
Код
Демо
#textto3d #3dtomesh #nefr2mesh #gaussian2mesh
Универсальный генератор меша, имитирующий кожаного моделера, проапгрейдили
Код
Демо
#textto3d #3dtomesh #nefr2mesh #gaussian2mesh
👍11⚡1❤1
CogVideoX
Вероятно, первая приличная опенсорсная модель генерации видео после Animatediff и SVD. Но готовьте вычислительные мощности
Гитхаб
Демо
#text2video
Вероятно, первая приличная опенсорсная модель генерации видео после Animatediff и SVD. Но готовьте вычислительные мощности
Гитхаб
Демо
#text2video
❤13👍1
GenAI-Arena
Арена и лидерборд видеогенераторов. Нет, только тех что в опенсорсе
#leaderboard #shootout #text2video
Арена и лидерборд видеогенераторов. Нет, только тех что в опенсорсе
#leaderboard #shootout #text2video
👍8👎1
IP Adapter Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts
В IP-Adapter-Plus добавили дополнительное обусловливание текстовым промптом.
Код
Демо
#conditioning #personalization #adapter
В IP-Adapter-Plus добавили дополнительное обусловливание текстовым промптом.
Код
Демо
#conditioning #personalization #adapter
🔥14👍4
This media is not supported in your browser
VIEW IN TELEGRAM
RayGauss: Volumetric Gaussian-Based Ray Casting for Photorealistic Novel View Synthesis
Очередная работа по улучшению рендера сцен на гауссианах
Код ждем
#gaussian #rendering #novelview
Очередная работа по улучшению рендера сцен на гауссианах
Код ждем
#gaussian #rendering #novelview
👍6🤯1
Compact 3D Gaussian Representation for Radiance Field
Компактное представление динамических 3D сцен на гауссианах.
Научились после обучения удалять несуществующие гауссианы и маскировать движущиеся объекты. Экономия памяти на пару порядков
Код для статических сцен
Код для динамических сцен
#gaussian #rendering #novelview
Компактное представление динамических 3D сцен на гауссианах.
Научились после обучения удалять несуществующие гауссианы и маскировать движущиеся объекты. Экономия памяти на пару порядков
Код для статических сцен
Код для динамических сцен
#gaussian #rendering #novelview
❤7👍2🤯1
🔥15👍1
Нейронавт | Нейросети в творчестве
FLUX ControlNet (Canny) #controlnet #flux #conditioning
huggingface.co
FLUX.1-DEV Canny - a Hugging Face Space by DamarJati
Use a text prompt and a control image to generate a detailed, enhanced image. Provide the prompt and a control image, and receive a high-quality, edited version as a result.
👍1🔥1