This media is not supported in your browser
VIEW IN TELEGRAM
Wan2.1
Генератор видео по тексту и по картинке от Alibaba, опенсорс
Требует всего 8.19 GB VRAM для работы
Младшая модель 1.3B требует всего 8.19 GB VRAM для работы, 5-секундное видео 480p создает за 4 минуты на RTX 4090
Старшая 14B выдает 480p и 720p
Гитхаб
Веса
#text2video #image2video
Генератор видео по тексту и по картинке от Alibaba, опенсорс
Требует всего 8.19 GB VRAM для работы
Младшая модель 1.3B требует всего 8.19 GB VRAM для работы, 5-секундное видео 480p создает за 4 минуты на RTX 4090
Старшая 14B выдает 480p и 720p
Гитхаб
Веса
#text2video #image2video
🔥8👏1
QwQ-Max-Preview
Рассуждалка от Qwen, обновленная Qwen2.5-Max
——————
YandexGPT 5
Тоже обновили. И теперь в ее основе Qwen2.5. Да, поэтому две новости объединил
Из нативно русскоязычных с нуля обученных моделей остался только Гигачат. Мне кажется вы были к нему слишком строги
Веса Pretrain-версии доступны на HF
Попробовать YandexGPT 5 Pro в чате с Алисой
#news #assistant #reasoning
Рассуждалка от Qwen, обновленная Qwen2.5-Max
——————
YandexGPT 5
Тоже обновили. И теперь в ее основе Qwen2.5. Да, поэтому две новости объединил
Из нативно русскоязычных с нуля обученных моделей остался только Гигачат. Мне кажется вы были к нему слишком строги
Веса Pretrain-версии доступны на HF
Попробовать YandexGPT 5 Pro в чате с Алисой
#news #assistant #reasoning
❤4👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI-WanVideoWrapper
Ноды видеогенератора Wan2.1 для #ComfyUI
В репозитории выложен тест 512x512x81, "~16GB used with 20/40 blocks offloaded"
Автор пишет что пока смог запустить только image2video
Сохраняйте спокойствие, работы ведутся
Пожатые веса
#image2video
Ноды видеогенератора Wan2.1 для #ComfyUI
В репозитории выложен тест 512x512x81, "~16GB used with 20/40 blocks offloaded"
Автор пишет что пока смог запустить только image2video
Сохраняйте спокойствие, работы ведутся
Пожатые веса
#image2video
❤7😁3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Code Assist стал бесплатным.
Окно контекста 128K токенов
20+ языков программирования
180 тысяч дополнений кода в месяц
Доступно для VSCode, Jetbrains. Github
Блог
#coding
Окно контекста 128K токенов
20+ языков программирования
180 тысяч дополнений кода в месяц
Доступно для VSCode, Jetbrains. Github
Блог
#coding
👍14🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Proxy Lite
Convergence опубликовали в общий доступ младшую версию своего браузерного агента
3B параметров
На основе Qwen2.5-VL-3B-Instruct
Код/Веса
#agent #browser #vlm
Convergence опубликовали в общий доступ младшую версию своего браузерного агента
3B параметров
На основе Qwen2.5-VL-3B-Instruct
Код/Веса
#agent #browser #vlm
🔥7❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Keyframe Control Lora
Лора ключевых кадров для HunyuanVideo T2V (T2V, генератор по тексту - так в репозитории написано)
Задаем два кадра и количество кадров - получаем видео, начинающееся с первого, оканчивающееся вторым
#lora #text2video #image2video
Лора ключевых кадров для HunyuanVideo T2V (T2V, генератор по тексту - так в репозитории написано)
Задаем два кадра и количество кадров - получаем видео, начинающееся с первого, оканчивающееся вторым
#lora #text2video #image2video
👍13❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Видеогенератор Wan2.1 поддерживается в #ComfyUI нативно
Судя по тому что по инструкции надо скачать fp8_e4m3fn модель, не удивлюсь если всю работу взяли у Kijai
У людей t2i (она может оказывается и просто картинки генерить) заводится даже на RTX2060!
Для видео на 1.3B модели заготовьте 15ГБ VRAM, а для 14B - 40ГБ VRAM
Блог
#text2video #image2video
Судя по тому что по инструкции надо скачать fp8_e4m3fn модель, не удивлюсь если всю работу взяли у Kijai
У людей t2i (она может оказывается и просто картинки генерить) заводится даже на RTX2060!
Для видео на 1.3B модели заготовьте 15ГБ VRAM, а для 14B - 40ГБ VRAM
Блог
#text2video #image2video
👍8❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Prompt-to-Leaderboard (P2L)
Теперь на lmarena.ai можете создавать свои лидерборды написав промпт во вкладке Chat.
Этим занимаются специально обученные модели, начинающиеся с 'p2l-'
Впрочем, можете организовать и свою арену с блекджеком и ботами, ведь есть веса и код
Гитхаб
Веса
#prompt2leaderboard #p2l #text2leaderboard
Теперь на lmarena.ai можете создавать свои лидерборды написав промпт во вкладке Chat.
Этим занимаются специально обученные модели, начинающиеся с 'p2l-'
Впрочем, можете организовать и свою арену с блекджеком и ботами, ведь есть веса и код
Гитхаб
Веса
#prompt2leaderboard #p2l #text2leaderboard
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
moonshine-live
Распознавание речи в реальном времени на Moonshine
Демо
Модели
#speech2text #ASR #subnoscripts #realtime
Распознавание речи в реальном времени на Moonshine
Демо
Модели
#speech2text #ASR #subnoscripts #realtime
🔥4
MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors
Реконструкция сцен реального мира по одному видео в реальном времени, 15 кадров в секунду на RTX 4090
Код
#video2scene #rendering #videoto3D
Реконструкция сцен реального мира по одному видео в реальном времени, 15 кадров в секунду на RTX 4090
Код
#video2scene #rendering #videoto3D
👍19🤯6🔥2
GPT-4.5
Open AI выпустили новую языковую модель
Доступна для подписчиков Pro
На следующе неделе выдадут тем у кого Plus
#news #assistant #reasoning
Open AI выпустили новую языковую модель
Доступна для подписчиков Pro
На следующе неделе выдадут тем у кого Plus
#news #assistant #reasoning
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion
Диффузный генератор высококачественных 3D PBR ассетов по тексту.
Процесс занимает 5 секунд
Ключевая идея - кодирование 3D-меша, текстуры и материалов в компактный тензор N x D. это называется PrimX
Код
Демо (еще не работает)
#PBR #textto3d
Диффузный генератор высококачественных 3D PBR ассетов по тексту.
Процесс занимает 5 секунд
Ключевая идея - кодирование 3D-меша, текстуры и материалов в компактный тензор N x D. это называется PrimX
Код
Демо (еще не работает)
#PBR #textto3d
🔥4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Motion Prediction
Wonder Dynamics выпустили модель для точной реконструкции движений актера, даже там где он перекрыт другими объектами в кадре
#video2pose
Wonder Dynamics выпустили модель для точной реконструкции движений актера, даже там где он перекрыт другими объектами в кадре
#video2pose
🔥9🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
ImageTo3D
Создает 3D локацию из любой картинки
Сделано в Claude 3.7
Бесполезно, но вы ведь уже знаете что с этим делать
Твит автора
#imageto3d
Создает 3D локацию из любой картинки
Сделано в Claude 3.7
Бесполезно, но вы ведь уже знаете что с этим делать
Твит автора
#imageto3d
😁14👍2🤷♂1
DreamEngine
Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями
Сайта нет
Код ждем
#text2image #vlm #personalization
Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями
Сайта нет
Код ждем
#text2image #vlm #personalization
👍6👎1