VideoLingo
Универсальный опенсорсный инструмент для перевода, локализации и дубляжа видео, предназначенный для создания субтитров качества Netflix.
3-этапный процесс Перевод-Осмысление-Адаптация для кинематографического качества
За дубляж отвечают GPT-SoVITS, Azure, OpenAI и др
Поддержка входных языков (будет добавлено больше):
🇺🇸 Английский 🤩 | 🇷🇺 Русский 😊 | 🇫🇷 Французский 🤩 | 🇩🇪 Немецкий 🤩 | 🇮🇹 Итальянский 🤩 | 🇪🇸 Испанский 🤩 | 🇯🇵 Японский 😐 | 🇨🇳 Китайский* 😊
Перевод поддерживает все языки, а язык дубляжа зависит от выбранного метода генерации голоса
Гитхаб
Офсайт - 15 минут бесплатно
#dubbing #speech2speech #translation #subnoscripts #text2speech #speech2text #tts #stt
Универсальный опенсорсный инструмент для перевода, локализации и дубляжа видео, предназначенный для создания субтитров качества Netflix.
3-этапный процесс Перевод-Осмысление-Адаптация для кинематографического качества
За дубляж отвечают GPT-SoVITS, Azure, OpenAI и др
Поддержка входных языков (будет добавлено больше):
🇺🇸 Английский 🤩 | 🇷🇺 Русский 😊 | 🇫🇷 Французский 🤩 | 🇩🇪 Немецкий 🤩 | 🇮🇹 Итальянский 🤩 | 🇪🇸 Испанский 🤩 | 🇯🇵 Японский 😐 | 🇨🇳 Китайский* 😊
Перевод поддерживает все языки, а язык дубляжа зависит от выбранного метода генерации голоса
Гитхаб
Офсайт - 15 минут бесплатно
#dubbing #speech2speech #translation #subnoscripts #text2speech #speech2text #tts #stt
👍8
Нейронавт | Нейросети в творчестве
CameraHMR: Aligning People with Perspective Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры Есть 4 ключевых фактора, которые делают его точным и надежным: 1. Чтобы получить точную 3D-форму и позу, а также…
This media is not supported in your browser
VIEW IN TELEGRAM
WHAC: World-grounded Humans and Cameras
Реконструкция позы и меша человека, а также ракурса/движения камеры (трекинг) по одному монокулярному (не стерео) видео
За позу отвечает SMPLest-X
Код
#video2pose #video2mesh #videoto3d #tracking #poseestimation #humanreconstruction
Реконструкция позы и меша человека, а также ракурса/движения камеры (трекинг) по одному монокулярному (не стерео) видео
За позу отвечает SMPLest-X
Код
#video2pose #video2mesh #videoto3d #tracking #poseestimation #humanreconstruction
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
GoWithTheFlow
Перенос движения с образца на генерацию Hunyuan видео
Неофициальные веса нетфликсовского Go with the Flow
Веса
ComfyUI-VideoNoiseWarp
#motiontransfer #motion2video
Перенос движения с образца на генерацию Hunyuan видео
Неофициальные веса нетфликсовского Go with the Flow
Веса
ComfyUI-VideoNoiseWarp
#motiontransfer #motion2video
👍20🔥2
Claude 3.7 Sonnet | Claude Code
Claude 3.7 Sonnet доступен даже бесплатным пользователям
Пробуем (притворитесь что вы не в РФ)
#news #assistant
Claude 3.7 Sonnet доступен даже бесплатным пользователям
Пробуем (притворитесь что вы не в РФ)
#news #assistant
🔥15😁2👍1
SynCD: Generating Multi-Image Synthetic Data for Text-to-Image Customization
Вообще это инструмент для кастомизации генераторов картинок. А по сути персонализатор. Даем ему три референса нашего объекта и получаем этот объект в разных новых местах - как материал для обучающего датасета
У меня нубский вопрос. Если мы и так уже можем создавать новые изображения нашего объекта, зачем нам еще чего-то там обучать на него?
Код
Демо
#personalization #text2image
Вообще это инструмент для кастомизации генераторов картинок. А по сути персонализатор. Даем ему три референса нашего объекта и получаем этот объект в разных новых местах - как материал для обучающего датасета
У меня нубский вопрос. Если мы и так уже можем создавать новые изображения нашего объекта, зачем нам еще чего-то там обучать на него?
Код
Демо
#personalization #text2image
👍4🔥2🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers
Рецепты наших дедушек. Сделать ваше генеративное видео вдвое длиннее очень просто, нужен всего лишь простой советский...freq[k-1]=(2*np.pi)/(L*s)
Короче, этот трюк позволяет создавать генеративное видео длиннее без какого-либо дообучения. На примерах видео удлинено с 129 до 261 кадров
Бонус - так можно не только увеличивать количество кадров, но повышать разрешение (см картинки)
Код - прикручено к Hunyuan, планируют прикрутить к другим моделям
#text2video
Рецепты наших дедушек. Сделать ваше генеративное видео вдвое длиннее очень просто, нужен всего лишь простой советский...
Короче, этот трюк позволяет создавать генеративное видео длиннее без какого-либо дообучения. На примерах видео удлинено с 129 до 261 кадров
Бонус - так можно не только увеличивать количество кадров, но повышать разрешение (см картинки)
Код - прикручено к Hunyuan, планируют прикрутить к другим моделям
#text2video
🔥8😁5👍3🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Wan2.1
Генератор видео по тексту и по картинке от Alibaba, опенсорс
Требует всего 8.19 GB VRAM для работы
Младшая модель 1.3B требует всего 8.19 GB VRAM для работы, 5-секундное видео 480p создает за 4 минуты на RTX 4090
Старшая 14B выдает 480p и 720p
Гитхаб
Веса
#text2video #image2video
Генератор видео по тексту и по картинке от Alibaba, опенсорс
Требует всего 8.19 GB VRAM для работы
Младшая модель 1.3B требует всего 8.19 GB VRAM для работы, 5-секундное видео 480p создает за 4 минуты на RTX 4090
Старшая 14B выдает 480p и 720p
Гитхаб
Веса
#text2video #image2video
🔥8👏1
QwQ-Max-Preview
Рассуждалка от Qwen, обновленная Qwen2.5-Max
——————
YandexGPT 5
Тоже обновили. И теперь в ее основе Qwen2.5. Да, поэтому две новости объединил
Из нативно русскоязычных с нуля обученных моделей остался только Гигачат. Мне кажется вы были к нему слишком строги
Веса Pretrain-версии доступны на HF
Попробовать YandexGPT 5 Pro в чате с Алисой
#news #assistant #reasoning
Рассуждалка от Qwen, обновленная Qwen2.5-Max
——————
YandexGPT 5
Тоже обновили. И теперь в ее основе Qwen2.5. Да, поэтому две новости объединил
Из нативно русскоязычных с нуля обученных моделей остался только Гигачат. Мне кажется вы были к нему слишком строги
Веса Pretrain-версии доступны на HF
Попробовать YandexGPT 5 Pro в чате с Алисой
#news #assistant #reasoning
❤4👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI-WanVideoWrapper
Ноды видеогенератора Wan2.1 для #ComfyUI
В репозитории выложен тест 512x512x81, "~16GB used with 20/40 blocks offloaded"
Автор пишет что пока смог запустить только image2video
Сохраняйте спокойствие, работы ведутся
Пожатые веса
#image2video
Ноды видеогенератора Wan2.1 для #ComfyUI
В репозитории выложен тест 512x512x81, "~16GB used with 20/40 blocks offloaded"
Автор пишет что пока смог запустить только image2video
Сохраняйте спокойствие, работы ведутся
Пожатые веса
#image2video
❤7😁3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Code Assist стал бесплатным.
Окно контекста 128K токенов
20+ языков программирования
180 тысяч дополнений кода в месяц
Доступно для VSCode, Jetbrains. Github
Блог
#coding
Окно контекста 128K токенов
20+ языков программирования
180 тысяч дополнений кода в месяц
Доступно для VSCode, Jetbrains. Github
Блог
#coding
👍14🔥2