Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
VideoLingo

Универсальный опенсорсный инструмент для перевода, локализации и дубляжа видео, предназначенный для создания субтитров качества Netflix.

3-этапный процесс Перевод-Осмысление-Адаптация для кинематографического качества

За дубляж отвечают GPT-SoVITS, Azure, OpenAI и др

Поддержка входных языков (будет добавлено больше):

🇺🇸 Английский 🤩 | 🇷🇺 Русский 😊 | 🇫🇷 Французский 🤩 | 🇩🇪 Немецкий 🤩 | 🇮🇹 Итальянский 🤩 | 🇪🇸 Испанский 🤩 | 🇯🇵 Японский 😐 | 🇨🇳 Китайский* 😊

Перевод поддерживает все языки, а язык дубляжа зависит от выбранного метода генерации голоса

Гитхаб
Офсайт - 15 минут бесплатно

#dubbing #speech2speech #translation #subnoscripts #text2speech #speech2text #tts #stt
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
GoWithTheFlow

Перенос движения с образца на генерацию Hunyuan видео
Неофициальные веса нетфликсовского Go with the Flow

Веса
ComfyUI-VideoNoiseWarp

#motiontransfer #motion2video
👍20🔥2
Claude 3.7 Sonnet | Claude Code

Claude 3.7 Sonnet доступен даже бесплатным пользователям

Пробуем (притворитесь что вы не в РФ)

#news #assistant
🔥15😁2👍1
SynCD: Generating Multi-Image Synthetic Data for Text-to-Image Customization

Вообще это инструмент для кастомизации генераторов картинок. А по сути персонализатор. Даем ему три референса нашего объекта и получаем этот объект в разных новых местах - как материал для обучающего датасета

У меня нубский вопрос. Если мы и так уже можем создавать новые изображения нашего объекта, зачем нам еще чего-то там обучать на него?

Код
Демо

#personalization #text2image
👍4🔥2🎃1
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers

Рецепты наших дедушек. Сделать ваше генеративное видео вдвое длиннее очень просто, нужен всего лишь простой советский... freq[k-1]=(2*np.pi)/(L*s)

Короче, этот трюк позволяет создавать генеративное видео длиннее без какого-либо дообучения. На примерах видео удлинено с 129 до 261 кадров

Бонус - так можно не только увеличивать количество кадров, но повышать разрешение (см картинки)

Код - прикручено к Hunyuan, планируют прикрутить к другим моделям

#text2video
🔥8😁5👍3🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Wan2.1

Генератор видео по тексту и по картинке от Alibaba, опенсорс

Требует всего 8.19 GB VRAM для работы

Младшая модель 1.3B требует всего 8.19 GB VRAM для работы, 5-секундное видео 480p создает за 4 минуты на RTX 4090
Старшая 14B выдает 480p и 720p

Гитхаб
Веса

#text2video #image2video
🔥8👏1
QwQ-Max-Preview

Рассуждалка от Qwen, обновленная Qwen2.5-Max

——————
YandexGPT 5

Тоже обновили. И теперь в ее основе Qwen2.5. Да, поэтому две новости объединил
Из нативно русскоязычных с нуля обученных моделей остался только Гигачат. Мне кажется вы были к нему слишком строги

Веса Pretrain-версии доступны на HF
Попробовать YandexGPT 5 Pro в чате с Алисой

#news #assistant #reasoning
4👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI-WanVideoWrapper

Ноды видеогенератора Wan2.1 для #ComfyUI

В репозитории выложен тест 512x512x81, "~16GB used with 20/40 blocks offloaded"
Автор пишет что пока смог запустить только image2video

Сохраняйте спокойствие, работы ведутся

Пожатые веса

#image2video
7😁3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Code Assist стал бесплатным.

Окно контекста 128K токенов
20+ языков программирования
180 тысяч дополнений кода в месяц

Доступно для VSCode, Jetbrains. Github

Блог

#coding
👍14🔥2