Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Объявляю сброс мемов, накопилось

#humor
🔥11😁105👎3😐2
This media is not supported in your browser
VIEW IN TELEGRAM
Wondera AI

Генератор музыки, конкурент Suno / Udio

На старте дают 1000 кредитов, за 1 генерацию списывают 20.

Есть функция Search (что он ищет и зачем?)

Есть Deep Compose - аналог ризонинга, модель рассуждает оценивает и улучшает прежде чем выдать финальный результат. Учтите что Deep Compose поглощаем кредиты как не в себя

Ну и можно подать ему на вход мелодию для вдохновения

#music #musicediting #sample2music #audio2music
👍8🤮4🔥1🤔1
Илон Маск тизерит Grok 4 после 4 июля

#news
🔥8😱1
SkyReels v2 Lora training

Вы знали что сервис skyreels позволяет обучать видеолоры? А также создавать по запросу целые монтажные сценарии и генерировать видео по ним

#text2movie #lora
👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Kling LypSync обновился

Теперь поддерживает выбор персонажей
Есть настройка таймлинии
Сохранение оригинального звука
Длительность до 60 секунд

#lypsync #image2video #posrtraitanimation
🔥51😱1😈1
This media is not supported in your browser
VIEW IN TELEGRAM
Kling Sound

А также выпустили генератор звуков для видео
Или просто по текстовому описанию

#video2sound #text2sound #sfx #foley
👍4🔥31
This media is not supported in your browser
VIEW IN TELEGRAM
3d-model-playground

Просто побаловаться с вебкой
Можно закинуть модельку и в реальном времени ее руками крутить и анимировать

#3d #realtime #webcam
1👍10
Baidu выпустили в опенсорс семейство моделей ERNIE 4.5

#SOTA на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.

Опубликовано всего 23 модели ERNIE 4.5 от компактнойdense‑версии с 0.3B параметров до старшей модели с 424B параметров (#MoE)

Попробовать
Веса
Гитхаб
AI Studio

#assistant #reasoning #VLM
👍6
XVerse: Consistent Multi-Subject Control of Identity and Semantic Attributes via DiT Modulation

Генератор картинок по тексту от ByteDance

Позволяет точно управлять несколькими объектами в одном изображении.

Детальная настройка семантических атрибутов, таких как поза, стиль и освещение

Код
Веса 1.2Gb + 1.8Gb - и что сегодня можно выжать из таких весов?
Демо ждем

#text2image #subjectcontrol #multisubject
👍5🤔4
Ovis-U1

Мультимодальная модель от Alibaba для понимания, генерации и редактирования изображений

- Поддерживает понимание сложных визуальных сцен и текстового контента, ответы на вопросы об изображениях, выполнение визуальных ответов на вопросы (VQA) и генерацию описаний изображений.

- Генерирует высококачественные изображения на основе текстовых описаний, поддерживая различные стили и сложные изображения сцен.

- Точное редактирование изображений на основе текстовых инструкций, включая добавление, корректировку, замену или удаление элементов, а также перенос стиля.

Код
Веса
Демо

#vlm #text2image #imageediting #captioning #image2text
👍8🔥1🤔1