Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Гугл анонсировал Google Assistant with Bard.
Скоро на андроидах.
Он сможет копаться в вашей почте, рассматривать ваши фотки чтобы настуч самостоятельно написать к ним пост в соцсети. И много другого полезного для Гугла

Что скажет Тим Кук?

#assistant #chatbot
👍2
В обновлении Яндекс браузера прикрутили фичу краткий пересказ видео.
Теперь длинные видео можно прочитать за пару минут.
Как я жил без этого?

#summary #video2text #video2summary
🔥10😁2
LLaVA v1.5

Говорят, у GPT-4V появился опренсорсный конкурент, который даже покруче будет

Демо
Код
Веса
Колаб

#multimodal #chatbot #LLM
🔥5🤯3👍2
UniAudio: An Audio Foundation Model Toward Universal Audio Generation

Универсальная базовая модель генерации звука
- текст в речь
- клонирование голоса
- замена голоса по образцу
- вокал по образцу без дообучения
- улучшение качества звука без дообучения
- удаление шума
- выделение одного голоса из микса голосов
- текст в звук
- текст в музыку
- редактирование звука по тексту
- удаление эха
- редактирование речи текстовыми указаниями

Впечатляет? Примеров слишком много чтобы тащить сюда, смотрите на сайте проекта, авторы планируют добавить примеры других задач

Код

#audio #TTS #text2music #text2sound #speech2speech #voicecloning #demix #denoise #audioenhance
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Insta-3D

Интерактивный демоспейс от ilumine.ai, где можно поиграть, сделав из картинки 3D-сцену и накидывая эффекты.

Вам понадобится карта глубины, ее можно сделать каким-нибудь генератором, поиск в этом канале по тегу #image2depth

#image2scene
👍41
HumanNorm: Learning Normal Diffusion Model for High-quality and Realistic 3D Human Generation

Дуиффузионный генератор-редактор реалистичных 3D-человеков по тексту. Целиком, по пояс или только голова. Можно редактрировать модель или позу. Конкуренты выдают мультяшные модели, а тут за счет генерации нормалей добиваются большей реалистичности.

Код обещают выложить
Галерея 3D-моделей

#textto3D #text2human #text2avatar #humanavatar
😁4🔥3👍1
AutoGen

Платформа от Microsoft для создания мультиагентных систем. Это как ИИ-ассистент, только их там внутри несколько, и они взаимодействуют друг с другом.
Не знаю зачем вам это, но если надо, то вот оно есть в открытом доступе.

Код

#chatbot #assistant #LLM
👍4
Moonvalley.ai

Держите новый генератор видео по тексту.
Идете на сайт, тыкате в кнопку Try the Beta - вас перекидывает в дискорд.
В дискорде после короткого опроса попадаете на начальную страницу, где можно почитать инструкцию.
А можно сразу перейти в один из каналов #new-moon
Видео генерится командой /create
У команды три параметра: prompt, style и duration. На стиль и продолжительность есть подсказки.

Ждем ваши генерации в чате

# text2video
👍5
Firefly Vector

Генератор векторных изобрашений по тексту. Делает готовые рекламные макеты, генерит логотипы и принты.

Записаться в бету

#text2vector
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Firefly Vector Model или text-to-vector
Адобченко представила векторную модель Firefly. Adobe описывает новую модель как "первую в мире генеративную модель, ориентированную на создание векторной графики". Firefly для Illustrator сможет создавать всю векторную графику с нуля. Как и другие модели Firefly, векторная модель также обучалась на данных из Adobe Stock.
Молодцы они, конечно. Пока остальные рядятся в выравнивание и цензуру, Адобченко делает готовые инструменты и ворочает мешки.
https://techcrunch.com/2023/10/10/adobe-brings-its-firefly-generative-ai-models-to-vector-graphics-in-illustrator/
👍42
Firefly Image model 2 (beta)

В том же обновлении Firefly реалистичные человеки, улучшенное следование промпту, референсные картинки на вход.

#text2image #image2image
7
This media is not supported in your browser
VIEW IN TELEGRAM
Там Elevenlabs выкатили нейродубляж.
Главное, есть русский язык.
Смеется уморительно, наслаждайтесь

Попробовать

#speech2speech #dubbing #voicetranslation
😁15
This media is not supported in your browser
VIEW IN TELEGRAM
Появился демоспейс DreamGaussian, пока делает 3D модели только по изображению.
Кидайте генерации в коменты.

Демо

#imageto3D
👍61
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
А теперь про продукт, который должен релизнуться в начале следующего года - Simulon.

Попробую предположить и не обосраться. После трёх лет разработки нам хотят показать что-то наподобие Wonder Studio, но с другого ракурса. Скажу сразу, информации по проекту очень мало, а особенно про то, что у него под капотом.

У вас должен быть, как минимум, iPhone, чтобы снять видео. LiDAR'ом отсканировать пространство вокруг объекта и втрекать туда персонажа, действие, битву, любой VFX и так далее. Все это как раз считается в облаках.

Картинка рендерится по-честному, с отражениями, тенями, свет ставится на основе HDR-карты, которую получили из видео. Поэтому объекты выглядят втреканными и вкомпоженными.
На выходе вы получаете красивую картинку с интеграцией того, что вы туда засунули.

Вопросов, конечно, больше, чем ответов. Вангую, мы не получим никакого occlusion culling вообще, слабая программная база у ребят, явно.

Когда раздавали инвестиции тем же Wonder Studio, Simulon явно стоял на улице под дождем, грустно стекая вниз по стеклу.

Но конкуренция, конечно, - это всегда хорошо! 😄
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5