NEW BOT Телеграм, страница

Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models

Визуальные анаграммы, иллюзии, перевертыши - без дообучения. Под капотом DeepFloyd. А я-то думал что он уже умер.
Возможности: вращение, переворот, инверсия цвета, мозаичные перестановки, случайные перестановки.
Напомню, что уже было подобное.

Код
Колаб
напечатать пазл-перевертыш. Там всего один вариант

#text2image #text2illusion #text2puzzle

❤6

1.2K views06:22

Нейронавт | Нейросети в творчестве

2:53

This media is not supported in your browser

VIEW IN TELEGRAM

Seamless Communication

Meta AI выпустили новую версию своего нейропереводчика.
На этот раз три модели:

SeamlessM4T v2 - улучшенная версия SeamlessM4T.
Демо

SeamlessExpressive - модель с акцентом на выразительность речи.
Демо

SeamlessStreaming - модель перевода в реальном времени, задержка 2 секунды.
Демо

Гитхаб

#dubbing #multimodal #llm #speech2speech #text2speech #speech2text #tts #stt

👍2

1.21K views06:55

Нейронавт | Нейросети в творчестве

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

Rask.ai

выкатили липсинк-перевод для нескольких спикеров одновременно. Что приятно, для русского есть бета клонирование голоса.

Зацените El Risitas

Попробовать

#lipsync #dubbing #speech2speech #translation

😁11👍4

1.4K views07:10

Нейронавт | Нейросети в творчестве

AntiFake

Защита голоса от клонирования.
Соседние каналы пишут что якобы человеческое ухо вообще не улавливает изменения. Легко убедиться что это не так. AntiFake добавляет к голосу шум, похожий на журчание воды. При этом голос звучит узнаваемо. Но нейросетку уже на этом голосе обучить не получится. Вернее, обучить можно, но на выходе голос будет другой.

Код

#voicecloning #tools #security

👍4

1.18K views11:06

Нейронавт | Нейросети в творчестве

2:19

This media is not supported in your browser

VIEW IN TELEGRAM

SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models

Больше управляемости и контроля для генераторов видео. А-ля контролнет для видео.

- интерполяция кадров
- интерполяция видео
- анимация изображения
- предсказание/продление видео
- генерация видео по карте глубины
- генерация видео по эскизу
- генерация видео по раскадровке

Код обещают выложить

#video2video #text2video

👍6❤1

1.24K views11:22

Нейронавт | Нейросети в творчестве

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

LEDITS++: Limitless Image Editing using Text-to-Image Models

Новый уровень редактирования изображений текcтовыми указаниями. Очевидно, развитие проекта LEDITS

- быстрый
- универсальный
- точный, привязывает изменения к соответствующим областям
- не зависит от архитектуры

Код
Демо

#image2image #text2image #inpainting #imageediting

👍3

1.46K views09:36

Нейронавт | Нейросети в творчестве

Что-то на сингулярном. GPT4 дает более развернутые ответы если если ему пообещать чаевые

твиттер

#яниначтоненамекаю

😁16🤔4❤1

13.3K viewsedited 11:47

Нейронавт | Нейросети в творчестве

Из соседнего чата

❤3

964 viewsedited 07:03

Нейронавт | Нейросети в творчестве

1:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

VideoBooth: Diffusion-based Video Generation with Image Prompts

Генератор видео по тексту с объектом из референсной картинки

Код обещают в конце декабря

#text2video #image2video

🔥1

1.01K views07:17

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

GraphDreamer: Compositional 3D Scene Synthesis from Scene Graphs

Генератор 3D с новой парадигмой. Генерирует композиционные 3D-сцены из графов сцен, где объекты представлены в виде узлов, а их взаимодействия - в виде ребер. Текстовый промт графа пишет ChatGPT. Не вручную же его создавать.

Ну а для семантической реконструкции графа из изображения - используют GPT4V

Код обещают выложить

#text2csene #textto3D

1.01K views07:29

Нейронавт | Нейросети в творчестве

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

Появился Колаб для HierSpeech++
Ждем русский язык

Колаб

#text2speech #tts #text2voice #text2emotion #voice2voice #speech2speech #voicecloning

👍6👏1

1.2K viewsedited 07:32

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

GeoDream: High-Fidelity and Consistent 3D Generation

Генератор 3D объектов по тексту. Модель помогает диффузионному генератору каким-то 3D пониматором. На выходе текстурированный меш

Код
Колаб

#texto3D

❤2🔥2

1.02K views07:44

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Scaffold-GS: Structured 3D Gaussians for View-Adaptive Rendering

Новый уровень точности реконструкции 3D сцен гауссианами. Превосходит 3D-GS по скорости, экономичности и качеству

Код обещают выложить на этой неделе

#imageto3D #image2scene #rendering #gaussian

🔥7👍3

1.32K views11:28

About

Blog

Apps

Platform