This media is not supported in your browser
VIEW IN TELEGRAM
Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models
Визуальные анаграммы, иллюзии, перевертыши - без дообучения. Под капотом DeepFloyd. А я-то думал что он уже умер.
Возможности: вращение, переворот, инверсия цвета, мозаичные перестановки, случайные перестановки.
Напомню, что уже было подобное.
Код
Колаб
напечатать пазл-перевертыш. Там всего один вариант
#text2image #text2illusion #text2puzzle
Визуальные анаграммы, иллюзии, перевертыши - без дообучения. Под капотом DeepFloyd. А я-то думал что он уже умер.
Возможности: вращение, переворот, инверсия цвета, мозаичные перестановки, случайные перестановки.
Напомню, что уже было подобное.
Код
Колаб
напечатать пазл-перевертыш. Там всего один вариант
#text2image #text2illusion #text2puzzle
❤6
This media is not supported in your browser
VIEW IN TELEGRAM
Seamless Communication
Meta AI выпустили новую версию своего нейропереводчика.
На этот раз три модели:
SeamlessM4T v2 - улучшенная версия SeamlessM4T.
Демо
SeamlessExpressive - модель с акцентом на выразительность речи.
Демо
SeamlessStreaming - модель перевода в реальном времени, задержка 2 секунды.
Демо
Гитхаб
#dubbing #multimodal #llm #speech2speech #text2speech #speech2text #tts #stt
Meta AI выпустили новую версию своего нейропереводчика.
На этот раз три модели:
SeamlessM4T v2 - улучшенная версия SeamlessM4T.
Демо
SeamlessExpressive - модель с акцентом на выразительность речи.
Демо
SeamlessStreaming - модель перевода в реальном времени, задержка 2 секунды.
Демо
Гитхаб
#dubbing #multimodal #llm #speech2speech #text2speech #speech2text #tts #stt
👍2
Rask.ai
выкатили липсинк-перевод для нескольких спикеров одновременно. Что приятно, для русского есть бета клонирование голоса.
Зацените El Risitas
Попробовать
#lipsync #dubbing #speech2speech #translation
выкатили липсинк-перевод для нескольких спикеров одновременно. Что приятно, для русского есть бета клонирование голоса.
Зацените El Risitas
Попробовать
#lipsync #dubbing #speech2speech #translation
😁11👍4
AntiFake
Защита голоса от клонирования.
Соседние каналы пишут что якобы человеческое ухо вообще не улавливает изменения. Легко убедиться что это не так. AntiFake добавляет к голосу шум, похожий на журчание воды. При этом голос звучит узнаваемо. Но нейросетку уже на этом голосе обучить не получится. Вернее, обучить можно, но на выходе голос будет другой.
Код
#voicecloning #tools #security
Защита голоса от клонирования.
Соседние каналы пишут что якобы человеческое ухо вообще не улавливает изменения. Легко убедиться что это не так. AntiFake добавляет к голосу шум, похожий на журчание воды. При этом голос звучит узнаваемо. Но нейросетку уже на этом голосе обучить не получится. Вернее, обучить можно, но на выходе голос будет другой.
Код
#voicecloning #tools #security
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models
Больше управляемости и контроля для генераторов видео. А-ля контролнет для видео.
- интерполяция кадров
- интерполяция видео
- анимация изображения
- предсказание/продление видео
- генерация видео по карте глубины
- генерация видео по эскизу
- генерация видео по раскадровке
Код обещают выложить
#video2video #text2video
Больше управляемости и контроля для генераторов видео. А-ля контролнет для видео.
- интерполяция кадров
- интерполяция видео
- анимация изображения
- предсказание/продление видео
- генерация видео по карте глубины
- генерация видео по эскизу
- генерация видео по раскадровке
Код обещают выложить
#video2video #text2video
👍6❤1
LEDITS++: Limitless Image Editing using Text-to-Image Models
Новый уровень редактирования изображений текcтовыми указаниями. Очевидно, развитие проекта LEDITS
- быстрый
- универсальный
- точный, привязывает изменения к соответствующим областям
- не зависит от архитектуры
Код
Демо
#image2image #text2image #inpainting #imageediting
Новый уровень редактирования изображений текcтовыми указаниями. Очевидно, развитие проекта LEDITS
- быстрый
- универсальный
- точный, привязывает изменения к соответствующим областям
- не зависит от архитектуры
Код
Демо
#image2image #text2image #inpainting #imageediting
👍3
Что-то на сингулярном. GPT4 дает более развернутые ответы если если ему пообещать чаевые
твиттер
#яниначтоненамекаю
твиттер
#яниначтоненамекаю
😁16🤔4❤1
VideoBooth: Diffusion-based Video Generation with Image Prompts
Генератор видео по тексту с объектом из референсной картинки
Код обещают в конце декабря
#text2video #image2video
Генератор видео по тексту с объектом из референсной картинки
Код обещают в конце декабря
#text2video #image2video
🔥1
GraphDreamer: Compositional 3D Scene Synthesis from Scene Graphs
Генератор 3D с новой парадигмой. Генерирует композиционные 3D-сцены из графов сцен, где объекты представлены в виде узлов, а их взаимодействия - в виде ребер. Текстовый промт графа пишет ChatGPT. Не вручную же его создавать.
Ну а для семантической реконструкции графа из изображения - используют GPT4V
Код обещают выложить
#text2csene #textto3D
Генератор 3D с новой парадигмой. Генерирует композиционные 3D-сцены из графов сцен, где объекты представлены в виде узлов, а их взаимодействия - в виде ребер. Текстовый промт графа пишет ChatGPT. Не вручную же его создавать.
Ну а для семантической реконструкции графа из изображения - используют GPT4V
Код обещают выложить
#text2csene #textto3D
This media is not supported in your browser
VIEW IN TELEGRAM
Появился Колаб для HierSpeech++
Ждем русский язык
Колаб
#text2speech #tts #text2voice #text2emotion #voice2voice #speech2speech #voicecloning
Ждем русский язык
Колаб
#text2speech #tts #text2voice #text2emotion #voice2voice #speech2speech #voicecloning
👍6👏1
GeoDream: High-Fidelity and Consistent 3D Generation
Генератор 3D объектов по тексту. Модель помогает диффузионному генератору каким-то 3D пониматором. На выходе текстурированный меш
Код
Колаб
#texto3D
Генератор 3D объектов по тексту. Модель помогает диффузионному генератору каким-то 3D пониматором. На выходе текстурированный меш
Код
Колаб
#texto3D
❤2🔥2
Scaffold-GS: Structured 3D Gaussians for View-Adaptive Rendering
Новый уровень точности реконструкции 3D сцен гауссианами. Превосходит 3D-GS по скорости, экономичности и качеству
Код обещают выложить на этой неделе
#imageto3D #image2scene #rendering #gaussian
Новый уровень точности реконструкции 3D сцен гауссианами. Превосходит 3D-GS по скорости, экономичности и качеству
Код обещают выложить на этой неделе
#imageto3D #image2scene #rendering #gaussian
🔥7👍3