Audio
Bark — модель преобразования текста в аудио с упором на создании крайне реалистичной речи, а также других аудиофайлов, включая музыку, фоновый шум и простые звуковые эффекты
Модель также может производить невербальные коммуникации, такие как смех, вздохи и плач
Код
#text2audio #tts
Модель также может производить невербальные коммуникации, такие как смех, вздохи и плач
Код
#text2audio #tts
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
NeAI: A Pre-convoluted Representation forPlug-and-Play Neural Ambient Illumination
Новый шаг на пути интеграции #nerf в CG пайплайн.
Насколько я понял из беглого знакомства с проектом, они используют nerf в качестве продвинутой HDRI для освещения традиционных 3D объектов. Классическое HDRI освещение не позволяет учитывать расстояние от освещаемого объекта до точки, запеченной на HDRI. Во многих случаях это связано с попоболью. А тут боги нейросетей принесли нам решение.
Код обещают выложить
Новый шаг на пути интеграции #nerf в CG пайплайн.
Насколько я понял из беглого знакомства с проектом, они используют nerf в качестве продвинутой HDRI для освещения традиционных 3D объектов. Классическое HDRI освещение не позволяет учитывать расстояние от освещаемого объекта до точки, запеченной на HDRI. Во многих случаях это связано с попоболью. А тут боги нейросетей принесли нам решение.
Код обещают выложить
👍1
Forwarded from Psy Eyes (Andrey Bezryadin)
This media is not supported in your browser
VIEW IN TELEGRAM
Runway открыли доступ к GEN-2 в дискорде.
1) Идём в любой #generate тред
2) Вбиваем @GEN2 и дальше текстовый запрос. Либо картинка + промт.
Можно применять параметры для большего контроля над выходным изображением. Ловите гайд по расширенным настройкам.
Плюс: инфа как получать результаты близкие к оригиналу по структуре, и удивить себя результатами отдалённо похожими на оригинал.
Промт:
1) Идём в любой #generate тред
2) Вбиваем @GEN2 и дальше текстовый запрос. Либо картинка + промт.
Можно применять параметры для большего контроля над выходным изображением. Ловите гайд по расширенным настройкам.
Плюс: инфа как получать результаты близкие к оригиналу по структуре, и удивить себя результатами отдалённо похожими на оригинал.
Промт:
a cat at the stage of the music festivalThis media is not supported in your browser
VIEW IN TELEGRAM
GEN-2
Он не знает Дарт Вейдера и штурмовиков, не знает Мир Уэйна. Жаль.
Но как круто выглядит для генеративного видео!
Darth Vader and stormtroopers sitting in a car and outrageously rocking their heads listening to the Bohemian rhapsody in a scene from the Wayne world movie -- upscale
Он не знает Дарт Вейдера и штурмовиков, не знает Мир Уэйна. Жаль.
Но как круто выглядит для генеративного видео!
Darth Vader and stormtroopers sitting in a car and outrageously rocking their heads listening to the Bohemian rhapsody in a scene from the Wayne world movie -- upscale
This media is not supported in your browser
VIEW IN TELEGRAM
Несколько новостей про #nerf
Reference-guided Controllable Inpainting of Neural Radiance Fields
Инпейнтинг нерфов, кода нет
#nerf #inpainting
Reference-guided Controllable Inpainting of Neural Radiance Fields
Инпейнтинг нерфов, кода нет
#nerf #inpainting
This media is not supported in your browser
VIEW IN TELEGRAM
Nerfbusters: Removing Ghostly Artifacts from Casually Captured NeRFs
Чистка #nerf от специфических облачков-артефактов
Код
Чистка #nerf от специфических облачков-артефактов
Код
👍1
Media is too big
VIEW IN TELEGRAM
Tetra-NeRFRepresenting Neural Radiance Fields Using Tetrahedra
Тетраэдральное представление #nerf. Вместо облака точек и вокселей - тетраэдры. Зачем? Так лучше
Код
Демо посмотреть
Тетраэдральное представление #nerf. Вместо облака точек и вокселей - тетраэдры. Зачем? Так лучше
Код
Демо посмотреть
Learning Neural Duplex Radiance Fields for Real-Time View Synthesis
Обычно в #nerf используется много слоев и тонны вычислений чтобы показать вам картинку. А тут придумали как запихнуть все в два слоя, да и после этого еще ускорить.
Демо посмотреть
Кода нет
Обычно в #nerf используется много слоев и тонны вычислений чтобы показать вам картинку. А тут придумали как запихнуть все в два слоя, да и после этого еще ускорить.
Демо посмотреть
Кода нет
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
AMT: All-Pairs Multi-Field Transforms for Efficient Frame Interpolation
Это нам надо. Интерполяция кадров. Иначе говоря, слоумоушен.
Код
Демо
Колаб
#frameinterpolation #slowmotion
Это нам надо. Интерполяция кадров. Иначе говоря, слоумоушен.
Код
Демо
Колаб
#frameinterpolation #slowmotion
🔥3❤1
aiscout.net — каталог полезных нейросетей
Целая библиотека самых полезных нейросетей, которая тщательно отсортирована по категориям. Кроме этого, есть фильтры, например, бесплатных сервисов.
К слову, этот каталог создан чуваком с реддита, он собрал все нейронки, которые он сам и его друзья используют в работе.
#gallery
Целая библиотека самых полезных нейросетей, которая тщательно отсортирована по категориям. Кроме этого, есть фильтры, например, бесплатных сервисов.
К слову, этот каталог создан чуваком с реддита, он собрал все нейронки, которые он сам и его друзья используют в работе.
#gallery
❤1👍1
На Forefront можно пользоваться GPT-4 без подписок. В чем подвох - не знаю.
Для удобства есть заготовленные роли для разных задач, а также папки, чтобы вы могли рассортировать свои диалоги с чат-ботом. Прекрасно понимает русский язык.
Из минусов — придется включить VPN на сервере США.
#chatbot #llm #nlp
Для удобства есть заготовленные роли для разных задач, а также папки, чтобы вы могли рассортировать свои диалоги с чат-ботом. Прекрасно понимает русский язык.
Из минусов — придется включить VPN на сервере США.
#chatbot #llm #nlp
🔥5👍1
Ask-Anything
Можно обсудить с ChatGPT видео. Короче, это модель понимания видео, состоящая из распознавая действия, распознавания образов и ChatGPT. Первичное описание видео - даром. Обсудить - понадобится API ключ OpenAI
Код
Демо (адрес скорее всего будет часто меняться, ищите на гитхабе)
#video2text
Можно обсудить с ChatGPT видео. Короче, это модель понимания видео, состоящая из распознавая действия, распознавания образов и ChatGPT. Первичное описание видео - даром. Обсудить - понадобится API ключ OpenAI
Код
Демо (адрес скорее всего будет часто меняться, ищите на гитхабе)
#video2text
This media is not supported in your browser
VIEW IN TELEGRAM
У Inpaint Anything новая фича:
Inpaint Anything 3D
Непонятно в каком видео берет на вход и отдает 3D сцену
#inpainting
Inpaint Anything 3D
Непонятно в каком видео берет на вход и отдает 3D сцену
#inpainting
This media is not supported in your browser
VIEW IN TELEGRAM
Forwarded from Nataliya Makarova
Привет!
🔸 Сегодня мы открыли бета-версию GigaChat.
В разработке модели участвуют команды SberDevices и Sber AI при поддержке института искусственного интеллекта AIRI и ряда отраслевых экспертов, привлечённых для передачи модели различных предметных знаний, настройки её на корректное исполнение инструкций и точность.
GigaChat умеет отвечать на вопросы, поддерживать диалог, создавать тексты и картинки на основе описаний.
Архитектура GigaChat основана на методе supervised fine-tuning, reinforcement learning with human feedback, а также на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающем в себя модели ruGPT-3.5 с 13 млрд параметров, Kandinsky 2.1, ruCLIP и FRED-T5.
Входящую в состав NeONKA ru-GPT 3.5 с 13 млрд параметров мы планируем в скором времени выложить в открытый доступ в целях ускорения развития open-source сообщества и технологий в области искусственного интеллекта. Следите за анонсами!
🔸 Сегодня мы открыли бета-версию GigaChat.
В разработке модели участвуют команды SberDevices и Sber AI при поддержке института искусственного интеллекта AIRI и ряда отраслевых экспертов, привлечённых для передачи модели различных предметных знаний, настройки её на корректное исполнение инструкций и точность.
GigaChat умеет отвечать на вопросы, поддерживать диалог, создавать тексты и картинки на основе описаний.
Архитектура GigaChat основана на методе supervised fine-tuning, reinforcement learning with human feedback, а также на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающем в себя модели ruGPT-3.5 с 13 млрд параметров, Kandinsky 2.1, ruCLIP и FRED-T5.
Входящую в состав NeONKA ru-GPT 3.5 с 13 млрд параметров мы планируем в скором времени выложить в открытый доступ в целях ускорения развития open-source сообщества и технологий в области искусственного интеллекта. Следите за анонсами!
Forwarded from Natalia Zueva
Сейчас GigaСhat работает в режиме бета-версии. Чтобы оказаться в числе первых, кто протестирует новую нейросеть, подписывайтесь на наш закрытый телеграм-канал. Подписчики канала первые получат доступ к нейросети.
Forwarded from Нейроновости - SD|MJ|GPT etc (TelepostBot)
Media is too big
VIEW IN TELEGRAM
Stable Diffusion и ControlNet полностью интегрировали в Blender. Теперь генерировать изображения можно прямо внутри программы. На видео выше можно увидеть что все работает с помощью привычных нод. Можно рендедерить картинки в разы быстрее чем используя рендер движки, а так же не думать о текстурах. Нужна только форма и описание.
GitHub: https://github.com/carson-katri/dream-textures/releases/tag/0.2.0
Wiki: https://github.com/carson-katri/dream-textures/wiki/Render-Engine
#stablediffusion
Нейроновости
GitHub: https://github.com/carson-katri/dream-textures/releases/tag/0.2.0
Wiki: https://github.com/carson-katri/dream-textures/wiki/Render-Engine
#stablediffusion
Нейроновости
👍4🔥3❤1