Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
Самое лучшее применение генераторов видео, что я видел за весь год. На моменте с соком порвало

Тикток автора

#aiart
🔥15👎2👍1
Relightable Gaussian Codec Avatars

Аватары на гауссианах с релайтингом от Meta.
Позволяет фиксировать трехмерные детали размером до миллиметра, такие как пряди волос и поры на динамических изображениях лица. Дополнительно улучшают точность отражения глаз и явное управление взглядом. Отдельно работают со спекулярами. Работает в реальном времени.

Кода не дали (такая корова самим нужна)

[UPDATE]
Код

#realtime #humanavatar #head #talkinghead #relighting
🔥4👍1
Imagine with Meta AI

К Emu прикрутили веб-интерфейс. Теперь можно генерить Бендера бесплатно без смс, но только американцам. А если с VPN? Можно, но только тихо. Понадобится аккаунт Meta.

Ну и можно шерить ссылки на свои генерации

Тест Бендера на 6 из 10

#text2image
Upscale-A-VideoTemporal-Consistent Diffusion Model for Real-World Video Super-Resolution

Диффузионный апскейлер видео. На вход нужно видео и текстовое описание. Демонстрационные результаты выглядят круто. На деле посмотрим когда выложат код.

Код

#upscale #superresolution #video2video #upscalevideo
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
A Task is Worth One Word: Learning with Task Prompts for High-Quality Versatile Image Inpainting

Высококачественный инпейнтинг/аутпейнтинг - замена объектов на изображении/дорисовка

Код
Демо (китайский сайт, у меня загрузился только через VPN)

#inpainting #outpainting
👍9
Forwarded from CG дневничок (Sergey Frolov)
This media is not supported in your browser
VIEW IN TELEGRAM
Midjourney выкатила браузерную версию нейронки — без ебучего дискорда. Мы дожили до этого момента.

Пока попробовать веб-версию Midjourney могут только юзеры с 10 тысячами генераций за плечами.
🔥14👍3
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Короче, мы выкатили диффузию в инстаграм для редактирования изображений, а именно - генерацию фона по тексту. Эта модель была анонсирована еще на Connect, но только сейчас ее выкатили в прод в США.

Загружаешь фото, вводишь любой пропмт, например, "преследуемый динозаврами" или "я в Париже", и получаешь несколько новых версий своей фотки.

Моделька основана на нашей text2image диффузии Emu и технологии по типу SAM, которая позволяет автоматически находить нужную маску.

Тут я говорю "мы выкатили", потому что мы с нашей командой крутили и искоряли эту модель, чтобы она работала за пару секунд.

Диффузия Go Brrrrr! - это лозунг нашей команды.

Приятно, когда результатами твоей работы могут пользоваться миллионы людей. Даже работая в ресерче в фаанге, не всегда есть такая возможность. Мне в этом смысле повезло, т.к. наша GenAI орга, кроме написания статей, ещё и катит ресерч в продукты и имеет реальный импакт.

@ai_newz
🔥41👍1
Это примерно сколько у меня накопилось неразобранных новостей по нейросеткам. И увы, сегодня разбирать тоже некогда. Не теряйте, скоро вернусь
👍138😁4
Вот несколько важных штук о которых я вам не успевал рассказать. Текст честно с@$&дил у Олега. И тегов насыплю чтобы можно было найти по поиску

Alibaba представили виртуальную примерку OutfitAnyone, загружаете фото и примеры одежды, получаете фото в одежде или даже анимацию 🕺💃 Демо, Сайт проекта.

В Open-Source появилась модель Mistral 8x7b, превосходящая результаты GPT 3.5 при низких требованиях к железу 🔥 Подробнее, Попробовать.

Разработчики выпустили Dobb-E: open-source framework для обучения домашних роботов 🤖 Сайт, Клип.

Meta выпустила Foundation Model для генерации звука: голоса, музыки, спецэффектов и т.д 🎶 Ссылка.

Google выпустили новый генератор музыки MusicFX. Работает для Штатов, Австралии и Кении 🎹 Слушать, Проверить здесь.

RunwayML представили "text-to-speech" для генерации закадрового голоса и диалогов на несколько разных голосов 🎙 Ссылка.

DeepMind представили FunSearch - метод исследования с использованием больших языковых моделей для открытия новых решений в математике и информатике 🌐 Блог-пост, Статья в Nature.

Google выпустили новый генератор text2video 📽 Демо, Статья.

StabilityAI выпустили Stable Zero123 для генерации 3D 🧊 Новость, Код.

WonderJourney: модульный фреймворк с использованием LLM для генерации 3D-сцен и формирования "чудесных путешествий" 🌅 Сайт.

PowerPaint: модель для редактирования изображений через инпейтинг, аутпейтинг и ControlNet 🖌 Сайт.

#inpainting #outpainting #textto3D #text2video #text2speech #text2music #voicecloning #text2audio #text2sound
🔥92👍1👎1
На литературном конкурсе победил научно-фантастический рассказ, написанный ИИ

Профессор журналистики написал научно-фантастическую новеллу о метавселенной и человекоподобных роботах под названием «Страна воспоминаний». Она написана на китайском языке объёмом почти 6000 знаков. ИИ создал черновик на 43 000 знаков всего за три часа с помощью 66 подсказок.

Иллюстрации к новелле также были созданы искусственным интеллектом.

На конкурсе от Ассоциации писателей-фантастов Цзянсу произведение получило второй приз из 17. Только один из шести судей был уведомлен о том, что профессор использовал ИИ в своей работе. Другой судья, который изучал вопрос создания контента с использованием ИИ, догадался, что работа была сгенерирована ИИ и не стал голосовать за неё, так как работе «не хватало ярких эмоций».

Хабр

#news
4
LongAnimateDiff

Гнератор "длинных" видео по тексту в двух вариантах

- LongAnimateDiff, от 16 до 64 кадров.
Веса можно загрузить с Google Drive или HuggingFace. Для получения оптимальных результатов рекомендуется использовать шкалу движения 1,28.

- Специализированная модель, 32 кадра. Создает видео более высокого качества по сравнению с моделью LongAnimateDiff, поддерживающей 16-64 кадра. Веса на Google Drive или HuggingFace. Для получения хороших результатов используйте масштаб движения 1,15.

Есть готовый воркфлоу для ComfyUI

Код
Демо

#text2video
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Fairy

А вот более впечатляющая нейросетка от Meta (запрещена в РФ) для обработки видео.

Fairy расставляет на кадрах готового видеоролика ключи, на которые уже распространяет диффузионные особенности по кадрам. Это обеспечивает сгенерированному видео точность и похожесть на оригинал.

Fairy генерирует 120-кадровые видеоролики 512x384 пикселей (длительностью 4 секунды при 30 FPS) довольно шустро - всего за 14 секунд, превосходя предыдущие нейрости 44 раза.

- замена объекта/персонажа
- стилизация
- генерация длинных видео без переполнения памяти. 27-секундное видео генерит за 71.89 секунд на шести A100

Код ждем

#video2video
5
VideoPoet

Генератор видео от Google. А точнее - генератор историй.
Сами авторы классифицируют свое детище как LLM, а не какой-то там генератор видео.

- продление поданных на вход видео
- генерация звука к заданному видео
- Inpaint/Outpaint
- Редактирование видео с помощью анимации промптов
- Анимация входного изображения
- стилизация видео

Кода нет.

#text2video #image2video #video2audio #video2video
5🔥1