Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Invoke 5

Обновился один из интерфейсов для генерации картинок Invoke до версии 5. Работает с #Flux
Одна из фишек, отличающих его от Forge и ComfyUI - холст со слоями наподобие фотошоповских (смотрите видео)

Установить его можно по инструкции на гитхабе или легкой установкой в агрегаторах Pinokio, Stable Matrix

#tools #text2image #image2image
👍10
Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction

Генератор глубины и нормалей. Где вы еще видели такую детализацию?

Код ждем на днях
Демо ждем на днях

#image2depth #image2normal
👍8🔥7
Emu3: Next-Token Prediction is All You Need

Новый набор современных мультимодальных моделей от китайцев. Короче говоря, генератор-пониматор изображений и видео. Недиффузный, генерирует предсказывая следующий токен, то есть, мог бы работать быстрее чем диффузные генераторы, но нет - 13 минут на одну картинку на H100
Умеет продлевать видео, может имитировать некоторые аспекты окружающей среды, людей и животных в физическом мире.

Код
Демо

#text2image #text2video #video2video #videoextension
👍7
ebook2audiobook

Конвертер электронных книг в аудиокниги.

📖 Преобразует электронные книги в текстовый формат с помощью Calibre.
📚 Разбивает электронную книгу на главы для упорядоченного воспроизведения звука.
🎙 Высококачественное преобразование текста в речь с помощью Coqui XTTS.
🗣 Дополнительно - клонирование голоса с помощью вашего собственного голосового файла.
⭐️ Поддерживает несколько языков (по умолчанию английский), есть русский
⭐️⭐️ Предназначен для работы с 4 ГБ RAM.

Код
Демо

#text2speech #ebook2audiobook
👍24
Announcing FLUX1.1 [pro] and the BFL API

FLUX1.1 [pro] (он же - темная лошадка blueberry на image arena) втрое быстрее чем нынешний FLUX1[pro]

Будет доступен на together.ai, Replicate, fal.ai и Freepik.com

BFL API

#text2image #api #news
👍7👏21
Исследование, проведенное на 800 программистах, показало отсутствие особого улучшения от использования Copilot на GitHub. Время на запросы и пропускная способность не стали лучше.

Разработчики, которые пользовались Copilot, допустили на 41% больше ошибок. И Copilot не помогает от эмоционального выгорания.

Почти 30% нового кода написано с помощью искусственного интеллекта. Но похоже что программисты могут стать ленивыми и зависимыми от ИИ. А код, созданный с помощью ИИ, сложно понять и починить.

#news #coding
💯5👍4😁21🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Movie Gen: A Cast of Media Foundation Models

Видеогенератор от Meta AI
30B модель генерит 16-секундные видео в 1080p, 16FPS

13B модель для генерации видео одновременно со звуком в 48kHz.

Редактирование видео по тексту и персонализация заданным фото.

Попробовать (нужен US акк фейсбук или инста)

Пост одного из разработчиков в тг!

#text2video #personalization #videoediting #video2video
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
BlinkShot

Flux1.1 [pro] без реги
Инференс на Together AI.
Авторы планируют прикрутить рульки разрешения и количества шагов.

После несколькитх попыток он мне сказал что мой лимит исчерпан, мол, возращайся через 24 часа.

Вообще он типа в реальном времени должен обновлять картинку, пока вы пишете промпт, как в Krea.ai. Но сейчас все его осадили, он вообще не справляется с нагрузкой

Код в опенсорсе на гитхабе. Но вы же понимаете, если захотите запустить то вам понадобится API ключик

Код

#flux #text2image
🔥6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
NeuLS: Neural Light Spheres for Implicit Image Stitching and View Synthesis

Преобразует панорамный снимок с андроида с данными гироскопа в интерактивную широкоугольную реконструкцию с параллаксом, отражениями и динамикой сцены. Рендерит 1080p в реальном времени

Код ждем

#image2scene #panorama2scene
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
CogStudio

GUI для запуска CogVideo - опенсорсного видеогенератора. Не хотите разбираться в ComfyUI - вам сюда.

Видео по тексту, по изображению, по видео и продление видео

#text2video #image2video #video2video #videoextension
🔥6
CogVideoX-Fun

Но лучше заморочиться и установить это если у вас есть 24Гб VRAM.

Это файнтюн CogVideoX

ComfyUI

#text2video #image2video #video2video
👍5
Вы хотели новостей? фигушки. Админ заболел и сдает проект.
Держите мемы

#humor
😁2110👍1
This media is not supported in your browser
VIEW IN TELEGRAM
dzine

Помните сервис с кучей функций для работы с картинками Stylar? Они переименовались в Dzine, добавили фич. Прислали письмо с предложением опробовать их Image-to-video генератор.

А чтобы его опробовать надо подписаться на недельную триалку, что мне делать неохота сейчас.
Есть кто смелый попробовать?

Ну и да, у них все еще есть рефералка, ссылка вверху реферральная

#image2video #imageediting #inpainting #outpainting
👍3