Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
А вот пример от сотрудника Satbility AI как локально запустить SDXL Turbo на ComfyUI

Рекомендован SDE Karras (или подобные) и очень низкий CFG (1-2.5, а в оригинале вообще - 0)

инструкция

#text2image #realtime
Forwarded from AI для Всех (Artemii)
Революционное открытие в материаловедении: ИИ от DeepMind обнаружил миллионы новых кристаллов

Вдохновившись (и набравшись опыта) AlphaFold, DeepMind запускают новую революцию. На этот раз в материаловедении. ИИ-инструмент GNoME от DeepMind открыл 2.2 миллиона новых кристаллов.

Современные технологии, такие как компьютерные чипы и батареи, зависят от неорганических кристаллов. Стабильность этих кристаллов критична.

Инструмент GNoME использует глубокое обучение для предсказания стабильности новых материалов, ускоряя и упрощая процесс их открытия. Он предсказал 2.2 миллиона новых кристаллов. Из них 380 000 - стабильны (а следовательно перспективные кандидаты для экспериментального синтеза).

Среди этих стабильных кристаллов, было найдено 52 000 новых слоистых соединений, аналогичных графену, которые могут произвести революцию в электронике.

Это открытие демонстрирует потенциал ИИ в области поиска и разработки новых материалов. GNoME не только предсказывает структуру новых, стабильных кристаллов, но и помогает ускорить их открытие, повышая эффективность предсказания стабильности материалов с 50% до 80%.

Благодаря GNoME нас ждет более устойчивое будущее, с более эффективными технологиями и материалами для электромобилей и вычислительной техники.

🥳 Блог-пост
🔮 Статья
🔥13
SDXL Turbo можно установить локально без плясок с нодами ConfyUI. Для этого понадобится браузер Pinokio

Говорят (твиттер) что на нем даже работают LoRa SDXL 1.0. Разумеется, не так быстро как голый Turbo, 0.8 сек/кадр на RTX A5000

Установить diffusers SDXL Turbo в Pinokio

#realtime #text2image
1
На Civitai уже появились экзотические LoRa

SDXL Turbo-LoRA-Stable Diffusion XL на основе SDXL Turbo, можно использовать с любым чекпойнтом SDXL

LCM&TurboMix LoRA на основе SDXL Turbo и LCM, на 8 шагах дает лучший результат чем LCM или Turbo

#lora #text2image
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
pikaso

Онлайн рисовалка по эскизу. Вообще по вейтлисту, но вот ваи инвайт на немедленный доступ: LINUS

Попробовать

#image2image #sketch2image
🔥3
Ну и Stable Video Diffusion (SVD) тоже прекрасно устанавливается локально в Pinokio. Открываете Pinokio, заходите в Discover, и оно там.

Вот, наваял

#image2video #neuronaut_art
🔥3
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

В помощь тиктокерам любителям кринж-танцев. Ну и нам на что-нибудь сгодится. Фреймворк для анимации персонажа. На вход нужно одно изображение персонажа и анимированная поза. Обратите внимание на одежду и вообще на все. Круто же, да?

Код будет тут

#image2video #humananimation #characteranimation #pose2video
🔥132
SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

Генератор видео из картинки + текста, заточенный на создание переходов от одной картинки к другой и длинные видео

На демонстрационном видео переходы в красных рамках, длинные видео - в синих

Код
Демо

#image2video
👍31
This media is not supported in your browser
VIEW IN TELEGRAM
Вы могли заметить что последнее время я ставлю на видео вотермарки. Привет большим каналам. А еще на андроидах такие видео не открывались. Проблема частично решена благодаря помощи @graphnull.

А дело в том что бот, добавляющий вотермарки я написал целиком под диктовку Deepseek coder. Я знаю что есть готовые боты, но мы не ищем легких путей, мы ищем интересных. Некоторых нюансов работы с видео Deepseek coder не знает и порой при исправлении ошибок ходит по кругу. Приходилось немного погуглить и даже перепоручить одну ошибку ChatGPT.

Сейчас инструмент еще сырой, вотермарк в будущем станет аккуратнее. Если будут траблы с просмотром видео, пишите в чат.
🔥111
This media is not supported in your browser
VIEW IN TELEGRAM
Visual Anagrams: Generating Multi-View Optical Illusions with Diffusion Models

Визуальные анаграммы, иллюзии, перевертыши - без дообучения. Под капотом DeepFloyd. А я-то думал что он уже умер.
Возможности: вращение, переворот, инверсия цвета, мозаичные перестановки, случайные перестановки.
Напомню, что уже было подобное.

Код
Колаб
напечатать пазл-перевертыш. Там всего один вариант

#text2image #text2illusion #text2puzzle
6
This media is not supported in your browser
VIEW IN TELEGRAM
Seamless Communication

Meta AI выпустили новую версию своего нейропереводчика.
На этот раз три модели:

SeamlessM4T v2 - улучшенная версия SeamlessM4T.
Демо

SeamlessExpressive - модель с акцентом на выразительность речи.
Демо

SeamlessStreaming - модель перевода в реальном времени, задержка 2 секунды.
Демо

Гитхаб

#dubbing #multimodal #llm #speech2speech #text2speech #speech2text #tts #stt
👍2