Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
C4AI Command R+

Мощная языковая модель на 104B параметров. Умеет в рассуждения, суммаризацию, ответы на вопросы и другое

Демо
Код/веса

#llm #assistant #chatbot #summary
🔥5
SSR-Encoder: Encoding Selective Subject Representation for Subject-Driven Generation

Генерация изоюражения по образцу, в том числе нескольких разных объектов. Применимо также и к видео.

Код

#conditioning #text2image #image2image #personalization
🔥3👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Face-to-All

Генерация портретов по образцу персонажа. Персонализация, иначе говоря. Вдохновлено face-to-many

#personalization @image2image #text2image #stylization
🔥4👎1
StreamingT2V:Consistent, Dynamic, and Extendable Long Video Generation from Text

Плагин к видеогенераторам для генерации ооочень длинных видео (80, 240, 600, 1200 кадров и больше) с плавными переходами.

Код
Демо

#adapter #text2video
👍5👎1
VAR: Image Generation via Next-Scale Prediction

Новый пошаговый метод генерации изображений от Bytedance при помощи GPT. В отличие от медленной диффузии, тут на каждом шаге предсказывается увеличение масштаба изображения, получается шустро.

Гитхаб
Веса
Демо

#next2image
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
FeatUp: A Model-Agnostic Framework for Features at Any Resolution

Метод повышения разрешения визуальных моделей. Например, сегментаторов, генераторов технических карт (глубины, нормалей). Не подходит для генераторов изображений по тексту.

Еще раз поясню, это не апскейлер, а расширение, позволяющее моделям #image2image выдавать результат бОльшего разрешения

Код
Демо
Колаб

#enhance #plugin
3👍1
Euler Smea Dyn Sampler

Сэмплер для корректной генерации рук, в том числе и на больших разрешениях

Гитхаб
ComfyUI

#text2image
👍51
Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following

Точное следование промпту при генерации изображения по тексту. Достигается через семантическую панель. Разработка Alibaba.

Код

#plugin #text2image
👍72
This media is not supported in your browser
VIEW IN TELEGRAM
У Krea.ai обновка - мультикартиночный промт. Можно смешивать до трех картинок, да еще и в реальном времени

Попробовать

#realtime #image2image #conditioning
🔥8🤯3
Opera Software представила функцию в Opera One, позволяющую загружать и использовать большие языковые модели (LLM) локально.

Чтобы получить доступ к фиче, установите последнюю версию Opera One ( windows | mac ) и выполните следующее:

1️⃣ Откройте боковую панель Aria Chat (понадобится аккаунт Opera)
В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
2️⃣ Нажмите “Перейти к настройкам”
Здесь вы можете выполнить поиск и выбрать, какие модели вы хотите загрузить. Загрузите, например, GEMMA: 2B-INSTRUCT-Q4_K_M, одну из небольших и быстрых моделей, нажав на кнопку загрузки справа
3️⃣ После завершения загрузки нажмите кнопку меню в левом верхнем углу и запустите новый чат
4️⃣ В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
5️⃣ Выберите модель, которую вы только что загрузили
6️⃣ Вуаля, пользуйтесь

#news #LLM #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍1
Опубликован код ELLA и веса для SD 1.5

Код
Веса
Демо ждем

#text2image
🔥10👍32
This media is not supported in your browser
VIEW IN TELEGRAM
Google научил Gemini 1.5 Pro понимать аудио.

• Распознает слова, тон, эмоции и т д
• Можно скинуть лекцию и получить викторину по содержанию за пару секунд, как на видео
• Выжимка подкастов, лекций и т д
• До 11 часов аудио за раз
• Добавили режим JSON и открыли API без листа ожидания

Попробовать (включайте VPN)

#audio2text #speech2text #assistant
👍11🤯2🔥1