Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.75K videos
41 files
4.78K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages

Мультимодальная #LLM на 39 языков, русский в их числе. 7B параметров. "Полный" опенсорс

Код
Демо

#Multimodal #Mllm
😁11👍3
This media is not supported in your browser
VIEW IN TELEGRAM
LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding

А вот вам свежий метод экномии видеотокенов для видеопониматоров от запрещенной Meta.
Под капотом DINOv2 и еще чего-то там.

Прикручено к Qwen и Llama3.2 от 1B до 7B

Код
Демо

#MLLM #VLM
👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
LargeSpatialModel: End-to-end Unposed Images to Semantic 3D

Реконструкция сцены на гауссианах по двум входным изображениям. По одному уже было

LSM использует в качестве входных данных два некалиброванных изображения и в реальном времени восстанавливает световое поле, включая геометрию, внешний вид и семантику

Код будет в ноябре есть
Демо

#gaussian #image2scene #imageto3d #image2gaussian #realtime
🔥8
Forwarded from эйай ньюз
Google готовит к релизу Jarvis

Заказать билеты на самолёт, отменить подписку или сделать какую-то мелкую монотонную работу скоро за вас сможет ИИ агент на основе Gemini. В отличие от Anthropic, которые научили Claude использовать весь компьютер, Jarvis будет ограничен браузером и как-то интегрирован с Chrome. С одной стороны это меньшая гибкость, с другой - таким образом надёжность агента будет заметно выше, что очень важно для релиза на сотни миллионов человек.

Показать могут уже вместе с Gemini 2.0, в декабре. А вот попользоваться, скорее всего, сначала дадут лишь маленькой группе пользователей.

Rabbit нужно было всего лишь подождать годик с релизом

@ai_newz
🔥3👍1
Flux IP-Adapter v2 от XLabs

Вторая версия подъехала, забираем

Перед началом работы обязательно обновите ноды: x-flux-comfyui.git
Воркфлоу

@ai_xlabs

#personalization
🔥9
Suno на iOS теперь доступен избранным пользователям со всего мира, то есть за пределами американского AppStore.

Это значит что скоро выдадут и простым смертным. Всем или не всем - неизвестно

#news #mobile #text2music
🤷‍♂5🤔1
Stable Diffusion 3.5 Medium

Объявлен релиз Stable Diffusion 3.5 Medium

Без оптимизаций прет на 10ГБ VRAM
Коммерческая и некоммерческая лицензия

Демо
Веса на HF

#SD35 #text2image
🔥6🤷‍♂1
Media is too big
VIEW IN TELEGRAM
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality

Новый метод ускорения видеодиффузии от команды Vchitect

Поддерживает Open-Sora 1.2, Open-Sora-Plan 1.1, Latte, CogvideoX-2B и Vchitect 2.0

Ждем быстрых генераций на ведущих генерилках

Код

#text2video #optimization
👍4😱2