Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
MetaCLIP 2

Запрещенная в РФ Meta положила конец гегемонии английского языка в текстовом энкодере

Побили CLIP на Английском бенчмарке и установили #sota на мультилингвальном

HF
Гитхаб
Демо не работает сейчас

#encoder
👍10🔥3
Gemini 3 Pro

Релизнули. Всех во всем побил, бла бла бла молодец

Контекст 1M токенов, вывод — 64k, знания по январь 2025

API несколько дороже gpt-5.1.

Прицепом выпустили Google Antigravity - аналог Cursor, IDE для разработки, пока бесплатный

Gemini
AI Studio

#assistant #news #reasoning
13👍4
А помните, все новые нейросети запускали в колабе?
Дефорумы всякие, диско дифьюжены. Даже sd файнтюнили в нем пока не появились богомерзкие а1111 с комфиями.

Так вот, Colab прикрутили к VS Code — теперь можно подключить локальные ноутбуки из IDE к облачным GPU/TPU

1. Заходим в магазин расширений VS Code и устанавливаем Google Colab.
2. Создаём и открываем файл .ipynb.
3. Выбираем Colab в Select Kernel и нужную вычислительную среду.
4. Логинимся в аккаунт Google. Вуаля

Кроме того, ИИ в Google Colab теперь будет доступен бесплатным пользователям

К моделям уже можно обратиться двумя способами:

1. Через библиотеку google.colab.ai, которую сделали открытой для всех пользователей. Прямо в ячейке прописываете from google.colab import ai, и затем можете:

– Просмотреть все доступные вам модели:

ai.list_models()

Сгенерировать что-нибудь:

response = ai.generate_text("2+2?", model_name = 'google/gemini-2.0-flash-lite')
print(response)


– Или стримить ответ:

stream = ai.generate_text("Tell me a short story.", stream=True)
for text in stream:
print(text, end='')


2. Через новую кнопку «Add AI prompt cell», которая расположена рядом с кнопкой +Code.
🔥15👍2🤔2
Продолжение тестов Nano Banana Pro

Модель здорово работает с большим количеством персонажей (в тестах перечислял по 30 штук), с героями наших мультфильмов справилась не идеально, зато с диснеевскими вообще никаких проблем (результат в комментах).

Знает Васю Ложкина, но не особо знает Альберто Мьельго (причем, сгенерированные картины Ложкина больше похожи на Ложкина, чем сам Ложкин. Еще пара примеров в комментах).
🔥35👍43
Media is too big
VIEW IN TELEGRAM
Introducing SAM 3D: Powerful 3D Reconstruction for Physical World Images

Реконструкция 3d объектов от запрещенной Meta

SAM 3D Objects для объектов и сцен

SAM 3D Body для реконструкции человеков

Segment Anything Playground, тут можно попробовать модели семейства SAM, в том числе и сегментатор

#segmentation #imageto3d #humanreconstruction
👍102🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
MMaDA-Parallel: Parallel Multimodal Large Diffusion Language Models for Thinking-Aware Editing and Generation

Мультимодальная модель, способная думать в процессе генерации изображения. Ее фишка в паралльлельном взаимодействии текста и изображения

Гитхаб
HF
Демо

#multimodal #text2image
👍17
Uni-MoE-2.0-Omni

Языково‑ориентированная омнимодальная модель на базе Qwen2.5‑7B

Обрабатывает, анализирует и генерирует изображения, текст и речь в 10 модальностях, используя динамическую архитектуру MoE.

Гитхаб
HF

#multimodal #text2image #tts #vlm #alm #image2text
👍101