Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Нейронавт | Нейросети в творчестве
AutoPR: Let's Automate Your Academic Promotion! Эта модель переводит научные статьи в контент, оптимизированный под разные соцсети с учётом достоверности, соответствия и вовлечённости аудитории. Извлекает контент из научных статей, синтезирует логичные нарративы…
Paper2Agent: Reimagining Papers As AI Agents

А вот мультиагентная ИИ-система, которая преобразует научные статьи в интерактивных ИИ-агентов с минимальным участием человека.

На видео пример работы с AlphaGenome и TISSUE

Принцип работы:

1. Анализ текста и кода: Aper2Agent анализирует научную статью и её код (если он имеется), выделяет ключевые методы и разрабатывает инструменты внутри MCP-сервера.
2. Интеграция с чат-ботом: Сервер связывается с чат-агентом, например, Claude Code или ChatGPT.

Результат:

Каждая статья получает собственного ИИ-ассистента, который:

* излагает материал доступным языком;
* запускает код без необходимости искать репозитории, зависимости и API-ключи;
* интегрирует данные и процессы из различных исследований.

Компоненты MCP-сервера:

* Функциональные возможности: инструменты, такие как прогнозирование изменений экспрессии генов.
* Репозиторий: текст, код, наборы данных.
* Шаблоны: подсказки для выполнения пошаговых задач.

Гитхаб

#paper2code #text2code #mcp #agent #assistant
👍43
This media is not supported in your browser
VIEW IN TELEGRAM
Kontinuous Kontext: Continuous Strength Control for Instruction-based Image Editing

Контекстный редактор изображений от Snap Research с плавной (на самом деле не очень) регулировкой степени изменения изображения на базе Flux Kontext

На сайте можно интерактивно покрутить рульки

Код ждем
Демо ждем

Спасибо @m_franz

#imageediting
🔥6👍1
DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

Модель для создания реалистичных панорамных изображений на базе Flux с лорой

— улучшает качество существующих панорам за счёт устранения артефактов и искажений в полярных областях

— использует перспективные изображения для обогащения панорамного контента и повышения фотореализма

— обеспечивает согласованность границ и устраняет искажения в полярных регионах

— делает инпейнтинг и аутпейнтинг без дополнительного обучения

— использует несколько механизмов для контроля геометрии и искажения в латентном пространстве

Код
Демо

#panorama #text2panorama #text2image
👍61
Лутаем 600+ кредитов Higgsfield и еще немножко если у вас есть подписка

Включаем американский ВПH, идем с новым имейлом на https://higgsfield.ai/me/settings и вставляем промокоды - все подряд которые подойдут

150CREDS_HIGGSFIELDSORAADS

SKETCH2VIDEOHIGGS_xWVAZ


Для этих нужно прикинутся что вы из штатов(хотя у некоторых и без этого работает):
SORASTREAM_150CREDS

HIGGSFIELD_SORA2TRENDS_150CREDITS


Эти промокоды сработают если у вас платная подписка(и тоже прикинувшись что вы из штатов):
STREAM200

GIFT200


раздачу подрезал у @AINetSD

#giveaway
👍125🔥1
AVoCaDO: An AudioVisual Video Captioner Driven by Temporal Orchestration

Кэпшонер на базе Qwen2.5-Omni-7B, создает описание видео, учитывая как визуальную, так и аудиосоставляющую, синхронизируя их во времени

Код
HF

#captioning #VLM #video2text
👍111
EPG: Advancing End-to-End Pixel Space Generative Modeling via Self-supervised Pre-training

Новая #SOTA генератор картинок в пиксельном пространстве

первая успешная попытка обучить консистентную модель непосредственно на изображениях высокого разрешения без использования предварительно обученных VAE или диффузионных моделей.


Код ждем

#research #text2image
👍7🔥2
Говорят, VEO 3.1 сегодня выйдет

#news
👍6😱3
MAI-Image-1

Новый картинкогенератор от Microsoft

Сейчас на 9 месте на LMArena

Очевидно, умеет изображать текст.
Делают ставку на фотореализм и скорость:
MAI-Image-1 отлично подходит для создания фотореалистичных изображений, таких как освещение (например, отраженный свет, блики), пейзажи и многое другое. Это особенно важно по сравнению со многими более крупными и медленными моделями. Благодаря сочетанию скорости и качества пользователи могут быстрее отображать свои идеи на экране, быстро просматривать их, а затем переносить свою работу в другие инструменты для дальнейшей доработки.


Непонятно выдадут ли код или сервис, а пока пробуем на арене. Можно выбрать Direct Chat -> mai-image-1

#text2image
👍5