Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Ernie 4.5 / X1

Новая мультимодальная языковая модель от Baidu уровня GPT-4.5 за 1% от ее цены.

В двух версиях

Ernie 4.5 - нерассуждающая, с анализом картинок / документов / аудио
В чате работает бесплатно

Цены OpenAI: Input $75 / 1M, Output $150 / 1M
Цены Baidu: Input $0.55 / 1M, Output $2.20 / 1M

Ernie X1 - рассуждающая, конкурент DeepSeek R1 за полцены. Скоро в чате

Input $0.28 / 1M, output $1.1 / 1M.

Чат

#assistant #reasoning
7🔥6👍3
Дайджест интересного о чем не успел написать отдельным постом

Free AI background remover: бесплатное удаление фона онлайн от Adobe #backgroundremoval

MANUS: хайповый автономный агент (записаться в вейтлист) для выполнения задач на компе, собранный из 29 инструментов. Есть расширения Chrome и Edge, аппки Android / IOS и приложения для ПК но бесплатно они мало что могут #agent

ANUS: MANUS клонировал сам себя в опенсорс #agent

OpenManus: ANUS, но рабочий. спасибо @Qwinty

Mirage от Captions: генератор видеоблогеров. За ваши $199 генерит и шевелит поясной портрет, а не только голову

Pika: добавили эффекты для превращения в ребёнка, героя, принцессу, или музейный экспонат. Pikaswaps и Pikadditions теперь генерят в 1080p. #image2video

WAN effects/LoRAs: тем временем подобные же эффекты в опенсорсе #image2video

SkyReels: добавили липсинк к своему генератору видео. Демо. #lipsync

FLARE: получение новых видов сцены или её 3D геометрии из несшитых рандомных фоток. Код / Демо #image2mesh #novelview #imageto3d

CTRL-D: редактирование видео промтом. Код #videoediting #video2video

Ideogram: выпустили Ideogram 2a и версию Turbo, для более быстрой и дешевой генерации картинок. Также улучшились тексты на них. #text2image

Light-a-Video: для релайтера видео появилось ComfyUI #relighting #comfyUI

Tight Inversion SDXL: редактирование картинок промтом. #imageediting
👍7🔥31
Command A

Наследник Command R+ на 111B параметров, контекстное окно 256k

Ориентирован на агентные, мультиязычные, программистские задачи

Веса
API

#assistant #coding #agent
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Agentic Radar

Анализ агентных систем на предмет уязвимости и угроз безопасности

#agent #security
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Thera: Aliasing-Free Arbitrary-Scale Super-Resolution with Neural Heat Fields

Новая SOTA в апскейле любого разрешения со встроенным антиалайасингом

Код
Демо (до 600х600 на вход)

#upscale #enhance
👍5👎1
Mistral-Small-3.1

Производительная ( 150 токенов в секунду) мультимодалка от Mistral на 24B параметров, контекст 128K.
Мультиязычная, платформа для продвинутых рассуждений. Визуальные задачи, агентные.

В квантизованном виде влезет на RTX 4090 или 32GB RAM MacBook

Веса Base
Веса Instruct
API

#assistant #reasoning #vlm
👍13🔥4
VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control

Инпейнтинг видео любой длины с контролем контекста. От Tencent.
Умеет не только заполнять заданные области, но и заменять объекты по текстовому промпту.

Судя по сравнениям уделывает ProPainter одной левой. Но зачем они выставили кейс с заменой девушки на Энн Хэтеуэй, ведь это провал?

Код
Веса

#inpainting #videoediting
👍41🔥1
Forwarded from CGIT_Vines (Marvin Heemeyer)
Andrew Price затестил текущие модели для генерации 3D. Тест не идеальный, так как некоторые игроки не представлены на тестах. Но, тем не менее, это дает представление о текущем положении дел.

Главное — помнить, что где-то использовались PRO-версии генераторов, которые, как я подозреваю, просто наваливают больше геометрии, и точность вырастает именно из-за этого. Стоит ли пользоваться или переживать — решать вам.
👍7🔥1👏1