NEW BOT Телеграм, страница - 368380722

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.45K photos

3.72K videos

41 files

4.76K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DeepEyesV2: Toward Agentic Multimodal Model

Агентная мультимодальная модель на 7B параметров, умеет не только понимать текст и изображения, но и активно использовать внешние инструменты, например, среды выполнения кода и веб-поиск, интегрируя их в процесс рассуждения

Гитхаб
HF

#agent #multimodal #vlm

❤7👍4

2.22K views08:11

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ChronoEdit-14B-Diffusers-Upscaler-LoRA

NVIDIA опубликовала лору-апскейлер к редактору ChronoEdit

#upscale #lora #restoration #imagerestoration

👍17🔥2

2.08K views09:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DEMO: Dense Motion Captioning

Модель для описания действий человека в последовательностях 3D-движений. Генерирует подробные описания действий с привязкой ко времени

Код ждем на этой неделе

#captioning #video2text

👍5

1.74K views10:13

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Taku

Операционная система, которая должна заменить вайбкодинг для непрограммистов.

Позволяет создавать и запускать приложения и инструменты в один шаг, работая при этом в привычной рабочей среде без лишних усилий и возни с кодом / деплоем и т д.

Записаться в вейтлист

#coding #agent #assistant #OS

👍9❤1

1.9K views11:14

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Moondream распознает видео в реальном времени

От понимания картинок к пониманию потокового видео

Может работать с веб-камерами, камерами безопасности, дронами и другими источниками видео.

Может запускать оповещения, логировать события и управлять системами.

Применяется в безопасности, контроле качества, мониторинге безопасности и розничной аналитике.

Работает по API

Гитхаб
Демо по ссылке в шапке. Там можно подключить свою вебку или закинуть видеофал

#vlm #captioning #detection #moe #cv #image2text

👍8❤2🥴1

1.88K viewsedited 12:16

Нейронавт | Нейросети в творчестве

Опубликован код генератора-реставратора изображений DDCM

Код
Демо

#text2image #imagerestoration #enhance #facerestoration #upscale #image2image

Нейронавт | Нейросети в творчестве

DDCM: Compressed Image Generation with Denoising Diffusion Codebook Models

Метод генерации и реставрации изображений

Код ждем
Демо

#text2image #imagerestoration #enhance #facerestoration #upscale #image2image

👍7🔥2

2.11K views13:16

Нейронавт | Нейросети в творчестве

ComfyUI Step Audio EditX TTS

Кастом ноды аудиомодели Step-Audio-EditX

#comfyui #tts #text2speech #audioediting #speechcontrol #speechediting #speech2speech #voicecloning

👍9

2.22K views14:17

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

😁8😭4👎1

1.71K views15:18

Нейронавт | Нейросети в творчестве

Пошли слухи про Flux 2 от разработчиков из BlackForest Labs

🙏 Пусть сделают открытые веса, чтоб влезало в 8 ГБ и без цирка с лоу - хай моделями

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍28🌚3😱2❤1

2.04K views16:19

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

Omnilingual ASR: Open-Source Multilingual Speech Recognition for 1600+ Languages Аудиораспознавалка 1600+ языков от Meta (запрещено в РФ) включая 500 низкоресурсных языков, которые ранее не транскрибировались с помощью ИИ. носитель неподдерживаемого языка…

This media is not supported in your browser

VIEW IN TELEGRAM

ElevenLabs Scribe v2 Realtime

У ElevenLabs своя аудиораспознавалка. Рилтаймовая, задержка 150мс.

Распознает и маркирует голоса
Превосходит Gemini 2.5 Flash, GPT 4o MiniTranscribe и Deepgram Nova 3
90+ языков, включая русский.
Бесплатного триала нет

Ну и пусть сидят там со своими жалкими 90 за своим дискриминационным забором

#stt #speech2text #asr #realtime

😁12❤1👍1🔥1🤯1

1.89K viewsedited 06:11

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Аттаркцион неслыханной щедрости от Хиггсфилд

Бесплатный Nano-Banana в твиттере.
Nano-Banana который и так бесплатный в браузере.
Но если вам далеко идти на офсайт гугла, а в твиттер недалеко то просто за скромные пиар-услуги Хиггсфилд БЕЗВАЗДМЕЗДНА сгенерит вам нанобананой картинку

- тэгните @higgsfield_ai в любом месте на X а лучше под постом
- Добавьте #nanobanana + свой промпт
- вам ответят картинкой
- Подпишитесь на @higgsfield_ai, ~~и вам выдадут 250 кредитов за то вы такой красивый котик. Но только примерно до 16ч по МСК сегодня.~~ Проверил. картинку сделали (см комменты). Кредитов - шиш пока что

Ну и похоже они собираются каждый день устраивать аттракционы с разными моделями

#tex2image #giveaway

👍4

1.64K viewsedited 07:11

Нейронавт | Нейросети в творчестве

Мэтью Макконахи и Майкл Кейн подписали договор с ElevenLabs на клонирование своих голосов.

ElevenLabs запустили маркетплейс ИИ-голосов знаменитостей для рекламы Iconic Voice Marketplace и уже получили контракт с вышеуказанными актерами.

Макконахи инвестировал в ElevenLabs и использует их технологию для выпуска аудиоверсии своего информационного бюллетеня на испанском языке

На фоне голливудской ИИ-фобии новость смотрится интересно

#news

❤14👍9😁2

1.78K views08:11

Нейронавт | Нейросети в творчестве

VibeThinker-1.5B

Открытая языковая модель с всего 1.5B параметров, уровня DeepSeek R1, у которого на минуточку, параметров в 400 раз больше

А обучение этой рассуждалки стоило жалких $7,800 USD

Веса всего 3.5 ГБ. Очень интересно если в жизни он как в описании

[UPDATE] мухлеж с тестами. Этим джентльменам на слово больше не верим

Гитхаб

#assistant #reasoning

👍8😁4❤3🤯1😱1

3.39K views09:12

Нейронавт | Нейросети в творчестве

Anime2Realism

Лора #QIE для превращения аниме картинок в реалистичные изображения

#lora

🔥9👍6🤯1

1.78K views10:13

Нейронавт | Нейросети в творчестве

Grok Imagine 1.0

Говорят что таинственный картинкогенератор Mandarin на LMarena это Grok Imagine 1.0

Ну и пишут что он уже на https://grok.com/imagine

Но чтото я не вижу явных доказательств

#news #text2image

👍5

1.82K views11:14