Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.47K photos
3.74K videos
41 files
4.77K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
VLM Image Captioning Tool

Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.

Поддерживает большинство VLM провайдеров, в том числе локальные VLM

Видео

#captioning #image2text #vlm
👍53
В четверг в 6 утра по Москве релиз Grok 4

Твит

#news
👍11🔥2
Media is too big
VIEW IN TELEGRAM
Moonvalley Marey

Новый видеогенератор

1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI

Бесплатного тарифа нет, приветственных кредитов не насыпают

Marey Realism v1.5 in ComfyUI

Спасибо @p0lygon

#text2video #comfyUI
👍8🤯42
This media is not supported in your browser
VIEW IN TELEGRAM
Sara - AI Interviewer for hiring

Трепещите, кожаные. Теперь вас будет отвергать железяка.

ИИ-собеседователь.
Я попытался получить у нее позицию коммерческого директора. Мои знания о том как быть коммерческим директором равны нулю. Но она высоко оценила мою уверенность.

Дают 10-дневную триалку.

А поболтать можно бесплатно

#assistant #hr #interviewer
😁7👀3👎2😱2🍌1
Flux Kontext Character Turnaround Sheet LoRA

Лора #kontext на рабочий лист персонажа

HF
Civitai

#lora #image2image
👍171
HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context

Ресерч.
Если встретите название HumanOmniV2, не путайте его с OmniHuman

Проект HumanOmniV2 от Alibaba направлен на улучшение способности больших языковых моделей (LLM) понимать и интерпретировать человеческие намерения и эмоции через мультимодальные данные.

Если кому нужен код, вот

Код

#llm #research
👍6
Media is too big
VIEW IN TELEGRAM
Проактивного ИИ-агента Proactor уже можно потестить

На бесплатном тарифе дают 30 минут транскрибации и 100 кредитов на прочие ИИ-ничтяки

Попробовать

#agent #realtime
👍3🍌1
Dubnote

‼️Бесплатную пожизненную подписку можно получить до 10 июля 11:00 МСК

iOS приложение для записи музыкальных идей

AI Split: автоматическое разделение аудио на секции.

- Smart & Manual Edits: возможность редактировать секции с помощью AI или вручную.

- Export Sections: экспорт отдельных секций в файлы .wav или .aac

- Auto-Tagging: автоматическое тегирование аудио.

- On-Device Speech-to-Text: преобразование речи в текст без подключения к интернету

Я до сих пор пользовался MusicMemo но тут кажется покруче

AppStore

#iOS #mobile #memo #assistant
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥2😁1
Media is too big
VIEW IN TELEGRAM
4DSloMo: 4D Reconstruction for High Speed Scene with Asynchronous Capture

Работа с участием NVIDIA.
Реконструкция #4D слоумошен сцены из видео с нескольких ракурсов, снятого обычными камерами в 25 fps. Эффективная частота кадров получается 100-200 fps
Под капотом 4D модель на гауссианах

Код ждем

#videoto4d #gaussian #4d
👍9🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity Comet

Новый ИИ-браузер от Perplexity

Умный поиск Perplexity
Агентный поИСк
Умные вкладки
Блокировщик рекламы

Сейчас доступ дают только подписчикам MAX. Обещают в будущем бесплатный функционал.

Записаться в вейтлист

#search #browser
👍6👎1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield Soul ID

Тут были наезды на Higgsfield Soul, что у них лица слегка одинаковые и вообще похоже не на генерацию, а на вытаскивание максимально похожих из датасета.

На что разрабы ответили с помощью Higgsfield Soul ID

Это типа быстрая тренировка (внутренняя) лор под ВАШИ фотачки.

Теперь вы можете загрузить 10+ своих фотографий, и Soul создаст вашу версию, которая будет выглядеть, двигаться и вести себя как вы:

- остается неизменной независимо от угла, выражения лица или освещения
- почти никаких подсказок не требуется

Дальше резвитесь промптами.

https://higgsfield.ai/

@cgevent
🔥10👍1
Нейронавт | Нейросети в творчестве
В четверг в 6 утра по Москве релиз Grok 4 Твит #news
Grok 4

Релизнули.

– Фокус на рассуждениях и академических способностях

– Контекст 256k токенов

– Есть две версии модели: обычная Grok 4 и продвинутая Grok 4 Heavy

– Grok 4 Heavy прошел тест по математике AIME25 на 100%

– В самом сложном бенчмарке «Последний экзамен человечества» обе модели побили прошлый рекорд, набрав 38,6% и 44,4% соответственно

– обещают, что Grok 4 может генерировать видеоигры по одному промпту и с высокой вероятностью редсказывать исход различных спортивных событий (не читал, думаю, высокая вероятность это где-то в районе 60%)

Ну все, наконец тотализаторы загнутся. Правда, и кожаные перестанут играть в игры и состязаться. А зачем если результат известен.

Доступен на офсайте по подписке
Grok 4 за $300 в год
Grok 4 Heavy за $3000 в год

в халявном твиттере все еще 3 версия, разумеется

#news #assistant #sota
😁6👍5🤯3