Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
PRX

Генератор картинок уровня примерно SD 1.5 от Photoroom

Правда, старшая модель разрешением 1024, это как у SDXL. Но может ли она выдать картинку качества SDXL?

Немножко может в NSFW, как SD1.5 без файтюнов, см наш чат

Главная особенность в том, что
разработчики стремятся сделать открытым не только конечный продукт, но и весь процесс создания: делиться опытом, ошибками и деталями, которые обычно остаются скрытыми.


HF
Демо 1024

Спасибо @EvgenyiPerm

#text2image
👍101
фактчекинг картинок на марше

#humor
😁26👍1💯1
Music Flamingo: Scaling Music Understanding in Audio Language Models

Аудиоязыковая модель от NVIDIA для понимания музыки

Обрабатывает аудиозаписи длительностью до 15 минут с контекстным окном в 24 тысячи токенов

Возможности модели:

— делает детальные описания треков, включая жанр, темп, тональность, инструменты и настроение

— отвечает на вопросы о структуре, вокале, лирических темах и решениях в микшировании

— распознаёт инструменты и жанры

— транскрибирует тексты песен на разных языках. То есть это еще и транскрибатор

— анализирует музыку с учётом культурного контекста.

Гитхаб
Демо
HF

#captioning #asr #ALM #music2text #audio2text #assistant
👍9🔥61
This media is not supported in your browser
VIEW IN TELEGRAM
alphaxiv.org

Инструмент для удобного чтения статей на arxiv.org

Меняем в адресной строке статьи arxiv на quickarXiv и читаем выжимку

Есть чат с ИИ, можно задавать вопросы по статье

#tools #assistant
👍13🔥5
Нейронавт | Нейросети в творчестве
alphaxiv.org Инструмент для удобного чтения статей на arxiv.org Меняем в адресной строке статьи arxiv на quickarXiv и читаем выжимку Есть чат с ИИ, можно задавать вопросы по статье #tools #assistant
This media is not supported in your browser
VIEW IN TELEGRAM
Code wiki

Новый инструмент от Google для работы с кодом

Открываем codewiki.google, закидываем ссылку на репозиторий и получаем документацию со схемами.

Есть чат с Gemini по репозиторию

Изменения в репозитории отражаются в документации на codewiki

Спасибо @EvgenyiPerm

#assistant #tools
👍101
This media is not supported in your browser
VIEW IN TELEGRAM
Думали роботы только работу у вас отберут?

#humor
😁17👍31🔥1
Не, не рассчитывайте на это

#humor
😁14😎3👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Пост выходного дня

Игра Марио в браузерной строке.

В браузерной строке, Карл!

Играть тут. Для игры нужна клавиатура, с мобилки не получится.

Гитхаб

#оффтоп #game
🔥8👍1😱1
Еще #оффтоп

Астрофотограф снял парашютиста на фоне Солнца и назвал это фото «Падением Икара».

Снимок сделан 8 ноября в Аризоне: фотографу и парашютисту потребовались недели подготовки и 7 попыток

Им еще пришлось доказывать, что они не использовали нейросети

P.S. А выглядит будто картонную фигурку заанимировали трансформом в афтерэффекте
15🔥10😁2👍1
Kandinsky 5.0 Video Pro

Новая модель видеогенератора Kandinsky

19B параметров, HD видео, понимает русский и английский, есть контроль камеры.

Спасибо @m_franz

#text2video #cameracontrol
👍10🔥4👎1😱1
Лоры для Qwen-Image-Edit собранные подписчиком. Ну и я одну докинул

eigen-banana-qwen-image-edit

Файнтюн на 35 операций по редактированию изображений, есть сайт проекта: https://www.eigenai.com/blog/2025-10-30-eigen-banana.html и Демо: https://app.eigenai.com/eigen-banana-qwen-image-edit.html

Qwen Edit
Turn to photo (из рисунков в фотореализм)

https://huggingface.co/Pixaroma/experimental_loras/tree/main

Fusion (композ)
https://huggingface.co/dx8152/Qwen-Image-Edit-2509-Fusion

White to scene (замена белого фона)
https://huggingface.co/dx8152/Qwen-Image-Edit-2509-White_to_Scene

Object removal alpha (клинап) https://huggingface.co/lrzjason/QwenEdit2509-ObjectRemovalAlpha

Face to full body (сцены с сохранением лица)
https://huggingface.co/DiffSynth-Studio/Qwen-Image-Edit-F2P

Uncrop (инпейнт, аутпейнт)
https://civitai.com/models/2106308/uncropinpaintoutpaint-with-context-image-for-qwen-image-edit-2509-lora

Спасибо @goncharov_vitaly

#QUE #imageediting #lora
1👍157
От подписчика про FlashVSR 1.1

FlashVSR v1.1 уже с неделю гонял, разницы с прошлой версией не заметил. Вообще апскейлер достойный, действительно восстанавливает детали. Но для реализма, особенно на крупных планах людей не особо подходит. Делает слишком искусственные лица и глаза. Есть также небольшой косяк с определением глубины резкости, любит сделать всё резким, даже если сзади размытие. В остальном достойно, работает с длинными видео (лично пробовал на полторы минуты). Сделал удобный ворк с ссылками на новую модель и подсказками, если интересно попробовать



https://civitai.com/models/2089506/friendly-flashvsr-video-super-resolution

Спасибо @RuslanKuznetsov_spb

#upscale #enhancevideo #workflow
👍191
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Довольно прельстиво выглядит генерация целых 3Д-сцен от 3daistudio.

Я немного пофактчекал и меня смущает только одна вещь. Весь этот развесистый проект выглядит как еще один агрегатор моделей разного толка, от картинок и видео до 3Д.
В разделе картинок и видео у них нет никаких своих моделей, только чужие.
А в разделе 3Д у них есть не очень известные Prism и Forge, но также присутствуют Meshy, Seed3D и даже Hunyuan 3D.

И на видео представлена именно генерация Hunyuan 3D после экспорта в Blender.

Так что это скорее демонстрация мощи Хуньяня, чем самого 3daistudio.

И рекламировать себя за счет интеграции API чужих моделей - ну такое..

https://www.3daistudio.com/

@cgevent
Qwen Code v0.2.1

Обновлен инструмент для кодинга адаптированный с Gemini CLI

На бесплатном тарифе 1000 вызовов API в день

- Веб‑поиск: бесплатно 2 000 запросов в день для пользователей Qwen OAuth (поддержка нескольких провайдеров)
- Редактирование кода: улучшено нечёткое сопоставление — меньше ошибок и токенов
- Настройки ИИ: регулировка температуры, top_p и максимального числа токенов
- Интеграция с IDE: расширена поддержка Zed IDE (инструменты управления задачами)
- Вывод данных: ответы в простом тексте (вместо JSON)
- Поиск: улучшена фильтрация файлов (с учётом `.gitignore`), инструменты поиска
- Производительность: оптимизирована обработка Unicode, лимиты вывода, ускорено сопоставление
- Исправления: устранены проблемы с лимитами токенов, улучшена поддержка macOS и Windows

Гитхаб

#coding #assistant
👍51