Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.42K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Claude Opus 4.5

На SWE-bench 80.9%, лучше Gemini-3-Pro.
По API немного дешевле прошлой версии и сильно экономнее по количеству токенов в ризонинге

Claude Code доступен в десктопном приложении.

#assistant #reasoning #coding
👍6
Loomis Painter: Reconstructing the painting process

Лора для реконструкции процесса рисования картины на базе WAN 2.1

На вход даем картину, на выходе - видео.

Работает в разных техниках - акрил, масло, карандаш

Был похожий проект Paints-Undo от lllyasviel

Гитхаб
HF

#image2video #wan
7👍5🥴4
Почему японский дизайн такой странный? Как любое медиа рано или поздно превращается в телевидение? Можно ли отличить сгенерированные фотки (и котиков 😐 ) от настоящих?

На эти и другие вопросы о влиянии технологий ищите ответы на канале «Живем в обществе».

Подписывайтесь!

#промо
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍2
GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization

Агент от Tencent по фото определяет координаты где оно снято

Объединяет визуальное рассуждение и веб-поиск для уточнения гипотез.

Увеличивает масштаб изображений чтобы детально рассматривать интересующие области.

Гитхаб
HF ~34 ГБ

#image2geolocation #map #location #geolocation
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe Photoshop Web на год бесплатно

Раздача годовой подписки на Photoshop Web - на странице расширения Adobe Photoshop для Гугл Хром.

Заходим на страницу расширения притворившись нероссиянином. У меня сработало через Польшу
Устанавливаем расширение и жмем кнопку с подпиской.
Нужна будет авторизация - пользуемся нероссийским аккаунтом.
Нейросетки должны работать в нем.

#giveaway #imageediting
👍76
This media is not supported in your browser
VIEW IN TELEGRAM
Dia2

Потоковый рилтаймовый генератор речи от Nari-labs, новая версия
Про первую версию тут

Всего 1B и 2B параметров.

Создает аудио до 2 минут на английском, ну этого должно хватать для диалогов. А для чего еще потоковая речь? Что с другими языками непонятно.

проект вдохновлён KyutaiTTS и Sesame

Гитхаб
HF
Демо

#tts #voicecloning #realtime #text2speech
👍61
FLUX.2: Frontier Visual Intelligence

Слухи оказались правдивы, новую версию генератора картинок Flux 2 выпустили.
Внутри Mistral-3 VLM 24B

— сохраняет характер и стиль при работе с несколькими референсными изображениями;

— следует сложным структурированным подсказкам;

— читает и пишет сложный текст;

— соблюдает брендбуки;

— грамотно работает с освещением, макетами и логотипами;

— редактирует изображения размером до 4 мегапикселей, сохраняя детали и целостность изображения;

— поддерживает работу с до 10 референсными изображениями одновременно;

— создаёт детальные фотореалистичные изображения и инфографику со сложной типографикой;

— надёжно обрабатывает сложную типографику, включая создание инфографики, мемов и макетов пользовательских интерфейсов с читаемым мелким текстом.

В релиз вошли следующие модели семейства FLUX.2:

FLUX.2 [pro]: модель с высоким качеством генерации изображений, быстрой работой и относительно низкими затратами.

FLUX.2 [flex]: модель, которая позволяет настраивать параметры (количество шагов, шкала руководства) и хорошо рендерит текст и мелкие детали.

FLUX.2 [dev]: открытая модель с 32 миллиардами параметров, поддерживает синтез текста в изображение и редактирование изображений с несколькими входными изображениями.

FLUX.2 [klein]: предстоящий релиз — открытая модель, более мощная и удобная для разработчиков по сравнению с аналогами того же размера. Вписаться в бету

FLUX.2 - VAE: вариационный автоэнкодер для латентных представлений, обеспечивает баланс между обучаемостью, качеством и степенью сжатия.

BFL Playground
BFL API
HF
Демо

#text2image #referencing #image2image #imageediting #vlm
🔥183
Ну неплохо

Но с направлениями беда. Надо справа налево.
И как прочие модели не любит изображать людей на заднем плане с лица, предпочитает рисовать спины.

photo of fantasy Fish straight-walking from right to the left in a human city as undercover agent, wearing a survival landsuit with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguise, masterpiece, wide view, distant view
👍4🤷‍♂2🔥1