NEW BOT Телеграм, страница

Stable Audio Open Small

Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM

До 11 секунд 44.1kHz стерео по тексту локально на мобилках

Веса
Гитхаб

#news #mobile #text2audio

🤔2👍1👏1

1.65K views11:34

Нейронавт | Нейросети в творчестве

0:41

Media is too big

VIEW IN TELEGRAM

MoviiGen 1.1

Файнтюн Wan 2.1 с заявкой на кинокачество, видео по тексту.

720P и 1080P

Должно работать с любым родным Wan 2.1 t2v вокрфлоу

есть GGUF

#text2video

👍18👏3🔥2❤1

1.72K views12:16

Нейронавт | Нейросети в творчестве

Hunyuan Image 2.0

Tencent выкатил генератор картинок 2.0
Генерит мгновенно!
Высокая реалистичность.
Dual-Canvas Studio - редактор с холстом позволяет смешивать слои.

Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда-то ткнул, сделал котика. Первая картинка с котиком - моя, просто по запросу Cat, непонятно новой моделью или старой.

Вообще выглядит впечатляюще

#text2image #realtime #imageediting

👍10❤7

2.07K views12:40

Нейронавт | Нейросети в творчестве

Короче, надо ткнуть в 1, потом в 2, потом нажать кнопку 3, появится всплывающее окошко и надо успеть ткнуть в нем на кнопку, она почему-то сразу исчезает, тогда появится сообщение что мол ждите приглашение на почту

А мой кот был из старой версии, получается

🔥6😁2👍1👌1

1.54K views12:45

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

так видимо выглядит работа с холстом

🔥11👍2

1.5K views12:47

Нейронавт | Нейросети в творчестве

BLIP3-o

Мультимодальная модель от Salesforce. Сочетает в себе авторегрессионную силу рассуждений и инструкций с генеративной силой диффузионных моделей. Есть 4B и 8B параметров

Понимает картинки и умеет отвечать на вопросы как минимум

Демо
Код
Веса

#multimodal #image2text #instruct

🔥7❤1

1.64K views13:16

Нейронавт | Нейросети в творчестве

2:29

This media is not supported in your browser

VIEW IN TELEGRAM

LightLab: Controlling Light Sources in Images with Diffusion Models

Гугл в соавторстве создали модель для управления видимыми источниками света на изображениях. Увы кода нет. На сайте проекта можно интерактивно потыкать картинки

#relighting

👍11❤1🔥1

1.59K views13:47

Нейронавт | Нейросети в творчестве

0:16

This media is not supported in your browser

VIEW IN TELEGRAM

Marigold: Generative Computer Vision

Опа, Marigold прокачался
Там теперь не только глубина а целая пачка пассов: нормали, альбедо, какой-то intrinsic. RollingDepth на нем сделан.

Есть в Diffusers, гайд

Код
Демо глубина
Демо нормали
Демо интринсик

#image2depth #image2normal #image2albedo

🔥11❤2👍1

1.92K views14:47

Нейронавт | Нейросети в творчестве

Не угадали! Codex норм название

#coding #vibecoding #assistant

Нейронавт | Нейросети в творчестве

Альтман опять что-то спойлерит, неизвестно что.
Делаем ставки

👍 - придумают нормальное название продукта
👎 - как всегда, будет бессмысленное цифро-буквенное обозначение

#news

👍1

1.56K viewsedited 16:21

Нейронавт | Нейросети в творчестве

Forwarded from Сиолошная

https://openai.com/index/introducing-codex/

— Codex — AI-агент-программист у вас в браузере
— может работать над несколькими задачами
— под капотом модель Codex-1 , основанная на o3
— можно подключать свой GitHub аккаунт, чтобы давать доступ агенту
— Plus юзеры пока не получат доступ, выкатят скоро.
— For developers building with codex-mini-latest (МИНИ), the model is available on the Responses API and priced at $1.50 per 1M input tokens and $6 per 1M output tokens, with a 75% prompt caching discount. Модель основана на o4-mini и заточена под работу в Codex CLI
— иногда (не ясно, как часто) модель при внесении исправлений добавляет тесты, которыми проверяет новую или исправленную функциональность, и итерируется до тех пор, пока тест не пройдет

YouTube

A research preview of Codex in ChatGPT

Greg Brockman, Jerry Tworek, Joshua Ma, Hanson Wang, Thibault Sottiaux, Katy Shi, and Andrey Mishchenko introduce and demo Codex in ChatGPT.

👍3❤1

1.22K views16:21

Нейронавт | Нейросети в творчестве

Залил для вас вчерашний стрим Hunyian Image 2.0 на ютуб, включайте в Яндекс браузере дубляж и смотрите часовое видео если хотите все подробности

Если хотите коротко, то держите подкаст на чистом русском из NotebookLM. Вот оказывается для чего он нужен

Нейронавт | Нейросети в творчестве

👍10

1.94K viewsedited 08:51

Нейронавт | Нейросети в творчестве

Tencent Hunyuan Image 2_0 Release.wav

17.6 MB

1.79K views08:51

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Comfyui-FlowChain

Позволяет заворачивать группы нод и целые форкфлоу в одну ноду

#ComfyUI #tools

🔥10❤1🤯1

1.76K views09:05

Нейронавт | Нейросети в творчестве

Ollama

Платформа запуска языковых моделей Ollama представила новый движок с полной поддержкой мультимодальных ИИ-моделей, которые могут работать как с текстом, так и с изображениями.

Что нового:
• Каждая модель теперь полностью автономна - это упрощает обновления и интеграцию
• Улучшена точность визуального анализа благодаря передаче метаданных и поддержке больших изображений
• Оптимизирована работа с памятью: кэшируются изображения, улучшен KV-кэш, модели работают быстрее и стабильнее

Скачать Ollama

#multimodal #VLM #news

👍7❤2🤯1

1.73K views09:48

About

Blog

Apps

Platform