Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

Редактирование 3D без масок и обучения

— использует FlowEdit и TRELLIS для локального редактирования

— сохраняет структурную точность благодаря стратегиям слияния регионов

Код ждем

#3d #3dedtiting
👍4
недостаток багов

#humor
😁282
Forwarded from Data Secrets
OpenAI немного переборщили с маркетингом и опозорились на весь Твиттер

Помните, мы рассказывали, что GPT-5 "решила" открытую задачу по математике из списка Эрдёша? Кратко освежаем память: решить-то модель задачу решила, вот только решение было не ее. Она откопала его в литературе 20-летней давности. То есть задача уже была кем-то решена кучу лет назад, просто люди об этом забыли и пометили ее как "нерешенную".

Ну так вот. У истории появилось продолжение, и при этом не совсем приятное. Ровно таким же образом GPT-5 "решила" еще 10 задачек из того же списка AKA нашла их решение в забытой литературе. И вроде бы все норм: моделька молодец, умеет качественно серчить материал, честно сообщает об источниках и все такое.

Вот только сотрудники OpenAI почему-то решили запостить это вот с такими словами: "GPT-5 нашла решения еще 10 открытых задач по математике".

И да, с одной стороны, где-то там они сослались на прошлые твиты, в которых прямо говорили, что решения были найдены именно в литературе, а не выдуманы моделью. С другой стороны, если читатель не знаком с предысторией (что очень вероятно), то для него это однозначно звучит как "ИИ открыл новую математику".

Невольно появляется ощущение, что OpenAI на то и рассчитывали, и выбрали такую формулировку специально, чтобы похайпиться. Но Твиттер подобного не прощает, и в итоге вместо хайпа они заслужили только волну насмешек и обвинений. Даже нобелевский лауреат из Google Демис Хассабис прокомментировал ситуацию как "Это позор".

В итоге твит с неудачной формулировкой был удален, а авторы оправдались тем, что ничего такого в виду не имели. Верим 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
😁10👍9🌚3
This media is not supported in your browser
VIEW IN TELEGRAM
эмм... сегодня будет браузер от Open AI?

#news
😐11🤔3👎2🤯1😭1
Нейронавт | Нейросети в творчестве
эмм... сегодня будет браузер от Open AI? #news
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT Atlas

В общем, если вы еще не в курсе, Open AI родили ИИ-браузер

Основные фичи:

1. Встроенный ChatGPT на любой веб-странице.

2. Память — интеллектуальный поиск по истории. Ее можно включать/отключать и вообще решать какие сайты ChatGPT может просматривать а какие нет.

3. Агент, только для тарифов Pro и Plus.

Тесты уже показали, что навороченные сайты с кучей скриптов могут поставить Atlas в тупик, но со статичными страницами справляется

Доступен для #MacOS кроме intel - скачать через 3 буквы. Но после установки должен работать для всех стран

Windows, iOS, Android - ждем

#browser
😁2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Realtime 14B

Потоковый видеогенератор от Krea на базе WAN 2.1 14B с Self-Forcing
Позволяет редактировать видео промптом на лету

Тут конечно сферический рилтайм в ваккуме ибо это 11 фпс на NVIDIA B200

HF
Гитхаб
Попробовать

Спасибо @EvgenyiPerm

#realtime #text2video
🔥6👍2🥴2
Media is too big
VIEW IN TELEGRAM
Qwen Deep Research

Обновился.

Теперь создает не только отчет, но и веб-страницу в режиме реального времени и подкаст - на базе Qwen3-Coder, Qwen-Image и Qwen3-TTS

#deepresearch #assistant
7👍4🤯1
HunyuanWorld-Mirror

В полку генераторов-реконструкторов объемных сцен от Hunyuan-Tencent прибыло.
Говорю так потому что его определили в одно семейство с генераторами 3D миров

Воссоздает 3D сцены по видео, в том числе сгенерированным, мультиракурсным наборам изображений, и по одному изображению

За один проход создает сразу облако точек, многовидовые карты глубины, параметры камеры, нормали поверхности, сцену на гауссианах.

Код
Демо - очень шустрое. Сделал тест по одной картинке. Лучше все-таки иметь несколько ракурсов
HF ~5 ГБ

#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
🔥5👎1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Ищем AI/CGI/VFX креаторов или команду для создания реалистичных роликов (реальная съемка + ИИ / 3D элементы)

Оплата: 50-200.000 рублей в месяц (зависит от объема роликов)

Есть оплачиваемое тестовое задание

Требования:
Опыт создания аналогичных реалистичных проектов

Что имеем в виду под реалистичностью?

Не подходит: Полностью сгенерированные все предметы и части ролика, не имеющие отношения к реальным объектам

Подходит: реально отснятые люди (или их реалистичные генеративные копии), реально отснятые предметы (или их генеративные/3D копии) с ИИ-элементами

Пример: реальная девушка (отснятая в студии) взаимодействует с сгенерированным/смоделированным роботом, действие реалистично, ее внешность сохраняется

Прайс и примеры только реалистичных работ присылайте сюда: @dariatareva

P.S. Пожалуйста, не отправляйте ВСЁ портфолио, будем рассматривать тех, кто направил релевантные по ТЗ выше ролики

#вакансия
2👍2🥴2🌚2
MoGA: Mixture-of-Groups Attention for End-to-End Long Video Generation

Это еще один способ генерации длинных видео от ByteDance

Создает многоплановое монтажное видео в формате 480p, 24 фпс, хронометраж до минуты, с контекстом 580К токенов

Интегрируется с современными механизмами внимания, например, FlashAttention, и поддерживает распараллеливание

Умеет в генерацию видео с несколькими сюжетными отрезками и может управлять сценами с помощью текстовых описаний на уровне каждого отрезка

Согласованность персонажей и фона, бла-бла-бла

В качестве базовой модели используются Wan2.1 (1.3B и 14B) и MMDiT.

Код / веса ждем

#text2video #image2video
👍122
Qwen3-VL-2B и Qwen3-VL-32B

Qwen забрасывает нас обновками.

Qwen3-VL-32B превосходит GPT-5 mini и Claude 4 Sonnet по производительности в STEM, VQA, распознавании текста, понимании видео, задачах агентов и многом другом.

Всего в 32B параметров, на уровне моделей с 235B (даже превосходя их в OSWorld!)

Доступны версии FP8
Доступны варианты Instruct и Thinking

Чат
HF
API

#vlm
🔥141👍1