Media is too big
VIEW IN TELEGRAM
NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks
Редактирование 3D без масок и обучения
— использует FlowEdit и TRELLIS для локального редактирования
— сохраняет структурную точность благодаря стратегиям слияния регионов
Код ждем
#3d #3dedtiting
Редактирование 3D без масок и обучения
— использует FlowEdit и TRELLIS для локального редактирования
— сохраняет структурную точность благодаря стратегиям слияния регионов
Код ждем
#3d #3dedtiting
👍4
Forwarded from Data Secrets
OpenAI немного переборщили с маркетингом и опозорились на весь Твиттер
Помните, мы рассказывали, что GPT-5 "решила" открытую задачу по математике из списка Эрдёша? Кратко освежаем память: решить-то модель задачу решила, вот только решение было не ее. Она откопала его в литературе 20-летней давности. То есть задача уже была кем-то решена кучу лет назад, просто люди об этом забыли и пометили ее как "нерешенную".
Ну так вот. У истории появилось продолжение, и при этом не совсем приятное. Ровно таким же образом GPT-5 "решила" еще 10 задачек из того же списка AKA нашла их решение в забытой литературе. И вроде бы все норм: моделька молодец, умеет качественно серчить материал, честно сообщает об источниках и все такое.
Вот только сотрудники OpenAI почему-то решили запостить это вот с такими словами: "GPT-5 нашла решения еще 10 открытых задач по математике".
И да, с одной стороны, где-то там они сослались на прошлые твиты, в которых прямо говорили, что решения были найдены именно в литературе, а не выдуманы моделью. С другой стороны, если читатель не знаком с предысторией (что очень вероятно), то для него это однозначно звучит как "ИИ открыл новую математику".
Невольно появляется ощущение, что OpenAI на то и рассчитывали, и выбрали такую формулировку специально, чтобы похайпиться. Но Твиттер подобного не прощает, и в итоге вместо хайпа они заслужили только волну насмешек и обвинений. Даже нобелевский лауреат из Google Демис Хассабис прокомментировал ситуацию как "Это позор".
В итоге твит с неудачной формулировкой был удален, а авторы оправдались тем, что ничего такого в виду не имели. Верим🤖
Помните, мы рассказывали, что GPT-5 "решила" открытую задачу по математике из списка Эрдёша? Кратко освежаем память: решить-то модель задачу решила, вот только решение было не ее. Она откопала его в литературе 20-летней давности. То есть задача уже была кем-то решена кучу лет назад, просто люди об этом забыли и пометили ее как "нерешенную".
Ну так вот. У истории появилось продолжение, и при этом не совсем приятное. Ровно таким же образом GPT-5 "решила" еще 10 задачек из того же списка AKA нашла их решение в забытой литературе. И вроде бы все норм: моделька молодец, умеет качественно серчить материал, честно сообщает об источниках и все такое.
Вот только сотрудники OpenAI почему-то решили запостить это вот с такими словами: "GPT-5 нашла решения еще 10 открытых задач по математике".
И да, с одной стороны, где-то там они сослались на прошлые твиты, в которых прямо говорили, что решения были найдены именно в литературе, а не выдуманы моделью. С другой стороны, если читатель не знаком с предысторией (что очень вероятно), то для него это однозначно звучит как "ИИ открыл новую математику".
Невольно появляется ощущение, что OpenAI на то и рассчитывали, и выбрали такую формулировку специально, чтобы похайпиться. Но Твиттер подобного не прощает, и в итоге вместо хайпа они заслужили только волну насмешек и обвинений. Даже нобелевский лауреат из Google Демис Хассабис прокомментировал ситуацию как "Это позор".
В итоге твит с неудачной формулировкой был удален, а авторы оправдались тем, что ничего такого в виду не имели. Верим
Please open Telegram to view this post
VIEW IN TELEGRAM
😁10👍9🌚3
Нейронавт | Нейросети в творчестве
эмм... сегодня будет браузер от Open AI? #news
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT Atlas
В общем, если вы еще не в курсе, Open AI родили ИИ-браузер
Основные фичи:
1. Встроенный ChatGPT на любой веб-странице.
2. Память — интеллектуальный поиск по истории. Ее можно включать/отключать и вообще решать какие сайты ChatGPT может просматривать а какие нет.
3. Агент, только для тарифов Pro и Plus.
Тесты уже показали, что навороченные сайты с кучей скриптов могут поставить Atlas в тупик, но со статичными страницами справляется
Доступен для #MacOS кроме intel - скачать через 3 буквы. Но после установки должен работать для всех стран
Windows, iOS, Android - ждем
#browser
В общем, если вы еще не в курсе, Open AI родили ИИ-браузер
Основные фичи:
1. Встроенный ChatGPT на любой веб-странице.
2. Память — интеллектуальный поиск по истории. Ее можно включать/отключать и вообще решать какие сайты ChatGPT может просматривать а какие нет.
3. Агент, только для тарифов Pro и Plus.
Тесты уже показали, что навороченные сайты с кучей скриптов могут поставить Atlas в тупик, но со статичными страницами справляется
Доступен для #MacOS кроме intel - скачать через 3 буквы. Но после установки должен работать для всех стран
Windows, iOS, Android - ждем
#browser
😁2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Realtime 14B
Потоковый видеогенератор от Krea на базе WAN 2.1 14B с Self-Forcing
Позволяет редактировать видео промптом на лету
Тут конечно сферический рилтайм в ваккуме ибо это 11 фпс на NVIDIA B200
HF
Гитхаб
Попробовать
Спасибо @EvgenyiPerm
#realtime #text2video
Потоковый видеогенератор от Krea на базе WAN 2.1 14B с Self-Forcing
Позволяет редактировать видео промптом на лету
Тут конечно сферический рилтайм в ваккуме ибо это 11 фпс на NVIDIA B200
HF
Гитхаб
Попробовать
Спасибо @EvgenyiPerm
#realtime #text2video
🔥6👍2🥴2
Media is too big
VIEW IN TELEGRAM
Qwen Deep Research
Обновился.
Теперь создает не только отчет, но и веб-страницу в режиме реального времени и подкаст - на базе Qwen3-Coder, Qwen-Image и Qwen3-TTS
#deepresearch #assistant
Обновился.
Теперь создает не только отчет, но и веб-страницу в режиме реального времени и подкаст - на базе Qwen3-Coder, Qwen-Image и Qwen3-TTS
#deepresearch #assistant
❤7👍4🤯1
HunyuanWorld-Mirror
В полку генераторов-реконструкторов объемных сцен от Hunyuan-Tencent прибыло.
Говорю так потому что его определили в одно семейство с генераторами 3D миров
Воссоздает 3D сцены по видео, в том числе сгенерированным, мультиракурсным наборам изображений, и по одному изображению
За один проход создает сразу облако точек, многовидовые карты глубины, параметры камеры, нормали поверхности, сцену на гауссианах.
Код
Демо - очень шустрое. Сделал тест по одной картинке. Лучше все-таки иметь несколько ракурсов
HF ~5 ГБ
#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
В полку генераторов-реконструкторов объемных сцен от Hunyuan-Tencent прибыло.
Говорю так потому что его определили в одно семейство с генераторами 3D миров
Воссоздает 3D сцены по видео, в том числе сгенерированным, мультиракурсным наборам изображений, и по одному изображению
За один проход создает сразу облако точек, многовидовые карты глубины, параметры камеры, нормали поверхности, сцену на гауссианах.
Код
Демо - очень шустрое. Сделал тест по одной картинке. Лучше все-таки иметь несколько ракурсов
HF ~5 ГБ
#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
🔥5👎1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Ищем AI/CGI/VFX креаторов или команду для создания реалистичных роликов (реальная съемка + ИИ / 3D элементы)
Оплата: 50-200.000 рублей в месяц (зависит от объема роликов)
Есть оплачиваемое тестовое задание
Требования:
Опыт создания аналогичных реалистичных проектов
Что имеем в виду под реалистичностью?
❌ Не подходит: Полностью сгенерированные все предметы и части ролика, не имеющие отношения к реальным объектам
✅ Подходит: реально отснятые люди (или их реалистичные генеративные копии), реально отснятые предметы (или их генеративные/3D копии) с ИИ-элементами
Пример: реальная девушка (отснятая в студии) взаимодействует с сгенерированным/смоделированным роботом, действие реалистично, ее внешность сохраняется
Прайс и примеры только реалистичных работ присылайте сюда: @dariatareva
P.S. Пожалуйста, не отправляйте ВСЁ портфолио, будем рассматривать тех, кто направил релевантные по ТЗ выше ролики
#вакансия
Оплата: 50-200.000 рублей в месяц (зависит от объема роликов)
Есть оплачиваемое тестовое задание
Требования:
Опыт создания аналогичных реалистичных проектов
Что имеем в виду под реалистичностью?
❌ Не подходит: Полностью сгенерированные все предметы и части ролика, не имеющие отношения к реальным объектам
✅ Подходит: реально отснятые люди (или их реалистичные генеративные копии), реально отснятые предметы (или их генеративные/3D копии) с ИИ-элементами
Пример: реальная девушка (отснятая в студии) взаимодействует с сгенерированным/смоделированным роботом, действие реалистично, ее внешность сохраняется
Прайс и примеры только реалистичных работ присылайте сюда: @dariatareva
P.S. Пожалуйста, не отправляйте ВСЁ портфолио, будем рассматривать тех, кто направил релевантные по ТЗ выше ролики
#вакансия
❤2👍2🥴2🌚2
MoGA: Mixture-of-Groups Attention for End-to-End Long Video Generation
Это еще один способ генерации длинных видео от ByteDance
Создает многоплановое монтажное видео в формате 480p, 24 фпс, хронометраж до минуты, с контекстом 580К токенов
Интегрируется с современными механизмами внимания, например, FlashAttention, и поддерживает распараллеливание
Умеет в генерацию видео с несколькими сюжетными отрезками и может управлять сценами с помощью текстовых описаний на уровне каждого отрезка
Согласованность персонажей и фона, бла-бла-бла
В качестве базовой модели используются Wan2.1 (1.3B и 14B) и MMDiT.
Код / веса ждем
#text2video #image2video
Это еще один способ генерации длинных видео от ByteDance
Создает многоплановое монтажное видео в формате 480p, 24 фпс, хронометраж до минуты, с контекстом 580К токенов
Интегрируется с современными механизмами внимания, например, FlashAttention, и поддерживает распараллеливание
Умеет в генерацию видео с несколькими сюжетными отрезками и может управлять сценами с помощью текстовых описаний на уровне каждого отрезка
Согласованность персонажей и фона, бла-бла-бла
В качестве базовой модели используются Wan2.1 (1.3B и 14B) и MMDiT.
Код / веса ждем
#text2video #image2video
👍12❤2
Qwen3-VL-2B и Qwen3-VL-32B
Qwen забрасывает нас обновками.
Qwen3-VL-32B превосходит GPT-5 mini и Claude 4 Sonnet по производительности в STEM, VQA, распознавании текста, понимании видео, задачах агентов и многом другом.
Всего в 32B параметров, на уровне моделей с 235B (даже превосходя их в OSWorld!)
Доступны версии FP8
Доступны варианты Instruct и Thinking
Чат
HF
API
#vlm
Qwen забрасывает нас обновками.
Qwen3-VL-32B превосходит GPT-5 mini и Claude 4 Sonnet по производительности в STEM, VQA, распознавании текста, понимании видео, задачах агентов и многом другом.
Всего в 32B параметров, на уровне моделей с 235B (даже превосходя их в OSWorld!)
Доступны версии FP8
Доступны варианты Instruct и Thinking
Чат
HF
API
#vlm
🔥14❤1👍1