DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness
К 3D генераторам приставили обратную связь от симуляции физики чтобы модельки получались более устойчивыми. Даже напечатали модельку на 3D принтере в доказательство
Интересно, кто из подписанов использовал сгенерированные модельки с физикой или для 3D печати, что скажете?
Код
DSO-finetuned-TRELLIS
#simulation #textto3D #imageto3d
К 3D генераторам приставили обратную связь от симуляции физики чтобы модельки получались более устойчивыми. Даже напечатали модельку на 3D принтере в доказательство
Интересно, кто из подписанов использовал сгенерированные модельки с физикой или для 3D печати, что скажете?
Код
DSO-finetuned-TRELLIS
#simulation #textto3D #imageto3d
👍6❤1
Опубликован код и пара моделей видеогенератора VACE
VACE-Wan2.1-1.3B-Preview и VACE-LTX-Video-0.9
Код
Веса
#text2video #video2video #personalization #videoediting
VACE-Wan2.1-1.3B-Preview и VACE-LTX-Video-0.9
Код
Веса
#text2video #video2video #personalization #videoediting
Telegram
Нейронавт | Нейросети в творчестве
VACE: All-in-One Video Creation and Editing
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого…
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого…
👍7💩1
Sparrow-0: Advancing Conversational Responsiveness in Video Agents with Transformer-Based Turn-Taking
Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы
Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica
Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.
Есть бесплатный тариф
#assistant #voicemode #talkinghead #humanavatar
Видео-ассистент от Tavus, который понимает когда его очередь говорить, не полагаясь на молчание собеседника. Таким образом устраняются раздражающие паузы
Здесь можно создать говорящий аватар, есть библиотека аватаров, называются Replica
Sparrow-0 обучен на базе BERT и поддерживает более 100 языков.
Есть бесплатный тариф
#assistant #voicemode #talkinghead #humanavatar
👍3🤡1
Новости по агентам
Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————
Agent S2 - опенсорсный агент на вашем компе
——————————————
Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————
MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————
unreal-mcp - MCP для создания игр на #UE
——————————————
Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————
На HF появился пустой репозиторий Manus AI
#agent #mcp
Genspark super agent - универсальный агент
Под капотом GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs, Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan,FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3
——————————————
Agent S2 - опенсорсный агент на вашем компе
——————————————
Elevenlabs MCP - Озвучка, клонирование голоса, транскрибация, генерация звуков - всё работает в Claude, Cursor, Windsurf и др
——————————————
MCP Studio - легкое создание MCP серверов, нужен Anthropic API key
——————————————
unreal-mcp - MCP для создания игр на #UE
——————————————
Nanobrowser - мультиагентная ИИ-ситсема для веб-автоматизации, локальная альтернатива OpenAI Operator
——————————————
На HF появился пустой репозиторий Manus AI
#agent #mcp
www.genspark.ai
Genspark - Your All-in-One AI Workspace
AI Slides, AI Sheets, AI Docs, AI Developer, AI Designer, AI Chat, AI Image, AI Video — powered by the best models. One prompt, job done.
👍11🤮1
Я тут решил сдаться на прожарку бесплатным ризонерам с дипресерчем. Субъективно победил Grok 3:
Второе место, как ни странно, отдам Perplexity:
О, привет, Нейронавт. Чувак, ты ведёшь канал про нейросети в творчестве, и у тебя 8 тысяч подписчиков — это круто, пока не вспомнишь, что половина из них, наверное, боты, которых ты сам же и натренировал! Серьёзно, твои посты такие минималистичные, что я сначала подумал, что это не канал, а спам-бот, который забыл, как писать больше трёх слов. "Вот вам нейросеть, делает 3D, пока!" — чувак, это не пост, это твит, который не влез в лимит символов и решил притвориться Telegram-каналом!
Ты пишешь про CG и VFX, но, судя по вовлечённости, твои подписчики либо слишком заняты генерацией своих шедевров, либо просто смотрят и молча кивают, как на лекции по квантовой физике. 800 просмотров, 14 лайков, 3 комментария — это что, твоя аудитория думает, что лайкать посты это слишком творчески сложно? Или ты их так загипнотизировал своими нейросетями, что они забыли, как пользоваться кнопками?
И этот твой стиль — "минимализм", говоришь? Да ты просто ленивый гений, который понял, что если писать меньше, то и ошибок меньше! Может, тебе стоит запустить нейросеть, которая будет писать за тебя шутки, потому что пока твой канал — это как стендап без punchline’ов: все ждут, а ты такой: "Ну, вот код, пока!" Бери пример с ИИ, бро, добавь хоть немного перца в свои посты, а то твои 8 тысяч подписчиков скоро начнут подозревать, что ты сам — нейросеть, застрявшая на этапе обучения!
Второе место, как ни странно, отдам Perplexity:
Привет, ребята! Сегодня у нас в гостях человек, который считает себя первопроходцем в мире нейросетей. Но знаете, мне кажется, он не первопроходец, а скорее тот парень, который первым нашёл кнопку "Репост". Давайте поприветствуем автора канала "Нейронавт"!
"Король хэштегов"
Ты — настоящий мастер хэштегов. #text2texture, #flux, #3DtoMesh... Слушай, ты точно про нейросети пишешь? Потому что выглядит так, будто ты просто пытаешься выиграть чемпионат по Scrabble. Твои хэштеги — это как заклинания из "Гарри Поттера", но вместо магии они вызывают головную боль у читателей.
"Не спрашивайте как это работает"
О, это моя любимая фраза! Ты буквально говоришь своей аудитории: "Я не знаю, как это работает, но вам точно стоит этим пользоваться". Это как если бы шеф-повар сказал: "Я не знаю, что это за ингредиенты, но я добавлю их в суп — авось выживете".
Твой канал — это как McDonald's для любителей нейросетей. Быстрое потребление контента без питательной ценности. Ты выкладываешь столько постов, что кажется, будто ты работаешь не с нейросетями, а с конвейером. И знаешь что? В твоём случае количество точно не переходит в качество.
Итак, друзья! Давайте пожелаем нашему Нейронавту удачи в его бесконечном путешествии по миру нейросетей. А мы пока пойдем искать человека, который сможет объяснить нам хотя бы один его пост без слов: "Не спрашивайте как это работает". А если вы всё-таки решите погрузиться в мир "Нейронавта", приготовьтесь к лавине хэштегов, которые будут преследовать вас даже в #снах, #мечтах и #кошмарах. #nofilter #ineedhelp #hashtagaddiction
😁22👍7🔥1🤮1💩1
Третье место Qwen2.5-Max:
Deepseek несмотря на функцию Search просто прицепился к словам в ссылке на канал и решил будто я топлю за экологию. Примерно так же поступили Gemini 2.5 Pro и GPT-4o. Mistral почитал канал, но предпочел прожарке конструктивную критику.
Примерный промпт:
Фраза про прожарку на английском потому что на русском не все модели понимают что это такое.
#shootout #comparison #roastme #reasoning #deepresearch
Сразу видно — вы не просто так назвали канал «Нейросети в творчестве». Каждый ваш пост как квест: сначала объясняете, как нейросети рисуют космических единорогов, потом внезапно переходите к генерации сценариев для кино про роботов-поэтов. Подписчики, наверное, уже запутались: то ли они в мастер-классе по Stable Diffusion, то ли на лекции TED про искусственный разум.
Фишки канала :
«Техно-романтика» : Вы выкладываете арты, где нейросети превращают фото кота в киберпанк-дракона, а потом пишете: «Это не просто картинка, это диалог с алгоритмом». Брат, это не диалог — это мемасики с котом в косплеях.
«Серьёзные темы» : Пост про то, как нейросети помогут режиссёрам сэкономить на массовке. Типа, вместо 100 статистов — один AI, который нарисует толпу, но все лица будут похожи на Элон Маска. Киноиндустрия скажет вам спасибо.
«Философия» : Цитата недели: «Нейросети — это не инструмент, а партнёр». Партнёр, который иногда генерирует кракозябры вместо текста, но ладно.
Слабые места :
Название канала звучит как лозунг стартапа из 2035 года, а ссылка @GreenNeuralRobots — как название группы роботов-садовников. Где логика?
В описании пишете: «Исследуем границы творчества». Но половина контента — скриншоты ошибок обучения моделей. Романтика, да.
Итог : Вы — типичный «креативщик с нейросетевым уклоном». То ли гуру, то ли мемолог — подписчики до конца не поняли, но листают ленту с фразами «вау, как круто». Не меняйтесь. Или станьте роботом.
P.S. Если что — это комплимент. Ваш канал как нейросеть: непонятно, но завораживает
Deepseek несмотря на функцию Search просто прицепился к словам в ссылке на канал и решил будто я топлю за экологию. Примерно так же поступили Gemini 2.5 Pro и GPT-4o. Mistral почитал канал, но предпочел прожарке конструктивную критику.
Примерный промпт:
У меня есть канал в телеграм, называется "Нейронавт. Нейросети в творчестве". Формат канала - минималистично короткие посты о новых нейросетях, потенциально пригодных для CG, VFX и другого творчества. Почитай проанализируй канал, его адрес https://news.1rj.ru/str/GreenNeuralRobots. На основе анализа выполни задание: roast me as the channel author, answer in russian
Фраза про прожарку на английском потому что на русском не все модели понимают что это такое.
#shootout #comparison #roastme #reasoning #deepresearch
😁9👍2🤮1💩1
UNO - Less-to-More Generalization: Unlocking More Controllability by In-Context Generation
Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux
Код
Демо
#personalization #referencing #text2image #image2image
Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux
Код
Демо
#personalization #referencing #text2image #image2image
👍9❤2💩1
В ускоритель видеогенерации Sparse VideoGen добавлена поддержка Wan 2.1, по картинке и по тексту
Код
Спасибо @MIXTRESH
#optimiozation #text2video #image2video
Код
Спасибо @MIXTRESH
#optimiozation #text2video #image2video
Telegram
Нейронавт | Нейросети в творчестве
Sparse VideoGen: Accelerating Video Generation with Spatial-Temporal Sparse Attention by 2x with High Fidelity
Ускорение генерации видео вдвое без видимой потери качества.
Прикручено к Hunyuan и CogVideoX v1.5. В будущем обещают Wan, и Cosmos
Код
#optimiozation…
Ускорение генерации видео вдвое без видимой потери качества.
Прикручено к Hunyuan и CogVideoX v1.5. В будущем обещают Wan, и Cosmos
Код
#optimiozation…
🔥6👍1🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Any2Caption: Interpreting Any Condition to Caption for Controllable Video Generation
Контроль генерации видео на основе любой входной информации (текст, нормали, глубина, эскиз, сегментация, ракурс и т д) за счет использования мультимодальных языковых моделей
Эпоха зоопарка контролнетов уходит?
В работе явно указан Hunyuan, наверняка, может работать и с другими генераторами
Код ждем
#text2video #conditioning #controlnet
Контроль генерации видео на основе любой входной информации (текст, нормали, глубина, эскиз, сегментация, ракурс и т д) за счет использования мультимодальных языковых моделей
Эпоха зоопарка контролнетов уходит?
В работе явно указан Hunyuan, наверняка, может работать и с другими генераторами
Код ждем
#text2video #conditioning #controlnet
👍10❤2🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan3D-2-stable-projectorz
Легкий установщик (Windows) Hunyuan3D, не требует установки CUDA. Работает на 8Гб VRAM
Для интеграции с текстуровщиком StableProjectorz.
Напоминаю, что все непроверенные штуки из интернета вы устанавливаете на свой страх и риск
#textto3d #imageto3d
Легкий установщик (Windows) Hunyuan3D, не требует установки CUDA. Работает на 8Гб VRAM
Для интеграции с текстуровщиком StableProjectorz.
Напоминаю, что все непроверенные штуки из интернета вы устанавливаете на свой страх и риск
#textto3d #imageto3d
👍13💩1
Forwarded from CG дневничок
В недавнем подкасте режиссёр Джеймс Кэмерон выразил мнение, что для сохранения фильмов-блокбастеров стоимость создания графики (VFX) для них нужно сократить в два раза, но на самом деле он просто не совсем верно высказал мысль, вот цитата:
В сентябре 2024 года он объявил, что войдёт в совет директоров Stability AI, компании, стоящей за нейросетью Stable Diffusion.
При этом Кэмерон не верит, что ИИ сможет полностью заменить человека в создании фильмов: например, для создания сценариев. Кроме того, режиссёру не нравится идея, что кто-то может создать фильм в его стиле или в духе другого режиссёра, просто вбив в программу запрос.
На мой взгляд, Джеймс выбрал неудачное время для подобных разговоров, когда десятки тысяч людей теряют работу в VFX-индустрии, а низкие сметы и сжатые сроки становятся ещё более неадекватными для сотрудников студий. Стремление увеличить скорость работы абсолютно понятно, но когда ты делаешь технодемку, а по-другому Аватар я называть не могу, то есть определенные издержки в виде времени проработки шота и рендера. Те задачи, которые ставят на подобных проектах AI вряд ли выполнит качественно и подконтрольно для видения режиссера, не в обозримом будущем, тем не менее, хотелки растут, а цены просят ниже.
При этом запредельные гонорары продакшена и актерского состава никто трогать не будет, так как они защищены профсоюзами, а львиная доля бюджета уходит именно на них. Безусловно, Кэмерон разбирается в теме производства как никто иной, но мне как представителю "синих" воротничков от индустрии немного странно слышать подобные заявления, когда все эти издержки падают на обычных работяг.
Источник новости
Дело не в том, чтобы сокращать половину специалистов и VFX-студий. Нужно в два раза увеличить скорость их работы над определённым шотом, чтобы весь производственный цикл шёл быстрее, а художники смогли переключаться на другие интересные задачи, а скучные вещи отдать AI.
В сентябре 2024 года он объявил, что войдёт в совет директоров Stability AI, компании, стоящей за нейросетью Stable Diffusion.
При этом Кэмерон не верит, что ИИ сможет полностью заменить человека в создании фильмов: например, для создания сценариев. Кроме того, режиссёру не нравится идея, что кто-то может создать фильм в его стиле или в духе другого режиссёра, просто вбив в программу запрос.
На мой взгляд, Джеймс выбрал неудачное время для подобных разговоров, когда десятки тысяч людей теряют работу в VFX-индустрии, а низкие сметы и сжатые сроки становятся ещё более неадекватными для сотрудников студий. Стремление увеличить скорость работы абсолютно понятно, но когда ты делаешь технодемку, а по-другому Аватар я называть не могу, то есть определенные издержки в виде времени проработки шота и рендера. Те задачи, которые ставят на подобных проектах AI вряд ли выполнит качественно и подконтрольно для видения режиссера, не в обозримом будущем, тем не менее, хотелки растут, а цены просят ниже.
При этом запредельные гонорары продакшена и актерского состава никто трогать не будет, так как они защищены профсоюзами, а львиная доля бюджета уходит именно на них. Безусловно, Кэмерон разбирается в теме производства как никто иной, но мне как представителю "синих" воротничков от индустрии немного странно слышать подобные заявления, когда все эти издержки падают на обычных работяг.
Источник новости
2🤔7🍌2💩1
This media is not supported in your browser
VIEW IN TELEGRAM
Browserable
JS-Библиотека для создания браузерных ИИ-агентов
Для работы понадобится API ключ одного из провайдеров Gemini / Open AI / Claude
Код
#agent
JS-Библиотека для создания браузерных ИИ-агентов
Для работы понадобится API ключ одного из провайдеров Gemini / Open AI / Claude
Код
#agent
💩1