This media is not supported in your browser
VIEW IN TELEGRAM
Streaming Sortformer
Модель от NVIDIA для диаризации в реальном времени, которая позволяет определять, кто говорит в многоголосных аудиозаписях.
Возможности модели:
- диаризация на уровне кадров с тегами (например, spk_0, spk_1);
- точные временные метки для каждого помеченного высказывания;
- отслеживание 2–4+ говорящих с минимальной задержкой;
- оптимизация для английского языка, но успешное тестирование на мандаринском и других языках.
Пример на видео конечно дурацкий, все друг друга ждут чтобы сказать свою реплику, в жизни оно не так работает
HF
#ASR #speech2text #stt
Модель от NVIDIA для диаризации в реальном времени, которая позволяет определять, кто говорит в многоголосных аудиозаписях.
Возможности модели:
- диаризация на уровне кадров с тегами (например, spk_0, spk_1);
- точные временные метки для каждого помеченного высказывания;
- отслеживание 2–4+ говорящих с минимальной задержкой;
- оптимизация для английского языка, но успешное тестирование на мандаринском и других языках.
Пример на видео конечно дурацкий, все друг друга ждут чтобы сказать свою реплику, в жизни оно не так работает
HF
#ASR #speech2text #stt
👍10❤1🍌1
3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt
Еще одна оптимизированная модель для реконструкции сцен на гауссианах. От запрещенной Meta
Оптимизация достигается за счет путём замены оптимизатора ADAM (на втором этапе) на адаптированный алгоритм Левенберга-Маркварта (LM)
Модель ускоряет процесс оптимизации на 20 % по сравнению с оригинальным 3DGS, сохраняя при этом качество реконструкции.
Казалось бы, жиденькое ускорение. Но метод можно комбинировать с другими подходами для ускорения 3DGS, что позволяет достигать ещё более высоких скоростей обработки.
Код
#gaussian #novelview
Еще одна оптимизированная модель для реконструкции сцен на гауссианах. От запрещенной Meta
Оптимизация достигается за счет путём замены оптимизатора ADAM (на втором этапе) на адаптированный алгоритм Левенберга-Маркварта (LM)
Модель ускоряет процесс оптимизации на 20 % по сравнению с оригинальным 3DGS, сохраняя при этом качество реконструкции.
Казалось бы, жиденькое ускорение. Но метод можно комбинировать с другими подходами для ускорения 3DGS, что позволяет достигать ещё более высоких скоростей обработки.
Код
#gaussian #novelview
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Raylight
МультиGPU в #ComfyUI
Поддерживаются некоторые модели Wan (например, Wan 1.3B T2V и Wan 14B T2V), а также есть частичная поддержка других моделей (Flux, Qwen, Hunyuan). Для работы требуется FlashAttention. Есть известные проблемы, например, ошибки OOM при работе с большими моделями
Нет поддержки Non-DiT моделей
Не тестировано на Windows
спасибо @nightkraw13r
#optimization #gpu
МультиGPU в #ComfyUI
Поддерживаются некоторые модели Wan (например, Wan 1.3B T2V и Wan 14B T2V), а также есть частичная поддержка других моделей (Flux, Qwen, Hunyuan). Для работы требуется FlashAttention. Есть известные проблемы, например, ошибки OOM при работе с большими моделями
Нет поддержки Non-DiT моделей
Не тестировано на Windows
спасибо @nightkraw13r
#optimization #gpu
🔥6👍2
ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling
3D-реконструкция человека от запрещенной Meta по одной картинке, видео или 3D скану.
Разделяет скелет и внешнюю поверхность тела, чтобы отдельно настраивать форму тела и параметры скелета. Может изменять параметры скелета, например, увеличивать ширину плеч или длину рук, сохраняя реалистичность изображения.
На выходе меши, рендер, параметрические фигуры с позами
Код ждем
#humanreconstruction #imageto3D #videoto3d
3D-реконструкция человека от запрещенной Meta по одной картинке, видео или 3D скану.
Разделяет скелет и внешнюю поверхность тела, чтобы отдельно настраивать форму тела и параметры скелета. Может изменять параметры скелета, например, увеличивать ширину плеч или длину рук, сохраняя реалистичность изображения.
На выходе меши, рендер, параметрические фигуры с позами
Код ждем
#humanreconstruction #imageto3D #videoto3d
👍11🔥7❤1
😁13👍1
Аттракцион невиданной щедрости 🚩
Всем бесплатно дают аж 3 генерации в VEO 3 до конца выходных
У вас есть три желания, не продешевите!
Я сказал всем? Не забудьте спрятаться за три буквы и заходить с американского гуглоаккаунта
Забрать 3 бесплатных видео
#text2video #image2video #giveaway
Всем бесплатно дают аж 3 генерации в VEO 3 до конца выходных
У вас есть три желания, не продешевите!
Я сказал всем? Не забудьте спрятаться за три буквы и заходить с американского гуглоаккаунта
Забрать 3 бесплатных видео
#text2video #image2video #giveaway
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤1😁1
Культовые фотографии + редактирующая модель + немного фантазии
Кидайте в комменты работы которые вам понравились
Реддит
Админ на выходных
Кидайте в комменты работы которые вам понравились
Реддит
Админ на выходных
👍18
Немного новостей минувшей недели о том как ИИ улучшает (или нет) жизнь человечества
OpenAI и Retro Biosciences создали модель GPT-4b micro для белковой инженерии. С её помощью улучшили белки Yamanaka, что повысило в более чем 50 раз экспрессию маркеров перепрограммирования стволовых клеток и улучшило восстановление ДНК. Результаты подтверждены на разных клетках и методах доставки.
Новые белки улучшают восстановление ДНК в клетках и повышают их «омолаживающий» потенциал. Речь не идёт о полной остановке старения, но о значительном улучшении некоторых связанных с ним клеточных процессов.
————————————
Вайб-колоноскопия, курва!
Провели исследование в четырёх польских эндоскопических центрах.
В этих центрах использовали ИИ для помощи в обнаружении полипов. Сравнили качество колоноскопии до и после внедрения ИИ.
Исследование показало, что после введения искусственного интеллекта точность диагностики заболеваний врачами снизилась на 10%. А после отказа от ИИ этот показатель упал еще на 20%.
————————————
GPT-5 способна к открытиям (не уверен что уместно такое громкое слово) в математике.
Она помогла решить математическую задачу: улучшила доказательство о выпуклости кривой в градиентном спуске. Раньше считалось, что кривая выпукла при eta менее 1/L и не выпукла при eta более 1,75/L. GPT-5 показала, что кривая остается выпуклой при eta до 1,5/L, сократив неопределенный диапазон в три раза. Доказательство модели было ясным и правильным. На размышление ушло 17 минут
#research #news
OpenAI и Retro Biosciences создали модель GPT-4b micro для белковой инженерии. С её помощью улучшили белки Yamanaka, что повысило в более чем 50 раз экспрессию маркеров перепрограммирования стволовых клеток и улучшило восстановление ДНК. Результаты подтверждены на разных клетках и методах доставки.
Новые белки улучшают восстановление ДНК в клетках и повышают их «омолаживающий» потенциал. Речь не идёт о полной остановке старения, но о значительном улучшении некоторых связанных с ним клеточных процессов.
————————————
Вайб-колоноскопия, курва!
Провели исследование в четырёх польских эндоскопических центрах.
В этих центрах использовали ИИ для помощи в обнаружении полипов. Сравнили качество колоноскопии до и после внедрения ИИ.
Исследование показало, что после введения искусственного интеллекта точность диагностики заболеваний врачами снизилась на 10%. А после отказа от ИИ этот показатель упал еще на 20%.
————————————
GPT-5 способна к открытиям (не уверен что уместно такое громкое слово) в математике.
Она помогла решить математическую задачу: улучшила доказательство о выпуклости кривой в градиентном спуске. Раньше считалось, что кривая выпукла при eta менее 1/L и не выпукла при eta более 1,75/L. GPT-5 показала, что кривая остается выпуклой при eta до 1,5/L, сократив неопределенный диапазон в три раза. Доказательство модели было ясным и правильным. На размышление ушло 17 минут
#research #news
👍9🔥3❤2🍌2
Две лоры под #kontext от нашего подписчика @thedeoxen
RefControl Flux Kontext – Reference Pose LoRA - конторль позы
civitai
HF
workflow
—————————————
Depth Reference Fusion LoRA - контроль глубины
HF - воркфлоу в репозитории
#lora #controlnet #workflow
RefControl Flux Kontext – Reference Pose LoRA - конторль позы
civitai
HF
workflow
—————————————
Depth Reference Fusion LoRA - контроль глубины
HF - воркфлоу в репозитории
#lora #controlnet #workflow
🔥11👍4❤2