Z-Image / Flux.2 workflow
Подборка воркфлоу от подписчиков
Воркфлоу с простым инпэйнтингом
Воркфлоу с FaceDetailer
C image-to-image
Спасибо @asleephidden
Z Image Turbo Workflow with SageAttetion + MultiGPU
Flux.2 D Workflows (includes Edit workflow) with GGUF + SageAttention + MultiGPU
Cпасибо @stefanfalkok
#workflow #flux2 #zimage #text2image #imageediting
Подборка воркфлоу от подписчиков
Воркфлоу с простым инпэйнтингом
Воркфлоу с FaceDetailer
C image-to-image
Спасибо @asleephidden
Z Image Turbo Workflow with SageAttetion + MultiGPU
Flux.2 D Workflows (includes Edit workflow) with GGUF + SageAttention + MultiGPU
Cпасибо @stefanfalkok
#workflow #flux2 #zimage #text2image #imageediting
👍16❤6🔥3
Media is too big
VIEW IN TELEGRAM
Harmony: Harmonizing Audio and Video Generation through Cross-Task Synergy
Новая модель от Tencent Hunyuan
#Sota в генерации синхронизированного видео и аудио
Умеет клонировать голос, знает несколько языков.
Модель способна работать с разными сценариями:
— генерация аудиовизуального контента на основе речи
— синтез аудиовизуального материала по подсказкам, связанным с окружающими звуками (environmental sounds)
Код ждем
#text2av #audio2av #av #text2video #audio2video
Новая модель от Tencent Hunyuan
#Sota в генерации синхронизированного видео и аудио
Умеет клонировать голос, знает несколько языков.
Модель способна работать с разными сценариями:
— генерация аудиовизуального контента на основе речи
— синтез аудиовизуального материала по подсказкам, связанным с окружающими звуками (environmental sounds)
Код ждем
#text2av #audio2av #av #text2video #audio2video
🔥9❤2👍1👨💻1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows
Видеогенератор от Apple на архитектуре с нормализующими потоками
480p
Поддерживает несколько задач генерации «из коробки»: из текста в видео, из изображения в видео и из видео в видео, умеет в длинные видео.
Под капотом T5-XL и WAN2.2-VAE
Гитхаб
Спасибо @EvgenyiPerm
#text2image #text2video #image2video #video2video #longvideo
Видеогенератор от Apple на архитектуре с нормализующими потоками
480p
Поддерживает несколько задач генерации «из коробки»: из текста в видео, из изображения в видео и из видео в видео, умеет в длинные видео.
Под капотом T5-XL и WAN2.2-VAE
Гитхаб
Спасибо @EvgenyiPerm
#text2image #text2video #image2video #video2video #longvideo
🔥8🥴5👍3😱2❤1
Власти Китая запретили ByteDance использовать чипы Nvidia для новых вычислительных мощностей.
На минуточку, ByteDance - крупнейший китайский закупщик NVIDIA в 2025 году.
ByteDance остался с большими запасами оборудования, которое теперь нельзя использовать из-за ограничений.
Это решение — часть кампании Пекина по снижению зависимости от американских технологий, направленной на продвижение отечественных решений от Huawei и Cambricon.
Для нас это может означать следующее:
1. Им придется продать видеокарты. И возможно, они подешевеют
2. Будут ли новые разработки ByteDance работать на NVIDIA или только на каком-нибудь Цзинь-Пин-VIDIA?
#news #gpu
На минуточку, ByteDance - крупнейший китайский закупщик NVIDIA в 2025 году.
ByteDance остался с большими запасами оборудования, которое теперь нельзя использовать из-за ограничений.
Это решение — часть кампании Пекина по снижению зависимости от американских технологий, направленной на продвижение отечественных решений от Huawei и Cambricon.
Для нас это может означать следующее:
1. Им придется продать видеокарты. И возможно, они подешевеют
2. Будут ли новые разработки ByteDance работать на NVIDIA или только на каком-нибудь Цзинь-Пин-VIDIA?
#news #gpu
🔥13🤔7😁2❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Kimi Slides + Nano Banano Pro
В генерилку презентаций от Kimi подключили новый нанобанан
Говорят, до вечера воскресенья бесплатно. Бежим запасаться презентациями
#assistant #slides #giveaway
В генерилку презентаций от Kimi подключили новый нанобанан
Говорят, до вечера воскресенья бесплатно. Бежим запасаться презентациями
#assistant #slides #giveaway
👍10
Существует ли ИИ пузырь
Эндрю Ын считает, что ситуация с «пузырём» в сфере ИИ неоднозначна — разные области находятся в разном состоянии. Вот его основные мысли:
- В слое приложений ИИ наблюдается недостаточное инвестирование, потенциал этой области ещё не раскрыт полностью.
- Инфраструктура для инференса нуждается в значительных инвестициях, чтобы удовлетворить растущий спрос.
- В сфере инфраструктуры для обучения моделей есть определённый оптимизм, но существует и риск образования пузыря.
Ын подчёркивает, что не даёт инвестиционных советов, но в целом настроен оптимистично в отношении будущего ИИ. Он отмечает, что в долгосрочной перспективе фундаментальные основы ИИ сильны, даже если в краткосрочной перспективе возможны колебания из-за спекуляций и настроений на рынке.
Эндрю Ын (англ. Andrew Ng) — американский учёный в области информатики, исследователь робототехники, машинного обучения и искусственного интеллекта (ИИ). Известен как один из основателей стартапа в области онлайн-обучения Coursera, основатель компаний LandingAI и DeepLearning.AI, а также управляющий генеральный партнёр венчурного фонда AI Fund
PS Короче, Ын не прочь понадувать пузырь как я понял
#news
Эндрю Ын считает, что ситуация с «пузырём» в сфере ИИ неоднозначна — разные области находятся в разном состоянии. Вот его основные мысли:
- В слое приложений ИИ наблюдается недостаточное инвестирование, потенциал этой области ещё не раскрыт полностью.
- Инфраструктура для инференса нуждается в значительных инвестициях, чтобы удовлетворить растущий спрос.
- В сфере инфраструктуры для обучения моделей есть определённый оптимизм, но существует и риск образования пузыря.
Ын подчёркивает, что не даёт инвестиционных советов, но в целом настроен оптимистично в отношении будущего ИИ. Он отмечает, что в долгосрочной перспективе фундаментальные основы ИИ сильны, даже если в краткосрочной перспективе возможны колебания из-за спекуляций и настроений на рынке.
Эндрю Ын (англ. Andrew Ng) — американский учёный в области информатики, исследователь робототехники, машинного обучения и искусственного интеллекта (ИИ). Известен как один из основателей стартапа в области онлайн-обучения Coursera, основатель компаний LandingAI и DeepLearning.AI, а также управляющий генеральный партнёр венчурного фонда AI Fund
PS Короче, Ын не прочь понадувать пузырь как я понял
#news
😁6👍2🔥1
Canvas-to-Image
В Snap Research тоже сделали свой редактор изображенийс блэкджеком и шл с мультимодальным управлением. Модель объединяет различные сигналы управления (ссылки на объекты, ограничивающие рамки, скелеты поз) в единый интерфейс
Умеет интегрировать объекты в заданные фоны, сохраняя контроль над идентичностью и позой.
Только показывают, кода нет
#imageediting #research
В Snap Research тоже сделали свой редактор изображений
Умеет интегрировать объекты в заданные фоны, сохраняя контроль над идентичностью и позой.
Только показывают, кода нет
#imageediting #research
👍5🌚1
Промптхаб Яндекса
Яндекс выпустил платформу с идеями для применения нейронок. Есть как готовые промпты для разных задач, так и мини-курсы для обучения. Свои промпты тоже можно добавлять.
Если хотите посоревноваться в нейротворчестве – челленджи с разными заданиями на генерации, например видео для продажи товара на маркетплейсе или книжка со сказками.
Призы:
250 000 за первое место
150 000 за второе
50 000 за третье
и Яндекс станции за 4 и 5 места
#news #competition
Яндекс выпустил платформу с идеями для применения нейронок. Есть как готовые промпты для разных задач, так и мини-курсы для обучения. Свои промпты тоже можно добавлять.
Если хотите посоревноваться в нейротворчестве – челленджи с разными заданиями на генерации, например видео для продажи товара на маркетплейсе или книжка со сказками.
Призы:
250 000 за первое место
150 000 за второе
50 000 за третье
и Яндекс станции за 4 и 5 места
#news #competition
👍7👎4🥴4😐3🍌1
Fara-7B: An Efficient Agentic Model for Computer Use
Локальный компактный агент от Microsoft для управления компьютером на базе Qwen2.5-VL-7B
— ищет информацию и суммирует результаты;
— заполняет формы и управляет аккаунтами;
— бронирует путешествия, билеты в кино и рестораны;
— занимается шопингом и сравнивает цены в разных магазинах;
— находит объявления о работе и недвижимость.
Гитхаб
HF
#agent #gui #vlm
Локальный компактный агент от Microsoft для управления компьютером на базе Qwen2.5-VL-7B
— ищет информацию и суммирует результаты;
— заполняет формы и управляет аккаунтами;
— бронирует путешествия, билеты в кино и рестораны;
— занимается шопингом и сравнивает цены в разных магазинах;
— находит объявления о работе и недвижимость.
Гитхаб
HF
#agent #gui #vlm
1👍8❤1