Ultimate TTS Studio Pro
комбайн голосовых моделей в Pinikio
- F5-TTS
- Chatterbox TTS
- Kokoro TTS
- Fish speech
- IndexTTS
- Higgs Audio
- VoxCPM
- KittenTTS
автор
#tts #voicecloning
комбайн голосовых моделей в Pinikio
- F5-TTS
- Chatterbox TTS
- Kokoro TTS
- Fish speech
- IndexTTS
- Higgs Audio
- VoxCPM
- KittenTTS
автор
#tts #voicecloning
❤11👍5🔥1🤔1
ViBT: Vision Bridge Transformer at Scale
Редактор картинок и видео на базе Qwen-Image-Editing для изображений, для видео — на Wan2.1 1.3B
Напрямую моделирует траекторию между входными и выходными данными, а не преобразует шум в данные, как традиционные диффузионные модели
Ускоряет вывод, удаляя условные токены, и работает в 4 раза быстрее по сравнению с базовыми моделями, использующими много токенов.
Гитхаб
HF
Демо
#imageediting #videoediting
Редактор картинок и видео на базе Qwen-Image-Editing для изображений, для видео — на Wan2.1 1.3B
Напрямую моделирует траекторию между входными и выходными данными, а не преобразует шум в данные, как традиционные диффузионные модели
Ускоряет вывод, удаляя условные токены, и работает в 4 раза быстрее по сравнению с базовыми моделями, использующими много токенов.
Гитхаб
HF
Демо
#imageediting #videoediting
🔥13👍4🤔4😱1
Split-then-Merge (StM)
Композитинг на базе CogVideoX-I2V
Интегрирует динамический объект из одного видео в фон из другого
Кажется там у них кто-то очень любит интегрировать свиней
Код / веса ждем
#videoediting #compositing
Композитинг на базе CogVideoX-I2V
Интегрирует динамический объект из одного видео в фон из другого
Кажется там у них кто-то очень любит интегрировать свиней
Код / веса ждем
#videoediting #compositing
👍7👎1😁1😱1
Midjourney решает КАК выглядит картинка.
GPT решает ЗАЧЕМ и ДЛЯ КОГО.
Приглашаем на открытую сессию по работе с чат GPT от сервиса оплаты зарубежных подписок @TinaAIBoostBot.
GPT умеет:
— писать коммерческие офферы
— делать портфолио
— создавать презентации
— упаковывать услуги
— писать cold-message
— помогать вести переговоры
— генерировать коммерческие скрипты
Используй нейросети на все 100%, присоедийся к нашему уроку, чтобы познакомиться со всеми возможностями чата GPT
все подробности в боте или в нашем канале @magic_pill_is_real
#промо
GPT решает ЗАЧЕМ и ДЛЯ КОГО.
Приглашаем на открытую сессию по работе с чат GPT от сервиса оплаты зарубежных подписок @TinaAIBoostBot.
GPT умеет:
— писать коммерческие офферы
— делать портфолио
— создавать презентации
— упаковывать услуги
— писать cold-message
— помогать вести переговоры
— генерировать коммерческие скрипты
Используй нейросети на все 100%, присоедийся к нашему уроку, чтобы познакомиться со всеми возможностями чата GPT
все подробности в боте или в нашем канале @magic_pill_is_real
#промо
😁10👍3🔥3🍌2
Z-Image-Turbo-Fun-Controlnet-Union
Контролнет 5-в-1 под #Zimage от alibaba-pai
Canny, HED, Depth, Pose и MLSD
#controlnet #conditioning
Контролнет 5-в-1 под #Zimage от alibaba-pai
Canny, HED, Depth, Pose и MLSD
#controlnet #conditioning
👍21🔥5
Apple выложили на HuggingFace веса STARFlow
И это даже не видеогенератор, а прилагающийся к нему генератор картинок с базовым разрешением 256*256
Сам видеогенератор разрешением 480p ждем
HF
#text2image
И это даже не видеогенератор, а прилагающийся к нему генератор картинок с базовым разрешением 256*256
Сам видеогенератор разрешением 480p ждем
HF
#text2image
Telegram
Нейронавт | Нейросети в творчестве
STARFlow-V: End-to-End Video Generative Modeling with Normalizing Flows
Видеогенератор от Apple на архитектуре с нормализующими потоками
480p
Поддерживает несколько задач генерации «из коробки»: из текста в видео, из изображения в видео и из видео в видео…
Видеогенератор от Apple на архитектуре с нормализующими потоками
480p
Поддерживает несколько задач генерации «из коробки»: из текста в видео, из изображения в видео и из видео в видео…
🥴5👍2😁1
Nodes 2.0
новая система рендеринга нод в #ComfyUI, основанная на Vue, которая пришла на смену системе рендеринга Canvas на базе LiteGraph.js. Gозволяет ускорить разработку и улучшить взаимодействие с интерфейсом
Как попробовать Nodes 2.0:
Зайдите на cloud.comfy.org или обновитесь до ночной версии (версия для рабочего стола скоро появится)
При запуске ComfyUI нажмите «Try it out» на верхнем баннере
В чате уже обсуждают
новая система рендеринга нод в #ComfyUI, основанная на Vue, которая пришла на смену системе рендеринга Canvas на базе LiteGraph.js. Gозволяет ускорить разработку и улучшить взаимодействие с интерфейсом
Как попробовать Nodes 2.0:
Зайдите на cloud.comfy.org или обновитесь до ночной версии (версия для рабочего стола скоро появится)
При запуске ComfyUI нажмите «Try it out» на верхнем баннере
В чате уже обсуждают
👎6👍4😈2
грустный #Humor
SSD тоже подорожали вслед за памятью.
А я как раз хотел после памяти докупить SSD. А когда я успел купить память? В том-то и дело что не успел😭 😭 😂 😭 😭 😭
SSD тоже подорожали вслед за памятью.
А я как раз хотел после памяти докупить SSD. А когда я успел купить память? В том-то и дело что не успел
Please open Telegram to view this post
VIEW IN TELEGRAM
😭24😁5👍3
Все потешаются над "сосуном" Дурова
А "ИИчко" как будто никто и не заметил, а зря.
Ведь в русском языке кот наплакал существительных с двумя буквами "и" подряд чтобы придумывать прикольные названия связанные с ИИ. Вспомните сейчас хотя бы три русских слова содержащие "ИИ", а потом откройте спойлер:
гостеприимство
прииск
шиит
копиист
пиит
антиинтеллектуализм
антиискусство
мультиинструменталист
квазиимперия
полиимид
антииммуноглобулин
Иисус
Вот почти полный список. И большинство из них имеет две "и" подряд только благодаря приставке.
Не, ну антИИскусство конечно хорошо как название если вы неолуддит и ИИ-хейтер или, что менее вероятно, хейтер человеческого искусства. А так - не разгуляешься. Попробуйте-ка придумать название ИИ-стартапа, можете использовать любое слово из этого списка. Как вам ПрИИск?👀
Я знаю о чем вы думаете. Нет, даже не пытайтесь.
Не удваивайте "И" там где она изначально одна, это кринж. Не стоит вскрывать эту тему. Вы молодые, шутливые, вам все легко. Это не то.
То ли дело англИЙский язык. Чувствуете, даже название языка уже намекает нам что он изначально был придуман для называния всяких ИИ-штук
BrAIn
TrAIn
ExplAIn
RetAIn
ContAIn
PortrAIt
ChAIn
DetAIl
ClAIm
AIM
AID
Выбирай - не хочу.
Спрашивается чем думали советские словотворцы в 60-х? Достаточно было популяризировать термин Искусственный Разум вместо Искусственный Интеллект. Крайне безответственное поведение. Единственное для чего годится русское "ИИ" - это для какого-нибудь Института Искусственного Интеллекта. Но и то пишется красиво, а звучит кринжово - ИИИ
Вот и приходится Дурову придумывать всяких сосунов и иички. Хотя по его фото и не скажешь что шутник. Хотел быть аполлоном а приходится шутом
#набрюзжал #оффтоп #humor
А "ИИчко" как будто никто и не заметил, а зря.
Ведь в русском языке кот наплакал существительных с двумя буквами "и" подряд чтобы придумывать прикольные названия связанные с ИИ. Вспомните сейчас хотя бы три русских слова содержащие "ИИ", а потом откройте спойлер:
прииск
шиит
копиист
пиит
антиинтеллектуализм
антиискусство
мультиинструменталист
квазиимперия
полиимид
антииммуноглобулин
Вот почти полный список. И большинство из них имеет две "и" подряд только благодаря приставке.
Не, ну антИИскусство конечно хорошо как название если вы неолуддит и ИИ-хейтер или, что менее вероятно, хейтер человеческого искусства. А так - не разгуляешься. Попробуйте-ка придумать название ИИ-стартапа, можете использовать любое слово из этого списка. Как вам ПрИИск?
Я знаю о чем вы думаете. Нет, даже не пытайтесь.
Не удваивайте "И" там где она изначально одна, это кринж. Не стоит вскрывать эту тему. Вы молодые, шутливые, вам все легко. Это не то.
То ли дело англИЙский язык. Чувствуете, даже название языка уже намекает нам что он изначально был придуман для называния всяких ИИ-штук
BrAIn
TrAIn
ExplAIn
RetAIn
ContAIn
PortrAIt
ChAIn
DetAIl
ClAIm
AIM
AID
Выбирай - не хочу.
Спрашивается чем думали советские словотворцы в 60-х? Достаточно было популяризировать термин Искусственный Разум вместо Искусственный Интеллект. Крайне безответственное поведение. Единственное для чего годится русское "ИИ" - это для какого-нибудь Института Искусственного Интеллекта. Но и то пишется красиво, а звучит кринжово - ИИИ
Вот и приходится Дурову придумывать всяких сосунов и иички. Хотя по его фото и не скажешь что шутник. Хотел быть аполлоном а приходится шутом
#набрюзжал #оффтоп #humor
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🍌11😁9❤4🌚3👍1
Mistral 3
Новое поколение мультимодальных и мультиязычных ИИ-моделей. Проект предлагает ряд моделей разной мощности, включая три компактные модели (14B, 8B и 3B) и мощную модель Mistral Large 3 с 41B активными и 675B общими параметрами
— понимает текст и изображения
— поддерживает более 40 языков
— демонстрирует высокую производительность при работе с многоязычными диалогами, особенно вне английского и китайского языков
— занимает второе место в категории OSS-моделей без рассуждения на LMArena
По метрикам моделька на уровне DeepSeek 3.1 и Kimi K2. Если бы не DeepSeek-3.2, была бы #SOTA
Говорят, на НЕанглийском и НЕкитайском модель лучшая в своем классе.
Попробовать
HF Large 3
HF Ministral
#assistant #multimodal
Новое поколение мультимодальных и мультиязычных ИИ-моделей. Проект предлагает ряд моделей разной мощности, включая три компактные модели (14B, 8B и 3B) и мощную модель Mistral Large 3 с 41B активными и 675B общими параметрами
— понимает текст и изображения
— поддерживает более 40 языков
— демонстрирует высокую производительность при работе с многоязычными диалогами, особенно вне английского и китайского языков
— занимает второе место в категории OSS-моделей без рассуждения на LMArena
По метрикам моделька на уровне DeepSeek 3.1 и Kimi K2. Если бы не DeepSeek-3.2, была бы #SOTA
Говорят, на НЕанглийском и НЕкитайском модель лучшая в своем классе.
Попробовать
HF Large 3
HF Ministral
#assistant #multimodal
👍7🔥1
LongVT: Incentivizing "Thinking with Long Videos" via Native Tool Calling
Агент для работы с длинными видео, позволяет большим мультимодальным моделям (#LMM) эффективнее анализировать и делать выводы на основе часовых роликов.
Cнижает вероятность галлюцинаций за счёт привязки рассуждений к фактическому видеоконтенту, а не только к текстовым данным
Работает с редкими и мелкими деталями в длинных видео, которые сложно уловить существующим моделям, обученным на более грубых и коротких данных
Гитхаб
HF
Демо
Разъяснительный комикс (EN)
#vlm #video2text
Агент для работы с длинными видео, позволяет большим мультимодальным моделям (#LMM) эффективнее анализировать и делать выводы на основе часовых роликов.
Cнижает вероятность галлюцинаций за счёт привязки рассуждений к фактическому видеоконтенту, а не только к текстовым данным
Работает с редкими и мелкими деталями в длинных видео, которые сложно уловить существующим моделям, обученным на более грубых и коротких данных
Гитхаб
HF
Демо
Разъяснительный комикс (EN)
#vlm #video2text
🔥8👍4😱2
Infinity-RoPE: Action-Controllable Infinite Video Generation Emerges From Autoregressive Self-Rollout
Метод генерации бесконечных по длине видео с возможностью контроля действий и кинематографических переходов на базе Wan2.1-T2V-1.3B + Self-Forcing
Работает без дополнительного обучения, применяется поверх существующих моделей
— может генерировать видео неограниченной длины, выходя за пределы временного горизонта базовой модели
— осуществляет точный контроль действий, позволяя мгновенно менять подсказки и плавно переходить между действиями
Код ждем
#optimization #longvideo #adapter
Метод генерации бесконечных по длине видео с возможностью контроля действий и кинематографических переходов на базе Wan2.1-T2V-1.3B + Self-Forcing
Работает без дополнительного обучения, применяется поверх существующих моделей
— может генерировать видео неограниченной длины, выходя за пределы временного горизонта базовой модели
— осуществляет точный контроль действий, позволяя мгновенно менять подсказки и плавно переходить между действиями
Код ждем
#optimization #longvideo #adapter
👍15❤1😱1🌚1