Нейронавт | Нейросети в творчестве
Питерские камрады и камрадессы, сегодня в Доме Кино мероприятие, достойное посещения Мероприятие "Кинокод" раскроет секреты искусственного интеллекта в киноиндустрии. "Кинокод" – это не просто шоу, это взгляд в будущее киноиндустрии Вход бесплатный, по предварительной…
Инфа от посетителя.
В целом интересно побывать на таком мероприятии, хотя ничего нового для тех кто в курсе что видео можно генерировать.
Впечатлил клип на неизданный трек Кирилла Толмацкого aka Дэцл.
Артист ушел из жизни в 2019 году. После чего его отец Александр Толмацкий обнаружил на флешке неизданный трек Кирилла и постарался довести его до финального качества. На этот трек и был создан видеоклип с использованием видеогенераторов участвовавший в конкурсе ИИ фильмов.
Кто знает где посмотреть клип - киньте ссылку, посмотрим вместе
[update] спасибо @lovelettertomyheart
Клип:
https://www.youtube.com/watch?v=F7FO0HRZ2QY
#event
В целом интересно побывать на таком мероприятии, хотя ничего нового для тех кто в курсе что видео можно генерировать.
Впечатлил клип на неизданный трек Кирилла Толмацкого aka Дэцл.
Артист ушел из жизни в 2019 году. После чего его отец Александр Толмацкий обнаружил на флешке неизданный трек Кирилла и постарался довести его до финального качества. На этот трек и был создан видеоклип с использованием видеогенераторов участвовавший в конкурсе ИИ фильмов.
Кто знает где посмотреть клип - киньте ссылку, посмотрим вместе
[update] спасибо @lovelettertomyheart
Клип:
https://www.youtube.com/watch?v=F7FO0HRZ2QY
#event
🔥7👎1🤯1
OpenCoder
Опенсорсное семейство LLM для кодинга, заявлен уровень качества, соответствующий топовым LLM. Разводить самомтоятельно
#coding #assistant
Опенсорсное семейство LLM для кодинга, заявлен уровень качества, соответствующий топовым LLM. Разводить самомтоятельно
#coding #assistant
huggingface.co
OpenCoder - a infly Collection
OpenCoder is an open and reproducible code LLM family which matches the performance of top-tier code LLMs.
👍4😁1
Media is too big
VIEW IN TELEGRAM
DimensionX: Create Any 3D and 4D Scenes from a Single Image with Controllable Video Diffusion
Управление камерой при генерации видео из одной картинки от авторов ReconX.
Чем именно управляется камера непонятно. Есть какое-то упоминание референсного видео.
Из опубликованных весов только вращение влево. Ага, значит траектория зашита в веса. НУууу это неудобно. Но авторы обещают продолжать придумывать ништяки в этом направлении.
Работает с Kijai’s CogVideo wrapper в #ComfyUI
Код
#cameracontrol
Управление камерой при генерации видео из одной картинки от авторов ReconX.
Чем именно управляется камера непонятно. Есть какое-то упоминание референсного видео.
Из опубликованных весов только вращение влево. Ага, значит траектория зашита в веса. НУууу это неудобно. Но авторы обещают продолжать придумывать ништяки в этом направлении.
Работает с Kijai’s CogVideo wrapper в #ComfyUI
Код
#cameracontrol
👍6🔥2
SVDQuant
Новая схема квантизации от MIT. Ускоряет Flux втрое на ноутбуке с 16GB 4090.
Демо
Код
Веса
#optimization
Новая схема квантизации от MIT. Ускоряет Flux втрое на ноутбуке с 16GB 4090.
Демо
Код
Веса
#optimization
🔥19😱5👍2
This media is not supported in your browser
VIEW IN TELEGRAM
SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation
Еще одна модель для управления траекторией на видеогенерации из картинки.
Траектория задается прямоугольной областью и направлением.
Работа частично вдохновлена DragAnything и FreeTraj
Код
#cameracontrol
Еще одна модель для управления траекторией на видеогенерации из картинки.
Траектория задается прямоугольной областью и направлением.
Работа частично вдохновлена DragAnything и FreeTraj
Код
#cameracontrol
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
AdaFace: A Versatile Face Encoder for Zero-Shot Diffusion Model Personalization
Модель выучивает лицо персонажа по одному или нескольким фото. Дальше можно генерировать новые персонализированные портреты или видео
Демо портреты
Демо анимация
#personalization #text2image #text2video
Модель выучивает лицо персонажа по одному или нескольким фото. Дальше можно генерировать новые персонализированные портреты или видео
Демо портреты
Демо анимация
#personalization #text2image #text2video
👍7🔥3
Factory App AI
Приложение для генерации ИИ-приложений на платформе gradio. Под капотом WatsonX API и OpenAI
Проект в стадии разработки, по готовности будет создавать Docker контейнеры.
#coding
Приложение для генерации ИИ-приложений на платформе gradio. Под капотом WatsonX API и OpenAI
Проект в стадии разработки, по готовности будет создавать Docker контейнеры.
#coding
This media is not supported in your browser
VIEW IN TELEGRAM
Voice-Pro: The best gradio web-ui for trannoscription, translation and text-to-speech
Приложение для работы с речью - транскрибация, перевод и генерация речи по тексту.
Под капотом Whisper, Google Translator, Edge TTS. Поддерживает 100 языков. С учетом начинки можно рассчитывать на поддержку русского языка.
Умеет скачивать видео с ютуба, конвертировать в аудио, отделять речь из микса. Есть пакетная обработка и рилтайм
‼️Будьте осторожны. Уже есть пострадавшие. Устанавливайте если знаете что делаете
#tts #stt #dubbing #text2speech #speech2 text #speech
Приложение для работы с речью - транскрибация, перевод и генерация речи по тексту.
Под капотом Whisper, Google Translator, Edge TTS. Поддерживает 100 языков. С учетом начинки можно рассчитывать на поддержку русского языка.
Умеет скачивать видео с ютуба, конвертировать в аудио, отделять речь из микса. Есть пакетная обработка и рилтайм
‼️Будьте осторожны. Уже есть пострадавшие. Устанавливайте если знаете что делаете
это говно снесло мне Nvidia app при конфигурации и видуха тупо перестала работать
#tts #stt #dubbing #text2speech #speech2 text #speech
👍9🤔5🤯2
Обновился генератор видео от Alibaba EasyAnimate до версии v5
Разрешение до 1024x1024, 49 кадров, 8 кадров в секунду, генерация по картинке (финальный кадр тоже можно указать!)
Поддержка #ComfyUI, Lora, Controlnet.
Запаситесь 24 GB VRAM
Демо
ComfyUI
Гитхаб
Веса:
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-InP
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-Control
#text2video #image2video
Разрешение до 1024x1024, 49 кадров, 8 кадров в секунду, генерация по картинке (финальный кадр тоже можно указать!)
Поддержка #ComfyUI, Lora, Controlnet.
Запаситесь 24 GB VRAM
Демо
ComfyUI
Гитхаб
Веса:
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-InP
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-Control
#text2video #image2video
👍5💯3👎2🤔2
Qwen2.5-Coder
Обновка LLM для работы с кодом Qwen
По бенчмаркам - уровень gpt4o
Опенсорс, доступны 0.5B / 1.5B / 3B / 7B / 14B / 32В. Можно запустить локально
Модели на HF
Демо
Гитхаб
#coding #assistant
Обновка LLM для работы с кодом Qwen
По бенчмаркам - уровень gpt4o
Опенсорс, доступны 0.5B / 1.5B / 3B / 7B / 14B / 32В. Можно запустить локально
Модели на HF
Демо
Гитхаб
#coding #assistant
🔥8👎1🤯1
e2-f5-tts multilingual
В голосовой модели e2-f5 мультиязычная обновка. Теперь можно клонировать голос и подгружать свои файнтюны, несколько готовых есть. Русского не нашел
Приложение доступно в Pinokio
Инструкция в твиттере
Демо (без файнтюнов)
Гитхаб
#text2speech #tts #voicecloninhg
В голосовой модели e2-f5 мультиязычная обновка. Теперь можно клонировать голос и подгружать свои файнтюны, несколько готовых есть. Русского не нашел
Приложение доступно в Pinokio
Инструкция в твиттере
Демо (без файнтюнов)
Гитхаб
#text2speech #tts #voicecloninhg
❤6