NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Питерские камрады и камрадессы, сегодня в Доме Кино мероприятие, достойное посещения Мероприятие "Кинокод" раскроет секреты искусственного интеллекта в киноиндустрии. "Кинокод" – это не просто шоу, это взгляд в будущее киноиндустрии Вход бесплатный, по предварительной…

Инфа от посетителя.
В целом интересно побывать на таком мероприятии, хотя ничего нового для тех кто в курсе что видео можно генерировать.

Впечатлил клип на неизданный трек Кирилла Толмацкого aka Дэцл.

Артист ушел из жизни в 2019 году. После чего его отец Александр Толмацкий обнаружил на флешке неизданный трек Кирилла и постарался довести его до финального качества. На этот трек и был создан видеоклип с использованием видеогенераторов участвовавший в конкурсе ИИ фильмов.

Кто знает где посмотреть клип - киньте ссылку, посмотрим вместе

[update] спасибо @lovelettertomyheart

Клип:
https://www.youtube.com/watch?v=F7FO0HRZ2QY

#event

🔥7👎1🤯1

1.6K views15:27

Нейронавт | Нейросети в творчестве

OpenCoder

Опенсорсное семейство LLM для кодинга, заявлен уровень качества, соответствующий топовым LLM. Разводить самомтоятельно

#coding #assistant

huggingface.co

OpenCoder - a infly Collection

OpenCoder is an open and reproducible code LLM family which matches the performance of top-tier code LLMs.

👍4😁1

1.57K views07:36

Нейронавт | Нейросети в творчестве

1:49

Media is too big

VIEW IN TELEGRAM

DimensionX: Create Any 3D and 4D Scenes from a Single Image with Controllable Video Diffusion

Управление камерой при генерации видео из одной картинки от авторов ReconX.

Чем именно управляется камера непонятно. Есть какое-то упоминание референсного видео.
Из опубликованных весов только вращение влево. Ага, значит траектория зашита в веса. НУууу это неудобно. Но авторы обещают продолжать придумывать ништяки в этом направлении.

Работает с Kijai’s CogVideo wrapper в #ComfyUI

Код

#cameracontrol

👍6🔥2

1.67K viewsedited 07:50

Нейронавт | Нейросети в творчестве

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

SVDQuant

Новая схема квантизации от MIT. Ускоряет Flux втрое на ноутбуке с 16GB 4090.

Демо
Код
Веса

#optimization

🔥19😱5👍2

1.84K views08:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation

Еще одна модель для управления траекторией на видеогенерации из картинки.
Траектория задается прямоугольной областью и направлением.

Работа частично вдохновлена DragAnything и FreeTraj

Код

#cameracontrol

👍4🔥1

1.52K viewsedited 08:37

Нейронавт | Нейросети в творчестве

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

ComfyUI Doom

Непонедельничная новость/ #оффтоп
Doom запустили на #ComfyUI

И вы можете

😁13🎃1

1.97K views08:55

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

AdaFace: A Versatile Face Encoder for Zero-Shot Diffusion Model Personalization

Модель выучивает лицо персонажа по одному или нескольким фото. Дальше можно генерировать новые персонализированные портреты или видео

Демо портреты
Демо анимация

#personalization #text2image #text2video

👍7🔥3

1.74K views09:08

Нейронавт | Нейросети в творчестве

1:25

This media is not supported in your browser

VIEW IN TELEGRAM

DimensionX на tost.ai

#image2video

❤5👍1

1.54K views09:33

Нейронавт | Нейросети в творчестве

#humor

😁50❤3😱2

1.51K views07:07

Нейронавт | Нейросети в творчестве

Factory App AI

Приложение для генерации ИИ-приложений на платформе gradio. Под капотом WatsonX API и OpenAI

Проект в стадии разработки, по готовности будет создавать Docker контейнеры.

#coding

1.46K views07:49

Нейронавт | Нейросети в творчестве

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

Voice-Pro: The best gradio web-ui for trannoscription, translation and text-to-speech

Приложение для работы с речью - транскрибация, перевод и генерация речи по тексту.

Под капотом Whisper, Google Translator, Edge TTS. Поддерживает 100 языков. С учетом начинки можно рассчитывать на поддержку русского языка.

Умеет скачивать видео с ютуба, конвертировать в аудио, отделять речь из микса. Есть пакетная обработка и рилтайм

‼️Будьте осторожны. Уже есть пострадавшие. Устанавливайте если знаете что делаете

это говно снесло мне Nvidia app при конфигурации и видуха тупо перестала работать

#tts #stt #dubbing #text2speech #speech2 text #speech

👍9🤔5🤯2

1.97K viewsedited 10:13

Нейронавт | Нейросети в творчестве

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

Обновился генератор видео от Alibaba EasyAnimate до версии v5

Разрешение до 1024x1024, 49 кадров, 8 кадров в секунду, генерация по картинке (финальный кадр тоже можно указать!)
Поддержка #ComfyUI, Lora, Controlnet.
Запаситесь 24 GB VRAM

Демо
ComfyUI
Гитхаб

Веса:
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-InP
https://huggingface.co/alibaba-pai/EasyAnimateV5-12b-zh-Control

#text2video #image2video

👍5💯3👎2🤔2

1.67K views10:35

Нейронавт | Нейросети в творчестве

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Qwen2.5-Coder

Обновка LLM для работы с кодом Qwen
По бенчмаркам - уровень gpt4o
Опенсорс, доступны 0.5B / 1.5B / 3B / 7B / 14B / 32В. Можно запустить локально

Модели на HF
Демо
Гитхаб

#coding #assistant

🔥8👎1🤯1

1.61K views12:43

Нейронавт | Нейросети в творчестве

1:29

This media is not supported in your browser

VIEW IN TELEGRAM

e2-f5-tts multilingual

В голосовой модели e2-f5 мультиязычная обновка. Теперь можно клонировать голос и подгружать свои файнтюны, несколько готовых есть. Русского не нашел

Приложение доступно в Pinokio

Инструкция в твиттере

Демо (без файнтюнов)

Гитхаб

#text2speech #tts #voicecloninhg

❤6

1.49K views16:10

Нейронавт | Нейросети в творчестве

Qwen2.5-Coder Обновка LLM для работы с кодом Qwen По бенчмаркам - уровень gpt4o Опенсорс, доступны 0.5B / 1.5B / 3B / 7B / 14B / 32В. Можно запустить локально Модели на HF Демо Гитхаб #coding #assistant

This media is not supported in your browser

VIEW IN TELEGRAM

Qwen2.5-Coder-Artifacts

Еще один демоспейс Qwen2.5-Coder
наподобие Claude artifacts

+ Qwen2.5-Coder 32B доступен в Hugging Chat

#coding #assistant

🔥4

1.46K views16:36

About

Blog

Apps

Platform