NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

DeepSearch-1.5B

Модель для решения задач, требующих рассуждений и вычислений, новая #SOTA среди рассуждалок 1.5B параметров

На базе Nemotron-Research-Reasoning-Qwen-1.5B v2

Подходит для выполнения математических задач и решения логических головоломок, в образовательных и исследовательских целях, где требуется высокая точность и эффективность вычислений и оптимизация вычислительных ресурсов.

#assistant #reasoning

🔥8👍4

1.76K views14:03

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

TTT3R: 3D Reconstruction as Test-Time Training

Метод улучшения 3D реконструкции CUT3R с использованием Test-Time Training (#TTT)

Вдвое улучшает оценку глобальной позы по сравнению с базовой моделью.

Обрабатывает тысячи изображений со скоростью 20 кадров в секунду, используя 6 ГБ VRAM

Пир этом избегает «забывания» данных

Гитхаб

#image2scene #video2scene #videoto4d #scenereconstruction #4d #novelview #imageto3d #image2scene #video2scene

🔥11👍2

2.11K views15:18

Нейронавт | Нейросети в творчестве

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

Dreamina AI Avatars

Dreamina запустила функцию оживления портрета по звуку и промпту.
Работает с людьми, животными, аниме и др.
——————————————

А также делали бесплатный доступ к Seedream 4.0 до 9 октября.
Но только для правильных стран. Заходите через 3 буквы. Польша не подошла

#portraitanimation #characteranimation #avatar #speech2video #image2video #humanavatar #text2image

👍6

2.43K views16:19

Нейронавт | Нейросети в творчестве

#humor #robot

😁22👍2💯2👎1

1.92K views19:23

Нейронавт | Нейросети в творчестве

Kandinsky 5.0 Video Lite Сбер выпустил видеогенератор в опенсорс. 2B параметров, 768 x 512, до 10 сек Из особенностей стоит отметить что модель учитывает элементы русской культуры при генерации и формирует текст на английском языке. За всего 2B параметров…

Кстати у Кандинского 5 есть и воркфлоу который, говорят, не работает

#text2video #workflow

GitHub

Kandinsky-5/comfyui at main · ai-forever/Kandinsky-5

Kandinsky 5.0: A family of diffusion models for Video & Image generation - ai-forever/Kandinsky-5

1😁15🔥6❤3😱1

1.77K viewsedited 06:09

Нейронавт | Нейросети в творчестве

Мудрость из соседнего чата, проверить не могу ибо Соры у меня нет

Гайд: Как убрать водяной знак в Sora 2

Шаг 1: ➡️ Перейдите в веб-версию Sora ➡️ Нажмите «Use the Old Sora» (Использовать старую версию Sora)

Шаг 2:

➡️ Откройте раздел Activity Category (Активность)
➡️ Прямая ссылка:
sora.chatgpt.com/activity#sora

Шаг 3:

➡️ Выберите одно из ваших сгенерированных видео
➡️ Оно откроется в редакторе

Шаг 4:

➡️ В редакторе кликните правой кнопкой мыши и выберите нужный вариант

Способы сохранить видео:
✔️ Скопировать ссылку на видео
✔️ Сохранить видео напрямую

Спасибо @oxidizer05

Sora

Transform text and images into immersive videos. Animate stories, visualize ideas, and bring your concepts to life.

❤6👍5👨‍💻2🔥1

3.54K views07:11

Нейронавт | Нейросети в творчестве

SINQ: Sinkhorn-Normalized Quantization for LLMs

В Huawei придумали новый метод квантования языковых моделей, снижающий требования к ресурсам без потери качества. Может работать как с равномерной, так и с неравномерной квантизацией, а также сочетаться с методами калибровки или работать без калибровки.

Метод совместим с различными архитектурами моделей и не требует взаимодействия между слоями, его удалось применить например и к MoE. Прямо об этом не сказано, но архитектурная независимость, видимо, позволит применять его и к видео / аeдио/ картинко-генераторам

Короче говоря, есть надежда что видео (и прочие) генераторы ~~будут более лучше квантоваться~~ можно будет сжимать без потери качества чтобы впихнуть невпихуемое

#research #optimization

👍17❤2🔥2

2.27K viewsedited 08:11

Нейронавт | Нейросети в творчестве

Wan2_2-Animate-14B_fp8_scaled_e4m3fn_KJ_v2

Kijai выложил вторую версию скейленных весов Animate

Спасибо @muxastarikov

#image2video #video2video #characteranimation #chracterswap #faceswap

huggingface.co

Upload Wan2_2-Animate-14B_fp8_scaled_e4m3fn_KJ_v2.safetensors · Kijai/WanVideo_comfy_fp8_scaled at 0b4ddcf

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

❤9🔥2👍1

2K views10:13

Нейронавт | Нейросети в творчестве

2:34

Media is too big

VIEW IN TELEGRAM

Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation

И еще один видеогенератор на базе #WAN22

Создает видео со звуком, как VEO3. По тексту, по картинке.
Может создавать звуковые эффекты и музыку, соответствующие визуалу

Хронометраж 5 сек, 24 кадра в секунду, разрешением 720×720, с различными соотношениями сторон (9:16, 16:9, 1:1, и т.д.)

Обещают выпустить модель с повышенным разрешением, повысить хронометраж, дистилл для быстрого инференса и скрипты обучения.

Гитхаб
HF

Спасибо @m_franz

#text2video #image2video #AV #text2Av #image2AV #sfx

🔥13👍3❤1

2.11K views11:14

Нейронавт | Нейросети в творчестве

0:41

This media is not supported in your browser

VIEW IN TELEGRAM

Браузер Comet сделали доступным для всех

Для бесплатных пользователей есть лимиты на запросы.

При установке он даже не спрашивает куда установиться, сам выбирает куда прописаться и вам не докладывает куда. А у меня может диск С на последнем издыхании. Видимо, ИИ-браузеры не для тех кто ограничен в дисковом пространстве.

Далее при первом запуске пытается подмять под себя все - хочет стать главным браузером, начальником почты, календаря и т д. И несмотря на мой отказ сделать его царь-браузером на моем компе он умудрился стереть выбор браузера по умолчанию из системы! "Так не достанься же ты никому!" При попытке открыть вебстраницу винда забыла чем открывать.

Зная что есть способы ободрать вас как липу через ИИ-инъекцию в почте, я не рискнул. Из любопытства посмотрю что там удобного-полезного. Но доступы раздавать не собираюсь

Отдаться в руки Perplexity

#search #browser

😁11🤷‍♂5👍4

1.87K viewsedited 14:18

Нейронавт | Нейросети в творчестве

Qwen-Image-Edit-Pruning

Обрезанная версия #QIE
Вырезали из оригинальной версии 20 слоев, оставили 40, снизив тем самым количество параметров до 13.6B

Есть оригинальная Edit и Edit-2509

Qwen-Image-Pruning - такая же лоботомия #Qwenimage до 12.7B параметров

Qwen-Image-Pruning-for-ComfyUI - версия для экселя. Шучу, для комфи конечно

#optimization #imageediting #text2image

👍11

2.19K views16:19

Нейронавт | Нейросети в творчестве

#humor

😁36

2.95K views18:42

Нейронавт | Нейросети в творчестве

Годнота от подписчика @SashaMelentev — генерилка датасета из одной фотки

1.72K views07:11

Нейронавт | Нейросети в творчестве

Forwarded from Great Same New (Sasha Melentev)

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Dataset Maker

Для ИИ-актрисы создания этот ComfUI скрипт генерит в один присест из одной фотографии человека 104 другие фотографии этого же человека с разных ракурсов и в разном освещении. Вишенка на троте - скрипт еще делает описание каждой новой фотографии, что удобно для последующей тренировки лоры или fine-tune'a.
Сразу же указать триггерное слово тоже можно.

Под капотом:
- Qwen Edit меняет ракурс, потом происходит апскейл и деблюр - картинка становится "в фокусе", потом - разгон на детали для большего реализма.
- Описание генерится через Mistral, будет нужен свой токен на этом сайте.

Системный промт. Вместо trigger_word нужно вставить свой.

Describe the character in picture, describe the characteristics of the face, jewelry, clothing, hairstyle, pose, where they are looking. Make the character's name is [trigger_word]. For example, “this is a photo of trigger_word in a white blazer, with a glass in the hand against a backdrop of rocky mountains.”
Write your denoscription in one sentence, no more than 38 words.

Из одной фотографии, Карл! Скрипто в комментариях по ссылке:
https://news.1rj.ru/str/GreatSameNew/255?comment=744

#Tools

🔥20❤1

1.73K views07:11

About

Blog

Apps

Platform