NEW BOT Телеграм, страница - 603847522

Derp Learning

13.2K subscribers

3.25K photos

942 videos

9 files

1.37K links

Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Download Telegram

About

Blog

Apps

Platform

13.2K subscribers

Forwarded from Ай, Гитарист! [AI Guitarist]

Media is too big

VIEW IN TELEGRAM

Разоблачаю сам себя: как создаются нейрокаверы

Впервые за 3 года я показываю свой рабочий процесс — от гитары и вокала до финальной обработки нейросетями и в Ableton.
Никакой магии, только честный взгляд изнутри.

В этом видео:
▫️ как я записываю гитару и вокал
▫️ где и зачем использую нейросети (RVC и др.)
▫️ как свожу трек в Ableton
▫️ почему ИИ — это всего лишь инструмент, как гитара или синтезатор

Поддержать мой проект и получить эксклюзивные материалы можно на Boosty: https://boosty.to/aigitarist/posts/143c72ce-a030-4d83-8465-6ae0445c21b2?share=success_publish_link

👇 Пишите в комментариях, что думаете о таком «закулисье» и какие темы разобрать в следующих видео!

https://youtu.be/1gDZwmvP0sk

#айгитарист #нейрокавер #aicover

🔥13🤡2❤1

4.62K views10:04

Forwarded from Just links

https://fixupx.com/Haoyu_Xiong_/status/1972480880192217260

Haoyu Xiong (@Haoyu_Xiong_)

Wow I gave Gemini Robotics my card (unseen) and asked it to pick it up.

🔥21❤3🎉2

3.91K views09:46

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

Новости от Хуньяньского

HunyuanImage 3.0

Тут есть две пачки новостей, хорошая и плохая.

Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0

Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)

Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.

HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.

В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.

Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность

Все это я проверил на ОДНОМ примере.

Вместо промпта написал ей:

solve this:
8x + 10 = 18
and make picture with soulution

Результат вы видите в шапке поста. Впечатляет.

Черрипики на сайте
https://hunyuan.tencent.com/image/en?tabIndex=0
довольно мощные, но давайте навалимся и протестируем сами (ссылка на fal.ai).

В общем выглядит прельстивейше.

А теперь Чорные Новости:

Нет (пока) image2image
Нет (пока) VLLM
Веса весят (пардон) СТО СЕМЬДЕСЯТ ГИГОВ

Ну и самое горькое: для запуска вам понадобится ЧЕТЫРЕ карты по 80GB VRAM КАЖДАЯ (4х80GB VRAM)

Там вроде MoE c 64 экспертами юзают не все 80B параметров, а только 13B активных. Ждем оптимизаций, выгрузок, и нам также обещаны дистиллированные веса (тут мы такие - дистилят для слабаков и плохого качества)

То есть это вроде бы опен сорс, но не для людей, а для олигархов с видеосерверами на 320GB VRAM на кухне.
Предлагаю называть это элитный опен сорс.

Отзывы в твитторах противоречивые. Есть проблемы с анатомией и текстурой кожи, но надо пробовать самим.

А вообще Хунь, в отличие от Алибабы и Квена, любит бахнуть на Гитхаб сырой код, огромные веса, формальное описание типа "мы смогли, а вы держитесь"

Пока тестируем на агрегаторах.

@cgevent

❤14🔥6🤩3👍2👨‍💻2🤗1

4.25K views10:58

Forwarded from Dev Meme / devmeme

We surely have a timeline where this is real

🫡37

4.46K views13:42

Forwarded from Dev Meme / devmeme

🤣70😁13🔥7😢3

4.66K views06:22

Forwarded from Neural Shit

Лайфхак

1🔥63😁26🤡14🤣7🤬4❤2😱1

3.94K views03:04

Forwarded from AI для Всех

F9K2DM

Если вы хотели попробовать Sora 2, но не знали где взять инвайт, то вот вам код от исследователя из команды Sora, для первых 10.000 человек

👍12🤡9❤1

4.66K views17:15

Forwarded from r/ретранслятор

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Пользователи выяснили, что Sora 2 генерирует очень реалистичные видео, но при этом совершенно не может показать человека, который садится в машину.

Видеографы могут спать спокойно. Пока могут
r/#OpenAI

😁91❤3👍1

5.82K views07:46

Forwarded from Dev Meme / devmeme

😁54👍5😱2

5.37K views16:37

😁67💯9😢3😎3

10.8K views15:02

https://www.cnbc.com/2025/10/04/sora-openai-video-app.html

vibe infringement

AI Sam Altman and the Sora copyright gamble: 'I hope Nintendo doesn't sue us'

CNBC has seen videos of characters from shows like "SpongeBob SquarePants" on the platform and was able to independently generate other characters.

😁18

5.11K views09:17

Forwarded from Dev Meme / devmeme

😁76💯17❤2🔥1

4.38K views08:35

Forwarded from ∏ρØƒuñçτØρ Øπτµç∑ | 👁‍🗨››››

🤣45❤3😁2🤡2🔥1😱1

5.17K views15:56

Forwarded from Denis Sexy IT 🤖

Полезный сервис (не очень), который добавляет вотермарки Sora на любое видео что вы туда загрузите:
https://soramarker.t3.gg

Потому что мы живем в мире пост иронии, ее нужно множить ☕️

Please open Telegram to view this post

VIEW IN TELEGRAM

😁76😢2🤡2🫡2👍1🔥1🤩1

4.91K views07:15

Forwarded from Fast Food Memes / ffmemes

Мемы не для слабых: 🍔🍔🍔

🔥59😁51❤7😱1

5.66K views07:28

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

Ну, за драматургов!

Королевская опера Версальского дворца в 2026 году представит спектакль по пьесе, написанной искусственным интеллектом. Она будет создана в стиле французского драматурга Мольера.

Пьеса «Астролог, или Ложные предсказания» находится на стадии написания. Взяли Mistal и ну учить его на пьесах Мольера. Премьера ожидается 5 и 6 мая 2026 года.

@cgevent

😱14🤡14❤5🤣5

4.49K views08:03

🤣98😁16❤4

5.12K views19:53

Forwarded from Neural Shit

This media is not supported in your browser

VIEW IN TELEGRAM

Китайцы используют робо-собак по максимуму.

Просто посмотрите насколько счастливы дети

видео отсюда

❤62🔥10👀5

3.82K views20:39