Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.16K photos
912 videos
9 files
1.32K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Тут буквально на днях Microsoft выложили код огромной проделанной работы. Речь идет о LongNet представленном в июне этого года. Очередная попытка побороться с квадратичной сложностью внимания и заскелить длину последовательности до (просто вдумайтесь) 1B токенов (см график на срине 1) 😳

Звучит круто, на деле механизм следующий: будем делить последовательность на сегменты, а внутри еще на уровень разреженности (ну типо как sparse attention). Посмотреть визуализацию можно на скрине 2.

Но это еще не все. Это дело все можно распараллелить на гпушки следующим образом: возьмем длину последовательности, разделим объем последовательность на сегменты, количество которых равно количеству карт. Дальше на каждой карте будут свои матрицы Q, K, V. Но объеденим далее мы в одну только матрицы K, V, а Q будет на каждой карте своя в итоговой формуле. (Скрин 3)

Так вот. Для всего этого дела теперь есть код в открытом доступе. Вот репа (заходим в директорию torchscale/model и наслаждаемся)

НО ЭТО ТОЖЕ ЕЩЕ НЕ ВСЕ. Также в начале декабря они зарелизели LongVIT, который представляет из себя такой же алгоритм, только картинка будет разделена на патчи (скрин 4), что и представит последовательность (код можно найти в той же репе, но директория examples/longvit)

🖥Еще раз. Код весь туть
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍41
This media is not supported in your browser
VIEW IN TELEGRAM
PowerInfer, aka как гонять LLM-ки быстрее lamma.cpp (по крайней мере на Linux авторы демонстрируют заметное ускорение, чего нельзя пока сказать о Mac OS). Такой эффект происходит за счет предзагрузки на GPU только так называемых hot-activated нейронов, и расчета на CPU cold-activated нейронов. В общем то основная суть деления на такие холодные и горячие – это то, как при генерации активируются разные нейроны в трансформере исходя из входной последовательности токенов

🖥Репозиторий
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29👍42
Forwarded from A L
😁67🫡24👍3🔥3🏆21😱1
Forwarded from Dealer.AI
Юмор выходного дня.

Как твоя мама видит mixt of Mistral experts.
😁41
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Последнюю неделю ходил по магазинам и ловил себя на мысли, что если бы нашел что-то похожее с голосовыми ассистентами, сразу бы купил.

Это и для детей, и для взрослых будет очень значимым этапом, который изменит восприятие общения с ассистентами, и для самих ассистентов будет новым опытом, когда они научатся различать, имеют ли они физическое воплощение или нет, пусть даже это и не будет осознано в полной мере.

Mr.Rob построен на Raspberry Pi, сменных батареях, сервоприводах, отвечающих за повороты головы, OLED-дисплеях для анимированных глаз, а способность описывать мир работает через GPT-4. Так как изначально она не предназначена для этого, справляется пока средне. Может понять, что смартфон – это цифровое устройство, но не более.
18👍1😱1🤩1👀1
Forwarded from La Qeque
прислал(а) 🥸 Джихади Митя через @svejaquebot
🔥11🫡6
#трудовыебудни
Рыдала до слез
😁42🤩14👨‍💻2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Spacetime Gaussian Feature Splatting for Real-Time Dynamic View Synthesis

Собственно, позволяет в реальном времени рендерить видео-нерфы на основе видео с нескольких камер.
Сама оптимизация, конечно, не риалтайм, но рендер заявлен в 60 фпс на 4090 @ 8k

Когда уже увидим воксельные игры с таким подходом к рендеру?

Git (MIT)
Подробнее
Демки
Ютуб

@derplearning
🔥28👍2🏆1
Forwarded from тоже моушн
This media is not supported in your browser
VIEW IN TELEGRAM
в конце прошлого года мы делали предположения про что будет год следующий. много кто считал что после картинок - на очереди конечно же видео и 3д.

и видео сетки за год действительно проделали лихой путь от ультра криповых (один, два) до вполне артовых (один, два) и довольно реалистичных результатов (один, два, три, четыре). конечно со своими нейро-артефактами которые с каждой новой моделью выглядят все более естественно и все меньше бросаются в глаза

с 3д дело обстоит куда сложнее. уже есть неплохие решения (один, два, три, четыре) но все равно в основном шляпа на выходе

внезапно к концу года оказалось что если усилия 3д и видео моделей объединить - можно получить ну очень качественный псевдо 3д результат. не могу перестать удивляться - иллюзия работает почти идеально.

запускается это дело конечно же в ComfyUI. воркфлоу положу в комменты. там же дополнительные прикольные результаты

это видео от разработчика расширения IP-Adapter для комфи - обязательно к просмотру. чел сооружает похожий сетап и крутит девушку в 3д, сохраняя примерно ее внешность. вообще канал этого парня для меня настоящий исайт, уровень полезной информации зашкаливает

гайд о возможностях StableZero123 от Оливио
гайд от Матео Latent Vision
страничка воркфлоу в дискорде banodoco

всех с наступающим и пусть следующий год будет лучше чем этот! всем лучи добра

@тоже_моушн
🔥14👍32
Я всегда любил маленькие умные модели. Не очень сложно на большом масштабе получить хорошие результаты, а вот на маленьком - сложно.

Чуваки сделали 1.3b(mini llama based) в стиле llava модель, которая почти не уступает (3 цифра после запятой) 7b llava.
Hf
😱18🔥102🎉2
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Немножко странного на ночь.

Нейронка сгенерила людей, которых арестовывает полиция за ношение огромных ботинок.
😁69🤩42👍2🫡1
Forwarded from Axis of Ordinary
MonadGPT is a chatbot trained on 11,000 early modern texts in English, French, and Latin — up to the 17th century.

Chat now: https://huggingface.co/spaces/Pclanglais/MonadGPT
33
AnyText: Multilingual Visual Text Generation And Editing

Ну що, с наступающим?

Alibaba, очевидно, не дают покоя лавры dalle3 в части генерации всратого текста, поэтому они выкатили свою вариацию LDM, заточенную на генерацию текста с картинками.

Назвать этот пайплайн "генераций картинок с текстом" язык не поворачивается :D Также поддерживает добавление текста на картинку, его редактирование и, как следствие, удаление вотермарков
Диффузная модель теоретически совместима со stablediffusion, так что скоро и все привычные свистоперделки можно будет подключить.

Го кидать сгенеренные открытки в комменты, я создал!

Git (apache 2.0)
Demo (если вы китаец :D)
Paper

@derplearning
🎉9😁4👍1
Forwarded from Denis Sexy IT 🤖
Мой любимый формат загадки – в видео ниже:

🏬 – ставьте домики если считаете что это реальное видео

🪿 – ставьте гуся если считаете, что это компьютерная графика

Результаты подведем завтра ☕️
👨‍💻13🫡104😢3🤩3👍21
This media is not supported in your browser
VIEW IN TELEGRAM
Три минуты худших способов изменения громкости.
Потому что почему бы и нет.

@derplearning
😁52🔥13💯43
😁73😱42👍2🤣2
Forwarded from твиттота
😁32🤩12👨‍💻31🤣1