NEW BOT Телеграм, страница - 498515999

Derp Learning

13.2K subscribers

3.26K photos

944 videos

9 files

1.37K links

Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Download Telegram

About

Blog

Apps

Platform

13.2K subscribers

Forwarded from что-то на DL-ском

Тут буквально на днях Microsoft выложили код огромной проделанной работы. Речь идет о LongNet представленном в июне этого года. Очередная попытка побороться с квадратичной сложностью внимания и заскелить длину последовательности до (просто вдумайтесь) 1B токенов (см график на срине 1) 😳

Звучит круто, на деле механизм следующий: будем делить последовательность на сегменты, а внутри еще на уровень разреженности (ну типо как sparse attention). Посмотреть визуализацию можно на скрине 2.

Но это еще не все. Это дело все можно распараллелить на гпушки следующим образом: возьмем длину последовательности, разделим объем последовательность на сегменты, количество которых равно количеству карт. Дальше на каждой карте будут свои матрицы Q, K, V. Но объеденим далее мы в одну только матрицы K, V, а Q будет на каждой карте своя в итоговой формуле. (Скрин 3)

Так вот. Для всего этого дела теперь есть код в открытом доступе. Вот репа (заходим в директорию torchscale/model и наслаждаемся)

НО ЭТО ТОЖЕ ЕЩЕ НЕ ВСЕ. Также в начале декабря они зарелизели LongVIT, который представляет из себя такой же алгоритм, только картинка будет разделена на патчи (скрин 4), что и представит последовательность (код можно найти в той же репе, но директория examples/longvit)

🖥Еще раз. Код весь туть

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥15👍4❤1

3.22K views15:58

Forwarded from что-то на DL-ском

This media is not supported in your browser

VIEW IN TELEGRAM

PowerInfer, aka как гонять LLM-ки быстрее lamma.cpp (по крайней мере на Linux авторы демонстрируют заметное ускорение, чего нельзя пока сказать о Mac OS). Такой эффект происходит за счет предзагрузки на GPU только так называемых hot-activated нейронов, и расчета на CPU cold-activated нейронов. В общем то основная суть деления на такие холодные и горячие – это то, как при генерации активируются разные нейроны в трансформере исходя из входной последовательности токенов ⏰

🖥

Репозиторий

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥29👍4❤2

3.49K views12:08

Forwarded from A L

😁67🫡24👍3🔥3🏆2❤1😱1

11.1K views15:08

Forwarded from Dealer.AI

Юмор выходного дня.

Как твоя мама видит mixt of Mistral experts.

😁41

3.78K views19:49

Forwarded from CGIT_Vines (Marvin Heemeyer)

This media is not supported in your browser

VIEW IN TELEGRAM

Последнюю неделю ходил по магазинам и ловил себя на мысли, что если бы нашел что-то похожее с голосовыми ассистентами, сразу бы купил.

Это и для детей, и для взрослых будет очень значимым этапом, который изменит восприятие общения с ассистентами, и для самих ассистентов будет новым опытом, когда они научатся различать, имеют ли они физическое воплощение или нет, пусть даже это и не будет осознано в полной мере.

Mr.Rob построен на Raspberry Pi, сменных батареях, сервоприводах, отвечающих за повороты головы, OLED-дисплеях для анимированных глаз, а способность описывать мир работает через GPT-4. Так как изначально она не предназначена для этого, справляется пока средне. Может понять, что смартфон – это цифровое устройство, но не более.

❤18👍1😱1🤩1👀1

3.96K views05:05

Forwarded from La Qeque

прислал(а) 🥸 Джихади Митя через @svejaquebot

🔥11🫡6

3.44K views07:34

Forwarded from Mashkka про Data Science

#трудовыебудни
Рыдала до слез

😁42🤩14👨‍💻2👍1

3.08K views07:11

This media is not supported in your browser

VIEW IN TELEGRAM

Spacetime Gaussian Feature Splatting for Real-Time Dynamic View Synthesis

Собственно, позволяет в реальном времени рендерить видео-нерфы на основе видео с нескольких камер.
Сама оптимизация, конечно, не риалтайм, но рендер заявлен в 60 фпс на 4090 @ 8k

Когда уже увидим воксельные игры с таким подходом к рендеру?

Git (MIT)
Подробнее
Демки
Ютуб

@derplearning

🔥28👍2🏆1

3.59K viewsedited 07:55

Forwarded from тоже моушн

This media is not supported in your browser

VIEW IN TELEGRAM

в конце прошлого года мы делали предположения про что будет год следующий. много кто считал что после картинок - на очереди конечно же видео и 3д.

и видео сетки за год действительно проделали лихой путь от ультра криповых (один, два) до вполне артовых (один, два) и довольно реалистичных результатов (один, два, три, четыре). конечно со своими нейро-артефактами которые с каждой новой моделью выглядят все более естественно и все меньше бросаются в глаза

с 3д дело обстоит куда сложнее. уже есть неплохие решения (один, два, три, четыре) но все равно в основном шляпа на выходе

внезапно к концу года оказалось что если усилия 3д и видео моделей объединить - можно получить ну очень качественный псевдо 3д результат. не могу перестать удивляться - иллюзия работает почти идеально.

запускается это дело конечно же в ComfyUI. воркфлоу положу в комменты. там же дополнительные прикольные результаты

это видео от разработчика расширения IP-Adapter для комфи - обязательно к просмотру. чел сооружает похожий сетап и крутит девушку в 3д, сохраняя примерно ее внешность. вообще канал этого парня для меня настоящий исайт, уровень полезной информации зашкаливает

гайд о возможностях StableZero123 от Оливио
гайд от Матео Latent Vision
страничка воркфлоу в дискорде banodoco

всех с наступающим и пусть следующий год будет лучше чем этот! всем лучи добра

@тоже_моушн

🔥14👍3❤2

2.89K views10:58

Forwarded from Love. Death. Transformers.

Я всегда любил маленькие умные модели. Не очень сложно на большом масштабе получить хорошие результаты, а вот на маленьком - сложно.

Чуваки сделали 1.3b(mini llama based) в стиле llava модель, которая почти не уступает (3 цифра после запятой) 7b llava.
Hf

😱18🔥10❤2🎉2

2.87K views12:49

Forwarded from Neural Shit

This media is not supported in your browser

VIEW IN TELEGRAM

Немножко странного на ночь.

Нейронка сгенерила людей, которых арестовывает полиция за ношение огромных ботинок.

😁69🤩4❤2👍2🫡1

3.05K views02:56

Forwarded from Axis of Ordinary

MonadGPT is a chatbot trained on 11,000 early modern texts in English, French, and Latin — up to the 17th century.

Chat now: https://huggingface.co/spaces/Pclanglais/MonadGPT

❤33

3.45K views15:51

AnyText: Multilingual Visual Text Generation And Editing

Ну що, с наступающим?

Alibaba, очевидно, не дают покоя лавры dalle3 в части генерации ~~всратого~~ текста, поэтому они выкатили свою вариацию LDM, заточенную на генерацию текста с картинками.

Назвать этот пайплайн "генераций картинок с текстом" язык не поворачивается :D Также поддерживает добавление текста на картинку, его редактирование и, как следствие, удаление вотермарков
Диффузная модель теоретически совместима со stablediffusion, так что скоро и все привычные свистоперделки можно будет подключить.

Го кидать сгенеренные открытки в комменты, я создал!

Git (apache 2.0)
Demo (если вы китаец :D)
Paper

@derplearning

🎉9😁4👍1

3.72K views09:10

Forwarded from Denis Sexy IT 🤖

Мой любимый формат загадки – в видео ниже:

🏬 – ставьте домики если считаете что это реальное видео

🪿 – ставьте гуся если считаете, что это компьютерная графика

Результаты подведем завтра ☕️

👨‍💻13🫡10❤4😢3🤩3👍2⚡1

2.52K views08:01

This media is not supported in your browser

VIEW IN TELEGRAM

Три минуты худших способов изменения громкости.
Потому что почему бы и нет.

@derplearning

😁52🔥13💯4❤3

3.69K viewsedited 02:55

Forwarded from Love. Death. Transformers.

😁73😱4❤2👍2🤣2

1.91K views08:52

Forwarded from твиттота

😁32🤩12👨‍💻3❤1🤣1

2.9K views16:09