NEW BOT Телеграм, страница - 264333088

Derp Learning

13.3K subscribers

3.27K photos

948 videos

9 files

1.38K links

Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Download Telegram

About

Blog

Apps

Platform

13.3K subscribers

Forwarded from эйай ньюз

⚡️Lightning Studio: Альтернатива Google Colab если хотите поиграться c модельками или заняться пет-проектом

Я тут случайно набрел на такую штуку. Не знал, что Lightning, та контора, что делает фреймворк Pytorch Lightning, ещё и пилит свою студию. По сути это онлайн среда для разработки и прототипирования deep-learning моделек. Тут все что нужно есть: и терминал, и VS Code, и ноутбуки, и удобный доступ к файловой системе и persitent хранилище (а не грёбаный google drive).

Фичи, которые есть тут, но нет в Google Colab:
- free persistent storage, то есть локальные файлы не пропадают, когда вы закрыли ноутбук
- free persistent environments
- unlimited background execution
- VSCode, PyCharm, (any IDE) integration

Дают бесплатно 22 гпу-часов (T4) в месяц, плюс можно докупить еще, если нужно. Платишь только за время, когда GPU активирована. Можно отмасштабировать и арендовать 8xA100, если нужно натренировать что-то серьезное.

https://lightning.ai/

@ai_newz

👍27🔥8❤1

3.96K views09:36

Хоть какая-то прикладная польза от этих ваших нейронок

❤44😁21🤩10👍3😢3

5.7K views12:01

Когда деплоишь в прод в пятницу вечером:

❤33😁22😱2💯2

5.99K views12:03

Forwarded from Zavtracast (Ярослав Ивус)

This media is not supported in your browser

VIEW IN TELEGRAM

На, программе для мониторинга Linux, htop запустили DOOM. Выглядит это как-то так.

Код уже лежит на GitHub.

@zavtracast

🔥49🤩8🏆4❤2👨‍💻2

4.96K views12:48

This media is not supported in your browser

VIEW IN TELEGRAM

Робопес, который всегда приземляется на свои четыре лапы. Или робокот?

@derplearning

😁24🔥10👍2😢2

4.99K views23:01

Forwarded from Dankest Memes // Данкест Мемс

This media is not supported in your browser

VIEW IN TELEGRAM

🤩20👀8👍3🔥3😱1

4.39K views07:19

Forwarded from CGIT_Vines (Marvin Heemeyer)

This media is not supported in your browser

VIEW IN TELEGRAM

Только что Tencent выкатил модель Instant Mesh, попробовать уже можно тут.

В отличие от остальных моделей, которых я, наверное, тонну перепробовал, в этой показан процесс генерации дополнительных ракурсов, т. к. модель на входе работает только с одним ракурсом и на основе дополнительных видов достраивает геометрию. Вполне неплохо держит контекст исходной картинки.

Прекрасно, дайте нам возможность управлять этими ракурсами, пусть мы сможем догенерировать с каждого вида то, что нам нужно. И раз геометрия почти на лету просчитывается, дайте возможность примитивами ее достраивать.

То, что сетка и текстуры такие мыльные, это вообще не проблема для демки, у нее задача другая. В целом это вообще не проблема, как вы понимаете.

👍19🔥4❤3

4.59K views06:38

Forwarded from Dankest Memes // Данкест Мемс

😁93👍9🤩5🔥4

4.68K views12:43

Forwarded from Dankest Memes // Данкест Мемс

😁74🔥7❤5👍1🤣1

4.29K views23:03

Когда открыл очередной китайский пейпер

😁45👍2🔥2

5.62K viewsedited 06:56

Забавный кейс.
Huggingface обычно сканирует модели, и предупреждает юзера, если это *.pkl с подозрительным кодом.
При этом через inference api эту модель можно запустить.

Что и проделали чюваки из WIZ Research (это те, кто недавно нашел на гитхабе 38тб приватных данных MicroSoft :D)
В итоге команде удалось получить доступ к шеллу, где крутилась модель, а затем чуть ли не ко всему инференс кластеру.
Дыру, конечно, закрыли еще до публикации поста, но существовала, она скорее всего, с момента появления inference api :D

Сидишь такой, профайлишь инференс, ищешь утечки памяти, а находишь майнер крипты.

Подробнее
Видео

@derplearning

Hugging Face works with Wiz to strengthen AI cloud security | Wiz Blog

Wiz researchers find architecture risks that may compromise AI-as-a-Service providers and risk customer data; works with Hugging Face on mitigations.

😁12❤4👍4

11K viewsedited 07:16

Media is too big

VIEW IN TELEGRAM

youtube

@derplearning

🔥19👀4❤3

5.14K views07:31

😁56🫡6

5.05K views09:29

Миллениалы изобрели git clone :D

😁54🤩2

4.53K views15:24

Joe Rogan sharing warp be like

😁15👍2

4.32K views19:10

Forwarded from эйай ньюз

LLM дайджест за неделю

LLaMa 3 - главная звезда недели, открытые веса, три размера: 8, 70 и 405 миллиардов параметров, последняя ещё тренируется, что не удивительно, ведь датасет для неё это 15 триллионов токенов. Попробовать можете тут, пока только с VPN или можете скачать квантизированные веса с Huggingface, но тогда у вас не будет прекрасной функции Imagine Flash, которую тренировал ваш покорный слуга (да, я).

Pile-T5 - у всех версий T5 довольно плохой токенизатор где отсутствует куча специальных символов, ребята из EleutherAI решили это пофиксить и заменили его токенизатором от второй ламы. Вышла модель чуть лучше базовой T5, но отстающая от FLAN файнтюнов. T5 – это рабочая лошадка, юзаемая как в проде бессчётного количества компаний, так и в новомодном ресёрче вроде SD3 и ReALM, так что пользы от такой "пофикшеной" версии будет немало. А ещё это напоминание что enc-dec модели живее всех живых.

Reka-Core - ещё один encoder-decoder от выходцев из Google, проприетарная модель на уровне примерно LLaMa 3 70B и ниже Gemini Ultra. Мультимодальная, кроме картинок умеет в видео и аудио. Её всё ещё тренируют, факт релиза сырой модели удивляет, походу у стартапа просто заканчиваются деньги. Цены API на уровне GPT-4 Turbo, так что непонятно кому это вообще нужно.

Mixtral 8x22B Instruct - тюн оригинального Mixtral 8x22B, который держал первое место среди открытых моделей по ряду бенчей вроде MMLU целых 26 часов, а потом случилась LLaMa 3.

RWKV EagleX v2 - модель без аттеншна перегнала LLaMA 2 7B и почти догнала Mistral 7B. При том, что на большей длине контекста она СИЛЬНО быстрее. Очень хорошо показывает себя на языках отличных от английского. Модель всё ещё тренируют (общая тема этого дайджеста), так что скорее всего Mistral они догонят.

Хочу отметить что за последние 30 дней рекорд по MMLU среди открытых моделей (который держала Mixtral 8x7B почти 4 месяца) били ПЯТЬ раз: Grok - 73.0%, DBRX - 73.7%, Command R - 75.7%, Mixtral Instruct - 77.75% и LLaMA 3 - 82.0%.

Как вам вообще такой формат дайджеста именно по LLM, стоит продолжать?

#дайджест
@ai_newz

эйай ньюз

🔥 LLaMa 3 конкретно ворвалась на лидерборд ChatBot Arena и уже бьет все существующие опенсорсные модели (даже Command R+, про Мистрали я вообще молчу).

И не только! Если брать запросы на английском языке, то LLaMa-3-70B-instruct уже рвет даже Claude 3 Opus…

👍49🔥13❤6

3.52K views16:36

Improving microbial phylogeny with citizen science within a mass-market video game

Наконец-то, статья, переплюнувшая статью Google Gemini по количеству контрибьюторов 😅

Если кратко - учёные, исследовавшие днк кишечной микрофлоры, запартнерились с gearbox и встроили в borderlands мини-игру, в которой игроки чинили реальные последовательности ДНК.

В итоге в мини-игру поиграло более 4 млн человек, решив 135 миллионов задач. Несложно прикинуть, сколько бы стоила обработка такого объема данных наемными людьми.
Вот это я понимаю краудсорсинг.

Образцы ДНК, кстати, были взяты из фекалий, чем можно объяснить повышенный интерес геймеров
/s

Пейпер

Improving microbial phylogeny with citizen science within a mass-market video game

Nature Biotechnology - Gamification of the multiple sequence alignment problem improves microbial phylogeny estimates.

🤩36🔥9👍7😁3🤗3❤2

23.6K viewsedited 20:19

😁59😱4❤3🤩2

4.63K views04:46

Forwarded from Dankest Memes // Данкест Мемс

😁71❤6🤩4

3.87K views16:36

Forwarded from эйай ньюз

Media is too big

VIEW IN TELEGRAM

Коротко о том, как развлекается кофаундер и CSO HuggingFace🤗

Чуваки сделали умного робота из ~~г*вна и палок~~ машинки на пульте управления и трёх open source нейронок:

Whisper - распознаёт речь.
Idefics2 - ЛЛМ с виженом.
Parler-TTS - голос робота.

Все под управлением Dora-CS, а компьют лежит на ноуте, но связь по безпроводу.

Назвали мило Немо😊

Малой неплохо так катается по офису, вроде как, даже знает, где кухня. На видео (лучше сами гляньте) один из разрабов вежливо просит привести ему кофе, но оказалось, что кофемашина на ремонте, о чем преданный четырёхколёсный отчитывается хозяину. А еще эта штука кажется понимает язык жестов и едет туда, куда ты тыкаешь.

Вот э тайм ту би алайв!

Твит
Код

@ai_newz

❤25👍6🤩2

3.21K views07:01

Forwarded from Zavtracast (Ярослав Ивус)

This media is not supported in your browser

VIEW IN TELEGRAM

Робот Thermonator, которого в прошлом году представила компания Throwflame, поступил в продажу.

Этот робопёс умеет пускать огненную струю на расстояние до 9 метров. Throwflame управляется по Wi-Fi/Bluetooth и работает от зарядки всего час.

Thermonator продаётся за $9420 на сайте компании.

@zavtracast

🔥28😱14🤣3

3.52K views13:53