Data Secrets – Telegram
Data Secrets
78.6K subscribers
6.36K photos
654 videos
20 files
2.65K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Forwarded from XOR
Ничего необычного, просто глава NVIDIA расписывается на груди фанатки.

Вот что бывает, когда капитализация твоей компании составляется $2,8 трлн.

@xor_journal
👍6933🔥12💅3🤯2
GPT-5 или все-таки ROBO-1?

OpenAI ищут в команду инженера-робототехника. Также напоминаем, что в прошлом году они заключили контракт с Figure AI, чтобы встроить GPT в роботов, разработанных стартапом.

Голос дали, пора бы и телом обзавестись
🔥4818👾82😁21
9 бывших и текущих сотрудников OpenAI публично требуют право в случае чего предупредить общественность об AGI

Они заявляют, что OpenAI ведет себя безрассудно в отношении AGI, оголтело летя впереди планеты всей.

Тем временем сотрудникам не разрешено не то что рассказывать о разработках компании, но и просто высказывать свое мнение о политике OpenAI. Иначе можно сказать «пока» всем своим акциям и, скорее всего, работе.

Сейчас сотрудники требуют обязать компанию прозрачно отчитываться о технологиях перед государством и разрешить ученым осведомлять общество о том, что на их взгляд может быть опасно.

Обожаю это чувство, как его… SkyNet
😁9714🔥87😨6👍5🙈5
Интересная ситуация произошла в Стэнфорде: там ученым пришлось извиняться перед китайцами за плагиат

Оказалось, что студенты скопипастили код из китайской MiniCPM-Llama3-V 2.5 для своего проекта Llama3-V. Вот и пришлось извинятся, хотя горе-ресерчеры утвеждают, что код писали вообще не они, а их коллега из университета Калифорнии, который сейчас не выходит на связь 😦

Медель выходила под флагом Стэнфордского университета, в соавторстве с несколькими профессорами, так что авторитет был подорван довольно сильно. Модель также пришлось удалить с Hugging Face. Да, жаль этих работяг.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8945😎4👍31
Accuracy: -1.5
😁1672915🎉3🤨1
Вышел долгожданный код для xLSTM! Это та самая недавняя взрывная архитектура от создателей LSTM, которая может стать альтернативой трансформеру.

Установить библиотеку и поиграться с xLSTM можно с помощью pip install xlstm.

Репозиторий с кодом тут.

А если вы до сих пор не разобрались с этой многообещающей моделью, то напоминаем, что у нас на сайте лежит ее подробный наглядный разбор: https://datasecrets.ru/articles/10
55🔥217👍2🍓2
This media is not supported in your browser
VIEW IN TELEGRAM
Студенты-дипломники, ну как там дела за пару дней до сдач?
🤝85😁46🔥10🗿74👍4👏2
⚡️ Тем временем Nvidia достигла капитализации в $3 триллиона, обогнала Apple и стала второй самой дорогой компанией в мире. Теперь компанию собирается проверить антимонопольная служба США.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁103🤯21👀148👍631
Кстати, кроме этого выпада группы сотрудников OpenAI случилось еще кое-что

Раньше в OpenAI в команде Суцкевера работал исследователь Леопольд Ашенбреннер. Пол года назад его уволили, якобы из-за утечки информации.

А на днях он дал интервью и рассказал, что на самом деле его уволили по другой причине: он критиковал компанию за небезопасное поведение.

Также Леопольд опубликовал кучастраничный отчет о состоянии ИИ. В нем он пишет, что AGI появится уже к 2027 году, и затем очень скоро превратиться в суперинтеллект, который будет опасен для человечества. “Для этого не нужно верить в фантастику, нужно лишь верить в прямые линии на графиках».

По его словам, уже сегодня компании перешли от $10 миллиардных вычислительных кластеров к $100 миллиардным и даже триллионным кластерам.

Пора бы OpenAI выходить на свет, а то общественности еще долго придется оценивать ситуацию по выкрикам отдельных исследователей
61🤯21👍104😁3🤓2🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Садимся снимать аниме – в опенсорс вышла модель ToonCraft, которая может сгенерировать мультипликацию по ключевым кадрам.

Она может "заполнить" ролик между двумя поданными кадрами, нарисовать мультик по скетчу и раскрасить анимацию по референсу.

Под капотом DynamiCrafter, которую зафайнтюнили на аниме. Для сохранения точного образа персонажей используется 3D-декодер.

Самое приятное: есть и статья, и демо, и код, и примеры – в общем все, что душе угодно.
5037👍12🤯4💅1
Stability AI опенсорснули часть функционала Stable Audio — нейросети для генерации музыки и звуков

Сеть обучена только на открытых данных, но ее, тем не менее, нельзя использовать в коммерческих целях. Да и работает она сильно обрезанно, по сравнению с закрытой версией: генерирует треки в четыре раза короче и не работает в режиме Audio2Audio.

Тем не менее, все что опенсорс, мы любим и уважаем (ну если только код не был "позаимствован", как у ребят из Стэнфорда).

Подробности и код для игр с моделькой оставили на сайте.
🔥13👍71
Google такие: «Нечестно, OpenAI специально сделали свою презентацию за день до нашей»
Также Google: опенсорсят конкурента Gradio прямо в день выхода новой версии

Gradio – это тулза для билда ML-приложений из ноутбуков или из проекта. Новый Mesop от Google – в точности то же самое. Даже лендинг похож на игру «найди 10 отличий».

Тем не менее, достойно внимания: гитхаб
32🤨11🕊6👍3💘2
Найден идеальный стул для программирования на… чем?

❤️ - PyTorch
👍 - TensorFlow
🔥- JAX
179👍117🔥58🙈123😁3
Forwarded from XOR
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Китайцы создали свой аналог SORA — Kling.

Что известно:

🟢Может снимать видео до двух минут с разрешением 1080p и 30 кадров в секунду. В Sora до одной минуты.

🟢Open Access

🟢Но воспользоваться пока нельзя

🟢Зато можно встать в лист ожидания. Так как сначала выпустят тест для небольшого количества пользователей

🟢Правда встать в лист ожидания сложно: нужно скачать китайское приложение «快影» и зарегистрироваться на китайский номер телефона. Что делаем? Учим язык?

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27😁136👍5🕊1🌭1
Vision-LSTM – новая фундаментальная CV-модель на основе xLSTM

Да, надстройки над xLSTM не заставили себя долго ждать. Vision-LSTM (ViL), в первую очередь, удивила всех скоростью. Модель быстрее, чем Vision-Mamba (тоже sequential модель) даже без ядр CUDA.

Под капотом: двунаправленные mLSTM блоки, которые обрабывают patch-токены изображения. При этом, в отличие от Vision-Mamba, где каждый блок обрабатывает последовательность сразу в двух направлениях, здесь направления чередуются между четными и нечетными блоками. За счет этого и скорость.

По метрикам на ImageNet1K тоже лучше, чем Vision-Mamba. Однако, как говорят сами авторы, так как оптимизированной реализации для xLSTM пока нет, для больших моделей все еще лучше подходит ViT (трансформер).

Выглядит многообещающе. Советуем прочитать статью полностью здесь. А еще авторы выложили код.
👍2710🔥10
Вау! Событие из красной книги: у OpenAI вышла статья с открытым кодом

В числе авторов Илья Суцкевер, и, как вы возможно уже поняли, статья про интерпретируемость. Подход идейно повторяет недавнюю работу Anthropic. Ресерчеры OpenAI также используют разреженный автоэнкодер и с помощью него выделяют в поведении модели "фичи" - интерпретируемые паттерны активаций (о них можно думать, как о темах).

Утверждается, однако, что заявленный подход масштабируется лучше, чем остальные существующие. Из GPT-4 удалось достать 16 миллионов фичей. Есть клевая визуализация. В опенсорсе показали подход на примере GPT-2.

Про управление фичами (в отличие от Anthropic) пока ничего особенного, оставляют на дальнейшие исследования.
26👍18🔥13
А что, просто пихать везде нейросети нельзя?
😁17636👍144
Apple решили, что теперь AI – это не Artificial Intelligence, а Apple Intelligence.

Да, именно так они назвали свою новую SIRI. Общество на такой гениальный ребрендинг отреагировало незамедлительно, и Интернет уже полон шуток – мы отобрали лучшие.

Новую систему AI в iOS 18 компания представит на конференции WWDC 2024, то есть через несколько дней.
😁8321🔥92👍2🤪1