Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Meta показали свой новый чип MTIA (Meta Training and Inference Accelerator)

Говорят, он гораздо производительней первой версии, которая вышла год назад. На этом чипе Meta, как сказано в статье, уже может крутить свои рексисы, а это дорогого стоит.

На сайте можно интерактивно поиграть 3D модельками и схемами и почитать подробности.

Зачем покупать у Nvidia, когда можно сделать самим?
👍227🤯6🔥3
Неоднозначные новости: на NeurIPS 2024 будет принимать работы старшеклассников.

Мнения сообщества разделились:

Одни говорят, что это правильный шаг и даст школьникам возможность выделиться и поступить в хороший вуз. К тому же, статья не предполагает быть глубоко-технической, это должно быть исследование про влияние AI на общество.

– Другие настаивают, что написание детьми настоящих научных статей не только бессмысленно, но и нечестно по отношению к самим школьникам: одни, пользуясь знаниями родителей и учителей, могут несправедливо получить преимущество. Тем самым, крысиные бега при поступлении только усилятся, как и пустая шумиха вокруг AI.

А вы что думаете?
❤️ - здорово
🗿- не здорово
🗿29857👍2
Data Secrets
Пу-пу-пуууу, больше не первые, получается
Ну и что вы думаете? OpenAI снова первые в лидерборде со своим новым обновленным GPT-4. Недолго радовались Anthropic.

Создается небольшое ощущение дразнилок со стороны сами знаете кого, хотя возможно корпорации просто уж очень важен факт первенства
🔥447👍4😁4
Тут вышла статья, в которой авторы замерили способность LLM (без дообучения) решать задачи классического ML и, в частности, строить регрессию.

Зацените результаты на графике.

Бустинг закурил в сторонке.
🤯6312🔥7😁2👍1🥰1
Meta наступает на грабли всех генераторов изображений: на этот раз сетка не может себе представить пару, в которой люди разных рас.

Это заметили в сети: репортер The Verge кучу раз пытался сгенерировать такую пару, но генератор так и не поддался.

Это, кстати, именно тот генератор, который компания пытается развернуть в Instagram. Кроме него, они также внедряют туда поиск на основе ИИ.
😁51🌚6🤓6👍3🕊3🔥2
Где взять данные? Этим вопросом хотя бы однажды задавался каждый из нас. Итак, подборка дата-ресурсов от редакции:

1. Kaggle. Не нуждается в представлении. Тысячи бесплатных датасетов.

2. Awesome Data Github репозиторий. Список открытых наборов данных с прямыми ссылками на скачивание. Есть данные с видео, картинками, аудио, и вообще со всем.

3. Open ML. 20k+ датасетов. Есть библиотеки для Python и R.

4. Open Data Registry от AWS. Тут есть некоторые датасеты, которых больше нигде не найти.

5. Papers with Code. Краш подборки. Почти 10k датасетов, которые использовались в реальных исследованиях.

6. Dagshub. Непопулярно, но иногда полезно. Датасеты удобно поделены по областям применения (NLP, CV, пр.)

7. Hugging Face. Также не нуждается в представлении. На данный момент там 80k+ датасетов.

Пользуйтесь и пилите свои мега-проекты!
👍54🔥159👏1🍾1
Media is too big
VIEW IN TELEGRAM
Туториал по AI, который мы заслужили
😁58🥰17💋8🦄7💅6🙈4❤‍🔥3
Пока Яндекс музыка развлекается с цветовым сопровождением приложения, подстраивающимся под трек, в Spotify запускают AI плейлисты

Приложение будет подбирать композиции в плейлист по текстовому запросу. В промпте можно указать жанр и ситуацию, под которую нужна музыка. Пока тестируют в бета-версии.

Осталось ко всему этому еще прикрутить LoudlyAI, которая генерит ИИ-музыку, и будет красота
👍35🔥11😁92👌1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
Рубрика «исследования, которые мы заслужили»: ученые из Мэрилэнда изобрели мантию-невидимку 21 века

Ладно, на самом деле это не мантия, а свитер. Надев его, человек за счет хитрых узоров становится невидимым для большинства методов детекции. Мы поискали, на алиэкспресс пока нет(

Если серьезно: делалось это, конечно, не по приколу, а чтобы изучить так называемые adversarial атаки на детекторы, и в будущем улучшить существующие модели.

Статья
🔥65👍1110🤔2🤨2
Data Secrets
Неоднозначные новости: на NeurIPS 2024 будет принимать работы старшеклассников. Мнения сообщества разделились: – Одни говорят, что это правильный шаг и даст школьникам возможность выделиться и поступить в хороший вуз. К тому же, статья не предполагает…
Подготовка к NeurlPS 2024 идет полным ходом 👆

* напоминаем, что недавно появилась новость о том, что в этом году на конференцию допустят работы школьников
Please open Telegram to view this post
VIEW IN TELEGRAM
😁68🔥10👍8🤯7🥰2
Лайф рулс в стиле Дурова от Андрея Карпаты ☝️

Недавно я попробовал просыпаться и сразу идти работать. Ничего не проверяйте — ни сообщений, ни электронной почты, ни новостей, ничего. Я это не до конца понимаю, но есть что-то разрушительное в «проверке» внешнего мира. Это загружает оперативную память множеством отвлекающих факторов, и внимание не может должным образом сосредоточиться на работе. Через несколько часов пообедайте и, по желанию, проверьте внешний мир.


Завтра рабочая неделя. Пробовать будем?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍146💯31🗿117🔥7🤪2🍌1
Сегодняшняя традиционная задача (то ли на знание теории вероятностей, то ли на проверку моральных принципов):

Два равносильных игрока договорились играть до шести побед. На кону – 80 монет, которые должен получить победитель. При счете 5:3 серию игр пришлось прервать. Как честно разделить 80 монет?


Ждем голоса вашей совести в комментариях 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔19🤯6🔥5👍1
Зацените, какой постер для фанатов нарисовали твиттерские режиссеры

Скоро, на всех экранах
😁65🤯10👍72💅2🔥1😨1
Неожиданный поворот произошел с OpenAI. Их антивоенная идеалогия тихо сменилась милитаризмом. Но журналисты из The Intercept не дремлют. Следим за ходом событий:

🔑 В 2023 году в октябре состоялся учебный семинар Министерства обороны по ИИ-грамотности, на котором Microsoft провели презентацию "GenerativeAl with DoD Data" с общим содержанием о том, как Пентагон может использовать инструменты ML OpenAI, включая ChatGPT и DALL-E. Начиная от анализа документов и заканчивая обслуживанием машин. На тот момент пресс-секретарь OpenAI Лиз Буржус говорит, что OpenAI не участвовала в презентации Microsoft и что она не продала никаких инструментов Министерству обороны.

🔑 В начале января этого года OpenAI тихо удалил пункт, прямо запрещающий использование его технологии в военных целях, из своей политики. После этого вице-президент OpenAI по глобальным вопросам, Анна Маканджу, сообщила Bloomberg о начале сотрудничества с Пентагоном, отмечая, что некоторые случаи использования инструментов OpenAI для обеспечения национальной безопасности, в целом, соответствуют миссии компании.

🔑 Почему это стало важно сейчас? На днях независимый журналист Джек Поулсон опубликовал детальное расследование презентации Microsoft. Один пункт в разделе "Продвинутое обучение компьютерному зрению" гласит: "Системы управления боями: использование моделей DALL-E для создания изображений для обучения систем управления боями".

Ситуация классическая: новые технологии -> бежим применять в военном деле.
Please open Telegram to view this post
VIEW IN TELEGRAM
🕊47🫡20🗿12😨10🤯3🌚3👍2😐2😁1🐳1🙈1
Вчера в нашем чате активно обсуждалось, стоит ли все-таки учить PyTorch или TensorFlow. Для тех, кто выбирает первый вариант, наш сегодняшний гайд по изучению торча:

1) Первым делом стоит изучить прекрасный туториал для бегинеров от самого торча: там вы найдете базовую информацию о тензорах, датасетах и даталодерах, training лупах и др. Еще есть в виде сериала на YouTube.

2) Посмотрите на примеры. Их можно найти в ноутбуках на Kaggle по поиску или вот тут, в туториалах торча. Там вы найдете точно правильно и чисто написанный код, так еще и с объяснениями.

3) Все, что было до этого - это 10% усилий. Остальные 90% - это практика. Заходите на Kaggle, ищете соревнование, в котором можно применить сеточки, и вперед!
👍4111🔥8👏3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Концепцию сверточных нейросетей предложил Ян Лекун в 1988 году. Это было 36 лет назад!

Мы обнаружили знаковое видео, на котором молодой Лекун в 1989 демонстрирует, как его сеть распознает цифры в различном стиле написания.
👍153🔥6818👏5❤‍🔥4👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Сэм Альтман в своем свежем интервью отвечает на вопрос «Как много стартапов еще убьет OpenAI»

Если кратко: есть два варианта развития событий. Первый: модели OpenAI больше не развиваются, и те стартапы, которые занимались надстройками над моделью, живут и радуются.

Второй (который случится со слов Сэма с 95% вероятностью) : модели развиваются, появляется GPT-5, стартапы из варианта один – банкроты. Выживут только те, кто получает тем больше, чем лучше модели выпускает OpenAI.

«Это не потому что мы кого-то недолюбливаем, просто у нас есть миссия»


Выдал базу.
👍68😁24🔥92
This media is not supported in your browser
VIEW IN TELEGRAM
До сих пор не понимаете, как обучаются LLM? Мы нашли для вас самое прозрачное видео-объяснение.

Претрейн, прогон на бенчмарке, Reinforcement Learning from Human Feedback – все по полочкам
🔥61😁44👍12🗿7
Вышел WizardLM 2, но есть один нюанс 🤡

Вообще, у ребят все круто: модель демонстрирует высокий перформанс, есть открытые веса и другие радости.

WizardLM-2 8x22B вообще по качеству сравнима с GPT-4-1106-preview. Модель на 70B - SOTA на своем размере, а 7B даже достигает метрик, сравнимых с ведущими опенсорс моделями, в 10 раз более крупными.

Но есть одно НО: модель пришлось отовсюду удались, потому что она не прошла элементарный тест на токсичность. Теперь ресерчеры в режиме турбо исправляют ситуацию и обещают скоро все перевыложить.

Пока что смотрим на 404
😁36🔥14👍4🤪31🤓1