Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Чит-лист по теории вероятности и статистике

Им поделился с нами подписчик в предложке (@data_secrets_bot), и тут есть почти все, от определения вероятности до характеристических функций распределений и ЦПТ. Основные распределения, теоремы, определения, формулы – одним словом прелесть.

В общем, мы уже печатаем и вешаем на стенку, а вы?

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45🔥14👏52
Про неочевидные тонкости обучения для несбалансированных классов

В задаче классификации данные называются несбалансированными (Imbalanced Data), если в обучающей выборке доли объектов разных классов существенно различаются, также говорят, что «классы не сбалансированы». Вопрос вот какой: что делать в такой ситуации?

Такой вопрос часто задают на собеседованиях, есть блог-заметки и ютуб-ролики на эту тему, почти все они дают ложное представление о дисбалансе. Обычно рекомендуют давать такой ответ – надо сделать перебалансировку данных. Сейчас поговорим о том, что подобный ответ не учитывает теорию и практику классификации.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍334
Cоздатель «Черного зеркала» Чарли Брукер дал интервью об искусственном интеллекте

Автор: Ник Чен
Ccылка вот

Главное: «Photoshop не заменил художников; он стал мощным инструментом для них. Это баланс, который мы пытаемся найти. Вы не можете засунуть джинна обратно в бутылку — Chat GPT должен cуществовать в руках писателей, а не отдельно от них. К тому же, он не умеет шутить». И еще много интересных высказываний. В общем, советуем.

😻 #advice #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🤯3😁1
Про решающие деревья

Все, что нужно знать, уложили в 8 карточек

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🔥108😁1😇1
Зацените, как люди любят визуализацию: нашли в Твиттере аналитика Ewa Tuteja, которая сама связала датавиз и пометила пост прикольным тегом #DressYourHouseInData

😻 #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47🔥12😁119🤯5
А вы знаете, что такое пирамида признаков? А трансформеры (нет, мы не про фильм)?

Это термины, которые используют инженеры, работающие с нейронными сетями! Мы их нашли в канале ИТ-компании «Криптонит» — подписывайтесь на ребят! У них выходят материалы и про ML, и про роботов, и про программирование.

А ниже мы выбрали несколько терминов из их нейрословаря🟡

📍Explaining Away эффект редукции причины как упрощённая схема рассуждений.

📍Инференс (inference) с точки зрения разработчика это третий этап жизненного цикла искусственной нейронной сети (после её обучения и развёртывания).

📍Многослойный перцептрон (MLP) — это одна из элементарных архитектур, с которой часто начинают освоение нейронных сетей и принципов их обучения.

📍Пирамида признаков (FPN, Feature Pyramid Net) — это вычислительная архитектура, используемая в машинном зрении для обработки изображений без привязки к их разрешению.

📍Трансформеры (transformers) — это не только роботы, но и прогрессивное семейство архитектур нейросетей от Google.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🤯2🙈1
Конфигурационные файлы и бибиотека Hydra

В проектах по машинному обучению параметры файлов часто меняются. Когда проект маленький – это еще терпимо, но вот когда кодовая база растет, появляются проблемы. Поэтому самые крутые из нас используют конфиги.

Мы кратко рассказали, что это такое, пробежались по основной библиотеке для работы с ними, упомянули все полезные фичи и объяснили, как их использовать. Кстати, вот открытый код либы и ее документация.

#python
👍26🔥124😁1