Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
💬 В блоге рассматривается создание сверточной нейронной сети (CNN) для локализации и классификации объектов. Автор затрагивает темы, такие как архитектура модели для регрессии и классификации, обучение модели и оценка performance metrics, таких как  loss, accuracy и среднee пересечение по объединению (IoU).
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤‍🔥3🔥3
⌨️ Проблема профессионала

После успешного путешествия по кривой Даннинга-Крюгера взгляд человека безвозвратно меняется и утрачивает особенности восприятия новичков на пике глупости или более опытных товарищей.

Часто профессионалы не могут разглядеть и осознать проблему, которая очевидна любому новичку, именно в силу своего опыта и пройденного пути.

Помнить об этой особенности восприятия полезно всегда, но особенно — при создании или работе с продуктом для широкой аудитории.

К примеру, условно, сеньёр, который мастерски создает модели для распознавания собак и кошек, может случайно упустить детальную разметку данных, если он решит приступить к распознаванию редких видов бабочек. В то время как джун, который недавно за этого били на курсах, может более ярко осознавать, что правильная разметка данных важна для успешного обучения модели в новой области, где бабочки становятся объектом внимания.

Ваш @dataminingteam🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13❤‍🔥2
🔆 Обзор эффективной архитектуры трансформера в обработке речи, её способности обрабатывать последовательные данные, применение в задачах, таких как распознавание речи и синтез текста в речь, использование self-attention слоев, методы предварительного обучения, гибридные модели, механизмы внимания, регулирование длины в TTS, аугментация данных для мультиязычных систем и этические аспекты внедрения систем обработки речи с трансформерами.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳4❤‍🔥1🔥1
💎 Автор представляет реализацию алгоритма выбора признаков на основе корреляции на Python с целью уменьшения размерности набора данных с 500 признаками до подмножества из 48 признаков.

🔗 Алгоритм применяется к данным Madelon, что приводит к существенному сокращению времени обучения и оценки с 40 секунд до примерно 6 секунд. Более того, процесс выбора признаков повышает точность модели метода опорных векторов (SVM) с 50% до примерно 66.5% при использовании кросс-валидации с 10 блоками.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤‍🔥1
Как уволиться правильно?

Когда ты решаешь покинуть команду, важно делать это с уважением и грамотно. Вот 4 примера как НЕ НАДО уходить:

🔠 Забывает передать важные дела, оставляя команду в неведении. А зачем объяснять им о текущем состоянии проектов, да? Сами разберутся😎

🔠 Создает неприятную атмосферу, не обращая внимание на эмоции команды при уходе. Когда уходит — ему всё равно, что он грубо сообщил об этом или что половины команды не было, когда он говорил об этом. Who cares, узнают от других как-нибудь, обычное дело.

🔠 Не поддерживает слаженную работу процессов после ухода. Отсутствие замены и поддержки процессов на последних этапах.

🔠 Оставляет много неопределенности по вопросам замены и переходного периода. Нежелание ответить на вопросы команды и предоставить четкий план.

Ваш @dataminingteam👋
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
🔴В работе представлен метод proxBoost, который значительно улучшает стандартные результаты стохастической выпуклой оптимизации, обеспечивая высокую вероятность достижения глобального минимума.

➡️Метод применим к широкому классу алгоритмов стохастической оптимизации для сильно выпуклых задач с дополнительной стоимостью, логарифмической по уровню уверенности и полилогарифмической по числу обусловленности. 
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤‍🔥2
😁145❤‍🔥4
🧬 Интуитивное объяснение дивергенции Кульбака-Лейблера, исследуя концепции, такие как самоинформация и энтропия, и применяя их к опросу о количестве растений в доме.

🔗Автор эффективно разъясняет сложные идеи, используя примеры, такие как нечестная монета и опрос о растениях. В заключении подчеркивается асимметрия дивергенции Кульбака-Лейблера, и предлагается рассмотреть дивергенцию Йенсена-Шеннона для симметричного измерения.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤‍🔥2
Поделись котиком с друзьями
❤‍🔥13
хайер скул оф мемс
Поделись котиком с друзьями
Немного милоты вам в ленту 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
5
1️⃣Что такое MRO? Как это работает?

2️⃣ Как dict и set реализованы внутри? Какова сложность получения элемента? Сколько памяти потребляет каждая структура? 

3️⃣Как создать класс без слова class?

4️⃣Чем фреймворк отличается от библиотеки? Перечислите те, с какими вы работали и почему выбрали их.

5️⃣Что такое monkey patching? Приведите пример использования.

Ставь «🔥» и пиши свои ответы комментах👇

Ваш @dataminingteam🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥53
🔗 В работе представлен подход к сегментации текста (chunking), синтаксической задаче, включающей группировку слов в неиерархическом порядке.

🔗 Авторы предлагают двухслойную иерархическую рекуррентную нейронную сеть (HRNN) для моделирования композиции слов в сегмент и сегмента в предложение, достигая заметного улучшения по сравнению с существующими методами, что поднимает F1-score до 6%.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤‍🔥3
джуны в тестовый период:
😁22🔥4💯4