Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
🤩Детальный разбор Convolutions on Graphs. Авторы охватывают проблемы вычислений на графах, представляют способы расширения сверток на графах, включая полиномиальные фильтры и современные графовые нейронные сети.

🍂Рассматриваются темы от локальных до глобальных сверток, спектральные свертки и обучение параметров графовых нейронных сетей.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥73🔥2
💻 Yandex Cloud выпустила большое обновление платформы для работы с данными

Облачная платформа запустила сервис для управления метаданными Yandex MetaData Hub, повысила безопасность баз данных, а инструмент BI-аналитики Yandex DataLens получил новые возможности. Всё это позволит компаниям быстро и надёжно создавать дата-проекты в облаке — от корпоративных хранилищ данных до аналитических и рекомендательных систем.

💬 Больше об обновлениях платформы данных читайте в статье.
Please open Telegram to view this post
VIEW IN TELEGRAM
61❤‍🔥1
🤩В данной работе представлен алгоритм LLE-HKAP для высокоразмерных наборов данных. Алгоритм решает проблемы, связанные с неопределенностью центра кластера и количеством кластеров, используя двухчастную стратегию, включающую метод Locally Linear Embedding (LLE) для снижения размерности и алгоритм Hybrid Kernel Affinity Propagation (HKAP). Алгоритм LLE-HKAP демонстрирует эффективность в точном определении числа кластеров и хорошей производительности по различным метрикам.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤‍🔥22
1⃣ В чём разница между пакетами и модулями? 

2⃣ Как проверить файл .py на синтаксические ошибки, не запуская его?

3⃣ Что такое *args и **kwargs в определении функции?

4⃣ Чем отличаются многопоточное и многопроцессорное приложение?

5⃣ Как работать с транзитивными зависимостями?

Ставь «🔥» и пиши свои ответы комментах👇

Ваш @dataminingteam🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥82
🤩Представление классификаторов минимаксного риска (MRC), минимизирующих потери в худшем случае для общих правил классификации и обеспечивающих точные гарантии производительности.

🍂Показано, как можно надежно оценить внесемпловую производительность MRC в процессе обучения, и что ошибка MRC из-за конечных размеров обучающих выборок определяется точностью оценок математических ожиданий. Кроме того, показано, что MRC являются сильно всесторонне согласованными в ситуациях, аналогичных тем, что соответствуют методам на основе ядра.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5🔥32
➡️ Руководство по поддержке моделей ML в продакшене, акцентируя внимание на необходимости решения проблем, таких как изменение данных и устаревание модели.

🩶 В ней затрагиваются ключевые темы: метрики сравнения моделей, стратегии развертывания, такие как теневое развертывание и A/B-тестирование, а также важность бизнес-метрик при принятии решений. Включены практические примеры: развертывание модели анализа настроения на AWS EC2.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥84🔥2
1️⃣ Что такое globals() и locals()?

2️⃣ Что такое асинхронный код? Приведите пример.

3️⃣ Опишите принцип работы сборщика мусора в python.

4️⃣ Для чего в классе используется атрибут slots?

5️⃣Что такое метаклассы и в каких случаях их следует использовать?

Ставь «🔥» и пиши свои ответы комментах👇

Ваш @dataminingteam🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥73
🔵Все мы стараемся избегать ошибок — будь то в работе, учебе, увлечениях или отношениях. Иногда боязнь провала мешает нам просто попробовать что-то новое. По опыту, таким людям сложнее просить о повышении.

❗️Нельзя предугадать все нюансы, и всегда есть место для человеческого фактора. Опытные люди бывают ценны, потому что они пробовали разные подходы и знают, что сработает, а что нет. Их ценность также в том, что они извлекли уроки из своих ошибок.

Не страшно менять что-то в жизни и не сразу найти свое "что-то". Это не делает вас неудачником. Для меня важно давать себе и другим право на ошибку, не оценивая свою ценность по неудачам.

🖥 Меня вдохновляет подход try-except в Python, который помогает обрабатывать ошибки. Код не считает себя плохим, а просто ищет варианты.

Будьте как try-except 😎

Ваш @dataminingteam👋
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥83❤‍🔥2
🧬 Алгоритм "Экстраполированное случайное дерево для регрессии" (ERTR) адаптируется к гладкости функции регрессии, сохраняя при этом интерпретируемость дерева. HRTR сходится к целевой функции, а ERTR использует линейную регрессию для экстраполяции оценок HRTR, превосходя RTR для целевых функций с высокой степенью гладкости из-за экстраполяции.

🔗 Для более поной картины можно глянуть вот этот ноутбук.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5🔥32
👀 Шпаргалка по обыкновенным дифференциальным уравнениям предоставляет ясный обзор основных концепций, методов решения и их применений, включая системы линейных ОДУ, устойчивость, численные методы и приложения в физике. Это незаменимый ресурс для студентов и специалистов, изучающих ОДУ и их применения в науке.

👀 Шпаргалка о втором порядке ОДУ предоставляет компактный и понятный обзор разнообразных методов решения, включая системы линейных и нелинейных уравнений, а также их приложения в реальных задачах.
Please open Telegram to view this post
VIEW IN TELEGRAM
7❤‍🔥2🔥1
1️⃣Kак перезагрузить импортированный модуль?

2️⃣ Поддерживает ли python множественное наследование?

3️⃣ Что такое интернирование строк? Почему это есть в python?

3️⃣ Python — это императивный или декларативный язык? Объясните различия.

4️⃣ Что такое менеджер пакетов? Какие менеджеры пакетов вы знаете? 

5️⃣ Как имплементировать словарь с нуля?

Ставь «🔥» и пиши свои ответы комментах👇

Ваш @dataminingteam🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤‍🔥21
🧬В статье исследуется роль pre-training в долгосрочном обучении. Авторы выявили, что модели с предварительными инициализациями проявляют меньше забывания по сравнению со случайными инициализациями, даже при начально более высокой производительности.

🕐 Анализ loss landscapes подтверждает, что предварительно обученные модели достигают минимумов с более плоскими характеристиками, что способствует снижению забывания задач.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳3❤‍🔥1🔥1
💬 В блоге рассматривается создание сверточной нейронной сети (CNN) для локализации и классификации объектов. Автор затрагивает темы, такие как архитектура модели для регрессии и классификации, обучение модели и оценка performance metrics, таких как  loss, accuracy и среднee пересечение по объединению (IoU).
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤‍🔥3🔥3
⌨️ Проблема профессионала

После успешного путешествия по кривой Даннинга-Крюгера взгляд человека безвозвратно меняется и утрачивает особенности восприятия новичков на пике глупости или более опытных товарищей.

Часто профессионалы не могут разглядеть и осознать проблему, которая очевидна любому новичку, именно в силу своего опыта и пройденного пути.

Помнить об этой особенности восприятия полезно всегда, но особенно — при создании или работе с продуктом для широкой аудитории.

К примеру, условно, сеньёр, который мастерски создает модели для распознавания собак и кошек, может случайно упустить детальную разметку данных, если он решит приступить к распознаванию редких видов бабочек. В то время как джун, который недавно за этого били на курсах, может более ярко осознавать, что правильная разметка данных важна для успешного обучения модели в новой области, где бабочки становятся объектом внимания.

Ваш @dataminingteam🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13❤‍🔥2
🔆 Обзор эффективной архитектуры трансформера в обработке речи, её способности обрабатывать последовательные данные, применение в задачах, таких как распознавание речи и синтез текста в речь, использование self-attention слоев, методы предварительного обучения, гибридные модели, механизмы внимания, регулирование длины в TTS, аугментация данных для мультиязычных систем и этические аспекты внедрения систем обработки речи с трансформерами.
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳4❤‍🔥1🔥1
💎 Автор представляет реализацию алгоритма выбора признаков на основе корреляции на Python с целью уменьшения размерности набора данных с 500 признаками до подмножества из 48 признаков.

🔗 Алгоритм применяется к данным Madelon, что приводит к существенному сокращению времени обучения и оценки с 40 секунд до примерно 6 секунд. Более того, процесс выбора признаков повышает точность модели метода опорных векторов (SVM) с 50% до примерно 66.5% при использовании кросс-валидации с 10 блоками.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤‍🔥1
Как уволиться правильно?

Когда ты решаешь покинуть команду, важно делать это с уважением и грамотно. Вот 4 примера как НЕ НАДО уходить:

🔠 Забывает передать важные дела, оставляя команду в неведении. А зачем объяснять им о текущем состоянии проектов, да? Сами разберутся😎

🔠 Создает неприятную атмосферу, не обращая внимание на эмоции команды при уходе. Когда уходит — ему всё равно, что он грубо сообщил об этом или что половины команды не было, когда он говорил об этом. Who cares, узнают от других как-нибудь, обычное дело.

🔠 Не поддерживает слаженную работу процессов после ухода. Отсутствие замены и поддержки процессов на последних этапах.

🔠 Оставляет много неопределенности по вопросам замены и переходного периода. Нежелание ответить на вопросы команды и предоставить четкий план.

Ваш @dataminingteam👋
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6🔥2
🔴В работе представлен метод proxBoost, который значительно улучшает стандартные результаты стохастической выпуклой оптимизации, обеспечивая высокую вероятность достижения глобального минимума.

➡️Метод применим к широкому классу алгоритмов стохастической оптимизации для сильно выпуклых задач с дополнительной стоимостью, логарифмической по уровню уверенности и полилогарифмической по числу обусловленности. 
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤‍🔥2