Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.28K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
💲 ТОП 3 на что смотрят инвесторы, когда выбирают стартап

1️⃣ Команда: Первое, на что обращают внимание инвесторы, — это команда. Идеально, если она способна покрыть все аспекты развития бизнеса. Важность команды постепенно снижается с развитием, но на начальном этапе это ключевой фактор.

2️⃣ Рынок: Инвесторы анализируют, насколько реально стартап может занять долю на рынке. Обязательный вопрос — какой потенциал доходности для инвестора. Общий "минимальный порог" — возможность достижения выручки в 1 млрд рублей для ранних стадий.

3️⃣ Ценностное предложение и соответствие рынку: Неважно, насколько хорош продукт, если он не решает значимую проблему. Инвесторы смотрят на то, насколько хорошо предложение компании соответствует потребностям рынка.

Ваш @dataminingteam👋
Please open Telegram to view this post
VIEW IN TELEGRAM
💯5👍2🔥22
Обширный и визуально понятный обзор тензоров, их декомпозиций и применений в машинном обучении. Авторами освещены базовые концепции тензоров, их декомпозиции, а также важные алгоритмы факторизации. Приведены примеры применения тензорных декомпозиций в машинном обучении и проведено исследование на основе оценки смеси моделей.

https://arxiv.org/pdf/1711.10781.pdf
❤‍🔥5👍4
1️⃣Шпаргалка по теории вероятности
https://vk.com/wall-94208167_7704

2️⃣Многорукие бандиты: полный обзор
https://vk.com/wall-94208167_7709

3️⃣Туториал по визуализации моделей глубокого обучения
https://vk.com/wall-94208167_7715

4️⃣Множественное восполнение пропущенных данных
https://vk.com/wall-94208167_7698

5️⃣Топ-15 библиотек Python для DA и ML
https://vk.com/wall-94208167_7718
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73
Исчерпывающий гайд o Support Vector Machine (SVM), начиная с его базовых принципов и математического обоснования, и до практической реализации в Python. Статья содержит информацию о разных типах алгоритмов SVM, работе с ядрами, выборе гиперпараметров и другом.

В дополнение можно пройтись по данной статье, где SVM рассматривается более визуально.
👍7❤‍🔥2🔥2
Статья охватывает тему многоклассовой классификации с использованием softmax-регрессии, рассматривает ее применения, преимущества и недостатки, а также предоставляет практическую реализацию на Python и в PyTorch.

https://spotintelligence.com/2023/08/16/softmax-regression/
❤‍🔥6
📣 Подробное руководство по пониманию и написанию кода для BERT с использованием PyTorch.

📎Охватывает его компоненты и различия с другими языковыми моделями.
Статья включает preprocessing, построени модели, определение функции потерь и оптимизации, а также обучение.

📎Автор объясняет характер BERT, его задачи предварительного обучения (модель языка с маскированными токенами и предсказание следующего предложения) и способность превосходить другие модели в различных задачах.

https://neptune.ai/blog/how-to-code-bert-using-pytorch-tutorial
❤‍🔥3
📣 Подробное руководство по пониманию и написанию кода для BERT с использованием PyTorch.

📎Охватывает его компоненты и различия с другими языковыми моделями.
Статья включает preprocessing, построени модели, определение функции потерь и оптимизации, а также обучение.

📎Автор объясняет характер BERT, его задачи предварительного обучения (модель языка с маскированными токенами и предсказание следующего предложения) и способность превосходить другие модели в различных задачах.

https://neptune.ai/blog/how-to-code-bert-using-pytorch-tutorial
❤‍🔥6🔥43
что, если не жиза?
💯85😁3👍1
🗣Материал вводит в важность и процесс feature engineering с подробным рассмотрением двух подходов: the Checklist Approach и the Domain-based Approach.

🔵Вы углубитесь в численные агрегаци, выборы параметров, преобразования числовых данных, кодирование категориальных переменных, обработку пропущенных значений.

💬Приведен пример по кассовым сборам фильмов.

https://www.learndatasci.com/tutorials/intro-feature-engineering-machine-learning-python/
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥3🔥2👍1
💬 В блоге рассматривается создание сверточной нейронной сети (CNN) для локализации и классификации объектов. Автор затрагивает темы, такие как архитектура модели для регрессии и классификации, обучение модели и оценка performance metrics,0 таких как  loss, accuracy и среднee пересечение по объединению (IoU).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
📎В статье рассматриваются вызовы в области выявления мошенничества, проводится сравнение rule-based и machine learning-based approaches, исследуется анализ данных, техника oversampling, обучение модели и её оценка, с акцентом на важности решения проблемы дисбаланса классов для эффективного выявления мошенничества.

🔖 Кроме того, статья подчеркивает значимость настройки порогов для балансировки ложных срабатываний и пропущенных мошеннических операций.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥5
Митап для DS и ML-разработчиков от МТС

4 июля | 18:30
Офлайн в Москве | Онлайн

Что будет в программе:

— Эксперты из RnD расскажут, как как адаптировать Open Source-модели генеративного ИИ, чтобы с минимальными ресурсами получить приемлемое качество дообучения.
— Обсудим, что такое персональные ИИ-решения и как в МТС создавали персональных Аватара и Ассистента.
— Узнаем про LLM от экспертов MTS AI.

Очных участников ждут нетворкинг и ламповый вечер в пространстве летнего кинотеатра в парке «Музеон». Все желающие смогут присоединиться онлайн.

Регистрируйтесь по ссылке.
🔥6
Идеальная карьера: с должности  исполнительного директора в Морган стэнли на позицию фермера, выращивающего гусей.

Вот это я понимаю, правильный карьерный рост🤣🤣🤣
😁8❤‍🔥4🔥2💯1
🔗 В работе представлен подход к сегментации текста (chunking), синтаксической задаче, включающей группировку слов в неиерархическом порядке.

🔗 Авторы предлагают двухслойную иерархическую рекуррентную нейронную сеть (HRNN) для моделирования композиции слов в сегмент и сегмента в предложение, достигая заметного улучшения по сравнению с существующими методами, что поднимает F1-score до 6%.
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2❤‍🔥1
🔄 Статья о Batch Normalization в нейронных сетях рассматривает две основные теории: стабилизацию распределений активаций и сглаживание ландшафта потерь и градиента.

🗣Описываются преимущества, включая более быструю сходимость и сниженную чувствительность к инициализации весов. Также ограничения, такие как неэффективность при малых размерах пакетов и неприменимость к рекуррентным сетям.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
Рубрика поддержи друзей 🌝

Собственно, наш друг занимается торговлей, поэтому просим вас поддержать.

По ссылке детский надувной круг.

Как поддержать?
- купить
- оставить отзыв
- сделать репост

https://ozon.ru/t/7wJRRN2
❤‍🔥5🔥21
🧬 Статья описывает метод ZLaP для классификации в условиях отсутствия размеченных данных. Этот метод использует модели видео-языковых представлений (VLM), которые показывают впечатляющую производительность в нулевой классификации, когда предоставляется только список названий классов.

🔗 ZLaP основан на методе распространения меток (LP) и использует геодезические расстояния для классификации на графах, содержащих как текстовые, так и изображенческие признаки.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤‍🔥3
🤩Представление классификаторов минимаксного риска (MRC), минимизирующих потери в худшем случае для общих правил классификации и обеспечивающих точные гарантии производительности.

🍂Показано, как можно надежно оценить внесемпловую производительность MRC в процессе обучения, и что ошибка MRC из-за конечных размеров обучающих выборок определяется точностью оценок математических ожиданий. Кроме того, показано, что MRC являются сильно всесторонне согласованными в ситуациях, аналогичных тем, что соответствуют методам на основе ядра.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤‍🔥1👍1