Data Mining | Анализ данных🚀 – Telegram
Data Mining | Анализ данных🚀
3.27K subscribers
1.73K photos
10 videos
5 files
1.7K links
• Купить рекламу: t.me/sahib_space
Админ: sahib_space
• Стоимость: https://www.notion.so/sahibspace/69ece414a4af49f2bdbdfe455e553e58?pvs=3&qid=
• Группа в ВК: vk.com/datamining.team
Download Telegram
Есть несколько стандартных модификаций метода k-средних, наиболее известная - алгоритм Ллойда, именно он реализован в scikit-learn. А вот на R реализованы:
* Lloyd,
* Forgy,
* MacQueen,
* Hartigan and Wong.
И много чего ещё. Там отличия в инициализации и пересчёте, очень неплохо написано здесь (хотя это не прям ценные знания).
❤‍🔥91
Сегодня столько возможностей, конечно, для получения качественного образования для школьников.

Как пример - Тинькофф запустил бесплатные математические онлайн-кружки для школьников.

Если вдруг кому нужно - регистрация до 6 сентября.

https://fintech.tinkoff.ru/school/generation/math/
3
К новому учебному году VK запустила целый ряд образовательных проектов

Студенты могут получить подписку от VK Education, которая дает выплаты и бонусы для карьерного развития, зоны VK в вузах, комиксы в Одноклассниках, олимпиады, стикеры для школьных чатов от Сферума и многое другое.

И это еще не все. Среди вузов-партнеров VK есть больше тридцати российских университетов, в некоторых из них пройдут мероприятия от VK Education, где можно будет узнать о карьерных возможностях и об образовательных программах, принять участие в активностях и выиграть мерч.

Инициатив действительно много: узнать обо всех можно тут.
2
«Тинькофф» запустил бесплатный курс по математике для школьников

▪️ Платформа «Тинькофф Образование» запустила программу для школьников 4–6 классов «Математика решает». Это двухлетний онлайн-курс, который на бытовых примерах поможет учащимся разобраться в предмете.

▪️ Главной задачей проекта будет развитие у школьников логики, критического мышления и творческих способностей. На курсе ученикам дадут задачи, которых нет в школьной программе, например задания на шифрование и кодирование, конфигурацию объектов. Это позволит школьникам получить начальные навыки в IT-профессии.

▪️ Авторами курса стали тренеры сборной Москвы на Всероссийской олимпиаде школьников по математике 2022 года, члены жюри и методических комиссий ведущих математических олимпиад и лауреаты грантов в сфере образования.
Введение в глубокое обучение на примере распознавания рукописных цифр: от простого перцептрона до state-of-the-art сверточной нейросети.

Читать
7
Канал Бориса Демешева из ВШЭ, посвященный анализу данных и эконометрике. Разбор множества тем (от линейной регрессии и прогнозирования временных рядов до случайных лесов и байесовской эконометрики), подробный вывод основных теоретических результатов, множество примеров в R.

Ссылка на канал: https://goo.gl/dT2t6N
14❤‍🔥5
Подборка классных библиотек для Питона. Можно найти что-то полезное для глубокого обучения, обработки текстов, удобной работы с командной строкой и многого другого.

Подборку за 2022 год можете сравнить с подборкой за 2017 год.
🔥6
Список AI and Machine Learning конференций по всему миру в 2023 и 2024 гг.

https://vk.cc/cr3qVX
4
Top 5 tips to make your pandas code absurdly fast

https://vk.cc/cr3qQH
15
Оригинальная статья про CUPED от 2013 года

https://vk.cc/csg2iO
6
Статья о том, какую математику сегодня проверяют работодатели при найме Data Analysts & Scientists

https://vk.cc/csg0zF
10
Курс по анализу данных от Александра Дьяконова

https://vk.cc/csg1mP
🔥9
Интересный пост о том, как погрузиться в DS

https://vk.cc/csg1v0
4🔥2
Библиотека для временных рядов

https://vk.cc/csg1DW
9
25 лучших книг для понимания машинного обучения 2022

https://vk.cc/csg1Li
Курс MITx: Введение в вычислительное мышление и науку о данных научит вас использовать вычисления для достижения различных целей и предоставит краткое введение в различные темы решения вычислительных задач.

Охватываемые темы включают в себя:
•Продвинутое программирование на Python 3
•Задача о рюкзаке, Графы и оптимизация графов
•Динамическое программирование
•Построение графиков с помощью пакета pylab
•Случайные прогулки
•Вероятность, Распределения
•Моделирование Монте-Карло
•Подгонка кривой
•Статистические ошибки

Курс длится до 21 декабря!
🔥7
Топ 3 статистических парадокса в Data Science

https://vk.cc/csg1Rp
3
🔥Любопытная статья предлагает решение проблемы overconfidence в последовательных рекомендательных моделях с помощью Generalised Binary Cross-Entropy Loss function. Она превосходит популярную модель BERT4Rec при этом требуя меньше времени для обучения.

Статья получила награду the Best Paper award at ACM RecSys 2023
7
Обширный обзор включает в себя краткие описания более чем 40 библиотек Python. Автор выделяет ключевые особенности каждой библиотеки, подчеркивая их уникальные характеристики и более подходящие сферы применения.

Идеальный ресурс в качестве 'шпаргалки'.
7🔥1