Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
629 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Сервис распознавания капч, который больше не нужен

Недавно сервис обмена файлами Turbobit в очередной раз внёс изменения в свой сайт, в результате чего моя программа оказалась бесполезной. Теперь я могу рассказать о сервисе распознавания поподробнее, уже не опасаясь приблизить этот момент.
Статья
🤖 Numpy, Pandas, matplotlib – необходимый минимум для старта в Machine Learning

В одном обзоре мы рассмотрим базовый программный минимум для старта в Machine Learning. Для этого понадобятся: Python 3.8+, Jupyter Notebook, numpy, pandas и matplotlib.
Статья
​​​​Кодите?

Обратите ваше внимание на полезный telegram-канал для обучения высокоуровневому языку программирования Python 

На канале ежедневно публикуются задачи по Python и Machine Learning: алгоритмы, функции, классы, регулярные выражения, итераторы, генераторы, ООП, исключения, numpy, pandas, matplotlib, scikit-learn, TensorFlow и многое другое!

✔️Перейти на канал "Задачи по Python и машинному обучению" здесь
Big Data: что это такое, как искать, хранить и использовать.

В этой статье разберемся, что считается Big Data, а что нет, как эту информацию хранить, обрабатывать и получать пользу.
Статья
Тест : Насколько хорошо вы знаете математику , которая прогодится в DataScience, и такие вопросы также спрашивают на интевью.

На танцплощадке собрались N юношей и N девушек. Сколькими способами они могут разбиться на пары для участия в очередном танце?
Anonymous Quiz
36%
N!
36%
N^2
26%
N(N-1)
3%
N-1
👨‍🎓️ Зачем и как нужно изучать C/C++ в 2021 году?

С и С++ считаются «мамонтами» в мире программирования. Несмотря на возраст (49 и 38 лет), эти языки по-прежнему используются, весьма популярны и позволяют создавать большое количество приложений.
Статья
Языки на букву «P»: сравниваем возможности Python и PHP
🐍 🐘🐍 🐘

В статье речь идет о языках Python и PHP, их схожих и отличных характеристиках. Никогда не задумывались о том, что у них общего? Рассказываем.
​​Log-Sum-Exp Trick: как свойства функций делают работу классификаторов реальной

В этой статье мы рассмотрим, что такое классификатор, поговорим о мультиклассовой классификации с помощью нейронных сетей. Затем, ознакомившись с контекстом перейдем к основному топику поста — к Log-Sum-Exp Trick. Напишем формулы и разберемся, как этот трюк помогает избежать переполнения чисел с плавающей точкой.
Статья
​​📊📈Математика за оптимизаторами нейронных сетей

В этой статье мы поговорим о математике градиентного спуска, почему при обучении нейронных сетей применяется стохастический градиентный спуск и о вариации SGD (Stochastic Gradient Descent) с использованием скользящего среднего (SGD с momentum и Nesterov Accelerated Gradient).
[ Статья ]
​​7 книг, которые стоит прочесть для изучения Python

Fluent Python (рус. Python. К вершинам мастерства) – Лучано Рамальо
Python Cookbook – Дэвид Бизли, Брайн Джонс
Effective Python – Брэтт Слаткин
Веб-программирование c Python
Flask Web Development (рус. Разработка веб-приложений с использованием Flask на языке Python) – Мигель Гринберг
Two Scoops Of Django – Даниэль Гринфилд, Одри Гринфилд
Обработка данных с Python
Python Machine Learning – Себастьян Рашка
Data Visualization with Python and Javanoscript – Кайран Дейл

Подробнее про содержания
​​🐍🐬 Python и MySQL: практическое введение.

Рассмотрим на практическом примере, как из кода Python делать SQL-запросы к MySQL-серверу: CREATE, SELECT, UPDATE, JOIN и т. д.
Статья
В шкафу лежат вперемешку 5 пар светлых ботинок и 5 пар темных ботинок одинаковых размера и фасона. Какое наименьшее количество ботинок надо взять наугад из шкафа, чтобы среди них была хоть одна пара (на правую и левую ноги) одинакового цвета?
Anonymous Quiz
31%
5
25%
7
12%
10
32%
11
🤔Хороший, плохой, злой: как Яндекс использует нейросети для борьбы со спамом и матом

Разработчики Яндекса автоматизировали борьбу со спамом и матом в своих сервисах. Рассказываем, какие инструменты они для этого использовали.
[ Статья ]
​​🎨 Используем CycleGAN для применения стиля к видео, полученному с веб-камеры

Вы когда-нибудь задумывались, как выглядел бы ваш портрет работы Моне? Или легендарного Ван Гога? Современные технологии позволяют увидеть это своими глазами.
Статья
​​🎥 Делаем DeepFake на коленке: пошаговое практическое руководство.

Хотите собственноручно сделать видеоролик DeepFake с помощью простых инструментов? Наше пошаговое практическое руководство позволит вам пошутить над друзьями или создать забавный ролик для соцсетей, не углубляясь в программирование
Статья
DataOps — инженер будущего, который выстраивает инфраструктуру для работы с данными.

👉🏻Если вы Data Engineer, администратор или DevOps с опытом, и хотите узнать больше об управлении данными, 15 июля OTUS приглашает на demo-занятие «Практики Data Governance»:

На этом открытом уроке вы узнаете:
- Почему обработка данных - это не только написание ETL-процедур.
- Как не превратить Data Lake в Data Swamp.
- Что в себя включают практики Data Governance.

Занятие дает возможность предварительно попробовать новый онлайн-курс «DataOps Engineer» и познакомиться с преподавателем.
📍Для регистрации пройдите вступительный тест: https://otus.pw/XwXH/
​​⚕ Какие специалисты по Data Science требуются в медицинских проектах и что им нужно знать?

Что может быть прибыльнее, чем вести войну, торговать оружием и промышлять в даркнете? Правильно – лечить людей и продавать лекарства. Рассказываем, что нужно знать и уметь, чтобы влиться в выгодную и легальную индустрию здравоохранения.
Статья
​​5 неожиданных мест работы дата-сайентиста: от йоги до борьбы с deepfakes

Специалисты в области Data Science за последние пять лет стали особенно востребованными. Так, в 2019 году вакансий для них стало почти в 1,5 раза больше, чем в 2018, и почти в 10 раз больше, чем в 2015. Главные заказчики — финансовый сектор и IT-компании. Однако хорошие дата-сайентисты нужны не только в этих отраслях...
Статья
6 сентября стартует новый поток курса о данных в энтерпрайзе. Это первая подобная программа в стране. Ее разработали создатели MDM- и CDI-решений из компании HFLabs.

🧑‍💻 Для кого

Подойдет всем, кто работает или будет работать с клиентскими данными в крупной компании. Специальность не имеет значения.

📚 Программа

Пять дней, пять преподавателей, пять модулей:
1. Предпосылки создания MDM-системы. Проектирование модели данных.
2. Построение MDM-системы: структура и правила работы с данными.
3. Добавление новых источников в MDM-систему.
4. Получение данных из эталонной клиентской базы. Обратное распространение.
5. Управление качеством данных в MDM-системе.

🧙‍♂️ Преподаватели

Эти специалисты работают с клиентскими данными в ВТБ, «Открытии», «Росгосстрахе», МТС. Каждый «закрыл» минимум десяток проектов для крупного бизнеса.

🏃‍♀️ Студенты уже регистрируются

До 1 августа цены ниже на 4 000—6 000 ₽. Мест всего 16, разлетаются быстро.

Узнать больше https://bit.ly/3r5b0yd
🐍Скрапинг сайта с помощью Python: гайд для новичков.

В этой статье мы разберемся, как создать HTML скрапер на Python, который получает неофициальный доступ к коду сайта и позволяет извлечь необходимые данные.

Статья