Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​Машинное обучение, которое ускорит сайт

Машинное обучение, доступное каждому! В статье приведена реальная проблема некоторых сайтов и ее решение с использованием machine learning.
Статья
​​Пишем свою нейросеть: пошаговое руководство

Отличный гайд про нейросеть от теории к практике. Вы узнаете из каких элементов состоит ИНС, как она работает и как ее создать самому.
Статья
​​Работаете с нейросетями? Возможно, вы знаете, что поразительные результаты трансформеров в задачах NLP привлекли огромное внимание сообщества. Но смогут ли они произвести революции в Computer Vision, аналогично тому, как это сделали сверточные нейронные сети в 2012?

16 августа для тех, кто хочет научиться решать задачи компьютерного зрения, в OTUS пройдет demo-занятие на тему трансформеров в CV.

Занятие проведет Антон Витивицкий, Head of Computer Vision в BOOST INC. Это возможность познакомиться с преподавателем и оценить онлайн-курс «Computer Vision». 

Для регистрации пройдите вступительный тест: https://otus.pw/ZkXh/
​​🤖 Машинное обучение для начинающих: алгоритм случайного леса (Random Forest)

В отличие от большинства используемых в машинном обучении методов, алгоритм случайного леса не требует сложной теории. В небольшом обзоре рассказываем про его особенности и возможности применения.
Статья
Хочешь повысить свой скилл в программировании на Python? У меня есть 2 способа!

Дурацкий способ. Скачать кучу книг для чайников, отложить их до лучших времен и никогда не читать.

Простой. Подпишись на Python nation и ты найдешь много интересных постов которые взорвут твой скилл и расширят возможности программирования на Python.

Подпишись — @pythonnation
​​Как мы улучшали процесс загрузки товаров на AliExpress.ru: машинное обучение, проблемы и решения

Статья
​​3D-реконструкция и нейронные аватары: 3D компьютерное зрение на CVPR 2021

Статья
​​Как три ML-разработчика из Белгорода покоряли зарубежный IT-рынок

Всем известно, что зарплаты программистов в США или Европе на порядок выше российских. Правда обычно из этого следует, что большую часть заработанного ты тратишь на налоги, жилье, питание, медицину. А как живут разработчики, которые получают зарплату по зарубежным меркам, но живут в СНГ — с нашими ценами и налогами?
Статья
​​Строим аналитическое хранилище данных с готовыми модулями ML на Google BigQuery: просто, быстро, доступно

Статья
На курсах европейской компании DataWorkshop обучилось уже 1000+ студентов из разных стран мира, которые работают в Google, IBM, Intel, Microsoft, Oracle и др. топовых компаниях.

Почему курсы от DataWorkshop такие эффективные, а полученные навыки можно сразу применять в рабочих проектах:

Автор курсов - практик с 8 летним опытом в Data Science (опыт получал в американских и европейских компаниях)

Курсы состоят из 80% практики, причем на реальных данных

Сложные вещи из математики, статистики и программирования объясняются простым языком с помощью примеров из жизни

В DataWorkshop дают базовый концентрат знаний и навыков, что позволяет экономить деньги и время, и как можно быстрее сделать успешный старт карьеры в сфере Data Science

В DataWorkshop предоставляют полностью готовую среду для обучения на виртуальном сервере (нужен только интернет - вводишь логин и пароль и все работает)

Во время курса создадите свое портфолио (на основании решения реальных задач), которое сможет заинтересовать работодателей

По окончанию курса получите именной электронный сертификат

Успейте приобрести курсы по старой и очень выгодной цене:
1️⃣ "Практическое введение в Python для Data Science" - https://bit.ly/3yWizKI
Старт 6 сентября
Длительность 3 недели

2️⃣ "Практический Data Science курс с нуля" - https://bit.ly/2W3UxyM
Старт 4 октября
Длительность 4 недели

А еще при покупке курса, получаете БЕСПЛАТНУЮ 5-дневную практику по машинному обучению на реальных данных магазина из Великобритании. Старт интенсива - 30 августа.

Курсы DataWorkshop стартуют в сентябре, а выпускниками уже интересуются работодатели. Не упустите свой шанс!
​​🔥 «Люблю» и «ненавижу»: анализ эмоциональной окраски текста с помощью Python

Решаем Data Science-задачу определения эмоциональной окраски текста с помощью Python-библиотеки spaCy и стопки рецензий на фильмы. Сентимент-анализ в действии.
статья
​​🤖💬 Автодополнение длиной в тысячу слов. Что известно о нейросетевой модели GPT-3

О том, что умеет (и чего не может) языковая модель GPT-3, которую называют прорывом в задачах обработки естественного языка.
Статья
Мечтаете стать аналитиком, но не можете пройти отбор в топовую компанию? Тогда 25 августа в 19:00 приходите на бесплатный живой вебинар, где вам ответят на главный вопрос: «За какими аналитиками охотятся работодатели?»

Трансляцию проведёт Андрей Алясов, CEO Changellenge >>, за спиной которого не только работа в A.T. Kearney и Microsoft, но и сотрудничество с половиной топ-50 рейтинга Universum.

На вебинаре вы узнаете:
— какими навыками обладает востребованный аналитик;
— как умение структурно мыслить поможет в карьере;
— как эффективно решать бизнес-задачи;
— как покорить HR- специалиста и получить оффер.

Успейте зарегистрироваться до 25 августа включительно: https://clck.ru/Wx8J6
​​🐍 Линейное программирование. Практика решения задач оптимизации на Python.

Рассмотрим на примере максимизации прибыли характерные особенности задач линейного программирования. В качестве высокоуровневых инструментов – Python, библиотеки SciPy и PuLP.

Статья
Начните работать в Power BI и научитесь строить свой первый отчет. Приходите на бесплатный мастер-класс "Основы анализа данных в Power BI" от онлайн школы IQBI.

За два часа мастер-класса:
🔍Вы научитесь подключаться к данным;
🔍Построите отчёт о продажах компании в Power BI;
🔍Увидите какие факторы влияют на суммы покупок;
🔍Сможете публиковать отчёт в облако, чтобы мониторить бизнес показатели в режиме реального времени.

Это начальные шаги при работе с Power BI и уже после мастер-класса вы сможете внедрить Power BI в свою компанию.

✔️Мастер-класс будет проведен 25 августа
🕖Начинаем в 19:00, заканчиваем к 21:30 по МСК

А тем, кто пройдет мастер класс и выполнит несложное домашнее задание мы дадим доступ к модулю из нашего платного курса, чтобы вы смогли продолжить обучение. Записывайтесь через наши чат-боты по ссылке ниже, куда мы пришлем вам ссылку на трансляцию в день проведения.

Зарегистрироваться: https://bit.ly/2UAweIt
📕🔥Kниги для изучения data science c нуля.
Необходимые базовые навыки
Python & SQL
Математика для анализа данных.

Data Science from Scratch: First Principles with Python Даёт хороший обзор всех основных принципов data science и демонстрацию как простейшим образов реализовать данные вещи с помощью Python. Большая выгода этой книги - изложение порядка решения задач с помощью Python, которое помогает лучше освоить язык программированиея что самом по себе очень ценно.

Statistics Done Wrong .The woefully complete guide by Alex Reinhart
Oтличная иллюстрация того как не стоит применять математические методы проверки гипотез. Автор рассказывает как даже профессиональные учёные всё время ошибаются в их использовании.
​​🤖 Введение в машинное обучение: решаем Titanic на платформе Kaggle

Что такое Kaggle?
Kaggle – площадка, объединяющая соревновательную систему по исследованию данных, образовательный ресурс по искусственному интеллекту и машинному обучению, а также соцсеть специалистов в указанных областях.

статья
Какая команда в SQL используется для получения данных из базы данных
Anonymous Quiz
9%
EXTRACT
76%
SELECT
2%
OPEN
13%
GET
Вы хотите узнать, что такое ETL и почему это является одним из основных понятий в Data Engineering'е.

👉🏻Тогда записывайтесь на demo-занятие в рамках онлайн-курса «DataOps Engineer» 26 августа.

В ходе вебинара мы с вами разберем на практике, как при помощи Airflow создать свой ETL pipeline.

Занятие будет полезно для тех, у кого есть базовые знания в программировании, но ещё нет опыта в работе с данными.

📍Для регистрации пройдите вступительный тест: https://otus.pw/MSTv/
3 Крутых языка для Big Data

Python
Да, 39% набрал один из самых крутых языков программирования, который совсем не случайно оказался популярен и среди людей, работающих с обработкой больших потоков данных. В некотором роде это компромисс между изощренностью R и лёгкостью, которую дарит язык Python. Его популярность обосновывается как раз отсутствием необходимости применения идеальных алгоритмов в угоду возможности включать в работу группу программистов, не имеющих специальных навыков. Если вы хотите начать изучать этот язык, рекомендуем пройти наш онлайн-интесив по питону.

Julia
Язык, который возник совсем недавно, но уже попал на радары всех специалистов Big Data. Он прост и масштабируем, как Python, при этом эффективен, как R. Пока язык Julia молод, ему не хватает мелких доработок, библиотек и элементарной человеческой поддержки, но сомнений в его безоблачном будущем практически нет.

Scala
Если вы никогда ранее не слышали об этом языке, то можете просто ознакомиться со статистическими данными ,чтобы понять насколько успешен сегодня и насколько перспективен завтра будет Scala. Java-подобный язык может быть развёрнут под веб и платформу Android. Но главное его преимущество заключается в удобстве и гибкости, которые не дадут вам многие другие языки из Big Data. Twitter, Siemens и LinkedIn подтверждают.
Как обучить крупную нейросеть, не имея больших ресурсов

Yandex Research рассказал об успешном использовании технологии по децентрализованному обучению нейронных сетей — Distributed Deep Learning in Open Collaborations или сокращённо DeDLOC. Она была создана исследователями из Yandex вместе с командой Hugging Face и University of Toronto. Библиотека и код есть в свободном доступе (ищите ссылки в конце статьи)
Статья