Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Корпоративный мессенджер Slack стер рабочие пространства российских компаний. Кризис облачных решений и что делать бизнесу?

В субботу 12 марта Slack удалил проекты и рабочие пространства некоторых компаний из России. Пострадали в том числе и разработчики Сбера. Никаких предупреждений и возможности сделать резервную копию данных не было: пользователи узнали о произошедшем, зайдя в приложение и не обнаружив своих переписок. Инцидент вызвал шок и шквал негатива, а также окончательно подорвал доверие к облачным решениям для корпоративных коммуникаций. Самый актуальный на сегодня вопрос - что делать всем тем, кто использует зарубежные облачные решения или задумывается об этом?

Инцидент окончательно дал понять, что в сложившейся ситуации SaaS решения – не вариант. Информация, которая хранится и обрабатывается за пределами ИТ-инфраструктуры компании, принадлежит вам только формально: в любой момент в доступе к вашим данным могут отказать или вообще их уничтожить. Единственно безопасным и надежным на сегодня решением для бизнеса являются корпоративные мессенджеры российских разработчиков, которые (это важно!) размещаются на собственном сервере заказчика. Мессенджер eXpress, который до недавнего времени был в арсенале только крупных отечественных корпораций, готов предоставить всему российскому бизнесу стабильный и защищенный инструмент коммуникации.

https://clck.ru/dxixN
​​На курсе «Инженер данных» мы учим проектировать хранилища и пайплайны данных, а ещё — помогаем сменить профессию.

→ Приходите учиться, если вы хотите развить свои компетенции или перейти на должность Data Engineer. Курс подойдет разработчикам, аналитикам и специалистам по Data Science, начинающим инженерам данных. 

Выпускники смогут работать с полным циклом данных и использовать нужные инструменты, создавая пайплайны.
В Практикуме мы обучаем в уникальной образовательной среде, которая объединяет технологии и людей. Вот, что будет на учёбе:
⬛️Теория в интерактивном тренажёре, который доступен 24/7. 
⬛️Упражнения на написание кода с быстрой обратной связью. 
⬛️ Обучение на реальных рабочих задачах из исследования JMF и на командных проектах.
⬛️ Код-ревью и персональные советы от действующих инженеров данных.
⬛️ Чат с преподавателями в слаке, где можно задать вопрос по сложной теме.
⬛️ Вебинары и продакшн-опыт от экспертов в инженерии данных. 
⬛️ Кураторы, команда поддержки и дедлайны, которые не дадут прокрастинировать.

Мы помогаем выпускникам сменить работу, если они этого хотят. 71,1% наших выпускников начинают карьеру в новой сфере.
После курса в вашем арсенале будут: резюме, сопроводительное письмо, портфолио, пробное интервью, практика по нетворкингу с работодателями. 

→ Старт потока — 21 марта. Учёба длится шесть с половиной месяцев.
→ Спроектируйте свой первый процесс обработки данных с помощью Python — это бесплатно.
Что в глубинах Data Lake?

На Хабр вышел отличный текст от технического руководителя Core Data Lake центра Big Data МТС о том, какие слои находятся внутри Data Lake, как построить архитектуру базы данных и чем распределенный Data Mesh-подход отличается от монолитного хранения данных.

В статье автор рассказал о задачах, архитектуре и проблемах развития Data lake, а также представил способы решения возникающих проблем, специфику процессов и перспективы развития.

Читать тут.
Настройка Data Science окружения на вашем компьютере

После прохождения различных курсов и обучения на различных образовательных платформах, вроде Datacamp, вашим следующим шагом станет использование полученных знаний о Python, R, Git или Unix Shell на персональном компьютере. Однако, многие из нас затрудняются с тем, какие пакеты и программное обеспечение нужно установить, чтобы начать работу с различными технологиями. Именно об этом эта статья

Читать...
МТС проведет онлайн-митап для дата-саентистов, дата-инженеров и специалистов, интересующихся машинным обучением

Виртуальная встреча состоится 24 марта в 18:00 по московскому времени. Участие бесплатное. Зарегистрироваться можно тут.

Спикеры из МТС и ivi.ru расскажут про PU Learning и разберут принципы сортировки блоков с фильмами на главной странице IVI. После этого Виктор Кантор, Валерий Бабушкин и Павел Мягких поделятся опытом использования Data Science в разных сферах бизнеса.
Путеводитель по основным трендам 2021 года в области обработки естественного языка и не только

Число исследований в области машинного обучения с каждым годом растет. Конечно, приятно было бы прогуляться по каждой статье или ветке исследований отдельно, но времени на это просто может не хватить, а «посетить» 2021 год еще раз, увы, не удастся. Следовательно, необходимо также искать «путеводители» - статьи, подсвечивающие некоторые тренды, понимание которых важно для будущих направлений исследований. В начале года одна из таких статей «гуляла» по различным каналам и чатам. Мне захотелось перевести ее на русский и поделиться с вами. Далее приведу перевод этой статьи с моими комментариями.

Читать...
В открытом море можно ориентироваться по звёздам, но лучше — иметь навигатор.

Бесплатный курс Нетологии — и есть такой навигатор в море Data Science. Вместе с преподавателями-энтузиастами вы на простых примерах разберёте, как алгоритмы принимают решения, и напишите первый код на языке SQL. Всё, чтобы вы могли погрузиться в данные и вынырнуть с понимаем, куда плыть дальше. 

Регистрируйтесь → https://netolo.gy/hLD
Структуры данных: двусвязный (двунаправленный) список

Двусвязный (двунаправленный) список — это разновидность связного списка, при которой переход по элементам возможен в обоих направлениях (как вперед, так и назад), в отличие от односвязного (однонаправленного) списка.

Читать...

Предыдущая статья: Структуры данных: связный список
​​Сказки от TENSORFLOW и LSTM

Разбор применения алгоритмов машинного обучения с использованием технологий LSTM для создания текстов.

Читать...
​​Подсчет количества пар товаров в продуктовых чеках с помощью трех инструментов: Python, Spark, SQL

Читать...
Бесплатный сервис видеоконференций без ограничений на замену покидающим российский рынок 

В прошлом году Сбер запустил сервис для проведения видеовстреч Jazz by Sber, и он стремительно развивается и обрастает все новыми полезными умениями. Например, появилась опция текстовой расшифровки видеовстречи – можно читать ее в реальном времени, если отвлеклись от звонка, или скачать полный текст в конце. 

Jazz by Sber подходит и для общения с близкими, и для корпоративного использования. Конференции не ограничены по времени. Число участников — до 200 человек. Запустить звонок можно в один клик в мобильном приложении Салют, браузерах, через приложение для компьютера Jazz Desktop, на смарт-дисплее SberPortal и умном ТВ-медиацентре SberBox Top.

В сервисе есть умное шумоподавление, режим администратора, возможность видеозаписи. Сейчас сервис работает бесплатно.

Создайте свою первую видеоконференцию по ссылке
​​Оптимальный маршрут доставки, скидки от срока годности и подбор одежды онлайн: 3 примера машинного обучения в e-com

Дата-сайентист из команды СберМаркета Дмитрий Руденко рассмотрел три научных статьи, посвященных применению машинного обучения для доставки товаров в международной компании Zalando и в двух китайских компаниях Meituan и Alibaba.

Читать...
​​🐍📈 Как «оживлять» графики и впечатлять всех красивыми анимациями с помощью Python

Показываем на примерах, как создавать красивые анимации с помощью Python, чтобы удивлять даже самых искушенных зрителей.

Читать...
​​РАБОТА для QA Data Engineer & Backend Go Engineer в международной компании в Москве, которая продолжает свою работу на российском рынке в полном объеме!
 
Международный проект и интересные задачи, работа в команде европейских лидов
 
Используемый стек технологий:
👉 Java, JavaScript, Selenium
👉 Golang, Perl/Python
👉 Database: Couchbase, ElasticSearch, Hadoop, MariaDB
👉 Cloud: Google Cloud Platform
👉 Versionning: Git/Gitlab/Jenkins
👉 Other: RabbitMQ/Kafka, Kubernetes, CouchBase, ClickHouse, Prometheus/Grafana, Docker
👉 Linux/GNU, Debian
👉 MySQL
 
Обязанности:
• Backend Go Engineer - in WAM Team, working on the backend systems of the DMP
• QA Data Engineer - mission is to implement automated tests for validating data streams in the company’s applications
 
Мы ищем специалистов для данной компании - пожалуйста, пишите / присылайте резюме в Telegram @olganikolova или на почту: olga.nikolova@hpims.ru
​​Основные тренды ЦОД в 2022 году и примеры проектов

Компания Acer снова с вами! Мы планируем рассказывать об интересных продуктах: как своих, так и других участников рынка. В первую очередь речь пойдет о серверах и соответствующих корпоративных решениях. Впоследствии мы, возможно, расширим тематику и будем рассказывать о ноутбуках, а также обо всем, что с ними связано.

Читать...
​​Хотите попробовать силы в Data Science? Пройдите бесплатный онлайн-интенсив по обработке и анализу данных с 4 по 6 апреля! Начало прямых трансляций — в 21:00 по московскому времени. 

Записывайтесь: 👉 https://clc.to/8D-N7A.

Кому полезен интенсив:

📌 Интересующимся новичкам. Узнаете, с чем сталкиваются в работе специалисты по данным. Решите несколько реальных задач и оцените, интересна ли вам эта профессия.
📌 Начинающим специалистам. Научитесь применять Python для построения статистических моделей. Поработаете с библиотеками Pandas и Matplotlib. Разберёте несколько практических заданий и повысите свой уровень.

💬 Спикер интенсива — руководитель направления по исследованию данных в Сбере с семилетним опытом в программировании Анастасия Борнева.

🎁 Каждый участник, сдавший практическую работу, получит сертификат на 10 тысяч рублей на любой курс Skillbox.  


Присоединяйтесь!
​​Чистый AutoML для “грязных” данных: как и зачем автоматизировать предобработку таблиц в машинном обучении

В данном посте хотелось бы затронуть такую очень известную и много где описанную тему как предобработка табличных данных в Data Science. Вы можете задать вопрос: “А зачем нам это нужно, ничего нового то тут не скажешь?”. Действительно, что может быть банальнее обработки табличных данных для моделей машинного обучения. Но мы постараемся собрать как можно больше информации в одном ультимативном, если так угодно, гайде, и подадим его через призму автоматического машинного обучения (AutoML). 

Читать...
​​MeetUP Data Science от Альфа-Банка🚀

12 апреля в 18:00 пройдет митап для дата-саентистов и тех, кому интересны решения прикладных задач с помощью машинного обучения.

Программа митапа: 

🤓Извлечение бизнес-инсайтов из отзывов клиентов
Эдуард Янаков, Младший специалист по интеллектуальному анализу данных в Альфа-Банке

📈Прогнозирование спроса — работа и проблемы в продакшене
Максим Павлов, Руководитель направления мультивариативного анализа в Х5

📲Склонностные модели транзакционной активности
Алексей Запольский, Старший специалист по созданию новых признаков в Альфа-Банке

💰Определение дохода зарплатного клиента до получения первой зарплаты для целей раннего cross-sale
Евгения Дзюба, Младший специалист по интеллектуальному анализу данных в Альфа-Банке

Участие бесплатное, но нужно зарегистрироваться на Alfa Digital, чтобы вам прислали ссылку для подключения!
​​Уважаемые коллеги! 

МГТУ им. Н.Э. Баумана и ЦИТМ Экспонента приглашают 
вас принять участие в VIII Всероссийской международной научно-практической конференции “Технологии разработки и отладки сложных технических систем”, которая пройдет:

6 и 7 апреля 2022 г.
по адресу: г. Москва, Рубцовская наб., 2/18,
МГТУ имени Н.Э. Баумана. Возможно участие онлайн. 

Конференция будет особенно интересна разработчикам, инженерам, ведущим инженерам, программистам, алгоритмистам, тестировщикам систем, главным конструкторам и руководителям проектов.

В ходе конференции будут представлены десятки докладов от инженеров-практиков модельно-ориентированного проектирования, показаны примеры решений практических задач, а также обзоры новейших технологий в следующих инженерных областях: 

👉 Искусственный интеллект;
👉 Системы автоматического управления;
👉 Цифровая обработка сигналов;
👉 Беспилотные системы;
👉 Глубокое обучение;
👉 Цифровые двойники;
👉 Полунатурные стенды;
👉 Системная инженерия; 

Цель конференции - обмен лучшими практиками и ноу-хау в применении модельно-ориентированного проектирования сложных технических систем.

💡Для наглядной демонстрации различных технологий мы подготовим специальные точки общения. На них вы сможете обсудить возможность применения данных технологий для решения своих задач, сложности при выполнении проектов и получить квалифицированную помощь в использовании инструментов модельно-ориентированного проектирования.

Участие в мероприятии бесплатное, для посещения конференции необходимо зарегистрироваться. Количество мест ограничено!
​​Этапы погружения junior-разработчика

Меня зовут Иван Сёмин, я руковожу несколькими командами разработки в компании Домклик. На данный момент в моём подчинении 28 человек, часть из которых приходила на junior-позицию. Хочу поделиться своим видением погружения новых сотрудников в процессы компании и коллектив, и рассказать о способах развития разработчиков до middle-уровня в крупных командах.

Читать...
🔥Не пропусти новости и качественные тексты из мира IT!

Подпишись на канал @Selectel, там каждую неделю:

▪️Говорим о новом железе и гаджетах.

▪️Делимся знаниями о дата-центрах.

▪️Рассказываем про языки программирования . 

▪️Анонсируем вебинары про технологии и горячие тренды.

Переходи, чтобы получать контент одним из первых!