Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Ускорение роста бизнеса с помощью обработки естественного языка

Обработка естественного языка (NLP) — это поддисциплина в рамках искусственного интеллекта (ИИ), которая позволяет синтезировать и анализировать речь и текст, и при этом вооружает компьютеры способностью понимать и общаться с людьми и другими машинами.

Сегодня НЛП широко используется предприятиями в разных отраслях в нескольких формах. На самом деле, согласно недавнему исследованию, к 2026 году ожидается, что размер мирового рынка НЛП достигнет 35,1 миллиарда долларов.

Читать...
C нуля до Senior за два года

Цель статьи: дать понять, подходит ли Вам эта специальность в принципе, и рассказать про эффективные подходы к самообучению, которые мне помогли (отдельно планирую потом детальные статьи по отдельным темам).

Отличные материалы уже существуют по большинству конкретных тем, автор сам по ним учился.
Думаю, многим будут полезны "мета" материалы о том, как выбирать курсы и статьи, по которым учиться.

Читать...
7 главных страхов тех, кто мечтает стать дата-сайентистом

Анализ больших данных сегодня используют в самых разных индустриях: от ретейла и туризма до образования и медицины. А профессию дата-сайентиста из года в год называют одной из самых востребованных. 

Но на первый взгляд кажется, что освоить ее совсем не просто. Мы собрали главные страхи тех, кто задумался о карьере в этой области, а Дмитрий Крылов — ментор по направлению Data Science в SkillFactory — объяснил, почему не стоит бояться.

Читать...
Как перекатиться в Data Science

Мотивация: В 2018 году автор учился в аспирантуре и оказался на должности инженера в университете, занимаясь в основном рутинными вещами и бумажной работой.

Такая работа вступала в резкий контраст с тем, что я видел, пока работал на производстве лопаток газотурбинных двигателейю.

Читать...
Веб-сайты для поиска наборов данных

Лучший способ улучшить визуализацию — практиковаться, практиковаться и практиковаться.

Основной шаг в создании информационной панели включает сбор данных, то есть сбор наборов данных. Продолжайте читать до конца, чтобы узнать, откуда автор черпает вдохновение.

Читать...
Восхищаемся тем, что делают ребята из международной IT-компании Social Discovery Ventures!
Когда весь мир ушел на карантин, они не растерялись и решили стать лучшими среди компаний, поддерживающих формат удаленной работы.

За основу новой корпоративной идеологии они взяли культуру цифрового кочевничества и призывают сотрудников больше путешествовать и вдохновляться культурой разных стран, работая из любой точки мира.

Такую культуру компания поддерживает не только на словах: оплачивает профильное обучение сотрудников в разных странах, направляет работать их на время в локации мечты.
Все это ребята освещают в своих социальных сетях и корпоративных блогах: рассказывают о возможностях удаленной работы, делятся опытом получения визы цифрового кочевника в разных странах и как переехать жить в локации мечты. 

В общем, работа мечты найдена. У них, кстати, есть несколько открытых вакансий, подробности ищите здесь.
Жизненный цикл ML-модели

Будем называть ML-моделью объект, возвращающий прогноз для входящего набора признаков. Пусть для простоты это будет модель бинарной классификации.

В этой статье автор расскажет вам, как мы разрабатываем устойчивые ML-модели в суровых условиях изменчивого мира.

Читать...
7 главных страхов тех, кто мечтает стать дата-сайентистом

Анализ больших данных сегодня используют в самых разных индустриях: от ретейла и туризма до образования и медицины. А профессию дата-сайентиста из года в год называют одной из самых востребованных. 

Но на первый взгляд кажется, что освоить ее совсем не просто. Мы собрали главные страхи тех, кто задумался о карьере в этой области, а Дмитрий Крылов — ментор по направлению Data Science в SkillFactory — объяснил, почему не стоит бояться.

Читать...
​​Прокачайте свои навыки в сфере IT и аналитики данных — примерьте роль Data Scientist! Участвуйте в бесплатном онлайн-интенсиве, который пройдёт с 10 по 12 марта. Начало — в 19:00 по московскому времени.  

Записывайтесь: 👉 https://clc.to/9ND-Qw.

За 3 дня вы научитесь:

⚡️ исследовать данные с помощью языка программирования Python;
⚡️ отличать Data Science от Machine Learning и Artificial Intelligence; 
⚡️ строить модели для реальных кейсов;
⚡️ находить аномалии в данных;
⚡️ решать реальные задачи, с которыми сталкивается Data Scientist.

В роли спикера выступит руководитель направления по исследованию данных в Сбере с семилетним опытом в программировании — Анастасия Борнева.

🎉 Каждый участник, сдавший практическую работу, получит сертификат на 10 тысяч рублей на любой курс Skillbox. 

Присоединяйтесь!
Задачи и инструменты ML и их практическое применение

Машинное обучение – распространившийся термин, но не все понимают его верно.

В этом материале эксперты направления аналитических решений ГК «КОРУС Консалтинг» Алена Гайбатова и Екатерина Степанова расскажут, что же на самом деле такое machine learning (ML), в каких случаях эту технологию стоит использовать в проектах, а также, где машинное обучение активно применяется на практике. 

Читать...
​​Расскажем про старт карьеры в инженерии данных и что делать, чтобы получить новую профессию.

Для кого:
-Аналитиков
-Разработчиков
-Начинающих инженеров данных

11 марта в 19.00 по мск
Зарегистрироваться по ссылке
Как постичь машинное обучение, если ты не великий математик

Будем честны: все мы слышали о зарплатах инженеров по машинному обучению.  Но машинное обучение еще нужно освоить — и вот тут начинается мрак.

Много споров по поводу того, насколько хорошо нужно знать математику для освоения машинного обучения. Но знать точно нужно.

Читать...
Преимущества периферийного зрения для машин

Исследователи находят сходство между тем как некоторые системы компьютерного зрения обрабатывают изображения, и тем, как люди видят краем глаза.

Исследования Массачусетского технологического института показывают, что определенный тип надежной модели компьютерного зрения воспринимает визуальные представления так же, как люди делают это с помощью периферийного зрения.

Читать...
​​​​Сделайте шаг к профессии DevOps-специалиста! Изучите базовые инструменты на бесплатном онлайн-интенсиве Skillbox, который пройдёт 14–16 марта в 21:00 по московскому времени.

Регистрируйтесь: 👉 https://clc.to/PK08zA

Под руководством опытного Lead DevOps-специалиста в ВТБ Константина Брюханова вы:
💻 поймёте, что такое DevOps и почему эта специальность так востребована;
💻 узнаете подробнее о профессии специалиста DevOps;
💻 выясните основные задачи DevOps и инструменты их решения.

К концу интенсива упакуете небольшое приложение в Docker и автоматизируете его сборку. Это высоко оценят будущие работодатели. 

🎁 Всем дошедшим до конца интенсива дарим электронную книгу Пола Доэрти и Джеймса Уилсона «Человек + машина» издательства МИФ. А тем, кто выполнит практическую работу, — сертификаты на 10 тысяч рублей. Их можно потратить на любой курс Skillbox.
 
Регистрируйтесь прямо сейчас и получите в подарок полезный материал о профессии, зарплатах и карьерных перспективах.
Как data science помогает угадывать цены на рынке

Считается, что практически все технологические инновации в области инвестиций появляются именно в хедж-фондах.

Будущее хедж-фондов зависит от data science и искусственного интеллекта, но без человека все равно не обойтись, уверен аналитик банка MUFG в Лондоне и выпускник «Школы анализа данных» «Яндекса» Артур Мешковский.

Читать...
Интересные проекты искусственного интеллекта 

Искусственный интеллект используют для создания интересных проектов, развлекаясь с которыми можно пропасть на долгое время.

Например, вы можете играть с ИИ в ассоциации или же рассматривать изображения котов, созданные нейронной сетью. Или же, если вы любите рисовать, но не умеете, то к вашим услугам сервис AutoDraw, где любые ваши каракули Искусственный интеллект превратит в более-менее ровную и приятную картинку.

Читать...
Вакансия Архитектора по ML-платформе в МегаФон

Мы ищем архитектора в команду BigData, который будет разрабатывать архитектуру одной из крупнейших в России ML-платформ. Готовы рассмотреть продвинутого Data-инженера, который хочет двигаться дальше. 

Нам важно: 

экспертные знания Hadoop, Spark, системное мышление, четкое понимание процесса разработки.

Подробнее о вакансии
Вы уверенны в безопасности своих данных?

Solar JSOC заявили о беспрецедентных по масштабу кибератаках за последние недели. Многие владельцы бизнеса также объявили о краже данных. Юристам компаний придется столкнуться с рисками, вызванными кибератаками. Но многие ли из них знают и умеют работать с данными? На фоне последних событий остро встает вопрос о должном уровне защиты данных, и о юристах, работающих с ними.

На курсе Moscow Digital School «Юрист по работе с данными» вы узнаете, как правильно и эффективно осуществлять юридическую защиту данных. Рассмотрите нормативные требования и правоприменительную практику в области сбора, хранения и обработки всех видов данных (персональные данные, Big Data, IоT, ноу-хау, коммерческая тайна и др.). Узнаете, как безопасно продавать и покупать, а также зарабатывать на их использовании.

Старт обучения: 24 марта 2022.
Скидка на обучение 10% по промокоду: DATASCIENCE. Акция действует 3 дня.
Корпоративный мессенджер Slack стер рабочие пространства российских компаний. Кризис облачных решений и что делать бизнесу?

В субботу 12 марта Slack удалил проекты и рабочие пространства некоторых компаний из России. Пострадали в том числе и разработчики Сбера. Никаких предупреждений и возможности сделать резервную копию данных не было: пользователи узнали о произошедшем, зайдя в приложение и не обнаружив своих переписок. Инцидент вызвал шок и шквал негатива, а также окончательно подорвал доверие к облачным решениям для корпоративных коммуникаций. Самый актуальный на сегодня вопрос - что делать всем тем, кто использует зарубежные облачные решения или задумывается об этом?

Инцидент окончательно дал понять, что в сложившейся ситуации SaaS решения – не вариант. Информация, которая хранится и обрабатывается за пределами ИТ-инфраструктуры компании, принадлежит вам только формально: в любой момент в доступе к вашим данным могут отказать или вообще их уничтожить. Единственно безопасным и надежным на сегодня решением для бизнеса являются корпоративные мессенджеры российских разработчиков, которые (это важно!) размещаются на собственном сервере заказчика. Мессенджер eXpress, который до недавнего времени был в арсенале только крупных отечественных корпораций, готов предоставить всему российскому бизнесу стабильный и защищенный инструмент коммуникации.

https://clck.ru/dxixN
​​На курсе «Инженер данных» мы учим проектировать хранилища и пайплайны данных, а ещё — помогаем сменить профессию.

→ Приходите учиться, если вы хотите развить свои компетенции или перейти на должность Data Engineer. Курс подойдет разработчикам, аналитикам и специалистам по Data Science, начинающим инженерам данных. 

Выпускники смогут работать с полным циклом данных и использовать нужные инструменты, создавая пайплайны.
В Практикуме мы обучаем в уникальной образовательной среде, которая объединяет технологии и людей. Вот, что будет на учёбе:
⬛️Теория в интерактивном тренажёре, который доступен 24/7. 
⬛️Упражнения на написание кода с быстрой обратной связью. 
⬛️ Обучение на реальных рабочих задачах из исследования JMF и на командных проектах.
⬛️ Код-ревью и персональные советы от действующих инженеров данных.
⬛️ Чат с преподавателями в слаке, где можно задать вопрос по сложной теме.
⬛️ Вебинары и продакшн-опыт от экспертов в инженерии данных. 
⬛️ Кураторы, команда поддержки и дедлайны, которые не дадут прокрастинировать.

Мы помогаем выпускникам сменить работу, если они этого хотят. 71,1% наших выпускников начинают карьеру в новой сфере.
После курса в вашем арсенале будут: резюме, сопроводительное письмо, портфолио, пробное интервью, практика по нетворкингу с работодателями. 

→ Старт потока — 21 марта. Учёба длится шесть с половиной месяцев.
→ Спроектируйте свой первый процесс обработки данных с помощью Python — это бесплатно.
Что в глубинах Data Lake?

На Хабр вышел отличный текст от технического руководителя Core Data Lake центра Big Data МТС о том, какие слои находятся внутри Data Lake, как построить архитектуру базы данных и чем распределенный Data Mesh-подход отличается от монолитного хранения данных.

В статье автор рассказал о задачах, архитектуре и проблемах развития Data lake, а также представил способы решения возникающих проблем, специфику процессов и перспективы развития.

Читать тут.