Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​Месяц назад ребята из Delivery Club поделились первой частью эволюции собственной рекомендательной системы ресторанов. Подробнее в публикации на Хабре.

На днях вышло продолжение. Из новой статьи вы узнаете, как отранжировать рестораны персонально для каждого пользователя, зачем нужна офлайновая ML-модель и почему обучение моделей «в лоб» не работает.
​​Хочешь стать незаменимым специалистом в ML команде? Освой инженерию данных — одно из самых востребованных направлений в Data Science.

На курсе «Инженер данных» от школы karpovꓸcourses под руководством опытных практиков из VK, Яндекс Go, СберМаркет и Mars за 5 месяцев ты научишься:

● Работать с реляционными и MPP базами данных
● Автоматизировать ETL-пайплайны
● Проектировать традиционные и облачные хранилища
● Применять ML-модели на больших данных
● Разрабатывать дашборды для мониторинга DWH платформы

Здесь тебя ждут интересные проекты и настоящая инфраструктура: Greenplum, Hadoop, Kubernetes, Spark, Hive, Kafka, Airflow, Tableau.

По итогам обучения ты станешь крепким Middle+ специалистом с широким набором прикладных навыков, а наш HR обязательно доведёт тебя до оффера в хорошую компанию.

Переходи по ссылке и записывайся на курс до 10 мая. Кстати, на сайте доступна бесплатная демоверсия.
​​ML-модели VS осложнения при бурении нефтяных скважин

В этой статье рассказывается о том как искалось решение для проблемы с прихватами при бурении нефтяных скважин с помощью машинного обучения и к чему в результате пришли.

Конкретнее, речь пойдёт о том, какие данные нам понадобились, что с ними было не так, какие модели прогнозирования мы испробовали и на какой комбинации моделей мы в результате остановились.

Читать...
​​Прокачайте свои навыки в сфере IT и аналитики данных — примерьте роль Data Scientist! Участвуйте в бесплатном онлайн-интенсиве, который пройдёт с 16 по 18 мая. Начало — в 19:00 по московскому времени.  

Записывайтесь: 👉 https://clc.to/OijvOg.

За 3 дня вы научитесь:

⚡️ исследовать данные с помощью языка программирования Python;
⚡️ строить модели для реальных кейсов;
⚡️ находить аномалии в данных;
⚡️ автоматизировать решение бизнес-задач с помощью искусственного интеллекта и Machine Learning.

В роли спикера выступит руководитель направления по исследованию данных в Сбере с семилетним опытом в программировании — Анастасия Борнева.

🎉 Участвуйте, задавайте вопросы и получите сертификат на 10 тысяч рублей на любой курс Skillbox. 

Присоединяйтесь!
​​Применение подхода eXtreme Multi-Label Classification для классификация записей материально-технических ресурсов

Данная работа является пересказом статьи Jingzhou Liu, Wei-Cheng Chang, Yuexin Wu, and Yiming Yang. 2017. Deep Learning for Extreme Multi-label Text Classification. In Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '17). Association for Computing Machinery, New York, NY, USA, 115–124. https://doi.org/10.1145/3077136.3080834

Читать...
​​Python коллекция полезных готовых скриптов

Сборник Python-скриптов для решения и задач автоматизации и упрощения рутинной работы.

Перейти по ссылке...
​​Значительно снизить расходы на приобретение нового оборудования и справиться с дефицитом IT-инфраструктуры помогут облачные сервисы. Ваши данные будут надежно защищены в отказоустойчивом ЦОД TIER III в Москве.

☁️Облако за 990 руб. в месяц! Держим цены 2021 года - убедитесь сами с помощью калькулятора.

Мы предлагаем облачные сервисы для бизнеса:
• корпоративная почта,
• 1С в облаке,
• хранение и резервное копирование данных, 
• платформа для совместной работы с документами,
• информационная безопасность,
• вычислительные ресурсы по моделям IaaS/PaaS.

Оформите бесплатный тестовый доступ на нашем сайте.

Приглашаем к сотрудничеству в рамках партнерской программы.
📞 Тел: +7(495)789 4135
🌏 Сайт: https://nubes.ru/
​​Подборка книг по Data Sciense

👉 Практическая статистика для специалистов Data Science
Авторы: Питер Брюс, Эндрю Брюс
Описание: как: В книге рассказывается о таких штуках как: разведочный анализ данных, статистические эксперименты, проверка значимости, регрессия, классификация, машинное обучение. Но для прочтения вам понадобятся знания математической статистики и языка R.

👉 Data Science
Авторы: Кэти О’Нил, Рэйчел Шатт
Описание: Книга основана на курсе Колумбийского университета по анализу данных. В процессе обучения вы узнаете о байесовском методе, визуализации данных, статистических алгоритмах, рекомендательных движках, MapReduce и финансовом моделировании.

👉 Теоретический минимум по Big Data
Авторы: Анналин Ын, Кеннет Су
Описание: Издание не ориентировано только на профессионалов, заняться образованием могут начать аналитики, бизнесмены, программисты и непрофильные специалисты. На страницах этого труда рассматривается масса алгоритмов, каждому из которых посвящена отдельная глава, с картинками и примерами из реальных задач.

👉 Основы Data Science и Big Data
Авторы: Дэви Силен, Арно Мейсман, Мохамед Али
Описание: Изучение DS вы начнете с базовых вещей, а потом приступите к алгоритмам машинного обучения, массивам данных, NoSQL и т. д. В качестве языка программирования в этой книге используется Python со специальными библиотеками.

👉 Principles of Strategic Data Science
Авторы: Peter Prevos
Описание: Книга начинается с объяснения того, что такое наука о данных и как организации могут ее использовать для оптимизации всех рабочих процессов. Затем автор приводит критерии надежности информационных продуктов и способы визуализации информации. В процессе изучения пятиэтапной структуры вы будете открывать для себя стратегические аспекты DS, которые позволяют повысить ценность извлекаемых данных. В заключительной главе рассматривается роль штатного аналитика данных в процессе интеграции DS-подхода в бизнес-процессы организации.
​​Российский рынок технологий с голосовыми решениями на базе ИИ достигнет $561 млн в 2025 году.

SmartSpeech — подобная разработка от команды Сбера.

Что умеет?
Распознавать речь: фильтрует шумы, понимает, закончена фраза или нет, какие эмоции у говорящего.
Синтезировать речь, в том числе на английском – говорить естественно, менять тон и тембр, правильно произносить ё. Не путается при произношении сложных адресов и названий.

Где использовать?
Для превращения аудио в текст и наоборот, для озвучки интерфейсов, автоответов по телефону, голосового управления, в том числе с использованием голосовых помощников.

Как протестировать?
На что способен SmartSpeech в части распознавания речи, можно посмотреть с помощью бесплатного Telegram-бота. Его назначение — конвертировать голосовые сообщения и другие аудиофайлы в текст. 

Для кого подходит?
Особенно оценят специалисты, которые работают со словом. Для бизнеса бот — отличный способ познакомиться с возможностями умной технологии SmartSpeech
​​Почему я ушел из Netflix с позиции разработчика с окладом 450000$

Перевод статьи Michael Lin. Ссылка на оригинал

Читать перевод на хабре...
​​За считанные годы криптовалюты стали частью современного мира и используются для самых разных целей в том числе для инвестирования. Команда Николая Валиотти на канале LEFT JOIN не даёт советы с точки зрения инвесторов, зато они написали скрипты для обработки данных, которые помогают получать нужную информацию о валютах и быстро обрабатывать информацию на бирже инструментами аналитики данных, чтобы принимать взвешенные решения.

Об этом и многом другом вы можете узнать на канале LEFT JOIN. Подписывайтесь!
Forwarded from inDrive.Tech
​​📈 Как оценить изменения в технологическом продукте с помощью данных?

Этому посвящена англоязычная статья дата-сайентиста inDriver Николая Неустроева на Medium. В материале вы найдете подробное описание и примеры 9 экспериментальных и квази-экспериментальных методов для анализа данных.

Статья поможет понять, какой метод анализа данных выбрать, в зависимости от ситуации и ресурсов.
​​Стань дата-инженером с Яндекс Практикумом

Сервис онлайн-обучения цифровым профессиям Яндекс Практикум запускает программу обучения по специальности «Инженер данных». Курс предназначен для студентов с как минимум базовым знанием SQL и Python — перед стартом необходимо пройти тест.

Авторы и преподаватели – практикующие эксперты ведущих российских IT-компаний. 

Длительность — 6,5 месяцев. 

Курс на 75% состоит из практических занятий – по окончании программы в вашем портфолио будет не менее 10 проектов.
 
Вы научитесь: 
- работать с технологиями Python, SQL, Metabase, Airflow, PostgreSQL, MongoDB, ClickHouse, Celery, Kafka, Hadoop, Apache Spark, Spark Streaming и Yandex.Cloud
- извлекать, очищать и сохранять данные
- создавать и поддерживать хранилища типов Data Warehouse и Data Lake
- работать со стриминговой обработкой данных и облаками

Претендовать на работу по новой специальности студенты курса смогут уже в ходе обучения – с поиском вакансии помогут специалисты карьерного центра Яндекс Практикум. 

Запись на курс открыта, старт занятий для ближайшего потока студентов – 23 мая. 

Стоимость курса:
95 000 рублей при разовой оплате, при оплате в рассрочку – 17 000 рублей в месяц. 

По завершении программы студенты получат диплом о профессиональной переподготовке. 

Запись на бесплатную вводную часть и подробности по ссылке.
​​ML под ударом: противодействие атакам на алгоритмы машинного обучения

Ежегодно выходят тысячи научных работ об атаках на алгоритмы машинного обучения. Большая часть из них рассказывает о взломе компьютерного зрения, ведь на его примере можно наглядно продемонстрировать последствия атаки. На деле первыми под удар попадают спам-фильтры, классификаторы контента, антивирусные сканеры и системы обнаружения вторжений. Например, достается базе VirusTotal. Туда уже давно пробуют загружать безобидные файлы, которые распознаются, как вредоносные и вызывают цепочки ложных срабатываний.

Читать...
​​Израильский стартап упрощает найм сотрудников с использованием обработки естественного языка

Myinterview – израильский стартап, разрабатывающий инструменты машинного обучения для ускорения и упрощения процессов найма для компаний. Платформа Myinterview расшифровывает видеоинтервью кандидатов, оценивает их навыки и выставляет оценку.
Основатели утверждают, что Myinterview помогает работодателям экономить до 70% времени на найм. Миссия MyInterview состоит в том, чтобы создавать короткие и эффективные воронки найма.

Читать...
​​Аналитик данных с нуля до трудоустройства 

Ключевыми навыками аналитика являются умение собирать, анализировать и презентовать данные. Но где сегодня научиться этим навыкам и освоить основные инструменты аналитики? 

Приглашаем вас на курс «Профессия «Аналитика данных» от Moscow Digital School. Во время обучения вы освоите логические операторы SQL, работу с дашбордами BI, визуализации данных в Python, инструменты Excel и создадите свой аналитический проект. Научитесь строить прогнозы на основе данных и помогать бизнесу принимать решения. 

На курсе вас ждет большой объем практических заданий, а эксперты аналитики будут сопровождать вас на каждом этапе обучение, доступным языком объясняя сложные вещи и отвечая на все ваши вопросы. 

Лучшие студенты получат возможность попасть на стажировку в Ozon, Data Sfera, Agima.

Старт потока: 31 мая 2022.
Скидка 10% на обучение по промокоду: DATASCIENCE
Акция действует 5 дней.
​​На картинке 12 терминов. Сколько из них вы можете объяснить?

Если больше 10 - то вы молодец ✔️
Если меньше - то у вашей карьеры или бизнеса хреновое будущее

Это поправимо. Достаточно 2 минуты в день читать этот канал, который ведут эксперты АНО "Цифровая экономика", и вы быстро войдёте в курс необходимых в 2022 году знаний о цифровизации бизнеса. Как минимум, сможете блеснуть на собеседовании. Как максимум - сможете перезапустить бизнес.

А ещё там подписчикам раздают чек-листы по цифровизации и топовые книги.

Подписывайтесь по этой ссылке: https://news.1rj.ru/str/cdo2day.
​​DATApedia - канал про Data Science, и все что связано с данными, в котором вы найдете:

— Переведенные статьи;
— Полезные видео;
— Интересные опросы;
— Профессиональный юмор;

Присоединяйтесь, давайте расти как профессионалы вместе 😉

Подписаться: @data_science_wiki
​​Зачем бизнесу data science

Встретились как-то продакт с дата-сайентистом в одном офисе и стали выяснять, кто для бизнеса нужнее. Об этом в нашем видеоблоге вышел огромный выпуск, который я решил переделать в статью. Если интересно послушать полный диалог со всеми подробностями – добро пожаловать.

Всем привет! Меня зовут Игорь Уткин, я – дата-сайентист в hh.ru. В этой статье разбираемся: когда компании может понадобиться дата-сайентист, имеет ли собранная модель право на ошибку и как вообще люди уходят в data science. 

Читать...
​​Создание модели машинного обучения с помощью Google Colab без дополнительных настроек

Машинное обучение (МО) сейчас в тренде, поэтому неудивительно, что все компании хотят использовать его для улучшения своих продуктов или услуг. Мы наблюдаем растущий спрос на инженеров в сфере машинного обучения, и такой спрос привлекает внимание специалистов. Однако многим МО может показаться слишком сложным, особенно тем, у кого мало опыта работы с кодом или данными.

Читать...
​​Практические применения генеративных моделей: как мы делали суммаризатор текстов

В последнее время вышло большое количество генеративных моделей для русского языка. Команды Сбера выпустили целое семейство авторегрессионных моделей ruGPT3, ruT5, о которых мы подробно писали ранее. Сегодня мы расскажем, как практически применять обучение таких моделей и какие продукты можно получить на их основе.

Читать...