Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
630 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​На бесплатном митапе ответим на 7 важных вопросов, которые задает каждый новичок в Data Science.

25 апреля 19:00
Зарегистрироваться
​​Если вы работаете в Computer Vision, то для вас есть отличная новость!

Ребята из DeepSchool открыли набор на курс повышения квалификации в Deep Computer Vision. На курсе преподают 8 кураторов-практиков с опытом 3+ года в разработке, а мест всего 25.

Курс очень сильный, на нем научат решать востребованные задачи: Face Recognition, OCR, Tracking, Detection, Segmentation. Но самое главное — научат решать CV задачи end-to-end: добывать чистые данные, быстро учить модели, ускорять нейросети, создавать сервисы, автоматизировать их деплой, настраивать мониторинг и многое другое. Подробнее смотрите на странице курса.

Если вам не хватает ревью и поддержки от опытных наставников, если вы хотите больше нетворкинга с коллегами или желаете стать супер-звездой в CV, то успевайте запрыгнуть в «Ракету в Computer Vision».
​​Глобальная блокировка интерпретатора (GIL) и её воздействие на многопоточность в Python

В статье рассказано, зачем появилась и существует глобальная блокировка интерпретатора в Питоне, как она работает, и как она влияет на скорость работы Питона, а также о том, куда в будущем, вероятно, будет двигаться Питон.

Читать...
Прокачайте математику для анализа данных — найдите работу мечты!

Всё больше людей осваивают анализ данных, становятся аналитиками и специалистами по Data Science. Конкуренция растёт, и выигрывают в ней те, кто имеет крепкую математическую базу.  

Не можете похвастаться дипломом об окончании мехмата и не хотите тратить годы на освоение «царицы наук»? 

На курсе от Яндекс Практикума вы сможете освоить разделы математики, которые необходимы для работы аналитика и специалиста по Data Science.

Курс подойдёт:
- выпускникам и студентам курсов, посвящённых анализу данных,
- начинающим аналитикам данных и специалистам по Data Science,
- тем, кто готовится к математическим секциям собеседований в IT-компании.

Программа курса учитывает требования, которые предъявляют лучшие работодатели. Вы будете учиться только тому, что пригодится в профессии. 

Курс состоит из четырёх самостоятельных модулей:
- Теория вероятностей и статистика.
- Линейная алгебра.
- Математических анализ.
- Продвинутая линейная алгебра.

Прохождение каждого модуля займёт от одного до полутора месяцев. Вы можете выбрать один модуль или сразу несколько.

В курсе вас ждёт:
- теория в интерактивном формате, 1000 практических задач, в том числе на Python;
- поддержка от преподавателей и чат с однокурсниками;
- симуляция математической секции собеседования.

По завершении любого из модулей вы станете глубже понимать математические методы и увереннее чувствовать себя при решении рабочих задач.

Стоимость одного модуля — от 7 000р, при покупке нескольких модулей действуют скидки.

Подробности
​​Как мы распознавали птиц при помощи камер и искусственного интеллекта (часть 1)

Нейронные сети используются для множества задач, но слышали ли вы когда-нибудь про распознавание птиц? Мы – нет, поэтому возможность поработать над этим проектом очень нас захватила, а опыт по итогу оказался крайне интересным.

Читать...
Для тех, кто хочет заниматься исследованиями в области Machine Learning

Yandex Research запустил резидентскую программу ML Residency. Принять участие могут все — и опытные, и начинающие специалисты, в том числе студенты, а также те, кто развивается в смежных дисциплинах, например, математике, физике или компьютерных науках. 

Участники программы вместе с менторами из Яндекса выберут одну из проблем в области машинного обучения и разработают решение. Результаты можно презентовать на ведущих конференциях, а лучшие идеи будут в последующем использоваться в продуктах Яндекса или проектах с открытым кодом.

Узнать подробности и отправить заявку можно здесь.
​​Месяц назад ребята из Delivery Club поделились первой частью эволюции собственной рекомендательной системы ресторанов. Подробнее в публикации на Хабре.

На днях вышло продолжение. Из новой статьи вы узнаете, как отранжировать рестораны персонально для каждого пользователя, зачем нужна офлайновая ML-модель и почему обучение моделей «в лоб» не работает.
​​Хочешь стать незаменимым специалистом в ML команде? Освой инженерию данных — одно из самых востребованных направлений в Data Science.

На курсе «Инженер данных» от школы karpovꓸcourses под руководством опытных практиков из VK, Яндекс Go, СберМаркет и Mars за 5 месяцев ты научишься:

● Работать с реляционными и MPP базами данных
● Автоматизировать ETL-пайплайны
● Проектировать традиционные и облачные хранилища
● Применять ML-модели на больших данных
● Разрабатывать дашборды для мониторинга DWH платформы

Здесь тебя ждут интересные проекты и настоящая инфраструктура: Greenplum, Hadoop, Kubernetes, Spark, Hive, Kafka, Airflow, Tableau.

По итогам обучения ты станешь крепким Middle+ специалистом с широким набором прикладных навыков, а наш HR обязательно доведёт тебя до оффера в хорошую компанию.

Переходи по ссылке и записывайся на курс до 10 мая. Кстати, на сайте доступна бесплатная демоверсия.
​​ML-модели VS осложнения при бурении нефтяных скважин

В этой статье рассказывается о том как искалось решение для проблемы с прихватами при бурении нефтяных скважин с помощью машинного обучения и к чему в результате пришли.

Конкретнее, речь пойдёт о том, какие данные нам понадобились, что с ними было не так, какие модели прогнозирования мы испробовали и на какой комбинации моделей мы в результате остановились.

Читать...
​​Прокачайте свои навыки в сфере IT и аналитики данных — примерьте роль Data Scientist! Участвуйте в бесплатном онлайн-интенсиве, который пройдёт с 16 по 18 мая. Начало — в 19:00 по московскому времени.  

Записывайтесь: 👉 https://clc.to/OijvOg.

За 3 дня вы научитесь:

⚡️ исследовать данные с помощью языка программирования Python;
⚡️ строить модели для реальных кейсов;
⚡️ находить аномалии в данных;
⚡️ автоматизировать решение бизнес-задач с помощью искусственного интеллекта и Machine Learning.

В роли спикера выступит руководитель направления по исследованию данных в Сбере с семилетним опытом в программировании — Анастасия Борнева.

🎉 Участвуйте, задавайте вопросы и получите сертификат на 10 тысяч рублей на любой курс Skillbox. 

Присоединяйтесь!
​​Применение подхода eXtreme Multi-Label Classification для классификация записей материально-технических ресурсов

Данная работа является пересказом статьи Jingzhou Liu, Wei-Cheng Chang, Yuexin Wu, and Yiming Yang. 2017. Deep Learning for Extreme Multi-label Text Classification. In Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '17). Association for Computing Machinery, New York, NY, USA, 115–124. https://doi.org/10.1145/3077136.3080834

Читать...
​​Python коллекция полезных готовых скриптов

Сборник Python-скриптов для решения и задач автоматизации и упрощения рутинной работы.

Перейти по ссылке...
​​Значительно снизить расходы на приобретение нового оборудования и справиться с дефицитом IT-инфраструктуры помогут облачные сервисы. Ваши данные будут надежно защищены в отказоустойчивом ЦОД TIER III в Москве.

☁️Облако за 990 руб. в месяц! Держим цены 2021 года - убедитесь сами с помощью калькулятора.

Мы предлагаем облачные сервисы для бизнеса:
• корпоративная почта,
• 1С в облаке,
• хранение и резервное копирование данных, 
• платформа для совместной работы с документами,
• информационная безопасность,
• вычислительные ресурсы по моделям IaaS/PaaS.

Оформите бесплатный тестовый доступ на нашем сайте.

Приглашаем к сотрудничеству в рамках партнерской программы.
📞 Тел: +7(495)789 4135
🌏 Сайт: https://nubes.ru/
​​Подборка книг по Data Sciense

👉 Практическая статистика для специалистов Data Science
Авторы: Питер Брюс, Эндрю Брюс
Описание: как: В книге рассказывается о таких штуках как: разведочный анализ данных, статистические эксперименты, проверка значимости, регрессия, классификация, машинное обучение. Но для прочтения вам понадобятся знания математической статистики и языка R.

👉 Data Science
Авторы: Кэти О’Нил, Рэйчел Шатт
Описание: Книга основана на курсе Колумбийского университета по анализу данных. В процессе обучения вы узнаете о байесовском методе, визуализации данных, статистических алгоритмах, рекомендательных движках, MapReduce и финансовом моделировании.

👉 Теоретический минимум по Big Data
Авторы: Анналин Ын, Кеннет Су
Описание: Издание не ориентировано только на профессионалов, заняться образованием могут начать аналитики, бизнесмены, программисты и непрофильные специалисты. На страницах этого труда рассматривается масса алгоритмов, каждому из которых посвящена отдельная глава, с картинками и примерами из реальных задач.

👉 Основы Data Science и Big Data
Авторы: Дэви Силен, Арно Мейсман, Мохамед Али
Описание: Изучение DS вы начнете с базовых вещей, а потом приступите к алгоритмам машинного обучения, массивам данных, NoSQL и т. д. В качестве языка программирования в этой книге используется Python со специальными библиотеками.

👉 Principles of Strategic Data Science
Авторы: Peter Prevos
Описание: Книга начинается с объяснения того, что такое наука о данных и как организации могут ее использовать для оптимизации всех рабочих процессов. Затем автор приводит критерии надежности информационных продуктов и способы визуализации информации. В процессе изучения пятиэтапной структуры вы будете открывать для себя стратегические аспекты DS, которые позволяют повысить ценность извлекаемых данных. В заключительной главе рассматривается роль штатного аналитика данных в процессе интеграции DS-подхода в бизнес-процессы организации.
​​Российский рынок технологий с голосовыми решениями на базе ИИ достигнет $561 млн в 2025 году.

SmartSpeech — подобная разработка от команды Сбера.

Что умеет?
Распознавать речь: фильтрует шумы, понимает, закончена фраза или нет, какие эмоции у говорящего.
Синтезировать речь, в том числе на английском – говорить естественно, менять тон и тембр, правильно произносить ё. Не путается при произношении сложных адресов и названий.

Где использовать?
Для превращения аудио в текст и наоборот, для озвучки интерфейсов, автоответов по телефону, голосового управления, в том числе с использованием голосовых помощников.

Как протестировать?
На что способен SmartSpeech в части распознавания речи, можно посмотреть с помощью бесплатного Telegram-бота. Его назначение — конвертировать голосовые сообщения и другие аудиофайлы в текст. 

Для кого подходит?
Особенно оценят специалисты, которые работают со словом. Для бизнеса бот — отличный способ познакомиться с возможностями умной технологии SmartSpeech
​​Почему я ушел из Netflix с позиции разработчика с окладом 450000$

Перевод статьи Michael Lin. Ссылка на оригинал

Читать перевод на хабре...
​​За считанные годы криптовалюты стали частью современного мира и используются для самых разных целей в том числе для инвестирования. Команда Николая Валиотти на канале LEFT JOIN не даёт советы с точки зрения инвесторов, зато они написали скрипты для обработки данных, которые помогают получать нужную информацию о валютах и быстро обрабатывать информацию на бирже инструментами аналитики данных, чтобы принимать взвешенные решения.

Об этом и многом другом вы можете узнать на канале LEFT JOIN. Подписывайтесь!
Forwarded from inDrive.Tech
​​📈 Как оценить изменения в технологическом продукте с помощью данных?

Этому посвящена англоязычная статья дата-сайентиста inDriver Николая Неустроева на Medium. В материале вы найдете подробное описание и примеры 9 экспериментальных и квази-экспериментальных методов для анализа данных.

Статья поможет понять, какой метод анализа данных выбрать, в зависимости от ситуации и ресурсов.
​​Стань дата-инженером с Яндекс Практикумом

Сервис онлайн-обучения цифровым профессиям Яндекс Практикум запускает программу обучения по специальности «Инженер данных». Курс предназначен для студентов с как минимум базовым знанием SQL и Python — перед стартом необходимо пройти тест.

Авторы и преподаватели – практикующие эксперты ведущих российских IT-компаний. 

Длительность — 6,5 месяцев. 

Курс на 75% состоит из практических занятий – по окончании программы в вашем портфолио будет не менее 10 проектов.
 
Вы научитесь: 
- работать с технологиями Python, SQL, Metabase, Airflow, PostgreSQL, MongoDB, ClickHouse, Celery, Kafka, Hadoop, Apache Spark, Spark Streaming и Yandex.Cloud
- извлекать, очищать и сохранять данные
- создавать и поддерживать хранилища типов Data Warehouse и Data Lake
- работать со стриминговой обработкой данных и облаками

Претендовать на работу по новой специальности студенты курса смогут уже в ходе обучения – с поиском вакансии помогут специалисты карьерного центра Яндекс Практикум. 

Запись на курс открыта, старт занятий для ближайшего потока студентов – 23 мая. 

Стоимость курса:
95 000 рублей при разовой оплате, при оплате в рассрочку – 17 000 рублей в месяц. 

По завершении программы студенты получат диплом о профессиональной переподготовке. 

Запись на бесплатную вводную часть и подробности по ссылке.
​​ML под ударом: противодействие атакам на алгоритмы машинного обучения

Ежегодно выходят тысячи научных работ об атаках на алгоритмы машинного обучения. Большая часть из них рассказывает о взломе компьютерного зрения, ведь на его примере можно наглядно продемонстрировать последствия атаки. На деле первыми под удар попадают спам-фильтры, классификаторы контента, антивирусные сканеры и системы обнаружения вторжений. Например, достается базе VirusTotal. Туда уже давно пробуют загружать безобидные файлы, которые распознаются, как вредоносные и вызывают цепочки ложных срабатываний.

Читать...
​​Израильский стартап упрощает найм сотрудников с использованием обработки естественного языка

Myinterview – израильский стартап, разрабатывающий инструменты машинного обучения для ускорения и упрощения процессов найма для компаний. Платформа Myinterview расшифровывает видеоинтервью кандидатов, оценивает их навыки и выставляет оценку.
Основатели утверждают, что Myinterview помогает работодателям экономить до 70% времени на найм. Миссия MyInterview состоит в том, чтобы создавать короткие и эффективные воронки найма.

Читать...