ML Career – Telegram
ML Career
201 subscribers
139 photos
5 videos
2 files
184 links
Branched from @data_career
Download Telegram
Открытый практикум Data Analyst by Rebrain: АB-тестирование моделей машинного обучения

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

17 Января (Вторник) в 19:00 по МСК

Программа практикума:

🔹Что такое АБ-тестирование и для чего оно нужно в машинном обучении?
🔹Правила проведение корректного АБ-тестирования
🔹Оценка и анализ результатов

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.

https://news.1rj.ru/str/Rebrain_DataScience/105
🎓Нужно ли разработчику высшее образование?

Обязательно ли идти в ВУЗ и получать диплом бакалавра/магистра, чтобы стать крутым DS? И стоит ли выбирать путь прогера-Джедая, который уже в 11 классе обучает такие нейросети, что только держись, но полностью посвящает себя работе и забивает на образование? Зачем ему универ? Эти пара и лекции будут только отвлекать от работы и развития в области DS? Или все же нет и высшее образование нужно?

Разбираемся в вопросе на карьерном подкасте вместе с Академией ИИ.

Спойлер: как по мне, так высшее образование все же необходимо. И если начинать прогать, делать крутые вещи и работать можно и раньше, без него, то на более поздних этапах в карьере без него никуда. А чтобы узнать, почему я так считаю, смотрите подкаст.

Note: Готова спорить только с теми, кто все посмотрел ;)

#подкаст #ds

https://news.1rj.ru/str/mashkka_ds/327
This media is not supported in your browser
VIEW IN TELEGRAM
500+ список проектов AI с кодами

Гитхаб с таблицей, связывающей 100 проектов с кодом.
Полезный ресурс, если вы ищете вдохновение для своего следующего проекта, опирающегося на машину.

🖥 Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Курс ODS ML System Design.
В 17 лекциях дано широкое покрытие тем вокруг проектирования систем принятия решений на базе DS/ML, от особенностей работы с данными до интеграции моделей в бизнес процессы.

В контексте нашей темы недели можно посмотреть лекцию:
📺 8. Диагностика ошибок и отказов ML-систем. Диагностика проблем с данными. Мониторинг. (~40 минут).

Каждая лекция снабжена списком дополнительных материалов, в конце 8-ой лекции, например, вот такая занимательная подборка статей:
📄 J. Pan et al. - Adversarial Validation Approach to Concept Drift Problem in User Targeting Automation Systems at Uber, 2020 (~20-30 минут).
📄 R. Jiang et al. - Degenerate Feedback Loops in Recommender Systems, 2019 (~30-40 минут).
📄 S. Ira Ktena et al. - Addressing Delayed Feedback for Continuous Training with Neural Networks in CTR prediction, 2019 (~40-50 минут).
📄 P. J. Chia et al. - Beyond NDCG: behavioral testing of recommender systems with RecList, 2021 (~20-30 минут).

😎Команда курса ML System Design: Дмитрий Колодезев, Артем Карасюк, Евгения Сотникова и Ирина Голощапова.

📌 Подписывайтесь на канал коллег Reliable ML, если вы еще не там!

📞 И подключайтесь к нашему обсуждению в голосовом чате NoML в этот четверг!

https://news.1rj.ru/str/noml_digest/422
#Курс #ODS ML #SystemDesign
❗️Как пройти техническое собеседование на ML-специалиста?

👉Узнайте на примере mock-интервью с преподавателями курса «MLOps» в OTUS! На открытом уроке вы сможете наблюдать один из этапов собеседования при найме ML-специалистов — ML System Design секцию. Для удачного прохождения этого этапа нужно не только знать ML-алгоритмы, но и иметь навыки проектирования ML-систем, которые могут успешно работать в промышленной среде.

Спикеры:
Павел Филонов — Ex-Data Science Manager в Kaspersky.
Александр Миленькин — cтарший менеджер по работе с большими данными в X5 Retail Group.

🗓Когда: 24 января 19:00 мск

➡️Для участия пройдите вступительный тест
Please open Telegram to view this post
VIEW IN TELEGRAM
📃 Самообучение в Data science, с нуля до Senior за два года

Хочу поделиться методами освоения Data science с нуля человеком из другой ИТ специальности. Цель: дать понять, подходит ли Вам эта специальность в принципе, и рассказать про эффективные подходы к самообучению, которые мне помогли (отдельно планирую потом детальные статьи по отдельным темам).

Отличные материалы уже существуют по большинству конкретных тем, я сам по ним учился.

Думаю, многим будут полезны "мета" материалы о том, как выбирать курсы и статьи, по которым учиться. Например, я пересмотрел десятки статей и книг, пробовал много разных он-лайн курсов, но полезной оказалась лишь малая часть всего доступного.

Надеюсь, что смогу серьезно сэкономить вам время и помочь достигнуть большего, показав более эффективный путь самообучения.

Читать дальше
Please open Telegram to view this post
VIEW IN TELEGRAM
🔹Что такое Face Recognition и с помощью каких инструментов лучше подходить к задаче по распознаванию лиц?

💬Обсудим 23 января в 20:00 на открытом уроке онлайн-курса «Компьютерное зрение» в OTUS.

На занятии мы разберем:

- В чем заключается задача Face Recognition и из каких подзадач она состоит
- Какие существуют основные подходы по решению задачи детекции лиц
- С помощью каких алгоритмов решается задача распознавания лиц (EigenFaces, нейросетевые методы).
- Как на практике решить задачу распознавания лиц с помощью метода EigenFaces.
- Какие существуют датасеты, библиотеки и инструменты, необходимые для решения задачи распознавания лиц.

🔥Регистрируйтесь на мероприятие прямо сейчас и получите доступ к курсу по спец.цене!

Записаться на урок
#FaceRecognition
#Интерпретируемость ML-моделей: от инструментов до потребностей пользователя
Новая статья на Хабре

Опубликовали с Димой статью на Хабре - на основе постов в канале от осени 2022 г. Может быть интересно как новым участникам канала, так и тем, кому интересно прочитать все системно вместе, а не отдельными постами.

Интерпретируемость ML-моделей - очень широкая концепция. То, насколько интерпретация хороша, зависит не только от инструментов и отчетов, которые мы предоставляем пользователю, но и от потребностей пользователя и особенностей задач, которые он решает.

В статье разберемся, как эффективно работать с интерпретируемостью ML-моделей в зависимости от потребностей ключевых пользователей.

Лайк, шер, репост, конечно же! Всем добра!
🌹

Ваш
@ReliableML

https://habr.com/ru/post/709688/ #ReliableML

Источник: https://news.1rj.ru/str/reliable_ml/119
Forwarded from Aleron Backstage
Понемногу захожу в ML System Design.

Вчера получил дозу удовольствия от мастерского разбора задания от Павла Филонова (Ex-Head лабы Касперского). Разбирали анти-фрод систему.

План был такой. С меня была задача, с Павла демонстрационный разбор. Скоро появится запись.
👍2
Forwarded from Aleron Backstage
Aleron Backstage
Понемногу захожу в ML System Design. Вчера получил дозу удовольствия от мастерского разбора задания от Павла Филонова (Ex-Head лабы Касперского). Разбирали анти-фрод систему. План был такой. С меня была задача, с Павла демонстрационный разбор. Скоро появится…
С кем не говорю, все при упоминании MLSD говорят про видосы Бабушкина. На мой взгляд, у Бабушкина были не самые яркие кандидаты. Не принижаю достоинство других авторов, но я вчера четко прочувствовал, что много звездных экспертов остается еще пока в тени. Будем рыть в этом году контент в эту сторону тоже. Обещаю сделать пару ярких выпусков.
🔥 Финтех Хаб Банка России и ВТБ приглашают студентов принять участие в отборе на образовательную программу "Машинное обучение: No-code кластеризация текстов".

📅 Программа пройдет с 14 февраля по 7 апреля 2023 года.
🕒 Дедлайн подачи заявок: до 24 января 2023 года.
📝 Форма отбора: тестирование (25 января - 3 февраля 2023 года).

Теоретический модуль: 14 февраля - 7 марта 2023 года (дистанционно).

Модуль включает в себя 2 параллельных трека: "машинное обучение" и "разработка цифровых продуктов". У участников есть возможность обучаться сразу на двух треках, но при подаче заявки надо выбрать приоритетный трек, по которому будет оцениваться прогресс обучения.

Практический модуль: 16 марта - 7 апреля 2023 года (дистанционно + 6 очных дней, г. Москва, проезд и проживание участники оплачивают самостоятельно)

Участники, показавшие лучшие результаты в теоретическом модуле, смогут применить полученные знания и совместно с менторами из Департамента анализа данных и моделирования ВТБ пройти весь цикл продуктовой ML-разработки.

В ходе практического модуля вы:
🔹самостоятельно придумаете архитектуру и user-story NLP-сервиса для разведочного анализа текстов;
🔹поработаете в кросс-функциональной команде лучших участников первого модуля в одной из ролей — Data scientist, Front-end или Back-end разработчик;
🔹 самостоятельно разработаете и внедрите модели машинного обучения;
🔹 реализуете UI/UX сервиса от загрузки данных до визуализации результатов;
🔹 презентуете разработанный прототип на международной онлайн-конференции по анализу данных Data Fusion 13-14 апреля 2023 года!

🚀Подать заявку и ознакомиться с требованиями к участникам можно на сайте программы.

https://news.1rj.ru/str/noml_community/5020/5273
Курсы и #книги по #RL

#Курсы лекций:
🎓 Stanford CS234 - Reinforcement Learning, в открытом доступе есть запись лекций 2019 года.
🎓 ШАД - Practical RL, 2020 (лекции и на русском, и английском).
🎓 МФТИ, ШАД, DeepPavlov - Advanced Topics in Deep Reinforcement Learning, 2020 (лекции на русском).

И пара книг:
📖 R.S. Sutton, A.G. Barto - Reinforcement Learning, Second Edition, 2018 (есть перевод).
📖 S. Russell, P. Norvig - Artificial Intelligence: A Modern Approach, 4th ed., 2020 (есть перевод). Наши докладчики вчерашнего семинара рекомендуют обратить внимание на главу про RL.

https://news.1rj.ru/str/noml_digest/428
Forwarded from Big data world
This media is not supported in your browser
VIEW IN TELEGRAM
Ян ЛеКун в 1993 году демонстрация LeNet-1

Это была первая в мире сверточная нейронная сеть для распознавания рукописного ввода. 29 лет спустя — этот же подход лежит в основе большей части компьютерного зрения. Исторический момент для машинного обучения !
Forwarded from #ChatGPT now
Всем привет 👋!
Сегодня большой день - я первый раз публикую статью на Хабре. Мне очень нравится идея подробного объяснения, которое может поглотить читателей не на один вечер. Хотелось достигнуть того, что публикация станет интересна широкому кругу лиц - и новичкам в мире Машинного Обучения, и специалистам в области обработки текстов, и даже рядовому читателю без профильных знаний ML.

Я выбрал насущную тему, которая у многих на слуху и активно обсуждается в чатах. Речь пойдет о
👣 ChatGPT и её проблемах с точки зрения обработки фактической информации реального мира (даты/имена/места/...).

Насколько мы действительно близки к внедрению продвинутых чат-ботов в поисковые системы? Как может выглядеть новый интерфейс взаимодействия? Какие основные проблемы есть на пути интеграции? И могут ли модели сёрфить интернет бок о бок с традиционными поисковиками?

На эти и многие другие вопросы я постарался ответить в блогпосте. В нем больше 30 страниц текста
😨, однако информация разбита по уровням "техничности" и охватывает множество смежных тем. Каждый может погрузиться так глубоко, как этого захочет. Внутри даже присутствует глоссарий для удобства восприятия текста.

🖥 Ссылка: habr.com/ru/company/ods/blog/709222/

🌃 А ещё подписывайтесь на мой авторский канал в телеграм!
💬 Там в комментариях я с радостью отвечу на все возникающие вопросы 😊

Источник: https://news.1rj.ru/str/seeallochnaya/27 -> под пост
#статья #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Big Data Science
💡Top 6 data sources for deep diving into Machine Learning
Chronic disease data is a source where you can find data on various chronic diseases in the United States.
IMF Data - The International Monetary Fund, which also publishes data on international finance, debt indicators, foreign exchange reserves, investments, and so on.
Financial Times Market Data - contains information about the financial markets around the world, which includes indicators such as commodities, currencies, stock price indices
ImageNet is the image data for the new algorithms, organized according to the WordNet hierarchy, where hundreds and thousands of images represent each node of the hierarchy
Stanford Dogs Dataset - contains a huge number of images of various breeds of dogs
HotspotQA Dataset - question-answer type data that allows you to create systems for answering questions in the most understandable way.
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 5 расширения VS Code для датасаентиста.

Любой специалист по инженерии данных может установить несколько расширений и таким способом сделать редактор удобнее для работы с данными.

Рассмотрим некоторые из расширений VS Code, которые помогут дата-инженерам оптимизировать работу и увеличить объем выполненной работы.

CodeGPT - Это расширение: пишет код по текстовому запросу, сравнивает лучшие ответы Stackoverflow с ответом ИИ, находит проблемы в коде, отвечает на любые вопросу по коду, рефакторинг, документация и даже пишет модульные тесты.

Pylance - Приложение предоставляет мощный инстумент - автодополнения кода IntelliSense (дописывает функции при вводе начальных букв ).Расширения с продвинутой функцией
определения типов, предложениями функций, автоимпортами и многим другим.

Jupyter - расширение Jupyter пригодится при выполнении повседневных задач инженерии данных в ноутбуках Jupyter. Расширение позволяет редактировать блоки ноутбуков и запускать их на сервере Jupyter-ноутбуков, аналогично работе с ноутбуками Jupyter.

Excel Viewer - Расширение, которое позволит просматривать и редактировать файлы CSV и Excel прямо в VS Code без необходимости открывать другое приложение и обладает еще рядом удобного функционала.


IntelliCode - Расширение IntelliCode для Visual Studio предоставляет функции разработки с помощью ИИ для разработчиков Python, TypeScript/JavaScript , основанными на понимании контекста вашего кода в сочетании с машинным обучением. В приложении есть примеры с кодом для более чем 100 000 различных API.

Подробнее

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
#course #education

Курс Эффективные системы глубокого обучения

Хотел бы порекомендовать курс «Эффективные системы глубокого обучения», который преподают на факультете компьютерных наук НИУ ВШЭ и в Школе анализа данных Яндекса.

На курсе будут раскрыты следующие темы:
- Трэкинг экспериментов, моделей и версий данных. Тестирование DL кода
- Оптимизация тренировки моделей, профилирование DL кода
- Основы распределённых вычислений
- Эффективность использования памяти
- Деплой веб приложений
- ПО для деплоя нейронных сетей
- Оптимизация моделей для быстрого инференса

Будет несколько домашних заданий по следующим темам:

- Пайплайны обучения и профилирование кода
- Распределенное обучение с эффективным использованием памяти
- Развертывание и оптимизация моделей для продакшена


Курс будет очень полезен тем кто занимается computer vision и NLP задачами.
Forwarded from Курсы Data Science
Подборка курсов для быстрого старта в DS:

Бесплатные:
Основы статистики
Введение в Data Science и машинное обучение
Симулятор SQL от karpovꓸcourses

Платные:
Аналитик данных — тоже от ребят из karpovꓸcourses
Start ML - для тех, кому интереснее машинное обучение
🔥 Подборка каналов для Дата сайентиста

⭐️ Нейронные сети
@vistehno - chatgpt ведет блог, решает любые задачи и отвечает на любые ваши вопросы.
@aigen - сети для генерации картинок. видео, музыки и многого другого.
@neural – погружение в нейросети.

🖥 Machine learning
@ai_ml – погружение в нейросети, ai, Chatgpt, midjourney, машинное обучение.
@machinelearning_ru – машинное обучении на русском от новичка до профессионала.
@machinelearning_interview – подготовка к собеседованию.
@datascienceiot – бесплатные книги Machine learning
@ArtificialIntelligencedl – канал о искусственном интеллекте

@machinee_learning – чат о машинном обучении
@datascienceml_jobs - работа ds, ml
@Machinelearning_Jobs - чат работы мл

🖥 SQL базы данных

@sqlhub - блог ведущего аналитика Ozon tech. Повышение эффективности кода с грамотным использованием бд.
@chat_sql - чат изучения бд.

🖥 Python

@pythonl - главный канал самого популярного языка программирования.
@pro_python_code – учим python с ментором.
@python_job_interview – подготовка к Python собеседованию.
@python_testit - проверочные тесты на python
@pythonlbooks - современные книги Python
@python_djangojobs - работа для Python программистов
@python_django_work - чат обсуждения вакансий


🖥 Javanoscript / front

@react_tg - - 40,14% разработчиков сайтов использовали React в 2022 году - это самая популярная библиотека для создания сайтов.
@javanoscript -канал для JS и FrontEnd разработчиков. Лучшие практики и примеры кода. Туториалы и фишки JS
@Js Tests - каверзные тесты JS
@hashdev - погружение в web разработку.
@javanoscriptjobjs - отборные вакансии и работа FrontEnd.
@jsspeak - чат поиска FrontEnd работы.

🖥 Java
@javatg - выучить Java с senior разработчиком по профессиональной методике.
@javachats - чат для ответов на вопросы по Java
@java_library - библиотека книг Java
@android_its - Android разработка
@java_quizes - тесты Java
@Java_workit - работа Java
@progersit - шпаргалки ит

👣 Golang
@Golang_google - восхитительный язык от Google, мощный и перспективный.
@golang_interview - вопросы и ответы с собеседований по Go. Для всех уровней разработчиков.
@golangtests - интересные тесты и задачи GO
@golangl - чат изучающих Go
@GolangJobsit - отборные вакансии и работа GO
@golang_jobsgo - чат для ищущих работу.
@golang_books - полезные книги Golang
@golang_speak - обсуждение языка Go

🖥 Linux
@linux -топ фишки, гайды, уроки по работе  с Linux.
@linux chat - чат linux для обучения и помощи.
@linux_read - бесплатные книги linux

👷‍♂️ IT работа

@hr_itwork -кураторский список актуальных ит-ваканнсии

🤡It memes
@memes_prog - ит-мемы

⚙️ Rust
@rust_code - Rust избавлен от болевых точек, которые есть во многих современных яп
@rust_chats - чат rust

#️⃣ c# c++
C# - объединяет лучшие идеи современных языков программирования
@csharp_cplus чат
С++ - Универсальность. Возможно, этот главный плюс C++.

📓 Книги

@programming_books_it - большая библиотека. программиста
@datascienceiot -ds книги
@pythonlbooks - python библиотека.
@golang_books - книги Golang
@frontendbooksit - front книги
@progersit - ит-шпаргалки
@linux_read - Linux books
@java_library - Java books

🖥 Github
@github_code - лучшие проекты с github
@bigdatai - инструменты по работе с данными

🖥 Devops
Devops - специалист общего профиля, которому нужны обширные знания в области разработки.

📢 English for coders

@english_forprogrammers - Английский для программистов
Please open Telegram to view this post
VIEW IN TELEGRAM