ML Career – Telegram
ML Career
202 subscribers
139 photos
5 videos
2 files
184 links
Branched from @data_career
Download Telegram
🔹Что такое Face Recognition и с помощью каких инструментов лучше подходить к задаче по распознаванию лиц?

💬Обсудим 23 января в 20:00 на открытом уроке онлайн-курса «Компьютерное зрение» в OTUS.

На занятии мы разберем:

- В чем заключается задача Face Recognition и из каких подзадач она состоит
- Какие существуют основные подходы по решению задачи детекции лиц
- С помощью каких алгоритмов решается задача распознавания лиц (EigenFaces, нейросетевые методы).
- Как на практике решить задачу распознавания лиц с помощью метода EigenFaces.
- Какие существуют датасеты, библиотеки и инструменты, необходимые для решения задачи распознавания лиц.

🔥Регистрируйтесь на мероприятие прямо сейчас и получите доступ к курсу по спец.цене!

Записаться на урок
#FaceRecognition
#Интерпретируемость ML-моделей: от инструментов до потребностей пользователя
Новая статья на Хабре

Опубликовали с Димой статью на Хабре - на основе постов в канале от осени 2022 г. Может быть интересно как новым участникам канала, так и тем, кому интересно прочитать все системно вместе, а не отдельными постами.

Интерпретируемость ML-моделей - очень широкая концепция. То, насколько интерпретация хороша, зависит не только от инструментов и отчетов, которые мы предоставляем пользователю, но и от потребностей пользователя и особенностей задач, которые он решает.

В статье разберемся, как эффективно работать с интерпретируемостью ML-моделей в зависимости от потребностей ключевых пользователей.

Лайк, шер, репост, конечно же! Всем добра!
🌹

Ваш
@ReliableML

https://habr.com/ru/post/709688/ #ReliableML

Источник: https://news.1rj.ru/str/reliable_ml/119
Forwarded from Aleron Backstage
Понемногу захожу в ML System Design.

Вчера получил дозу удовольствия от мастерского разбора задания от Павла Филонова (Ex-Head лабы Касперского). Разбирали анти-фрод систему.

План был такой. С меня была задача, с Павла демонстрационный разбор. Скоро появится запись.
👍2
Forwarded from Aleron Backstage
Aleron Backstage
Понемногу захожу в ML System Design. Вчера получил дозу удовольствия от мастерского разбора задания от Павла Филонова (Ex-Head лабы Касперского). Разбирали анти-фрод систему. План был такой. С меня была задача, с Павла демонстрационный разбор. Скоро появится…
С кем не говорю, все при упоминании MLSD говорят про видосы Бабушкина. На мой взгляд, у Бабушкина были не самые яркие кандидаты. Не принижаю достоинство других авторов, но я вчера четко прочувствовал, что много звездных экспертов остается еще пока в тени. Будем рыть в этом году контент в эту сторону тоже. Обещаю сделать пару ярких выпусков.
🔥 Финтех Хаб Банка России и ВТБ приглашают студентов принять участие в отборе на образовательную программу "Машинное обучение: No-code кластеризация текстов".

📅 Программа пройдет с 14 февраля по 7 апреля 2023 года.
🕒 Дедлайн подачи заявок: до 24 января 2023 года.
📝 Форма отбора: тестирование (25 января - 3 февраля 2023 года).

Теоретический модуль: 14 февраля - 7 марта 2023 года (дистанционно).

Модуль включает в себя 2 параллельных трека: "машинное обучение" и "разработка цифровых продуктов". У участников есть возможность обучаться сразу на двух треках, но при подаче заявки надо выбрать приоритетный трек, по которому будет оцениваться прогресс обучения.

Практический модуль: 16 марта - 7 апреля 2023 года (дистанционно + 6 очных дней, г. Москва, проезд и проживание участники оплачивают самостоятельно)

Участники, показавшие лучшие результаты в теоретическом модуле, смогут применить полученные знания и совместно с менторами из Департамента анализа данных и моделирования ВТБ пройти весь цикл продуктовой ML-разработки.

В ходе практического модуля вы:
🔹самостоятельно придумаете архитектуру и user-story NLP-сервиса для разведочного анализа текстов;
🔹поработаете в кросс-функциональной команде лучших участников первого модуля в одной из ролей — Data scientist, Front-end или Back-end разработчик;
🔹 самостоятельно разработаете и внедрите модели машинного обучения;
🔹 реализуете UI/UX сервиса от загрузки данных до визуализации результатов;
🔹 презентуете разработанный прототип на международной онлайн-конференции по анализу данных Data Fusion 13-14 апреля 2023 года!

🚀Подать заявку и ознакомиться с требованиями к участникам можно на сайте программы.

https://news.1rj.ru/str/noml_community/5020/5273
Курсы и #книги по #RL

#Курсы лекций:
🎓 Stanford CS234 - Reinforcement Learning, в открытом доступе есть запись лекций 2019 года.
🎓 ШАД - Practical RL, 2020 (лекции и на русском, и английском).
🎓 МФТИ, ШАД, DeepPavlov - Advanced Topics in Deep Reinforcement Learning, 2020 (лекции на русском).

И пара книг:
📖 R.S. Sutton, A.G. Barto - Reinforcement Learning, Second Edition, 2018 (есть перевод).
📖 S. Russell, P. Norvig - Artificial Intelligence: A Modern Approach, 4th ed., 2020 (есть перевод). Наши докладчики вчерашнего семинара рекомендуют обратить внимание на главу про RL.

https://news.1rj.ru/str/noml_digest/428
Forwarded from Big data world
This media is not supported in your browser
VIEW IN TELEGRAM
Ян ЛеКун в 1993 году демонстрация LeNet-1

Это была первая в мире сверточная нейронная сеть для распознавания рукописного ввода. 29 лет спустя — этот же подход лежит в основе большей части компьютерного зрения. Исторический момент для машинного обучения !
Forwarded from #ChatGPT now
Всем привет 👋!
Сегодня большой день - я первый раз публикую статью на Хабре. Мне очень нравится идея подробного объяснения, которое может поглотить читателей не на один вечер. Хотелось достигнуть того, что публикация станет интересна широкому кругу лиц - и новичкам в мире Машинного Обучения, и специалистам в области обработки текстов, и даже рядовому читателю без профильных знаний ML.

Я выбрал насущную тему, которая у многих на слуху и активно обсуждается в чатах. Речь пойдет о
👣 ChatGPT и её проблемах с точки зрения обработки фактической информации реального мира (даты/имена/места/...).

Насколько мы действительно близки к внедрению продвинутых чат-ботов в поисковые системы? Как может выглядеть новый интерфейс взаимодействия? Какие основные проблемы есть на пути интеграции? И могут ли модели сёрфить интернет бок о бок с традиционными поисковиками?

На эти и многие другие вопросы я постарался ответить в блогпосте. В нем больше 30 страниц текста
😨, однако информация разбита по уровням "техничности" и охватывает множество смежных тем. Каждый может погрузиться так глубоко, как этого захочет. Внутри даже присутствует глоссарий для удобства восприятия текста.

🖥 Ссылка: habr.com/ru/company/ods/blog/709222/

🌃 А ещё подписывайтесь на мой авторский канал в телеграм!
💬 Там в комментариях я с радостью отвечу на все возникающие вопросы 😊

Источник: https://news.1rj.ru/str/seeallochnaya/27 -> под пост
#статья #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Big Data Science
💡Top 6 data sources for deep diving into Machine Learning
Chronic disease data is a source where you can find data on various chronic diseases in the United States.
IMF Data - The International Monetary Fund, which also publishes data on international finance, debt indicators, foreign exchange reserves, investments, and so on.
Financial Times Market Data - contains information about the financial markets around the world, which includes indicators such as commodities, currencies, stock price indices
ImageNet is the image data for the new algorithms, organized according to the WordNet hierarchy, where hundreds and thousands of images represent each node of the hierarchy
Stanford Dogs Dataset - contains a huge number of images of various breeds of dogs
HotspotQA Dataset - question-answer type data that allows you to create systems for answering questions in the most understandable way.
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 5 расширения VS Code для датасаентиста.

Любой специалист по инженерии данных может установить несколько расширений и таким способом сделать редактор удобнее для работы с данными.

Рассмотрим некоторые из расширений VS Code, которые помогут дата-инженерам оптимизировать работу и увеличить объем выполненной работы.

CodeGPT - Это расширение: пишет код по текстовому запросу, сравнивает лучшие ответы Stackoverflow с ответом ИИ, находит проблемы в коде, отвечает на любые вопросу по коду, рефакторинг, документация и даже пишет модульные тесты.

Pylance - Приложение предоставляет мощный инстумент - автодополнения кода IntelliSense (дописывает функции при вводе начальных букв ).Расширения с продвинутой функцией
определения типов, предложениями функций, автоимпортами и многим другим.

Jupyter - расширение Jupyter пригодится при выполнении повседневных задач инженерии данных в ноутбуках Jupyter. Расширение позволяет редактировать блоки ноутбуков и запускать их на сервере Jupyter-ноутбуков, аналогично работе с ноутбуками Jupyter.

Excel Viewer - Расширение, которое позволит просматривать и редактировать файлы CSV и Excel прямо в VS Code без необходимости открывать другое приложение и обладает еще рядом удобного функционала.


IntelliCode - Расширение IntelliCode для Visual Studio предоставляет функции разработки с помощью ИИ для разработчиков Python, TypeScript/JavaScript , основанными на понимании контекста вашего кода в сочетании с машинным обучением. В приложении есть примеры с кодом для более чем 100 000 различных API.

Подробнее

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
#course #education

Курс Эффективные системы глубокого обучения

Хотел бы порекомендовать курс «Эффективные системы глубокого обучения», который преподают на факультете компьютерных наук НИУ ВШЭ и в Школе анализа данных Яндекса.

На курсе будут раскрыты следующие темы:
- Трэкинг экспериментов, моделей и версий данных. Тестирование DL кода
- Оптимизация тренировки моделей, профилирование DL кода
- Основы распределённых вычислений
- Эффективность использования памяти
- Деплой веб приложений
- ПО для деплоя нейронных сетей
- Оптимизация моделей для быстрого инференса

Будет несколько домашних заданий по следующим темам:

- Пайплайны обучения и профилирование кода
- Распределенное обучение с эффективным использованием памяти
- Развертывание и оптимизация моделей для продакшена


Курс будет очень полезен тем кто занимается computer vision и NLP задачами.
Forwarded from Курсы Data Science
Подборка курсов для быстрого старта в DS:

Бесплатные:
Основы статистики
Введение в Data Science и машинное обучение
Симулятор SQL от karpovꓸcourses

Платные:
Аналитик данных — тоже от ребят из karpovꓸcourses
Start ML - для тех, кому интереснее машинное обучение
🔥 Подборка каналов для Дата сайентиста

⭐️ Нейронные сети
@vistehno - chatgpt ведет блог, решает любые задачи и отвечает на любые ваши вопросы.
@aigen - сети для генерации картинок. видео, музыки и многого другого.
@neural – погружение в нейросети.

🖥 Machine learning
@ai_ml – погружение в нейросети, ai, Chatgpt, midjourney, машинное обучение.
@machinelearning_ru – машинное обучении на русском от новичка до профессионала.
@machinelearning_interview – подготовка к собеседованию.
@datascienceiot – бесплатные книги Machine learning
@ArtificialIntelligencedl – канал о искусственном интеллекте

@machinee_learning – чат о машинном обучении
@datascienceml_jobs - работа ds, ml
@Machinelearning_Jobs - чат работы мл

🖥 SQL базы данных

@sqlhub - блог ведущего аналитика Ozon tech. Повышение эффективности кода с грамотным использованием бд.
@chat_sql - чат изучения бд.

🖥 Python

@pythonl - главный канал самого популярного языка программирования.
@pro_python_code – учим python с ментором.
@python_job_interview – подготовка к Python собеседованию.
@python_testit - проверочные тесты на python
@pythonlbooks - современные книги Python
@python_djangojobs - работа для Python программистов
@python_django_work - чат обсуждения вакансий


🖥 Javanoscript / front

@react_tg - - 40,14% разработчиков сайтов использовали React в 2022 году - это самая популярная библиотека для создания сайтов.
@javanoscript -канал для JS и FrontEnd разработчиков. Лучшие практики и примеры кода. Туториалы и фишки JS
@Js Tests - каверзные тесты JS
@hashdev - погружение в web разработку.
@javanoscriptjobjs - отборные вакансии и работа FrontEnd.
@jsspeak - чат поиска FrontEnd работы.

🖥 Java
@javatg - выучить Java с senior разработчиком по профессиональной методике.
@javachats - чат для ответов на вопросы по Java
@java_library - библиотека книг Java
@android_its - Android разработка
@java_quizes - тесты Java
@Java_workit - работа Java
@progersit - шпаргалки ит

👣 Golang
@Golang_google - восхитительный язык от Google, мощный и перспективный.
@golang_interview - вопросы и ответы с собеседований по Go. Для всех уровней разработчиков.
@golangtests - интересные тесты и задачи GO
@golangl - чат изучающих Go
@GolangJobsit - отборные вакансии и работа GO
@golang_jobsgo - чат для ищущих работу.
@golang_books - полезные книги Golang
@golang_speak - обсуждение языка Go

🖥 Linux
@linux -топ фишки, гайды, уроки по работе  с Linux.
@linux chat - чат linux для обучения и помощи.
@linux_read - бесплатные книги linux

👷‍♂️ IT работа

@hr_itwork -кураторский список актуальных ит-ваканнсии

🤡It memes
@memes_prog - ит-мемы

⚙️ Rust
@rust_code - Rust избавлен от болевых точек, которые есть во многих современных яп
@rust_chats - чат rust

#️⃣ c# c++
C# - объединяет лучшие идеи современных языков программирования
@csharp_cplus чат
С++ - Универсальность. Возможно, этот главный плюс C++.

📓 Книги

@programming_books_it - большая библиотека. программиста
@datascienceiot -ds книги
@pythonlbooks - python библиотека.
@golang_books - книги Golang
@frontendbooksit - front книги
@progersit - ит-шпаргалки
@linux_read - Linux books
@java_library - Java books

🖥 Github
@github_code - лучшие проекты с github
@bigdatai - инструменты по работе с данными

🖥 Devops
Devops - специалист общего профиля, которому нужны обширные знания в области разработки.

📢 English for coders

@english_forprogrammers - Английский для программистов
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Sci_Career
🧬 Подборка научных каналов и групп

Gene therapy — крупнейшее в России неформальное сообщество, объединяющее специалистов, работающих в области молекулярной медицины в широком смысле и генной терапии в частности

Проект AGCT — один из форумов сообщества @OpenLongevity, где обсуждаются механизмы старения и эксперименты по подбору комбинированной терапии

(sci)Berloga Всех Наук и Технологий — мультидисциплинарный канал о науке и технологиях. Data Science, Bioinformatics, Biology, Mathematics, Physics, IT, Computer Science

Russian Scientists — чат ученых для взаимопомощи внутри российского научного сообщества

Sci_Career — интересные и свежие карьерные возможности из мира просвещения, науч-попа и науки

Liza Loves Biology — авторский блог Лизы Мининой, молекулярного биолога и научного журналиста

SciClub FBB MSU — студенческий биологический клуб факультета биоинженерии и биоинформатики МГУ

PCR.NEWS — информационно-аналитический портал, где публикуются ежедневные новости и интересные инновации в молекулярной диагностике, биотехнологии, онкологии и других областях медицины

Молбиол, биотех, биохимия, биоинформатика — канал-агрегатор о молекулярной биологии и биоинформатике для специалистов

RNA BioTechnology — авторский блог биотехнологической компании о биодобавках, ноотропах, биотехнологиях и нейронауках

NanoBioSmartLab — новости нанобиотеха: различные научные события, конкурсы, конференции, гранты, вакансии и др.
Forwarded from AI Meetups
GlowByte приглашает всех 16 февраля на первый митап Data people junior 2023!

Место проведения: Нижний Сусальный переулок, дом 5с19

На митапе мы выясним, что же удобнее для работы с данными?

Михаил Жиляков расскажет о противостоянии “Pandas vs. SQL”. Обсудим особенности работы с этими технологиями, и разберем на примерах какие ошибки часто встречаются.

А специалист по работе с персоналом Марина Сухоруких раскроет непростую тему: "Подготовиться нельзя проиграть - куда ты поставишь запятую?", где обсудим, как подготовиться к собеседованию так, чтобы тебя запомнили и пригласили на следующий этап!

И завершим наш вечер вкусным мексиканским фуршетом и теплым общением со специалистами компании GlowByte

Вход свободный по регистрации ✔️
Forwarded from Reliable ML
Пишем ML System Design Doc вместе с Reliable ML
Учимся работать с шаблоном дизайн документа на реальных задачах

В декабре - в рамках открытого курса по ML System Design - мы опубликовали шаблон Reliable ML для дизайн документа систем машинного обучения и лекцию о том, что это такое и как с ним работать.

А в качестве вишенки на торте - объявили о готовности написать дизайн док вместе с вами (подробности в видео тут). Особенно, если это реальная задача и вы готовы разместить ссылку на ваш итоговый дизайн док в нашем репозитории (разумеется, удалив NDA часть).

С января мы уже работаем над рядом классных доков, в феврале - готовы взять еще пару проектов. Пишите - пока есть пара мест.

P.S. Если не готовы публично размещать итоговый документ, но все-равно нуждаетесь в нашей помощи - пишите. Попробуем вам помочь, если уместимся в вывозимую нагрузку).

Ваш @Reliable ML

#tech #ml_system_design
Forwarded from Data Analysis / Big Data
Важные исследования в области AI в 2022 г

Данная статья представляет собой свободный перевод раздела "Исследования" из доклада State of the Art 2022 (октябрь). Доклад State of the Art публикуется уже пятый год. Это подборка самых интересных вещей в мире AI, (конечно с точки зрения авторов). Отчет включает в себя несколько блоков:


Читать: https://habr.com/ru/post/711512/
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Многорукие бандиты Баейса

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

7 Февраля (Вторник) в 19:00 по МСК

Программа практикума:

🔹Многорукие бандиты, как продвинутые инструменты А/B/n-тестирования
🔹Практическое применение байесовских многоруких бандитов

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.