Магия данных | Артур Сапрыкин – Telegram
Магия данных | Артур Сапрыкин
906 subscribers
329 photos
57 videos
9 files
316 links
Канал Артура Сапрыкина.
- Основатель и CEO Maglosya (@maglosya)
- Создаю со своей командой AI/ML-проекты
- Преподаватель, автор курсов
- Исследователь ML и AI.

Сайт: https://arthursaprykin.ru/

По вопросам сотрудничества пишите мне: @arthur_saprykin
Download Telegram
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Практикум работы с изображениям с помощью OpenCV

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

24 Января (Вторник) в 19:00 по МСК

Программа практикума:

🔹Основные методы обработки изображений с помощью OpenCV
🔹Подготовка данных к решению прикладных задач компьютерного зрения

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
3
Ребята, тут Яндекс бесплатные тренировки по алгоритмам организовывает с 13 февраля по 13 марта.

Поговаривают, что даже есть варик потом в Яндекс устроиться.
Но я вижу пользу, как минимум, в расширении кругозора и алгоритмического мышления.

Вперёд покорять вершины 🦾
🔥12👍5
Товарищ поделился двумя мемами, чтобы проще было запомнить метрики классификации ☺️
😁3
Сегодня в сети наткнулся на классную статью про применение популярных языковых моделей GPT в поисковых системах.

Почему это начали обсуждать?
Microsoft заявили о том, что ChatGPT будет в их поисковом движке Bing. Гугл заочковал, и теперь думает, что же им делать.

Не знаю, как во что это выльется, но есть подозрение, что эта чудо-новость не больше, чем хайп на их же продукте. На сегодняшний день такое использовать нельзя, так как модель "красиво стелит", но факты часто выдуманы.

Так чем же статья хороша?

Она прекрасна для новичков и тех, кто хочет прокачаться в современном состоянии NLP.
Много деталей, начиная от того, что такое токен и языковая модель, заканчивая принципом обучения WebGPT и RLHF (писал выше)

Настоятельно рекомендую к изучению. Уделить времени нужно много, а лучше читать её дозированно, по чуть-чуть.

Даже я, зная принципы, утомился читать. Хотя, может потому и утомился, что скучновато было 😂
👍3👨‍💻3
Открываю цикл статей про поисковики с утечки Яндекса (да, её обсосали все и вся).

Один SEOшник покопался, и нашёл факторы ранжирования.

Не знаю, насколько достоверно всё, потому что сам не лез в эти исходники.

Тем не менее, выглядит интересно.

Что-то интересно, что-то очевидно.

В общем, изучайте.
👍3🤔1
Что же, продолжаю писать про поисковики, и сейчас предлагаю статью про ВМ25.

Один из древнейших алгоритмов, и в тоже время не устаревающих до последнего. Да, сейчас более современные работы по NLP могли бы составить конкуренцию, тем не менее, ВМ25 еще применим.

Если обратите внимание на формулу, то увидите прямую отсылку к tf-IDF. И это неслучайно, потому что одна из создателей этого алгоритма, как раз Карен Спарк Джонс, которая и придумала tf-IDF.

Теперь представьте, как давно алгоритм придумали 😂

Если поисковики интересны, то обязательно читайте. Будет понятней, как эти ваши Гуглы и Яндексы работают.
👍6
Не смог удержаться 😂🙌🏼
Forwarded from IT Юмор
«Семь ступеней дебага»
😁12
Продолжаю вещать про поисковики, и сегодня легенда поисковых алгоритмов - PageRank.

Тут написано про то, как он устроен. Принцип достаточно прост и понятен, потому и гениален.

Кроме того, PageRank можно использовать не только для веб-ссылок, но и для выделения ключевых слов, например. Такая модификация называется TextRank (об этом может быть позже напишу, или сами в сети найдёте).

Скажу, что знать его устройство обязательно. Гугл частично его использует до сих пор, да и сами вы можете его модифицировать под свои задачи.
👍4
Вот вам функции активации.

Спойлер: это не все, что есть, но нужно ли больше вам?
👍4
Классика вторника)
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Многорукие бандиты Баейса

Успевайте зарегистрироваться. Количество мест строго ограничено!

👉Регистрация

Время проведения:

7 Февраля (Вторник) в 19:00 по МСК

Программа практикума:

🔹Многорукие бандиты, как продвинутые инструменты А/B/n-тестирования
🔹Практическое применение байесовских многоруких бандитов

Кто ведет?

Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
1