Статейка вам на ночь.
Хотите знать, как обучили ChatGPT?
Уверен, все про неё слышали, и может быть даже в шоке от результатов работы.
Можно оценивать её по разному, но очень интересен способ обучения - Обучение с подкреплением от человеческого отклика.
Если очень коротко:
1. Обучаем языковую модель, как делали раньше
2. Формируем сетку, которая будет дообучаться от влияния (оценки) внешней среды (обучение с подкреплением)
3. Дальше берём датасет «промтов» и текстов, и генерим продолжения.
4. Выпускаем нашу сетку «в массы», и люди размечают, что их устроило, а что нет
5. Обновляем веса, повторяем п3-4.
Детали уже прочитаете в статье.
Успешного развития ☀️🙏🏼
Хотите знать, как обучили ChatGPT?
Уверен, все про неё слышали, и может быть даже в шоке от результатов работы.
Можно оценивать её по разному, но очень интересен способ обучения - Обучение с подкреплением от человеческого отклика.
Если очень коротко:
1. Обучаем языковую модель, как делали раньше
2. Формируем сетку, которая будет дообучаться от влияния (оценки) внешней среды (обучение с подкреплением)
3. Дальше берём датасет «промтов» и текстов, и генерим продолжения.
4. Выпускаем нашу сетку «в массы», и люди размечают, что их устроило, а что нет
5. Обновляем веса, повторяем п3-4.
Детали уже прочитаете в статье.
Успешного развития ☀️🙏🏼
huggingface.co
Illustrating Reinforcement Learning from Human Feedback (RLHF)
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥2
В этот вторник на занятии были упомянуты Байесовские многорукие бандиты.
Нет, это не название шайки разбойников, а клёвый инструмент для проведения A/B/n тестов. То есть, для 2 и более групп.
Зачем они нужны? Нередко внедрение какой-то фичи, даже тестовой, может повлечь за собой негативные последствия. Например, падение конверсии.
Чтобы и тест провести достойно, и потери уменьшить, можно перераспределять трафик пользователей с менее удачной группы на более удачные. Такая, некая оптимизация.
Это очень коротко о том, зачем нужны Байесовские многорукие бандиты.
Достаточно давно была написала статья от ODS, где подробно расписана проблематика и пояснение метода.
Более того, на основе этой статьи был создан целый урок по многоруким бандитам 😉
В общем, просвещайтесь! 🙌🏼☀️
Нет, это не название шайки разбойников, а клёвый инструмент для проведения A/B/n тестов. То есть, для 2 и более групп.
Зачем они нужны? Нередко внедрение какой-то фичи, даже тестовой, может повлечь за собой негативные последствия. Например, падение конверсии.
Чтобы и тест провести достойно, и потери уменьшить, можно перераспределять трафик пользователей с менее удачной группы на более удачные. Такая, некая оптимизация.
Это очень коротко о том, зачем нужны Байесовские многорукие бандиты.
Достаточно давно была написала статья от ODS, где подробно расписана проблематика и пояснение метода.
Более того, на основе этой статьи был создан целый урок по многоруким бандитам 😉
В общем, просвещайтесь! 🙌🏼☀️
Хабр
Байесовские многорукие бандиты против A/B тестов
Здравствуйте, коллеги. Рассмотрим обычный онлайн-эксперимент в некоторой компании «Усы и когти». У неё есть веб-сайт, на котором есть красная кнопка в форме прямоугольника с закругленными краями. Если...
👍8
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Практикум работы с изображениям с помощью OpenCV
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
24 Января (Вторник) в 19:00 по МСК
Программа практикума:
🔹Основные методы обработки изображений с помощью OpenCV
🔹Подготовка данных к решению прикладных задач компьютерного зрения
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
24 Января (Вторник) в 19:00 по МСК
Программа практикума:
🔹Основные методы обработки изображений с помощью OpenCV
🔹Подготовка данных к решению прикладных задач компьютерного зрения
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
❤3
Ребята, тут Яндекс бесплатные тренировки по алгоритмам организовывает с 13 февраля по 13 марта.
Поговаривают, что даже есть варик потом в Яндекс устроиться.
Но я вижу пользу, как минимум, в расширении кругозора и алгоритмического мышления.
Вперёд покорять вершины 🦾
Поговаривают, что даже есть варик потом в Яндекс устроиться.
Но я вижу пользу, как минимум, в расширении кругозора и алгоритмического мышления.
Вперёд покорять вершины 🦾
Тренировки Яндекса по алгоритмам, ML и DevOps
Новый сезон Тренировок по алгоритмам и ML
🔥12👍5
Товарищ поделился двумя мемами, чтобы проще было запомнить метрики классификации ☺️
😁3
Сегодня в сети наткнулся на классную статью про применение популярных языковых моделей GPT в поисковых системах.
Почему это начали обсуждать?
Microsoft заявили о том, что ChatGPT будет в их поисковом движке Bing. Гугл заочковал, и теперь думает, что же им делать.
Не знаю, как во что это выльется, но есть подозрение, что эта чудо-новость не больше, чем хайп на их же продукте. На сегодняшний день такое использовать нельзя, так как модель "красиво стелит", но факты часто выдуманы.
Так чем же статья хороша?
Она прекрасна для новичков и тех, кто хочет прокачаться в современном состоянии NLP.
Много деталей, начиная от того, что такое токен и языковая модель, заканчивая принципом обучения WebGPT и RLHF (писал выше)
Настоятельно рекомендую к изучению. Уделить времени нужно много, а лучше читать её дозированно, по чуть-чуть.
Даже я, зная принципы, утомился читать. Хотя, может потому и утомился, что скучновато было 😂
Почему это начали обсуждать?
Microsoft заявили о том, что ChatGPT будет в их поисковом движке Bing. Гугл заочковал, и теперь думает, что же им делать.
Не знаю, как во что это выльется, но есть подозрение, что эта чудо-новость не больше, чем хайп на их же продукте. На сегодняшний день такое использовать нельзя, так как модель "красиво стелит", но факты часто выдуманы.
Так чем же статья хороша?
Она прекрасна для новичков и тех, кто хочет прокачаться в современном состоянии NLP.
Много деталей, начиная от того, что такое токен и языковая модель, заканчивая принципом обучения WebGPT и RLHF (писал выше)
Настоятельно рекомендую к изучению. Уделить времени нужно много, а лучше читать её дозированно, по чуть-чуть.
Даже я, зная принципы, утомился читать. Хотя, может потому и утомился, что скучновато было 😂
Хабр
ChatGPT как инструмент для поиска: решаем основную проблему
Вышедшая чуть больше месяца назад ChatGPT уже успела нашуметь: школьникам в Нью-Йорке запрещают использовать нейросеть в качестве помощника, её же ответы теперь не принимаются на StackOverflow, а...
👍3👨💻3
Открываю цикл статей про поисковики с утечки Яндекса (да, её обсосали все и вся ).
Один SEOшник покопался, и нашёл факторы ранжирования.
Не знаю, насколько достоверно всё, потому что сам не лез в эти исходники.
Тем не менее, выглядит интересно.
Что-то интересно, что-то очевидно.
В общем, изучайте.
Один SEOшник покопался, и нашёл факторы ранжирования.
Не знаю, насколько достоверно всё, потому что сам не лез в эти исходники.
Тем не менее, выглядит интересно.
Что-то интересно, что-то очевидно.
В общем, изучайте.
Хабр
SEO Выводы из утечки кода поисковика Яндекс
Единственный мем который пришел в голову Я был в восторге, когда узнал об утечке проприетарного исходного кода Яндекса. И после анализа данных я должен сказать, что выводы оказались весьма...
👍3🤔1
Что же, продолжаю писать про поисковики, и сейчас предлагаю статью про ВМ25.
Один из древнейших алгоритмов, и в тоже время не устаревающих до последнего. Да, сейчас более современные работы по NLP могли бы составить конкуренцию, тем не менее, ВМ25 еще применим.
Если обратите внимание на формулу, то увидите прямую отсылку к tf-IDF. И это неслучайно, потому что одна из создателей этого алгоритма, как раз Карен Спарк Джонс, которая и придумала tf-IDF.
Теперь представьте, как давно алгоритм придумали 😂
Если поисковики интересны, то обязательно читайте. Будет понятней, как эти ваши Гуглы и Яндексы работают.
Один из древнейших алгоритмов, и в тоже время не устаревающих до последнего. Да, сейчас более современные работы по NLP могли бы составить конкуренцию, тем не менее, ВМ25 еще применим.
Если обратите внимание на формулу, то увидите прямую отсылку к tf-IDF. И это неслучайно, потому что одна из создателей этого алгоритма, как раз Карен Спарк Джонс, которая и придумала tf-IDF.
Теперь представьте, как давно алгоритм придумали 😂
Если поисковики интересны, то обязательно читайте. Будет понятней, как эти ваши Гуглы и Яндексы работают.
Хабр
Алгоритм BM25
Впервые данный алгоритм встретил на Википедии и не обратил на него особого внимания. Позже изучая научные труды сотрудников Яндекса, я обратил внимание на то, что они ссылаются на него, например, в...
👍6