Что посмотреть вечером в пятницу: отличный спич от X5 Tech о том, как они прокачивали ML модель под поведение пользователя
Спикер рассказывает про реальные задачи SberBoom, про трудности их решения и детально разбирает:
– Как различается поведение пользователя на устройствах с экраном и без?
– Какие изменения в ML-пайплайне определения намерения пользователя были сделаны, чтобы учесть эти различия для умной колонки SberBoom, и повысить качество?
Необычная DS-задача + крутое решение + интересный рассказ + красивая презентация = рекомендуем посмотреть
😻 #advice
Спикер рассказывает про реальные задачи SberBoom, про трудности их решения и детально разбирает:
– Как различается поведение пользователя на устройствах с экраном и без?
– Какие изменения в ML-пайплайне определения намерения пользователя были сделаны, чтобы учесть эти различия для умной колонки SberBoom, и повысить качество?
Необычная DS-задача + крутое решение + интересный рассказ + красивая презентация = рекомендуем посмотреть
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Как адаптировать ML модель под поведение пользователя. Прохор Гладких, Сбер
Прохор Гладких, DS Team Lead в SberDevices, рассказывает:
* Как различается поведение пользователя на устройствах с экраном и без?
* Какие изменения в ML-пайплайне определения намерения пользователя были сделаны, чтобы учесть эти различия для умной колонки…
* Как различается поведение пользователя на устройствах с экраном и без?
* Какие изменения в ML-пайплайне определения намерения пользователя были сделаны, чтобы учесть эти различия для умной колонки…
👍11❤4🤯3
Разработчики Jupyter объявили о выпуске JupyterLab 4.0
Пакет доступен на PyPI и conda-forge. Чтобы обновиться, просто запустите
😻 #python
Пакет доступен на PyPI и conda-forge. Чтобы обновиться, просто запустите
pip install --upgrade jupyterlab или conda install -c conda-forge jupyterlab. А мы пока расскажем, что нового в этой версии.Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31❤3
Лучшая IDE для Data Science – это...
Anonymous Poll
41%
Jupyter(Lab) Notebook
2%
Spyder
18%
Visual Studio
11%
Google Colab
5%
DataSpell
17%
PyCharm
6%
Другое
👍19🤓3
И еще одно обновление сегодня: English as the New Programming Language for Apache Spark
Помните, мы рассказывали про Pandas AI? Так вот, такую же фишку на днях анонсировали в Apache Spark. И работает похожим образом. Например:
То есть просто пишем запрос на естественном английском языке и получаем результат. Все, что нужно – знать пару методов (такие, как
Отдельный прикол – это декоратор
Ну просто рай для аналитиков, согласны?
😻 #python
Помните, мы рассказывали про Pandas AI? Так вот, такую же фишку на днях анонсировали в Apache Spark. И работает похожим образом. Например:
transformed_df = df.ai.transform('get 4 week moving average sales by dept')
То есть просто пишем запрос на естественном английском языке и получаем результат. Все, что нужно – знать пару методов (такие, как
ai.transform(), ai.plot(), ai.explain()), скормить им в качестве аргумента адекватный промпт и вуаля – вот тебе нужный результат. Так можно генерировать графики, датафреймы, обрабатывать данные, интерпретировать их и так далее. Отдельный прикол – это декоратор
@spark_ai.udf, который позволяет генерить User-Defined Functions по описанию, и потом использовать их по назначению. Ну просто рай для аналитиков, согласны?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51❤10
Самые важные формулы в Data Science
Выделили 21 штуку и все объединили в одну картинку. Сохраняйте!
😻 #advice
Выделили 21 штуку и все объединили в одну картинку. Сохраняйте!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍118🔥24❤11🤯9✍1
Perceiver
Проблема такая: большинство архитектур разрабатываются для одной задачи, из-за чего инженерам приходится идти на ухищрения, модифицировать входы и выходы в надежде, что модель научится решать новую проблему. А работа с несколькими типами данных вообще требует сложных мультимодальных систем.
Поэтому исследователи из DeepMind подумали: "А почему бы не создать универсальную архитектуру, способную решать разные проблемы и обрабатывать все типы данных?". И придумали Perceiver. Рассказываем, как он работает.
Статья | Код
😻 #NN
Проблема такая: большинство архитектур разрабатываются для одной задачи, из-за чего инженерам приходится идти на ухищрения, модифицировать входы и выходы в надежде, что модель научится решать новую проблему. А работа с несколькими типами данных вообще требует сложных мультимодальных систем.
Поэтому исследователи из DeepMind подумали: "А почему бы не создать универсальную архитектуру, способную решать разные проблемы и обрабатывать все типы данных?". И придумали Perceiver. Рассказываем, как он работает.
Статья | Код
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🤯11🔥5❤2🤔2
Для тех кому надоел Machine Learning хорошая новость: теперь можно позаниматься Machine Unlearning
Google анонсировала конкурс по "машинному удалению". Это задача по стиранию данных из памяти нейросетей и "отмене" влияния этих данных на выходы модели. Нужно разработать решение, не обучая модель заново и (желательно) не снижая качество её работы.
Появление такого типа задач было предсказумым. Скорее всего, скоро подобными исследованиями начнут заниматься и в Microsoft, и даже в OpenAI, на которых каждую неделю сыпится несколько исков, связанных с несанкционированным использованием кода, изображений и текстов для обучения нейросетей.
Конкурс будет проходить на Kaggle. Про призовой фонд пока ничего не слышно, но представляется, что он будет более чем приличным.
Какие мысли по поводу подходов к решению?
😻 #news
Google анонсировала конкурс по "машинному удалению". Это задача по стиранию данных из памяти нейросетей и "отмене" влияния этих данных на выходы модели. Нужно разработать решение, не обучая модель заново и (желательно) не снижая качество её работы.
Появление такого типа задач было предсказумым. Скорее всего, скоро подобными исследованиями начнут заниматься и в Microsoft, и даже в OpenAI, на которых каждую неделю сыпится несколько исков, связанных с несанкционированным использованием кода, изображений и текстов для обучения нейросетей.
Конкурс будет проходить на Kaggle. Про призовой фонд пока ничего не слышно, но представляется, что он будет более чем приличным.
Какие мысли по поводу подходов к решению?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍38🤯15😁7🔥4