Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.44K photos
669 videos
20 files
2.72K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Детекция образов с R-CNN

Проблему классификации изображений неплохо решают сверточные нейронки (CNN). С ними мы можем отделить фото котят от фото щеночков. Но что делать, если объектов на картинке несколько? Здесь работают уже более сложные модели. Про изящную архитектуру одной из них – R-CNN, мы сегодня и расскажем.

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥17👍95
Ребята из Сбера завезли новую библиотеку по spell checking и spell corruption – SAGE

Она содержит открытые SOTA модели для коррекции правописания на русском и на английском языках, бенчмарк с датасетами для оценивания, реализованными методами аугментации текстов и т.д. И все это – в опенсурсе. На GitHub есть несколько демо в colab, так что пора пробовать!

Российские исследователи не перестают радовать

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
37🔥13👍8
HalvingSearch – ускорение поиска по сетке

Подбор гперпараметров – сложная и распросраненная задача. Для ее решения часто используют поиск по сетке, но этот алгоритм очень уж медленный. Поэтому сегодня давайте обратим внимание на halving search. Его относительно недавно добавили в sklearn, и пришло время разобраться, как с ним работать.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47🔥53
Для тех, кто хотел разнообразить обучение

Представляем вашему вниманию: парень исполняет песенку про то, как обучить модельку в PyTorch. Весело, понятно, запоминается на ура.

😻 #forfun #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19😁11🔥5
Бинарные классификаторы be like:

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1207👍6🔥4
Про разреженные матрицы

Часто при обработке текста или категориальных признаков в итоге мы получаем матрицу, в которой очень-очень много нулей. А задумыались ли вы, как хранятся такие матрицы в памяти? Например, как реализовано хранение таких данных в PyTorch или NumPy? Поехали разбираться.

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
31👍5🔥3
Сегодня пятница 13-е

Это так называемый «день неприятностей». Надеемся, что сегодня вас неудачи обошли. Ну а вообще, у каждого ведь есть история того самого факапа? Расскажите!
👍42😁21😨7🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Запилили чат-бота ArXiv ChatGuru, который может объяснить любую статью из ArXiv'

Загружаешь статью, а это чудо разделит текст на части, обобщит, да еще и ответит на вопросы. Проект опенсорсный, подробное пояснение за архитектуру можно найти в репозитории. Инструкцию по установке тоже ищите там.

Кратко: это RAG, который внутри себя разбивает статьи на части с помощью LangChain, затем генерит для них эмбеддинги (с OpenAI LLM). Все это хранится в векторном виде в Redis, а когда приходит время отвечать на вопросы юзера, вместе с промптом эти данные отправляются в модельку OpenAI, откуда и получается ответ на запрос.

Ух, заживем, друзья-исследователи!

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍44🔥107