Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
632 photos
38 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
Всем привет! На связи Валерия Басова, Системный аналитик, группа разработки машинного обучения Embedika, хочу поделиться своей подборкой полезных книг для разработчиков, исследователей и просто интересующихся.

Дисклеймер: считаю важным обращаться к фундаменталистам, которые не просто дают проблему и решение, а объясняют философию.
​​🏊‍♂Ныряем со Сноркелем в море данных. Туториал по фреймворку для программирования датасетов

В этой статье хочу рассказать вам о Сноркеле - фреймворке для программирования данных (data programming).

Читать...
​​👍Как я извлекал иерархию статей Википедии для задач NLP

В этом руководстве я покажу, как на основе Википедии можно сделать текстовый датасет, метки которого будут иметь иерархию.

Читать...
​​🤔I never asked for this. Как понять, на что способен аугментатор текстов

В этой статье я расскажу о способе понять, на что способен ваш аугментатор текста и в каких случаях его лучше использовать.

Читать...
​​😵‍💫Вливаемся в Data Science: подробный roadmap что и где изучать

В этой статье рассмотрим план становления начинающим дата-сайнтистом.

Читать...
​​🤠NumPy: оттачивайте навыки Data Science на практике

В этой статье мы рассмотрим ряд различных упражнений, используя библиотеку NumPy.

Читать...
​​👨‍🔬Edge AI чипы от Kneron. Собираем оригинальный девайс

В этой статье я расскажу, как создать на базе KL520 собственный оригинальный девайс.

Читать...
​​😎Apache Flink. Как работает дедупликация данных в потоке Kafka-to-Kafka?

В этой статье решим реальную бизнес-задачу дедупликации данных в пайплайне Kafka-to-Kafka.

Читать...
​​📂25 СУБД, которые актуальны в 2024 году

В этой статье мы кратко рассмотрим 25 из самых популярных СУБД, которые играют важную роль в обработке и хранении данных в различных сферах, от корпоративного управления до интернет-технологий.

Читать...
​​🧠OpenAI запускает GPT Store — как создать свой custom GPT с внешними API вызовами

В этой статье мы разберемся, что это такое, и что оно дает, а затем создадим свой собственный GPT и добавим его в GPT Store.

Читать...
​​🗣SALMONN — универсальная модель для всех типов аудиоданных

В этой статье мы рассказываем об особенностях SALMONN на основе научной публикации его разработчиков.

Читать...
​​👍Mamba. От начала до конца

В этой статье мы детально рассмотрим всю математику новой архитектуры, заметая под ковер преимущества и недостатки.

Читать...
​​😎Обнаружение движущихся объектов с помощью OpenCV с использованием обнаружения контуров и вычитания фона

В этой статье рассмотрим комбинацию обнаружения контуров и вычитания фона, которые можно использовать для обнаружения движущихся объектов с помощью OpenCV.

Читать...
​​Айтишникам с большим стажем предложили давать звание «Ветерана труда». Для этого мужчинам нужно отработать 40 лет, а женщинам 35. За это полагаются льготы: ежемесячные выплаты, компенсация на оплату ЖКУ и льготные проездные.

Если закон примут, то IT-специалисты будут как врачи, учителя, пожарные или строители: 

Читать...
​​📞Почему в чат-ботах не сделают кнопку «Вызвать оператора»?

В этой статье автор рассмотрит основные причины и поделиться опытом, который заставит усомниться в необходимости этой бесхитростной фичи.

Читать...
🧐 LLM, GPT-3, STABLE-DIFFUSION: Яндекс выкатил интерактивную карту хардов ML-специалистов. А на основе трендов 2023 года сделали чек-лист для разработчиков.

По карте можно изучить, что сейчас в тренде из библиотек и методов, которые ML-специалисты стали чаще искать в 2023 году в поиске Яндекса (по сравнению с 2022-ым), и наметить себе карьерный трек — чему ещё стоит научиться и какие смежные сферы освоить.

Ну и отмечайте в чек-листе, что вы уже используете в проектах.

Смотреть…
​​👾LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?

В этой статье мы проверим способность моделей решать простые математические задачи, отвечать на вопрос по заданному контексту, в котором содержатся числа и выполнять простые текстовые инструкции.

Читать...
​​⭐️Революция в аналитике данных: погружение в мир NoSQL

В этой статье мы углубимся в особенности NoSQL, сравним его с традиционными SQL-базами данных и исследуем, как NoSQL преобразует сферу аналитики данных.

Читать...
​​👥Как сделать Spark в Kubernetes простым в использовании: опыт команды VK Cloud

В этой статье расскажу, почему мы решили делать Spark в Kubernetes, с какими сложностями столкнулись и как их обходили, а также что получили в итоге.

Читать...