Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
633 photos
38 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
​​🤖Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных

В данной статье показывается, как с помощью асинхронных запросов и встроенных особенностей vLLM можно увеличить скорость генерации примерно в 20 раз.

Читать...
​​😶🌫Parameter-Efficient Fine-Tuning (PEFT): методы LoRA, Prefix tuning, Prompt tuning и Adapters

В этой статье мы рассмотрим общую концепцию PEFT, его преимущества и основные методы.

Читать...
​​🗣Lingua Franca — Машинный перевод с учётом именованных сущностей для вопросно-ответных систем

В данной статье мы рассмотрим наш метод машинного перевода, учитывающий именованные сущности, под названием «Lingua Franca».

Читать...
​​👀Компьютерное зрение сквозь года

В этой статье я хочу привести примеры нейросетевых моделей, характерных для различных этапов становления области компьютерного зрения (далее - CV) в том виде, в котором мы его знаем сейчас.

Читать...
​​🤖Иерархия ИИ-потребностей

В этой статье вы узнаете о том, как использовать ИИ и машинное обучение, чтобы лучше справляться с тем, что мы делаем.

Читать...
​​⚡️Два сапога — пара, а три — уже community: как алгоритмы на графах помогают собирать группы товаров

В этой статье мы обсудим кластеризацию на графах, задачу выделения сообществ, распад карате-клуба, self-supervised и unsupervised задачи — и как всё это связано с матчингом.

Читать...
​​🧠Даем нейросотрудникам на базе ChatGPT настоящую постоянную память

В этой статье мы рассмотрим один из возможных подходов к организации такой памяти для наших нейросотрудников.

Читать...
​​👤Делаем intent classifier для службы поддержки без доменного датасета на русском

В этой статье я продемонстрирую, как без собственного датасета сделать классификатор намерений пользователя для службы поддержки в сфере e-commerce.

Читать...
​​🧐Почему нельзя сделать прогноз CLTV с помощью одной модели

В статье я расскажу что это за задача CLTV и для чего ее нужно решать банкам.

Читать...
​​👀Краткий обзор TinyML

В этой статье автор расскажет, как сделать ии или простые модельки доступным для самых маленьких устройств.

Читать...
​​🤔Как мы считали экономику продукта «Семья» через uplift CLTV

В этой статье я поделюсь с вами моим опытом решения задачи uplift-моделирования для оценки экономики продукта «Семья» с точки зрения CLTV.

Читать...
​​🧑‍💻Baldur и Thor снова в игре: Путь к совершенному ПО

В данной статье я познакомлю вас со всей теоретической и практической подноготной данной модели, этапами реализации и оценки метода, чтобы стать чуточку ближе к созданию идеального ПО.

Читать...
​​🤫Моя большая практическая шпаргалка SQL (SQLite) с готовыми запросами

В этой статье мы рассмотрим примеры довольно сложных запросов с агрегирующими функциями, триггерами, длинными подзапросами, с оконными функциями.

Читать...
​​👥«Душа молчит, хоть слышит всё вокруг»: как мы отучаем генеративные модели галлюцинировать

В этой статье мы расскажем, как заставить генеративные модели перестать придумывать несуществующие факты и как научиться находить эти ошибки, если они всё же случаются.

Читать...
​​🗣Распознавание и перевод жестовых языков: обзор подходов

В этой статье речь пойдет о распознавании и переводе жестового языка и передовых подходах для их решениях.

Читать...
​​📔Использование Jupyter Notebook для разведочного анализа данных

В этой статье мы поговорим о блокнотах Jupyter именно с точки зрения бизнеса, с точки зрения их применения в работе над реальными продуктами.

Читать...
​​🐶Лапочки с характером: Как машинное обучение помогает определить тип личности ваших пёсиков

В данной статье описывается успешная попытка применить методы искусственного интеллекта и ML для классификации и прогнозирования личностных качеств собак с использованием поведенческих данных, полученных из базы данных C-BARQ.

Читать...
​​🌐NanoSAM: Real-Time Object Segmentation on NVIDIA Jetson Orin Platforms with NVIDIA TensorRT

NanoSAM — это вариант модели Segment Anything (SAM), который способен работать в реальном времени на платформах NVIDIA Jetson Orin с NVIDIA TensorRT. Он обучается путем дистилляции кодера изображений MobileSAM на немаркированных изображениях. Для ознакомления с дистилляцией знаний мы рекомендуем ознакомиться с этим руководством.

🖥Github: https://github.com/NVIDIA-AI-IOT/nanosam

Tutorial: https://www.jetson-ai-lab.com/vit/tutorial_nanosam.html

@DevspПодписаться
​​🚀Maximizing NanoDB Efficiency: A Guide to Containerized Image Management and Operations

NanoDB — это мультимодальная векторная база данных, оптимизированная для CUDA, которая использует встраивания из преобразователя изображения CLIP для поиска по сходству txt2img и img2img.

🖥 Github: https://github.com/dusty-nv/jetson-containers/blob/master/packages/vectordb/nanodb/README.md

Tutorial: https://www.jetson-ai-lab.com/tutorial_nanodb.html

@DevspПодписаться
​​🎉Deep Learning Research on Audio Generation with AudioCraft: A PyTorch Library

AudioCraft — это библиотека PyTorch для исследований в области глубокого обучения генерации звука. AudioCraft содержит код вывода и обучения для двух современных генеративных моделей искусственного интеллекта, создающих высококачественный звук: AudioGen и MusicGen.

🖥 Github: https://github.com/facebookresearch/audiocraft

Tutorial: https://www.jetson-ai-lab.com/tutorial_audiocraft.html

@DevspПодписаться
​​🦾LLaVA: Large Language and Vision Assistant

LLaVA is a popular multimodal vision/language model that you can run locally on Jetson to answer questions about image prompts and queries.

🖥 Github: https://llava-vl.github.io/

Tutorial: https://www.jetson-ai-lab.com/tutorial_llava.html

@DevspПодписаться