Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
🤨Как настроить LLM на локальном сервере? Пошаговое руководство для ML-специалистов

В этой статье мы рассмотрим инструменты для оптимизации расходов, включая квантизацию и LoRA-адаптеры.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔒Безопасность приложений больших языковых моделей (LLM, GenAI)

В этой статье мы рассмотрим основные стратегии защиты ваших моделей и приложений искусственного интеллекта.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔍MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models

Обучаемый метод обрезки, который устанавливает полуструктурированную разреженность в LLM, направленный на снижение вычислительных издержек во время вывода.

Вместо разработки нового критерия важности MaskLLM явно моделирует шаблоны N:M как обучаемое распределение с помощью выборки Gumbel Softmax.

Этот подход облегчает сквозное обучение на больших наборах данных.

Он позволяет настраивать маски для безпотерьного применения разреженности 2:4 к нижестоящим задачам или доменам.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🤨Можно ли доверять GPT-4o конфиденциальные данные?

В этой статье мы разберемся в политике конфиденциальности Open AI и выясняем, почему эксперты окрестили GPT-4o «турбопылесосом данных».

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔Как оценить качество LLM модели

В этой статье мы представим общий обзор текущего состояния исследований оценок LLM, а также расскажем о некоторых опенсорсных реализациях в этой области.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩MIO: A Foundation Model on Multimodal Tokens

Новая базовая модель, построенную на многомодальных токенах, способную понимать и генерировать речь, текст, изображения и видео сквозным авторегрессивным способом.

Экспериментальные результаты показывают, что MIO демонстрирует конкурентоспособную, а в некоторых случаях и превосходящую производительность по сравнению с предыдущими двухмодальными базовыми линиями, базовыми линиями моделей any-to-any и даже базовыми линиями, специфичными для модальности.

Более того, MIO демонстрирует расширенные возможности, присущие его функции any-to-any, такие как чередующееся создание видеотекста, цепочка визуально-мысленных рассуждений, создание визуальных руководств, редактирование обучающих изображений и т. д.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🛡Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

В этой статье расскажу про основные риски, связанные с использованием LLM в корпоративной среде, и способы от них защититься.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
😎Эффективные запросы к ChatGPT и подобным моделям: Полное руководство по идеальной формуле

В этой статье я расскажу вам о единственной формуле, которую нужно знать, чтобы мастерски составлять запросы (промты) к ChatGPT и получать точные и полезные результаты.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🗣Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

В этой статье расскажу про особенности применения больших языковых моделей для оптимизации бизнес-процессов.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🐍Как проверить свои модели ONNX на Python: кратко

В этой статье разберем, что такое ONNX, как экспортировать модели в этот универсальный формат и, что самое главное, как протестировать их с помощью Python.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🥳Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go

В этой статье я поделюсь с вами своим опытом использования Golang, Kafka и Clickhouse на примере простого ETL-конвейера для параллельной передачи JSON-данных в базу данных с последующим прогнозированием температуры на основе машинного обучения.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀Как у нейросетей работает внимание? Статья про self-attention и cross-attention

В этой статье вы узнаете о механизме внимания (attention) в нейросетях, спецификациях self-attention и cross-attention, а также их роли в генерации изображений на основе текстовых описаний.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Как за месяц научить нейросеть говорить на татарском: опыт MTS AI

В этой статье расскажу вам о том, как мы силами пяти человек за месяц научили нашу большую языковую модель Cotype Lite общаться на татарском языке.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔Машинное обучение и криптография: знакомимся с CipherGAN

В этой статье мы рассмотрим генеративно‑состязательную сеть CipherGAN, используемую для определения базового шифровального отображения по банкам непарного зашифрованного текста и открытого текста.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

Мы представляем базовую модель для оценки глубины с помощью метрики нулевого кадра.

Модель синтезирует карты глубины высокого разрешения с непревзойденной резкостью и высокочастотными деталями.

Прогнозы являются метрическими, с абсолютным масштабом, без опоры на доступность метаданных, таких как внутренние параметры камеры.

Модель быстрая, производит карту глубины 2,25 мегапикселя за 0,3 секунды на стандартном графическом процессоре.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
💎Кратко про Ensemble методы с примерами

В этой статье мы рассмотрим три основных подхода: Bagging, Boosting и Stacking, и посмотрим, как их реализовать на Python.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👨‍💻Хранилища данных. Обзор технологий и подходов к проектированию

В этой статье будут рассмотрены основные подходы к проектированию архитектуры хранилищ данных (DWH), эволюция архитектур, взаимосвязь Data Lake, Data Factory, Data Lakehouse, Data Mesh c DWH, преимущества и недостатки подходов к моделированию данных.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🥳Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise

Новый подход Human-AI, который использует модель экспертного мышления для предоставления экспертного руководства репетиторам во время их репетиторства.

Это исследование является первым рандомизированным контролируемым испытанием системы Human-AI в живом репетиторстве, в котором участвуют 900 репетиторов и 1800 учеников K-12 из исторически малообеспеченных сообществ.

Tutor CoPilot демонстрирует, как системы «человек-искусственный интеллект» могут масштабировать экспертные знания в реальных областях, устранять пробелы в навыках и создавать будущее, в котором высококачественное образование будет доступно всем учащимся.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM