Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
🛡Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

В этой статье расскажу про основные риски, связанные с использованием LLM в корпоративной среде, и способы от них защититься.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
😎Эффективные запросы к ChatGPT и подобным моделям: Полное руководство по идеальной формуле

В этой статье я расскажу вам о единственной формуле, которую нужно знать, чтобы мастерски составлять запросы (промты) к ChatGPT и получать точные и полезные результаты.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🗣Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

В этой статье расскажу про особенности применения больших языковых моделей для оптимизации бизнес-процессов.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🐍Как проверить свои модели ONNX на Python: кратко

В этой статье разберем, что такое ONNX, как экспортировать модели в этот универсальный формат и, что самое главное, как протестировать их с помощью Python.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🥳Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go

В этой статье я поделюсь с вами своим опытом использования Golang, Kafka и Clickhouse на примере простого ETL-конвейера для параллельной передачи JSON-данных в базу данных с последующим прогнозированием температуры на основе машинного обучения.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀Как у нейросетей работает внимание? Статья про self-attention и cross-attention

В этой статье вы узнаете о механизме внимания (attention) в нейросетях, спецификациях self-attention и cross-attention, а также их роли в генерации изображений на основе текстовых описаний.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Как за месяц научить нейросеть говорить на татарском: опыт MTS AI

В этой статье расскажу вам о том, как мы силами пяти человек за месяц научили нашу большую языковую модель Cotype Lite общаться на татарском языке.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔Машинное обучение и криптография: знакомимся с CipherGAN

В этой статье мы рассмотрим генеративно‑состязательную сеть CipherGAN, используемую для определения базового шифровального отображения по банкам непарного зашифрованного текста и открытого текста.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

Мы представляем базовую модель для оценки глубины с помощью метрики нулевого кадра.

Модель синтезирует карты глубины высокого разрешения с непревзойденной резкостью и высокочастотными деталями.

Прогнозы являются метрическими, с абсолютным масштабом, без опоры на доступность метаданных, таких как внутренние параметры камеры.

Модель быстрая, производит карту глубины 2,25 мегапикселя за 0,3 секунды на стандартном графическом процессоре.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
💎Кратко про Ensemble методы с примерами

В этой статье мы рассмотрим три основных подхода: Bagging, Boosting и Stacking, и посмотрим, как их реализовать на Python.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👨‍💻Хранилища данных. Обзор технологий и подходов к проектированию

В этой статье будут рассмотрены основные подходы к проектированию архитектуры хранилищ данных (DWH), эволюция архитектур, взаимосвязь Data Lake, Data Factory, Data Lakehouse, Data Mesh c DWH, преимущества и недостатки подходов к моделированию данных.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🥳Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise

Новый подход Human-AI, который использует модель экспертного мышления для предоставления экспертного руководства репетиторам во время их репетиторства.

Это исследование является первым рандомизированным контролируемым испытанием системы Human-AI в живом репетиторстве, в котором участвуют 900 репетиторов и 1800 учеников K-12 из исторически малообеспеченных сообществ.

Tutor CoPilot демонстрирует, как системы «человек-искусственный интеллект» могут масштабировать экспертные знания в реальных областях, устранять пробелы в навыках и создавать будущее, в котором высококачественное образование будет доступно всем учащимся.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
😎Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM

В статье рассматриваются уязвимости генеративных моделей к атакам уклонения, которые манипулируют входными данными для получения неверных ответов.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔐Безопасность в машинном обучении: от проектирования до внедрения

В этой статье описывается методология Crisp-DM, позволяющая структурировать процесс разработки, а также рассматриваются уязвимости и возможные атаки на ML-модели.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🫠 ChatGPT и Gemini не могут справиться даже с простой математической задачкой на логику

Сегодня увидел на репетиторском канале простенькую задачку на логику. И решил попробовать скормить ее ChatGPT и Gemini. Просто интереса ради. Вспомнил, что когда вышла ChatGPT 4-o в демках показывали, как она якобы может заменить учителей.

Читать...
👎1
🥸Хочу как Гендальф: как создать бота для подбора паролей промптами

В этой статье рассказываем, как сделать такого бота, и попробовать выведать у него тайну.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Обучение GigaChat с контекстом в сотни тысяч токенов

Статья расскажет о том, как команда SberDevices увеличивала объем контекста в диалогах для модели GigaChat, чтобы она могла учитывать реплики, сказанные сотни шагов назад. Представлена расшифровка доклада.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔍 Поиск дубликатов в клиентском MDM на миллиард записей

Статья расскажет о подходах к объединению крупных баз данных с клиентской информацией, несмотря на ошибки и опечатки. Описываются методы предотвращения неверных объединений, включая сложные случаи, такие как записи братьев-близнецов.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠Квантовать или не квантовать LLM?

В этой статье расскажем о квантовании и как оно помогает в выборе оборудования, а также рассмотрим основные типы квантов в llama.cpp.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM