Data Science | Machinelearning [ru] – Telegram
Data Science | Machinelearning [ru]
20.1K subscribers
628 photos
39 videos
29 files
3.52K links
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
🚀Как у нейросетей работает внимание? Статья про self-attention и cross-attention

В этой статье вы узнаете о механизме внимания (attention) в нейросетях, спецификациях self-attention и cross-attention, а также их роли в генерации изображений на основе текстовых описаний.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Как за месяц научить нейросеть говорить на татарском: опыт MTS AI

В этой статье расскажу вам о том, как мы силами пяти человек за месяц научили нашу большую языковую модель Cotype Lite общаться на татарском языке.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔Машинное обучение и криптография: знакомимся с CipherGAN

В этой статье мы рассмотрим генеративно‑состязательную сеть CipherGAN, используемую для определения базового шифровального отображения по банкам непарного зашифрованного текста и открытого текста.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

Мы представляем базовую модель для оценки глубины с помощью метрики нулевого кадра.

Модель синтезирует карты глубины высокого разрешения с непревзойденной резкостью и высокочастотными деталями.

Прогнозы являются метрическими, с абсолютным масштабом, без опоры на доступность метаданных, таких как внутренние параметры камеры.

Модель быстрая, производит карту глубины 2,25 мегапикселя за 0,3 секунды на стандартном графическом процессоре.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
💎Кратко про Ensemble методы с примерами

В этой статье мы рассмотрим три основных подхода: Bagging, Boosting и Stacking, и посмотрим, как их реализовать на Python.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👨‍💻Хранилища данных. Обзор технологий и подходов к проектированию

В этой статье будут рассмотрены основные подходы к проектированию архитектуры хранилищ данных (DWH), эволюция архитектур, взаимосвязь Data Lake, Data Factory, Data Lakehouse, Data Mesh c DWH, преимущества и недостатки подходов к моделированию данных.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🥳Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise

Новый подход Human-AI, который использует модель экспертного мышления для предоставления экспертного руководства репетиторам во время их репетиторства.

Это исследование является первым рандомизированным контролируемым испытанием системы Human-AI в живом репетиторстве, в котором участвуют 900 репетиторов и 1800 учеников K-12 из исторически малообеспеченных сообществ.

Tutor CoPilot демонстрирует, как системы «человек-искусственный интеллект» могут масштабировать экспертные знания в реальных областях, устранять пробелы в навыках и создавать будущее, в котором высококачественное образование будет доступно всем учащимся.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@DevspПодписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
😎Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM

В статье рассматриваются уязвимости генеративных моделей к атакам уклонения, которые манипулируют входными данными для получения неверных ответов.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔐Безопасность в машинном обучении: от проектирования до внедрения

В этой статье описывается методология Crisp-DM, позволяющая структурировать процесс разработки, а также рассматриваются уязвимости и возможные атаки на ML-модели.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🫠 ChatGPT и Gemini не могут справиться даже с простой математической задачкой на логику

Сегодня увидел на репетиторском канале простенькую задачку на логику. И решил попробовать скормить ее ChatGPT и Gemini. Просто интереса ради. Вспомнил, что когда вышла ChatGPT 4-o в демках показывали, как она якобы может заменить учителей.

Читать...
👎1
🥸Хочу как Гендальф: как создать бота для подбора паролей промптами

В этой статье рассказываем, как сделать такого бота, и попробовать выведать у него тайну.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Обучение GigaChat с контекстом в сотни тысяч токенов

Статья расскажет о том, как команда SberDevices увеличивала объем контекста в диалогах для модели GigaChat, чтобы она могла учитывать реплики, сказанные сотни шагов назад. Представлена расшифровка доклада.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔍 Поиск дубликатов в клиентском MDM на миллиард записей

Статья расскажет о подходах к объединению крупных баз данных с клиентской информацией, несмотря на ошибки и опечатки. Описываются методы предотвращения неверных объединений, включая сложные случаи, такие как записи братьев-близнецов.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠Квантовать или не квантовать LLM?

В этой статье расскажем о квантовании и как оно помогает в выборе оборудования, а также рассмотрим основные типы квантов в llama.cpp.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🎭 Двойная игра в Power BI: как совмещать роли разработчика и администратора

Когда твой руководитель говорит: «А теперь ты еще и администратор сервера Power BI». Гид по выживанию для разработчика, внезапно ставшего многостаночником.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Топология в нейросетях?

Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии

Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👩‍💻 Линейная регрессия и её регуляризация в Scikit-learn

Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
➡️ Что такое технология TTS, как устроена и каких сферах используется синтез речи

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
📨 Пример использования программы для парсинга e-mail адресов с сайтов, созданный ИИ

Сегодня делимся программой для парсинга e-mail с сайтов, созданной за 30 минут с помощью ИИ от Rokitok. Это показывает, как ИИ ускоряет задачи, на которые раньше уходили дни или большие бюджеты.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM