NEW BOT Телеграм, страница - 428939560

Data Science | Machinelearning [ru]

20.2K subscribers

673 photos

41 videos

29 files

3.56K links

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD

Download Telegram

About

Blog

Apps

Platform

Data Science | Machinelearning [ru]

20.2K subscribers

Data Science | Machinelearning [ru]

🚀

Как у нейросетей работает внимание? Статья про self-attention и cross-attention

В этой статье вы узнаете о механизме внимания (attention) в нейросетях, спецификациях self-attention и cross-attention, а также их роли в генерации изображений на основе текстовых описаний.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.68K views12:07

Data Science | Machinelearning [ru]

⚡️

Как за месяц научить нейросеть говорить на татарском: опыт MTS AI

В этой статье расскажу вам о том, как мы силами пяти человек за месяц научили нашу большую языковую модель Cotype Lite общаться на татарском языке.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.68K views17:17

Data Science | Machinelearning [ru]

🤔

Машинное обучение и криптография: знакомимся с CipherGAN

В этой статье мы рассмотрим генеративно‑состязательную сеть CipherGAN, используемую для определения базового шифровального отображения по банкам непарного зашифрованного текста и открытого текста.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.39K views12:07

Data Science | Machinelearning [ru]

🔥

Depth Pro: Sharp Monocular Metric Depth in Less Than a Second

Мы представляем базовую модель для оценки глубины с помощью метрики нулевого кадра.

Модель синтезирует карты глубины высокого разрешения с непревзойденной резкостью и высокочастотными деталями.

Прогнозы являются метрическими, с абсолютным масштабом, без опоры на доступность метаданных, таких как внутренние параметры камеры.

Модель быстрая, производит карту глубины 2,25 мегапикселя за 0,3 секунды на стандартном графическом процессоре.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

2.49K views17:07

Data Science | Machinelearning [ru]

💎

Кратко про Ensemble методы с примерами

В этой статье мы рассмотрим три основных подхода: Bagging, Boosting и Stacking, и посмотрим, как их реализовать на Python.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.41K views12:36

Data Science | Machinelearning [ru]

🖥

Самые интересные статьи за последние дни:

• Кратко про Ensemble методы с примерами

• Машинное обучение и криптография: знакомимся с CipherGAN

• Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go

Please open Telegram to view this post

VIEW IN TELEGRAM

2.42K views17:08

Data Science | Machinelearning [ru]

👨‍💻

Хранилища данных. Обзор технологий и подходов к проектированию

В этой статье будут рассмотрены основные подходы к проектированию архитектуры хранилищ данных (DWH), эволюция архитектур, взаимосвязь Data Lake, Data Factory, Data Lakehouse, Data Mesh c DWH, преимущества и недостатки подходов к моделированию данных.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.41K views12:07

Data Science | Machinelearning [ru]

🥳

Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise

Новый подход Human-AI, который использует модель экспертного мышления для предоставления экспертного руководства репетиторам во время их репетиторства.

Это исследование является первым рандомизированным контролируемым испытанием системы Human-AI в живом репетиторстве, в котором участвуют 900 репетиторов и 1800 учеников K-12 из исторически малообеспеченных сообществ.

Tutor CoPilot демонстрирует, как системы «человек-искусственный интеллект» могут масштабировать экспертные знания в реальных областях, устранять пробелы в навыках и создавать будущее, в котором высококачественное образование будет доступно всем учащимся.

🤗 Hugging Face
💾 Arxiv
📂 PDF

@Devsp — Подписаться

Please open Telegram to view this post

VIEW IN TELEGRAM

2.47K views17:09

Data Science | Machinelearning [ru]

😎

Пока не исправили — модифицируй, или Анализ расширений атаки уклонения для LLM

В статье рассматриваются уязвимости генеративных моделей к атакам уклонения, которые манипулируют входными данными для получения неверных ответов.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.33K views12:14

Data Science | Machinelearning [ru]

🔐

Безопасность в машинном обучении: от проектирования до внедрения

В этой статье описывается методология Crisp-DM, позволяющая структурировать процесс разработки, а также рассматриваются уязвимости и возможные атаки на ML-модели.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.4K views17:07

Data Science | Machinelearning [ru]

🫠 ChatGPT и Gemini не могут справиться даже с простой математической задачкой на логику

Сегодня увидел на репетиторском канале простенькую задачку на логику. И решил попробовать скормить ее ChatGPT и Gemini. Просто интереса ради. Вспомнил, что когда вышла ChatGPT 4-o в демках показывали, как она якобы может заменить учителей.

Читать...

👎1

2.53K views12:07

Data Science | Machinelearning [ru]

🥸

Хочу как Гендальф: как создать бота для подбора паролей промптами

В этой статье рассказываем, как сделать такого бота, и попробовать выведать у него тайну.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.45K views17:07

Data Science | Machinelearning [ru]

🤖

Обучение GigaChat с контекстом в сотни тысяч токенов

Статья расскажет о том, как команда SberDevices увеличивала объем контекста в диалогах для модели GigaChat, чтобы она могла учитывать реплики, сказанные сотни шагов назад. Представлена расшифровка доклада.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.41K views12:07

Data Science | Machinelearning [ru]

🔍

Поиск дубликатов в клиентском MDM на миллиард записей

Статья расскажет о подходах к объединению крупных баз данных с клиентской информацией, несмотря на ошибки и опечатки. Описываются методы предотвращения неверных объединений, включая сложные случаи, такие как записи братьев-близнецов.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.66K views20:07

Data Science | Machinelearning [ru]

🧠

Квантовать или не квантовать LLM?

В этой статье расскажем о квантовании и как оно помогает в выборе оборудования, а также рассмотрим основные типы квантов в llama.cpp.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.5K views12:07

Data Science | Machinelearning [ru]

🎭

Двойная игра в Power BI: как совмещать роли разработчика и администратора

Когда твой руководитель говорит: «А теперь ты еще и администратор сервера Power BI». Гид по выживанию для разработчика, внезапно ставшего многостаночником.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.54K views12:07

Data Science | Machinelearning [ru]

🤔

Топология в нейросетях?

Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

2.65K views17:07

Data Science | Machinelearning [ru]

❓

Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии

Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.65K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Линейная регрессия и её регуляризация в Scikit-learn

Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.6K views14:07

Data Science | Machinelearning [ru]

➡️

Что такое технология TTS, как устроена и каких сферах используется синтез речи

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.68K views18:07

Data Science | Machinelearning [ru]

📨

Пример использования программы для парсинга e-mail адресов с сайтов, созданный ИИ

Сегодня делимся программой для парсинга e-mail с сайтов, созданной за 30 минут с помощью ИИ от Rokitok. Это показывает, как ИИ ускоряет задачи, на которые раньше уходили дни или большие бюджеты.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

2.6K views10:07