Data Science – Telegram
Data Science
41.2K subscribers
1.65K photos
4 videos
47 files
2.05K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
Scaling Large MoE Models with Wide Expert Parallelism on NVL72 Rack Scale Systems

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
A-Vibe и A-Vision — собственные языковые модели технологической платформы Авито — стали доступны всем.

Это первые российские решения, глубоко оптимизированные под русский язык и задачи e-commerce. Они подходят для анализа документации, создания ИИ-ассистентов и автоматизации контента. Компания потратила на разработку ИИ-моделей около полумиллиарда рублей.

Обе модели способны обрабатывать большие тексты (до 100 страниц) и вызывать внешние инструменты — например, для расчетов, поиска данных или работы с API. На их базе можно строить автономных ИИ-агентов и интегрировать технологии прямо в бизнес-процессы.

A-Vibe уже занимает верхние позиции в рейтингах, в том числе по пониманию русского языка. Команда Авито не собирается останавливаться: она адаптировала под русский целый набор тестов для оценки качества моделей. Все инструменты доступны бесплатно на Hugging Face.
StarBench: A Turn-Based RPG Benchmark for Agentic Multimodal Decision-Making and Information Seeking

Read

@datascienceiot
Does Model Size Matter? A Comparison of Small and LLMs for Requirements Classification

📚 Читать

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠 От скалярного произведения к бустингу: RecSys кейс из Яндекс Лавки

Классный кейс для всех, кто пилит рекомендательные системы для реальных операционных задач. Команда Лавки рассказала, как они решали задачу мэтчинга курьеров и слотов рабочих смен.

Что внутри интересного для DS/ML-специалиста:

🔹 Бейзлайн: как стартовали с простого решения на векторах и скалярном произведении.
🔹 Feature Engineering: какие фичи собирают для ML-модели.
🔹 Выбор метрики: детальное объяснение, почему в их задаче Recall оказался важнее Precision.
🔹 Таргет: как теперь движутся от прокси-метрики «принял слот» к более честному таргету «вышел на слот».

Отличный разбор полного цикла — от эвристик до подготовки данных для полноценной ML-модели.

👉 Прочитать статью можно здесь
🤖 От классифайда к собственному ИИ-ассистенту: кейс Авито

Технологическая платформа Авито регистрирует новый товарный знак для собственного ИИ-ассистента — «Ави», узнал Коммерсант. Его уже тестируют в разных категориях, чтобы в 2026 году запустить универсальное решение, которое будет работать во всех вертикалях.

Что внутри интересного:
🔹 «Ави» работает на базе большой языковой модели;
🔹 отвечает в формате живого диалога: уточняет цель покупки, важные параметры, рекомендует подходящие предложения и даже объясняет отличия между лотами.

«Коммерсант» пишет, что запуск подобных ИИ-решений крупными компаниями уже стал трендом на рынке. ИИ повышает отдачу и лояльность пользователей, позволяет собирать дополнительный контекст из общения с ассистентом и увеличивает вовлеченность в продукт, что положительно сказывается на продажах.

По оценкам экспертов, Авито уже мог вложить в разработку ИИ-ассистента около 500 млн руб. В уже озвученных планах компании были и еще более масштабные вложения: инвестировать 12 млрд в развитие генеративного ИИ и заработать более 21 млрд на технологии к 2028 году.

В открытом доступе уже есть две собственные ИИ-модели Авито — текстовая A-Vibe и мультимодальная A-Vision. Причем качество разработок подтверждают пользователи: A-Vibe всего за неделю набрала более 1400 скачиваний и вошла в топ трендовых моделей на платформе Hugging Face.​​​​​​​​​​​​​​​

📚 Читать

@datascienceiot
The Smol Training Playbook:
The Secrets to Building World-Class LLMs


📚 Read

@datascienceiot
Machine Learning Systems
Principles and Practices of Engineering Artificially Intelligent Systems


📚 Read

@datascienceiot
Запущен первый российский продуктовый бенчмарк RAG-решений: открыт прием заявок

Кейс, который важен всем, кто делает или внедряет корпоративные ИИ-решения: в России появился инструмент, позволяющий объективно сравнивать RAG-сервисы по реальным бизнес-задачам — RRNCB (Russian RAG Normative-Corporate Benchmark)

Что интересного внутри для AI/ML-команд:

🔹 Полный пайплайн: бенчмарк проверяет не только LLM, а все решение целиком — от извлечения документов до генерации ответа.

🔹 Реальные данные: тесты строятся на корпоративных сценариях — ГОСТы, договоры, регламенты.

🔹 Прозрачная методология: независимая оценка с участием экспертов и внешних LLM.

🔹 Прозрачная польза для всех участников: компании получают независимое подтверждение качества продукта и шанс попасть в первый рейтинг российских RAG-решений, а клиенты — рейтинг с понятными критериями.

К участию приглашены все российские компании, разрабатывающие и продающие собственные ИИ-продукты бизнесу. В рамках бенчмарка ожидается испытание популярных RAG решений: Сбер (GigaChat), Яндекс (Нейроэксперт), МТС (Cotype), Softline (Преферентум), Авито, Точка Банк, Just AI и других лидеров рынка.

🗓 Прием заявок на сайте RRNCB — до 21 ноября,
результаты — 12 декабря.

👉 Читать
Introduction to Agents

📚 Read

@datascienceiot
🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

AI-агенты перестали быть экспериментом — они становятся основой продуктовых решений. Вопрос лишь в том, умеете ли вы создавать своих?

С 20 ноября будет Yandex AI Studio Series — серия практических вебинаров для тех, кто хочет пройти путь от идеи до production-ready AI-агента за 7 дней.

💡Что будет на интенсиве:
🟠 4 онлайн-трансляции с сессией вопросов и ответов.
🟠Предзаписанный воркшоп для самостоятельной практики.
🟠Квиз и приятные сюрпризы.
🟠Нетворкинг в продуктовом комьюнити.
🟠Офлайн-встреча в офисе Яндекса в Москве.
Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

Участие в мероприятии бесплатное.

Если вы AI/ML-инженер или разработчик и хотите углубиться в инженеринг агентов и мультиагентных систем — присоединяйтесь.

Регистрация

@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
Fighting the New York Times’ invasion of user privacy

📚 Read

@datascienceiot
Understanding neural networks through sparse circuits

📚 Read

@datascienceiot