Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Scaling Large MoE Models with Wide Expert Parallelism on NVL72 Rack Scale Systems
📚 Читать
@datascienceiot
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
A-Vibe и A-Vision — собственные языковые модели технологической платформы Авито — стали доступны всем.
Это первые российские решения, глубоко оптимизированные под русский язык и задачи e-commerce. Они подходят для анализа документации, создания ИИ-ассистентов и автоматизации контента. Компания потратила на разработку ИИ-моделей около полумиллиарда рублей.
Обе модели способны обрабатывать большие тексты (до 100 страниц) и вызывать внешние инструменты — например, для расчетов, поиска данных или работы с API. На их базе можно строить автономных ИИ-агентов и интегрировать технологии прямо в бизнес-процессы.
A-Vibe уже занимает верхние позиции в рейтингах, в том числе по пониманию русского языка. Команда Авито не собирается останавливаться: она адаптировала под русский целый набор тестов для оценки качества моделей. Все инструменты доступны бесплатно на Hugging Face.
Это первые российские решения, глубоко оптимизированные под русский язык и задачи e-commerce. Они подходят для анализа документации, создания ИИ-ассистентов и автоматизации контента. Компания потратила на разработку ИИ-моделей около полумиллиарда рублей.
Обе модели способны обрабатывать большие тексты (до 100 страниц) и вызывать внешние инструменты — например, для расчетов, поиска данных или работы с API. На их базе можно строить автономных ИИ-агентов и интегрировать технологии прямо в бизнес-процессы.
A-Vibe уже занимает верхние позиции в рейтингах, в том числе по пониманию русского языка. Команда Авито не собирается останавливаться: она адаптировала под русский целый набор тестов для оценки качества моделей. Все инструменты доступны бесплатно на Hugging Face.
StarBench: A Turn-Based RPG Benchmark for Agentic Multimodal Decision-Making and Information Seeking
Read
@datascienceiot
Read
@datascienceiot
Does Model Size Matter? A Comparison of Small and LLMs for Requirements Classification
📚 Читать
@datascienceiot
@datascienceiot
Please open Telegram to view this post
VIEW IN TELEGRAM
🧠 От скалярного произведения к бустингу: RecSys кейс из Яндекс Лавки
Классный кейс для всех, кто пилит рекомендательные системы для реальных операционных задач. Команда Лавки рассказала, как они решали задачу мэтчинга курьеров и слотов рабочих смен.
Что внутри интересного для DS/ML-специалиста:
🔹 Бейзлайн: как стартовали с простого решения на векторах и скалярном произведении.
🔹 Feature Engineering: какие фичи собирают для ML-модели.
🔹 Выбор метрики: детальное объяснение, почему в их задаче Recall оказался важнее Precision.
🔹 Таргет: как теперь движутся от прокси-метрики «принял слот» к более честному таргету «вышел на слот».
Отличный разбор полного цикла — от эвристик до подготовки данных для полноценной ML-модели.
👉 Прочитать статью можно здесь
Классный кейс для всех, кто пилит рекомендательные системы для реальных операционных задач. Команда Лавки рассказала, как они решали задачу мэтчинга курьеров и слотов рабочих смен.
Что внутри интересного для DS/ML-специалиста:
🔹 Бейзлайн: как стартовали с простого решения на векторах и скалярном произведении.
🔹 Feature Engineering: какие фичи собирают для ML-модели.
🔹 Выбор метрики: детальное объяснение, почему в их задаче Recall оказался важнее Precision.
🔹 Таргет: как теперь движутся от прокси-метрики «принял слот» к более честному таргету «вышел на слот».
Отличный разбор полного цикла — от эвристик до подготовки данных для полноценной ML-модели.
👉 Прочитать статью можно здесь
GaussGym: An open-source real-to-sim framework for learning locomotion from pixels
Project: https://escontrela.me/gauss_gym/
Paper: https://arxiv.org/abs/2510.15352
Data: https://huggingface.co/collections/escontra/gauss-gym-datasets
Code: https://github.com/escontra/gauss_gym
@datascienceiot
Project: https://escontrela.me/gauss_gym/
Paper: https://arxiv.org/abs/2510.15352
Data: https://huggingface.co/collections/escontra/gauss-gym-datasets
Code: https://github.com/escontra/gauss_gym
@datascienceiot
🤖 От классифайда к собственному ИИ-ассистенту: кейс Авито
Технологическая платформа Авито регистрирует новый товарный знак для собственного ИИ-ассистента — «Ави», узнал Коммерсант. Его уже тестируют в разных категориях, чтобы в 2026 году запустить универсальное решение, которое будет работать во всех вертикалях.
Что внутри интересного:
🔹 «Ави» работает на базе большой языковой модели;
🔹 отвечает в формате живого диалога: уточняет цель покупки, важные параметры, рекомендует подходящие предложения и даже объясняет отличия между лотами.
«Коммерсант» пишет, что запуск подобных ИИ-решений крупными компаниями уже стал трендом на рынке. ИИ повышает отдачу и лояльность пользователей, позволяет собирать дополнительный контекст из общения с ассистентом и увеличивает вовлеченность в продукт, что положительно сказывается на продажах.
По оценкам экспертов, Авито уже мог вложить в разработку ИИ-ассистента около 500 млн руб. В уже озвученных планах компании были и еще более масштабные вложения: инвестировать 12 млрд в развитие генеративного ИИ и заработать более 21 млрд на технологии к 2028 году.
В открытом доступе уже есть две собственные ИИ-модели Авито — текстовая A-Vibe и мультимодальная A-Vision. Причем качество разработок подтверждают пользователи: A-Vibe всего за неделю набрала более 1400 скачиваний и вошла в топ трендовых моделей на платформе Hugging Face.
📚 Читать
@datascienceiot
Технологическая платформа Авито регистрирует новый товарный знак для собственного ИИ-ассистента — «Ави», узнал Коммерсант. Его уже тестируют в разных категориях, чтобы в 2026 году запустить универсальное решение, которое будет работать во всех вертикалях.
Что внутри интересного:
🔹 «Ави» работает на базе большой языковой модели;
🔹 отвечает в формате живого диалога: уточняет цель покупки, важные параметры, рекомендует подходящие предложения и даже объясняет отличия между лотами.
«Коммерсант» пишет, что запуск подобных ИИ-решений крупными компаниями уже стал трендом на рынке. ИИ повышает отдачу и лояльность пользователей, позволяет собирать дополнительный контекст из общения с ассистентом и увеличивает вовлеченность в продукт, что положительно сказывается на продажах.
По оценкам экспертов, Авито уже мог вложить в разработку ИИ-ассистента около 500 млн руб. В уже озвученных планах компании были и еще более масштабные вложения: инвестировать 12 млрд в развитие генеративного ИИ и заработать более 21 млрд на технологии к 2028 году.
В открытом доступе уже есть две собственные ИИ-модели Авито — текстовая A-Vibe и мультимодальная A-Vision. Причем качество разработок подтверждают пользователи: A-Vibe всего за неделю набрала более 1400 скачиваний и вошла в топ трендовых моделей на платформе Hugging Face.
📚 Читать
@datascienceiot
Machine Learning Systems
Principles and Practices of Engineering Artificially Intelligent Systems
📚 Read
@datascienceiot
Principles and Practices of Engineering Artificially Intelligent Systems
📚 Read
@datascienceiot
Запущен первый российский продуктовый бенчмарк RAG-решений: открыт прием заявок
Кейс, который важен всем, кто делает или внедряет корпоративные ИИ-решения: в России появился инструмент, позволяющий объективно сравнивать RAG-сервисы по реальным бизнес-задачам — RRNCB (Russian RAG Normative-Corporate Benchmark)
Что интересного внутри для AI/ML-команд:
🔹 Полный пайплайн: бенчмарк проверяет не только LLM, а все решение целиком — от извлечения документов до генерации ответа.
🔹 Реальные данные: тесты строятся на корпоративных сценариях — ГОСТы, договоры, регламенты.
🔹 Прозрачная методология: независимая оценка с участием экспертов и внешних LLM.
🔹 Прозрачная польза для всех участников: компании получают независимое подтверждение качества продукта и шанс попасть в первый рейтинг российских RAG-решений, а клиенты — рейтинг с понятными критериями.
К участию приглашены все российские компании, разрабатывающие и продающие собственные ИИ-продукты бизнесу. В рамках бенчмарка ожидается испытание популярных RAG решений: Сбер (GigaChat), Яндекс (Нейроэксперт), МТС (Cotype), Softline (Преферентум), Авито, Точка Банк, Just AI и других лидеров рынка.
🗓 Прием заявок на сайте RRNCB — до 21 ноября,
результаты — 12 декабря.
👉 Читать
Кейс, который важен всем, кто делает или внедряет корпоративные ИИ-решения: в России появился инструмент, позволяющий объективно сравнивать RAG-сервисы по реальным бизнес-задачам — RRNCB (Russian RAG Normative-Corporate Benchmark)
Что интересного внутри для AI/ML-команд:
🔹 Полный пайплайн: бенчмарк проверяет не только LLM, а все решение целиком — от извлечения документов до генерации ответа.
🔹 Реальные данные: тесты строятся на корпоративных сценариях — ГОСТы, договоры, регламенты.
🔹 Прозрачная методология: независимая оценка с участием экспертов и внешних LLM.
🔹 Прозрачная польза для всех участников: компании получают независимое подтверждение качества продукта и шанс попасть в первый рейтинг российских RAG-решений, а клиенты — рейтинг с понятными критериями.
К участию приглашены все российские компании, разрабатывающие и продающие собственные ИИ-продукты бизнесу. В рамках бенчмарка ожидается испытание популярных RAG решений: Сбер (GigaChat), Яндекс (Нейроэксперт), МТС (Cotype), Softline (Преферентум), Авито, Точка Банк, Just AI и других лидеров рынка.
🗓 Прием заявок на сайте RRNCB — до 21 ноября,
результаты — 12 декабря.
👉 Читать